大模型学习笔记一:大模型应开发基础(模型归类选型、安全因素选型、)

文章目录

    • 一、大模型一些概念介绍
    • 二、市面上大模型对比
    • 三、大模型使用安全选型
    • 四、使用大模型的方式(一问一答、Agent+ Function Calling、RAG、Fine-tuning
    • 五、大模型使用路线
    • 九、补充说明
      • 1)注意力机制讲解

一、大模型一些概念介绍

  • 1)产品和大模型的区别(产品通过调用大模型来具备的能力)
    在这里插入图片描述

  • 2)AGI定义
    概念:一切问题可以用AI解决

  • 3)大模型通俗原理
    根据上文,猜测下一个词
    在这里插入图片描述

  • 4)大模型测试代码

from openai import OpenAI

from dotenv import load_dotenv,find_dotenv
_ = load_dotenv(find_dotenv())


client = OpenAI()
prompt = "今天我很"
# prompt = "下班了,今天我很"
# prompt = "放学了,今天我很"
# prompt = "AGI 实现了,今天我很"

response = client.completions.create(
	model      = "gpt-3.5-turbo-instruct",
	propt      = prompt,
	max_tokens = 512,
	stream     = True
)

for chunk in response:
	print(chunk.choices[0].text,end='')

二、市面上大模型对比

在这里插入图片描述

三、大模型使用安全选型

在这里插入图片描述

四、使用大模型的方式(一问一答、Agent+ Function Calling、RAG、Fine-tuning


①一问一答
在这里插入图片描述
②Agent+ Function Calling
在这里插入图片描述
在这里插入图片描述
③RAG
在这里插入图片描述
在这里插入图片描述
④Fine-tuning
努力记住考试内容,长期记住,活学活用(在基础大模型之上加一层微调,该百年模型的权重)
在这里插入图片描述

五、大模型使用路线

1)是否要补充知识?
是—使用RAG
2)是否要对接其他系统
是—Function Calling
3)值得尝试微调?
是—用旧数据做fine-tune,有几大好处
①提高大模型的稳定性
②用户量大,降低推理的成本
③提高大模型生成速度

九、补充说明

1)注意力机制讲解

  • 文本举例讲解
    在这里插入图片描述

  • 有没有注意力机制的区别图
    在这里插入图片描述

①RNN会有一个隐藏状态,是AI用来理解一个中文词义的作用,可以看到JE和SUIS通过神经网络变成了一个向量

  • 注意力网络的实现

    注意力网络做的事:
    ①每个同学h(x)都听一遍
    ②同时还要找出其重点
    非注意网络做的事:
    ①线性传播一个人只能传递给下一个人
  • 注意力网络的方式
    上下文的向量:
c2 = a21h1+a22h2+a23h3 

①x(数字)是输入的语言,通过RNN神经网络变成一个状态h1,
②α是输入的加权平均(attention weight)
③c是每一个词权重的重点

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/357077.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux安装Jdk8

本文以centos7为例,一步一步进行jdk1.8的安装。 1. 下载安装 笑小枫网站下载:https://xiaoxiaofeng.com/resource/16 官网下载链接: https://www.oracle.com/cn/java/technologies/downloads/#java8 上传jdk的压缩包到服务器的/usr/local目…

封装通用mixins,在vue中实现a-table组件的可伸缩列(详细且使用便捷)

1、实现效果 2、使用场景 vue2 antd-vue 1.x版本由于antd-vue 1.x版本的组件库没有提供可伸缩列的功能,才需要我们手动开发在antd-vue 3.x版本以上的表格已经支持这个功能,不需要我们再去手动开发 3、话不多说,上代码 首先安装vue-dragga…

【超详细教程】GPT-SoVITs从零开始训练声音克隆教程(主要以云端AutoDL部署为例)

目录 一、前言 二、GPT-SoVITs使用教程 2.1、Windows一键启动 2.2、AutoDL云端部署 2.3、人声伴奏分离 2.4、语音切割 2.5、打标训练数据 2.6、数据集预处理 2.7、训练音频数据 2.8、推理模型 三、总结 一、前言 近日,RVC变声器的创始人(GitH…

网络安全防御保护 Day4

要点一:防火墙的智能选路 就近选路: 在访问不同运营商的服务器时直接通过对应运营商的链路,以此来提高通信效率,避免绕路。 策略路由(PBR): 这是一种基于用户定义的策略(如业务需求、…

嵌入式中Qt5.7.1添加支持openssl方法

1、openssl编译 版本:openssl-1.0.2g 一定要选对Qt版本对应的openssl版本,由于开始选的openssl版本不对,导致编译Qt时出现很多错误。 交叉编译 ./config no-asm shared --prefix/opt/Xilinx2018_zynq/zynq_openssl_1.0.2/ --cross-compile…

Unity-WebGL

问题:提示gzip压缩报错解决:关闭打包的地方压缩,如下图问题:窗口未全屏解决:使用百分比画布替换固定尺寸画布 参考:新版Unity打包Webgl端进行屏幕自适应_unity webgl分辨率自适应-CSDN博客问题:…

光学3D表面轮廓仪服务超精密抛光技术发展

随着技术的不断进步,精密制造领域对材料表面的处理要求越来越高,超精密抛光技术作为当下表面处理的尖端技术,对各种高精密产品的生产起到了至关重要的作用,已广泛应用于集成电路制造、医疗器械、航空航天、3C电子、汽车、精密模具…

ubuntu gedit主题更改

ubuntu16.04 gedit 编辑器又有首选项如何设置主题 这里下载主题 将主题XML复制到 /usr/share/gtksourceview-3.0/styles 文件夹内; 使用gsettings 命令设置喜欢的配色方案,使用方式如下:(实测不带.xml后缀哦) gsettings set org.gnome.gedi…

【UVM源码】UVM Config_db机制使用总结与源码解析

UVM Config_db机制使用总结与源码解析 UVM Config_db机制介绍UVM Config_db 机制引入的背景基本介绍使用方法优缺点: UVM Config_db机制使用示例:UVM Config_db使用高阶规则Config_db资源优先级 UVM Config_db 源码解析 UVM Config_db机制介绍 UVM Conf…

微信小程序上传时报错message:Error: 系统错误,错误码:80051,source size 2148KB exceed max limit 2MB

问题: 微信小程序上传时错误码:80051,source size 2248KB exceed max limit 2MB 问题原因: 由于代码中的静态资源 图片大小超了200k以及主包的体积超出1.5M 解决办法 分包 tabBar 是主包的,不需要分包处理,以下是分…

gitlib部署及应用

一. 下载源网址 Index of /gitlab-ce/yum/el7/ | 清华大学开源软件镜像站 | Tsinghua Open Source MirrorIndex of /gitlab-ce/yum/el7/ | 清华大学开源软件…

Onvif协议5: 预置位的操作

目录 1. 介绍 2. GetPreset 3. SetPreset 4.预置位的索引 5. GotoPreset 1. 介绍 球机的云台预置位控制主要包含的内容有:预置位的设置、预置位的调用、预置位的删除以及预置位的名称修改等 云台预置位的设置:调用Onvif协议中云台预置位设置接口&a…

【云原生】docker-compose单机容器集群编排工具

目录 一、docker-compose容器编排的简介 二、docker-compose的使用 1、docker-compose的安装 2、docker-compose的配置模板文件yaml文件的编写 (1)布尔值类型 (2)字符串类型 (3)一个key有多个值 &am…

成都直播产业园解析直播供应链金融服务,天府锋巢直播产业基地打造“金融+产业+生态”新型模式

天府锋巢直播产业基地如何打造“金融产业生态”新型模式? 本文将为您全面解析基地提供的成都直播产业园供应链金融服务 锋巢资讯~每周准时报道~~ 赶紧下拉,阅读全文 Q:企业入驻园区能获得哪些直播供应链金融服务&…

【gcc】RtpTransportControllerSend学习笔记 5:OnTransportPacketsFeedback及测试程序

【gcc】RtpTransportControllerSend学习笔记 4:码率分配 中阅读了大神的文章,依旧云雾中,因此,反复阅读大神的文章,结合代码,继续。本次是 基于m98的代码。src\modules\congestion_controller\goog_cc\goog_cc_network_control.cc GoogCcNetworkController 是核心类,其处…

基于UDP的套接字通信(附通信代码)

基于UDP的套接字通信 udp是一个面向无连接的,不安全的,报式传输层协议,udp的通信过程默认也是阻塞的。 不需要建立连接 UDP通信过程中,每次都需要指定数据接收端的IP和端口 UDP不对收到的数据进行排序,在UDP报文的…

【vue】defineModel在vue3.4中的最新用法和详解

在2023年12月28日,尤大发布了vue3.4版本,这个版本主要对一些实验性特性的改进(比如defineModel),大量重写了模板编译器并重构了响应式系统,可以说是大大提升了运行速度和效率。 之前在vue3.3中defineModel…

erp读书笔记20240129

ERP 计划中的时间概念,包括计划期、时段、时区与时界,以及五种作业时间。 计划期的定义是为了实现对产品全流程的控制,提高计划的预见性,实现供需链计划。时段的划分是为了区别优先级,满足滚动计划的需求。 时区与时界…

信创联盟--朗思科技加入证券基金行业信息技术应用创新联盟,共促金融信创发展

近期,证券基金行业信息技术应用创新联盟(以下简称:信创联盟)新一批成员单位名单公布,朗思科技LanSive凭借产品创新以及实践案例成功入选,正式成为信创联盟成员单位。 信创联盟由上交所联合行业券商倡议发起…

STM32控制DHT11温湿度传感器模块获取温湿度数据

时间记录:2024/1/29 一、DHT11引脚介绍 (1)VCC:电源引脚,3.3-5.5V (2)DATA:数据输入输出引脚 (3)NC:保留引脚,悬空即可 (…