七月论文审稿GPT第2.5版：微调GPT3.5 turbo 16K和llama2 13B以扩大对GPT4的优势

七月论文审稿GPT第2.5版：微调GPT3.5 turbo 16K和llama2 13B以扩大对GPT4的优势

article2025/2/21 22:00:28/文章来源:https://blog.csdn.net/v_JULY_v/article/details/136033055

前言

我司自去年7月份成立大模型项目团队以来，至今已有5个项目组，其中

第一个项目组的AIGC模特生成系统已经上线在七月官网
第二项目组的论文审稿GPT则将在今年3 4月份对外上线发布
第三项目组的RAG知识库问答第1版则在春节之前已就绪
至于第四、第五项目组的大模型机器人、Agent则正在迭代中

所有项目均为会对外上线发布的商用项目，而论文审稿GPT至今在过去的半年已经迭代两个版本，其中第二版的效果甚至超过了GPT4(详见《七月论文审稿GPT第2版：用一万多条paper-review数据集微调LLaMA2最终反超GPT4》)，为了持续累积与原始GPT4的优势，我们如今正在迭代第2.5版本：包括对GPT3.5 turbo 16K的微调以及llama2 13B的微调，本文也因此而成

第一部分微调GPT3.5 Tubor 16K

我们微调第一版的时候，曾经考虑过微调ChatGPT，不过其开放的微调接口的上下文长度不够大部分论文的长度(截止到23年10月底暂只有4K)，故当时没来得及，好在23年11.6日，OpenAI在其举办的首届开发者大会上，宣布开放GPT3.5 16K的微调接口

因此，我们在第2.5版便可以微调ChatGPT了，即我司正在尝试用我们自己爬取一万多条的paper-review数据集去微调GPT3.5 16k，最终让它们大乱斗，看哪个是最强王者

不过，考虑到可能存在的数据泄露给OpenAI的风险，故我们打算先用1/3的数据微调试下，看能否把这条路径走通，以及看下胜率对比

如果能超过咱们微调的开源模型，那ChatGPT确实强
如果没超过，则再上全量

1.1 GPT3.5 Tubor 16K的微调

1.1.1 微调GPT3.5的前期调研：费用、微调流程、格式转换等

首先，计算一下微调GPT所需的费用
由于我司爬取的15566条paper-review数据集的token数量为：118689950
根据OpenAI微调gpt3.5 turbo的定价策略(Pricing)
可知，全量样本Traning阶段预计要花费的费用为(按2个epoch)：118689950个token ✖️ 2个epoch ✖️ 0.008 ✖️ 汇率7.18 = 13635元
其次，这是微调的页面：https://platform.openai.com/finetune
此外，这是OpenAI官网上关于微调的教程：https://platform.openai.com/docs/guides/fine-tuning/fine-tuning-examples
接着，根据OpenAI微调教程给的提示
把我们自己爬的数据转成做成chatml的格式，即
{"messages": [{"role": "system", "content": "xxx"}, {"role": "user", "content": "xxx"}, {"role": "assistant", "content": "zzz"}]}
那种
在微调页面上传自己的数据

1.1.2 先后用150多条、1500多条、15000多条数据微调GPT3.5 Tubor 16K

为了先验证一下微调这个模式，故我们先用了156条paper-review数据集去微调gpt3.5 16k，然后跑完之后，我还和项目组的同事打趣说，搞不好我们是国内第一批微调gpt3.5 16k的呢，毕竟高质量的长文本数据非常稀缺

效果如何呢，我们先随机试一篇训练集之外的论文，做个验证，至于专业全面的评估下节详述

第二项目组的文弱同学用传七月大模型线上营群里的10pct那个数据集的倒数第二行的input(因为微调这个数据只用了群里10%的数据，所以后面的这个input数据可以做验证集)，分别让gpt3.5、微调过的gpt3.5对该input进行审稿意见的输出，且对比原始的人工审稿意见

这三个输出按顺序如下从左至右展示

1.2 对微调后的gpt3.5 16K的效果评估

// 待更

第二部分微调13B：首选Llama-2-13b-chat-hf

在我司这个论文审稿场景下，对于13B模型的微调，首选还是微调llama 13B(模型地址：Llama-2-13b-chat-hf)

其对卡的要求：双48g的卡或者单卡80g，即13b的话双A40用longqlora差不多

24年，2.3日开跑..

// 待更

参考文献与推荐阅读

第一阶段开始后续第2.5版的迭代：微调GPT3.5 16K
2.3日，新增一节的内容，即
7.1.1 微调GPT3.5的前期调研：费用、微调流程等
2.4日，新增一节，即
7.1.2 先后用150多条、1500多条、15000多条数据微调GPT3.5 Tubor 16K

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/370757.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

【stm32】hal库学习笔记-ADC模数转换（超详细！）

【stm32】hal库学习笔记-ADC模数转换（超详细！）

【stm32】hal库学习笔记-ADC模数转换（超详细！） 本篇章介绍了ADC实现电压检测的三种方式 ADC原理及选型 ADC将连续的模拟电压信号转换为二进制的数字信号选型参数速度（采样频率） 功耗精度转换原理 ADC hal库驱…

阅读更多...

一、Redis之NoSQL

一、Redis之NoSQL

1.1 什么是NoSQL NoSQL（Not Only SQL）即不仅仅是SQL，泛指非关系型的数据库，它可以作为关系型数据库的良好补充。随着互联网web2.0网站的兴起，非关系型的数据库现在成了一个极其热门的新领域，非关系数据库产…

阅读更多...

[Linux 进程控制(二)] 写时拷贝 - 进程终止

[Linux 进程控制(二)] 写时拷贝 - 进程终止

文章目录 1、写时拷贝2、进程终止2.1 进程退出场景2.1.1 退出码2.1.2 错误码错误码 vs 退出码2.1.3 代码异常终止引入 2.2 进程常见退出方法2.2.1 exit函数2.2.2 _exit函数本片我们主要来讲进程控制，讲之前我们先把写时拷贝理清，然后再开始讲进程控制。…

阅读更多...

$图论练习2$

图论练习2

内容：路径计数DP，差分约束最短路计数题目大意给一个个点条边的无向无权图，问从出发到其他每个点的最短路有多少条有自环和重边，对答案解题思路设边权为1，跑最短路表示的路径数自环和重边不影…

阅读更多...

基于OpenCV灰度图像转GCode的双向扫描实现

基于OpenCV灰度图像转GCode的双向扫描实现

基于OpenCV灰度图像转GCode的双向扫描实现引言激光雕刻简介OpenCV简介实现步骤 1.导入必要的库2. 读取灰度图像3. 图像预处理4. 生成GCode 1. 简化版的双向扫描2. 优化版的双向扫描 5. 保存生成的GCode6. 灰度图像双向扫描代码示例总结系列文章 ⭐深入理解G0和G1指令&…

阅读更多...

【深入浅出Java性能调优】「底层技术原理体系」详细分析探索Java服务器性能监控Metrics框架的实现原理分析（Dropwizard度量基础案例指南)

【深入浅出Java性能调优】「底层技术原理体系」详细分析探索Java服务器性能监控Metrics框架的实现原理分析（Dropwizard度量基础案例指南)

深入探索Java服务器性能监控Metrics框架的实现原理分析前提介绍Dropwizard MetricsDropwizard的特点Dropwizard的开发案例需要引入Maven依赖常用度量类型Meter（每秒请求数为单位测量请求率）定义度量核心MetricRegistry构建对应的Meter指标对象请求标记采样业务方法控制报告器…

阅读更多...

利用Excel爬取网页数据

利用Excel爬取网页数据

想要获取网页上的表格数据，可以通过Excel自带的功能，从网站导入数据，并且可以实时刷新最新数据。具体步骤如下： 1、新建Excel，打开，选择【数据】-【自网站】 2、在弹出的对话框中输入目标网址，…

阅读更多...

Java常用

Java常用

文章目录基础基础数据类型内部类Java IOIO多路复用重要概念 Channel **通道**重要概念 Buffer **数据缓存区**重要概念 Selector **选择器** 关键字final 元注解常用接口异常处理ErrorException JVM与虚拟机JVM内存模型本地方法栈虚拟机栈 Stack堆 Heap方法区 Method Area (JD…

阅读更多...

JavaSE-项目小结-IP归属地查询（本地IP地址库）

JavaSE-项目小结-IP归属地查询（本地IP地址库）

一、项目介绍 1. 背景 IP地址是网络通信中的重要标识，通过分析IP地址的归属地信息，可以帮助我们了解访问来源、用户行为和网络安全等关键信息。例如应用于网站访问日志分析：通过分析访问日志中的IP地址，了解网站访问者的地理位置分…

阅读更多...

毫米波雷达在汽车领域的原理、优势和未来趋势

毫米波雷达在汽车领域的原理、优势和未来趋势

1 毫米波雷达的原理汽车引入毫米波雷达最初主要是为了实现盲点监测和定距巡航。毫米波实质上是电磁波，其频段位于无线电和可见光、红外线之间，频率范围为10GHz-200GHz。工作原理类似一般雷达，通过发射无线电波并接收回波，利用障…

阅读更多...

vscode 无法远程连接waiting the server log

vscode 无法远程连接waiting the server log

使用版本报错信息相关日志 [17:32:59.765] > Waiting for server log... [17:32:59.801] > Waiting for server log... [17:32:59.831] > > * > * Visual Studio Code Server > * > * By using the software, you agree to > * the Visual Studio…

阅读更多...

Github开源项目Excalidraw：简洁易用的手绘风格白板工具

Github开源项目Excalidraw：简洁易用的手绘风格白板工具

Excalidraw是Github上的一个开源项目，它提供了一个简洁易用的手绘图形创建工具，用户可以通过它创建流程图、示意图、架构图和其他各种图形。本文将介绍Excalidraw的特点和功能，并探讨其在技术层面上的优势和扩展能力。 GitHub地址&#xff1a…

阅读更多...

Mysql学习记录补充

Mysql学习记录补充

索引在无索引情况下，就需要从第一行开始扫描，一直扫描到最后一行，我们称之为全表扫描，性能很低。如果我们针对于这张表建立了索引，假设索引结构就是二叉树，那么也就意味着，会对age这个字段…

阅读更多...

【数据结构与算法】(8)基础数据结构之优先级队列的无序数组实现、有序数组实现、堆实现详细代码示例讲解

【数据结构与算法】(8)基础数据结构之优先级队列的无序数组实现、有序数组实现、堆实现详细代码示例讲解

目录 2.7 优先级队列1) 无序数组实现2) 有序数组实现3) 堆实现习题E01. 合并多个有序链表-Leetcode 23 2.7 优先级队列 1) 无序数组实现要点入队保持顺序出队前找到优先级最高的出队，相当于一次选择排序 public class PriorityQueue1<E extends Priority&g…

阅读更多...

Amazon Bedrock ——使用Prompt构建AI软文撰写师的生成式人工智能应用程序

Amazon Bedrock ——使用Prompt构建AI软文撰写师的生成式人工智能应用程序

Amazon Bedrock 是一项完全托管的服务，通过单个 API 提供来自 AI21 Labs、Anthropic、Cohere、Meta、Stability AI 和 Amazon 等领先人工智能公司的高性能基础模型（FM），以及通过安全性、隐私性和负责任的 AI 构建生成式人工智能应…

阅读更多...

QCustomplot实现灰度曲线图

QCustomplot实现灰度曲线图

从 QCustomplot官网 https://www.qcustomplot.com/index.php/download 下载支持文件。首页有些demo可以进行参考学习。新建一个Qt工程，将下载得到的qcustomplot.h和qcustomplot.cpp文件加入到当前工程。pro文件中加上 printsupport 在ui界面中，添加一…

阅读更多...

【算法与数据结构】739、LeetCode每日温度

【算法与数据结构】739、LeetCode每日温度

文章目录一、题目二、解法三、完整代码所有的LeetCode题解索引，可以看这篇文章——【算法和数据结构】LeetCode题解。一、题目二、解法思路分析： 程序如下： 复杂度分析： 时间复杂度： O ( ) O() O()。空间复…

阅读更多...

CocosCreator3.8源码分析

CocosCreator3.8源码分析

Cocos Creator架构 Cocos Creator 拥有两套引擎内核，C 内核和 TypeScript 内核。C 内核用于原生平台，TypeScript 内核用于 Web 和小游戏平台。在引擎内核之上，是用 TypeScript 编写的引擎框架层，用以统一两套内核的差异&#xf…

阅读更多...

12. onnx转为rknn测试时有很多重叠框的修改（python）

12. onnx转为rknn测试时有很多重叠框的修改（python）

我们下载rknn-toolkit2-master后并进行前面的处理后，进入到rknn-toolkit2-master\examples\onnx\yolov5文件夹，里面有个test.py文件，打开该文件，其代码如下： # -*- coding: utf-8 -*- # coding:utf-8import os import…

阅读更多...

Photoshop CS6 下载安装教程，保姆级教程，小白也能轻松搞的，附安装包

Photoshop CS6 下载安装教程，保姆级教程，小白也能轻松搞的，附安装包

前言 Adobe Photoshop CS6强大的照片拍摄和突破性的新功能，用于复杂的图形、选择、逼真的绘画和装饰智能。创建惊人的高动态范围(HDR)图像。用逼真的笔触和混合的颜色绘画。消除噪音，添加种子，并绘制一个国家最先进的摄影设备的草图。凭借原…

阅读更多...

最新文章