前言
书生·浦语大模型应用实战营 第二期正在开营,欢迎大家来学习。(参与链接:https://mp.weixin.qq.com/s/YYSr3re6IduLJCAh-jgZqghttps://mp.weixin.qq.com/s/YYSr3re6IduLJCAh-jgZqg)
第一堂课的视频链接:https://m.bilibili.com/video/BV1Vx421X72Dhttps://m.bilibili.com/video/BV1Vx421X72D
本次笔记是学习完第一堂课,结合自己关心内容而创作,更偏向个人。尽管有很多细节丢失,但组织出来的内容仍反映本节课的关键知识、也是我的收获,与大家分享。
论述
大模型功能开发流程
以下是比较典型的大模型功能开发要经历的流程,但实际情况可能会更加复杂,也没必要去都呈现出来。所以我们学习这个就行。知道步骤进行原因,具体情况灵活应变
步骤一(步骤数字以最复杂的情况为举例):挑选模型
现在想象下我们要开发一个大模型应用。从接到任务到真正把功能实现出来,该经历怎样的流程?
大模型功能是为了满足某个业务需求的,首先我们得挑选合适的大模型,大家知道不同的大模型对同一个任务表现是不一样的,就拿Claude2来说,模型综合能力不及GPT-4 Turbo,但是在学术相关对话,表现出来的特定能力是明显比GPT-4 Turbo好的。
完成这一步骤,可能需要你有些经验,或者你也可以看权威些的排行榜。
步骤二:第一次模型评估
刚刚是你主观上觉得Ok、或者别人说的,但是实际怎么样呢?你得基于客观的测试,但到底是不是能够满足需要。
如果直接就满足了,那就直接可以部署模型了。达不到需要该怎么办?
我们得去微调大模型
步骤三:微调大模型
我们要做判断,现在我有没有微调所需要的资源?具体是硬件资源、和训练所需的语料资源。做好判断之后就进行微调的环节了
续训,也就是全参数微调,因为要将训练大量的语料,往往需要更长时间。
步骤四:构建智能体
如果大模型要与环境进行交互,比如与数据库的交互或者调用什么插件等,构建智能体是很好的策略。在具体情况下你可以判断一下,如果需要推荐你构建智能体
步骤五:第二次模型评估
功能始终是为了满足某种需要的,所以在我们改造模型后,还是得看满足了没有,是不是要继续调整。我们对模型进行第二次评估。
步骤六:模型部署
最后就是把模型嵌入应用中,部署好自己的模型就好了
这就是总的图
这是我学到的一个关键知识,它让我知道我以后面对我的项目的时候,该怎么办
书生·浦语全链条开源开放体系
听完课似乎我脑袋里留下的第二句话是:“书生·浦语对于开发的各个环节都提供了技术支持”。
大家可以把各个技术对应到上面我们总结的开发流程中,看什么地方我可以用到什么技术。
~~~~~~
以上就是我本篇想讲的所有内容了,如果这篇文章对你有价值的话,还请点个赞,你的支持对我非常重要!
我是阿航,一位胆大包天、梦想成为大牛的学生~
我们下篇文章接着聊