书生·浦语大模型实战营 | 第1次学习笔记

前言

书生·浦语大模型应用实战营 第二期正在开营,欢迎大家来学习。(参与链接:https://mp.weixin.qq.com/s/YYSr3re6IduLJCAh-jgZqgicon-default.png?t=N7T8https://mp.weixin.qq.com/s/YYSr3re6IduLJCAh-jgZqg

第一堂课的视频链接:https://m.bilibili.com/video/BV1Vx421X72Dicon-default.png?t=N7T8https://m.bilibili.com/video/BV1Vx421X72D

本次笔记是学习完第一堂课,结合自己关心内容而创作,更偏向个人。尽管有很多细节丢失,但组织出来的内容仍反映本节课的关键知识、也是我的收获,与大家分享。

论述

大模型功能开发流程

以下是比较典型的大模型功能开发要经历的流程,但实际情况可能会更加复杂,也没必要去都呈现出来。所以我们学习这个就行。知道步骤进行原因,具体情况灵活应变

步骤一(步骤数字以最复杂的情况为举例):挑选模型

现在想象下我们要开发一个大模型应用。从接到任务到真正把功能实现出来,该经历怎样的流程?

大模型功能是为了满足某个业务需求的,首先我们得挑选合适的大模型,大家知道不同的大模型对同一个任务表现是不一样的,就拿Claude2来说,模型综合能力不及GPT-4 Turbo,但是在学术相关对话,表现出来的特定能力是明显比GPT-4 Turbo好的。

完成这一步骤,可能需要你有些经验,或者你也可以看权威些的排行榜。

步骤二:第一次模型评估

刚刚是你主观上觉得Ok、或者别人说的,但是实际怎么样呢?你得基于客观的测试,但到底是不是能够满足需要。

如果直接就满足了,那就直接可以部署模型了。达不到需要该怎么办?

我们得去微调大模型

步骤三:微调大模型

我们要做判断,现在我有没有微调所需要的资源?具体是硬件资源、和训练所需的语料资源。做好判断之后就进行微调的环节了

 续训,也就是全参数微调,因为要将训练大量的语料,往往需要更长时间。

步骤四:构建智能体

 如果大模型要与环境进行交互,比如与数据库的交互或者调用什么插件等,构建智能体是很好的策略。在具体情况下你可以判断一下,如果需要推荐你构建智能体

步骤五:第二次模型评估

功能始终是为了满足某种需要的,所以在我们改造模型后,还是得看满足了没有,是不是要继续调整。我们对模型进行第二次评估。

 步骤六:模型部署

最后就是把模型嵌入应用中,部署好自己的模型就好了

这就是总的图

 这是我学到的一个关键知识,它让我知道我以后面对我的项目的时候,该怎么办

书生·浦语全链条开源开放体系

听完课似乎我脑袋里留下的第二句话是:“书生·浦语对于开发的各个环节都提供了技术支持”。

 大家可以把各个技术对应到上面我们总结的开发流程中,看什么地方我可以用到什么技术。

~~~~~~

以上就是我本篇想讲的所有内容了,如果这篇文章对你有价值的话,还请点个赞,你的支持对我非常重要!

我是阿航,一位胆大包天、梦想成为大牛的学生~ 

我们下篇文章接着聊

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/512717.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

AI在招聘中的优势:如何颠覆传统?

在当今快节奏的商业环境中,企业争相寻找提升效率的方法,特别是在招聘这一关键领域。人工智能(AI)凭借其卓越的数据处理能力和学习算法,为企业的招聘流程带来了革命性的变化。但是,人工智能到底是如何在招聘…

【设计】枚举的应用

什么是枚举 枚举是一种特殊的数据类型,用于定义具有固定个数的常量集。它可以帮助我们更好地管理常量,使代码更易于阅读和维护。 Java枚举是一种高效、可读性强的常量管理方式,它可以使代码更易于维护和扩展。使用Java枚举可以帮助我们有效…

frp内网穿透,让外网可以访问内网

需求 我们的svn部署在内网,用的一直没问题,但是有时候有需求在外网访问svn,进行提交更新等操作,这时候就有了内网穿透这个需求。 当然,我们也可以借助花生壳等软件进行内网穿透,傻瓜化操作,也…

快速成长的秘诀|学会自我培养和培养他人

> 插:AI时代,程序员或多或少要了解些人工智能,前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 坚持不懈,越努力越幸运,大家…

TDP3500泰克TDP3500差分探头

181/2461/8938产品概述: 泰克 TDP3500 探头是一款差分端有源探头,可为高频测量提供更真实的信号再现和保真度。它还提供当今数字系统设计所需的高速电气和机械性能。泰克 TDP3500 探头专为使用并直接连接到具有 TekVPI™ 探头接口的泰克示波器而设计。 …

Python(乱学)

字典在转化为其他类型时,会出现是否舍弃value的操作,只有在转化为字符串的时候才不会舍弃value 注释的快捷键是ctrl/ 字符串无法与整数,浮点数,等用加号完成拼接 5不入??? 还有一种格式化的方法…

Redis热点Key问题分析与解决

目录 一、问题现象描述 二、什么是热点Key 三、热点Key的危害 3.1 Redis节点负载过高 3.2 Redis集群负载不均 3.3 Redis集群性能下降 3.4 数据不一致 3.5 缓存击穿 四、热点Key产生的原因分析 4.1 热点数据 4.2 业务高峰期 4.3 代码逻辑问题 五、如何检测热点Key …

dm8 开启归档模式

dm8 开启归档模式 1 命令行 [dmdbatest1 dm8]$ disql sysdba/Dameng123localhost:5237服务器[localhost:5237]:处于普通打开状态 登录使用时间 : 3.198(ms) disql V8 SQL> select name,status$,arch_mode from v$database;行号 NAME STATUS$ ARCH_MODE ----------…

浅谈分布式光伏电站的运维管理

摘要:随着近些年我国对节能降耗关注力度的持续加大,为满足人们不断增长的电能需求,光伏发电产业得到迅猛发展,其中分布式光伏发电的比重持续增长。在打赢脱贫攻坚战的大背景下,国家电网公司探索出一条“阳光扶贫”的扶…

JVM 记录

记录 工具 https://gceasy.io 资料 尚硅谷宋红康JVM全套教程(详解java虚拟机) https://www.bilibili.com/video/BV1PJ411n7xZ?p361 全套课程分为《内存与垃圾回收篇》《字节码与类的加载篇》《性能监控与调优篇》三个篇章。 上篇《内存与垃圾回收篇…

使用docker部署MongoDB数据库

最近由于工作需要搭建MongoDB数据库:将解析的车端采集的数据写入到数据库,由于MongoDB高可用、海量扩展、灵活数据的模型,因此选用MongoDB数据库;由于现公司只有服务器,因此考虑容器化部署MongoDB数据,特此…

java头歌-JDBC基础编程练习

第1关:JDBC更新员工密码 package step1;import java.sql.*;public class UpdatePass {// 修改数据public static void updateDB() {/********* Begin *********/// 第一步:加载驱动try {Class.forName("com.mysql.jdbc.Driver");} catch (Clas…

一种遥感影像多类变化检测方法

多任务学习孪生网络的遥感影像多类变化检测 马惠1, 刘波2, 杜世宏2 1.河南省国土空间调查规划院,郑州 450016 2.北京大学遥感与地理信息系统研究所,北京 100871 摘要: 精确掌握土地覆盖/利用的变化及变化类型对国土空间规划、生态环境监测、灾害评估等有着重要意义,然而现有…

SRC实战-cookie注入漏洞

谷歌语法-信息收集 1.查找带有ID传参的网站(可以查找sql注入漏洞) inurl:asp idxx 2.查找网站后台(多数有登陆框,可以查找弱口令,暴力破解等漏洞) site:http://xxxx.com “admin” site:http://xx.com int…

ISOLAR AUTOSAR 组件供需端口图标

软件组件端口类型分为供型端口(Provision Port)、需型端口(Required Port)、和供需型端口(Provision Required Port),其中供需性不常用。 其中又分为S/R 发送者、接受者接口,C/S 客户…

【CANN训练营笔记】AscendCL图片分类应用(C++实现)

样例介绍 基于PyTorch框架的ResNet50模型,对*.jpg图片分类,输出各图片所属分类的编号、名称。 环境介绍 华为云AI1s CPU:Intel Xeon Gold 6278C CPU 2.60GHz 内存:8G NPU:Ascend 310 环境准备 下载驱动 wget ht…

STM32学习笔记(11_2)- W25Q64简介和工作原理

无人问津也好,技不如人也罢,都应静下心来,去做该做的事。 最近在学STM32,所以也开贴记录一下主要内容,省的过目即忘。视频教程为江科大(改名江协科技),网站jiangxiekeji.com 本期学…

鸿蒙开发(七)-UIAbility启动模式

鸿蒙开发(七)-启动模式 根据代码中定义,UIAbility的启动模式有以下几种: "launchType": {"description": "Indicates the boot mode of ability.","type": "string","enum": ["standard",…

高效准确!指甲剪盖片视觉检测技术解密

指甲剪的盖片是指指甲剪的一端,通常用来盖住另一端的刀刃部分。指甲剪盖片是指甲剪的重要部分,除了保护刀刃外,还起到美观和便捷的作用。正确使用和保养指甲剪盖片可以延长指甲剪的使用寿命。 本案是对指甲剪盖片最大尺寸长75mm*宽10mm*高3mm…

采用大语言模型进行查询重写——Query Rewriting via Large Language Models

文章:Query Rewriting via Large Language Models,https://arxiv.org/abs/2403.09060 摘要 查询重写是在将查询传递给查询优化器之前处理编写不良的查询的最有效技术之一。 手动重写不可扩展,因为它容易出错并且需要深厚的专业知识。 类似地…