书生浦语大模型实战营第一课笔记

书生浦语大模型全链路开源体系

  • 课程笔记
    • 大模型的发展趋势
    • InternLM2的主要亮点
    • 模型到应用的典型流程
    • 全链路的开源工具
  • InternLM2技术报告笔记
    • 大型语言模型的发展
    • InternEvo
    • Model Structure
    • 训练数据

课程笔记

第一节课主要对大模型进行介绍,特别是书生浦语大模型的发展历史和目前的全链路开源体系进行总体介绍。

大模型的发展趋势

由专用模型向通用大模型发展。
通用大模型:一个模型应对多种任务,多种模态。一个模型可以应对文本,语音,图像等相关任务。

InternLM2的主要亮点

超长上下文综合性能全面提升优秀的对话和创作体验工具调用能力整体升级突出的数理能力和实用的数据分析功能
上传表格,可以根据用户的要求,进行数据的分析和画图展示,以及采用机器学习模型进行建模。

模型到应用的典型流程

在这里插入图片描述
实际从模型到应用中间还间隔比较多步骤,个别步骤还是比较复杂和有难度,为此,书生浦语提供了全链路的开源体系,降低这个过程的难度。

全链路的开源工具

在这里插入图片描述

InternLM2技术报告笔记

大型语言模型的发展

预训练、监督微调(SFT)和基于人类反馈的强化学习(RLHF)等阶段

InternEvo

高效的轻量级预训练框架,在减少通信开销,通信预计算的重叠,长序列训练,容错性等方面做了很多功夫进行优化。

Model Structure

在Transformer架构基础上进行了改进,从而提高了训练效率和性能。

训练数据

据来源分为网页、论文、专利和书籍,并以JSON Lines (jsonl)格式存储。
低质量的数据被排除,尽管它们的比例相对较小,但我们的实证研究发现,移除它们对于优化 模型性能和保证训练稳定性至关重要。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/493848.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【读书微言】The first summary

系列文章目录 文章目录 系列文章目录前言一、读书微言总结 前言 一、读书微言 强大的内心催生信念我们的生活是否幸福并不是依靠外在的环境,而是依靠我们内在的信念。要想成为自己命运的主宰,我们就必须形成自己的信念。只要我们能坚定自己的内在信念&…

认识线程(Thread)

目录 一、概念 1、 线程是什么 2、为啥要有线程? 3、进程和线程的区别 4、Java 的线程 和 操作系统线程 的关系 二、第⼀个多线程程序 三、创建线程 ⽅法1:继承 Thread 类 ⽅法2:实现 Runnable 接⼝ 对⽐上⾯两种⽅法: 其他变形 四、…

鸿蒙应用开发学习:用Marquee组件做个跑马灯

一、前言 鸿蒙应用的学习持续进行中,这两天阅读官方的API参考文档,发现一个有趣的组件——Marquee,用它做了个跑马灯,做个学习记录。 二、参考资料 官网文档链接如下: https://developer.huawei.com/consumer/cn/d…

【JVM】Java八股文之JVM篇

目录 一、JVM类加载与垃圾回收加载过程加载机制优点图解加载机制 分代回收分代垃圾回收新生代垃圾回收老年代垃圾回收 回收算法 一、JVM类加载与垃圾回收 面试过程中最经典的一题: 请你讲讲在JVM中类的加载过程以及垃圾回收? 加载过程 当Java虚拟机&…

双纤SFP光模块和单纤SFP光模块之间的区别

双纤SFP光模块和单纤SFP光模块是两种不同的光模块类型。对于网络部署而言,了解它们之间的区别至关重要。本文将深入探讨这两种光模块之间的差异,并介绍其特性和适用场景。 双纤与单纤SFP光模块:它们是什么? 双纤SFP光模块是常用…

回文子串 每日温度 接雨水

647. 回文子串 力扣题目链接 如果s【i】和s【j】相同 dp【i1】【j-1】也是回文串的话 (等于true) 那么dp【i】【j】也是回文串 true 定义一个bool二维数组 遍历顺序是从下到上 从左到右 因为dp【i】【j】是通过dp【i1】【j-1】推出来的 i从最后一…

120.龙芯2k1000-qt(19)-做了一个qt测试界面

主要接口和性能测试,主要针对的是龙芯2k1000. 以下是windows下的截图,大概功能就是这样吧,能想到的都想了一遍。 cpu的温度和频率采集不到,就没有放了。

冒泡排序(六大排序)

冒泡排序 冒泡排序的特性总结: 1. 冒泡排序是一种非常容易理解的排序 2. 时间复杂度:O(N^2) 3. 空间复杂度:O(1) 4. 稳定性:稳定 动图分析: 代码实现: Swap(int*p1,int*p2) {int tmp *p1;*p1*p2…

程序员35岁的职业困惑及应对之道

35岁,对许多程序员来说,是一个职业生涯的重要分水岭。在这个年龄,一些人开始感到迷茫和焦虑,担心自己的技能已经落后,难以跟上日新月异的技术变革。而另一些人则充满信心,认为多年来积累的丰富经验和扎实的技术功底,将助力他们在未来的职业道路上取得新的飞跃。 无疑,在AI、自…

【Flutter 面试题】 Flutter中的路由(Route)是什么?如何在应用程序中实现路由导航?

【Flutter 面试题】 Flutter中的路由(Route)是什么?如何在应用程序中实现路由导航? 文章目录 写在前面口述回答补充说明 写在前面 🙋 关于我 ,小雨青年 👉 CSDN博客专家,GitChat专栏…

电商产品效果图渲染用什么工具更方便?

​在电子商务的快速发展中,产品的视觉呈现变得至关重要。对于电商行业的设计师而言,选择一款既便捷又高效的渲染工具,对于快速完成高质量的产品效果图至关重要。特别是对于初学者,工具的直观性和功能性是他们最为关注的焦点。 那…

在线接口文档预言方案

在线接口文档预言方案 要求: ​ 支持自动生成接口文档 ​ 能够支持在线测试(http,websocket) ​ 对代码没有侵入性 一、目前涉及的相关技术收集 sudo apt update #更新数据 sudo apt upgrade #更新软件 sudo apt install openssh-server #下载安装…

鸿蒙HarmonyOS应用开发之Node-API常见问题

ArkTS/JS侧import xxx from libxxx.so后,使用xxx报错显示undefined/not callable 排查.cpp文件在注册模块时的模块名称与so的名称匹配一致。 如模块名为entry,则so的名字为libentry.so,napi_module中nm_modname字段应为entry,大小…

844. 走迷宫 典bfs

AC代码&#xff1a; #include<algorithm> #include<iostream> #include<cstring> #include<queue> #include<algorithm> #include<cmath> using namespace std; const int N 110;int mp[N][N]; int sx,sy; bool vis[N][N]; struct node{i…

2024年热门游泳耳机推荐!公认最佳的4大游泳耳机分享,好用不贵

随着科技的发展&#xff0c;游泳运动已经不仅仅是一项健身活动&#xff0c;更是一种生活方式。在游泳过程中&#xff0c;音乐的陪伴能够让我们更好地享受这项运动&#xff0c;同时也能提高我们的游泳效果。因此&#xff0c;选择一款适合自己的游泳耳机显得尤为重要。 然而&…

嵌入式和 Java 走哪条路?

最近看到一个物联网大三学生的疑问&#xff0c;原话如下&#xff1a; 本人普通本科物联网工程专业&#xff0c;开学大三&#xff0c;现在就很迷茫&#xff0c;不打算考研了&#xff0c;准备直接就业&#xff0c;平时一直在实验室参加飞思卡尔智能车比赛&#xff0c;本来是想走嵌…

BRICK POP展示了有趣的链上游戏玩法与奖励

新游戏BRICK POP将Sui区块链技术与低Gas费用&#xff0c;以及我们在Web3游戏开发方面的专业知识无缝结合。通过充分利用Sui和我们自己的INNO平台的优势&#xff0c;BRICK POP为玩家提供了一个融合了前沿技术和引人入胜游戏的沉浸式游戏体验。BRICK POP游戏设计为实时交易和高用…

配置文件 application properties

配置文件 application properties 1 参数交由配置文件集中管理 Value(“${}”)用于外部配置的属性注入 在之前编写的程序中进行文件上传时&#xff0c;需要调用AliOSSUtils工具类&#xff0c;将文件上传到阿里云OSS对象存储服务当中。而在调用工具类进行文件上传时&#xff0c…

JaveSE—IO流详解:对象输入输出流(序列化及反序列化)

一. 基础理论知识 &#x1f4cc;怎么理解对象输入输出流 &#xff1f; ○ 把java中的对象输出到文件中&#xff0c;从文件中把对象输入到程序中. &#x1f4cc;为什么要这样做(目的) &#xff1f; 当我们创建一个对象时, 如new Student( "小张",20 ); 数据存储在…