LLMs之Grok-1.5:Grok-1.5的简介、安装和使用方法、案例应用之详细攻略

LLMs之Grok-1.5:Grok-1.5的简介、安装和使用方法、案例应用之详细攻略

导读:xAI公司在不久前发布了Grok-1模型以及模型结构,揭示了公司到去年11月为止在大语言模型研发上的进步。2024年3月28日(美国时间),xAI以“迅雷不及掩耳之势”正式发布Grok-1.5。具体特点如下所示

>> Grok-1.5在算术和编程相关任务中的表现有很大提升,在MATH和GSM8K等数学测评中的得分均有提高。

>> 支持的上下文长度扩大到128K的token,内存容量较之前扩大16倍,可以处理更长更复杂的任务输入。

>> 在需要在长文本中快速提取信息的NIAH测评中,Grok-1.5效果显著。

>> 采用基于JAX、Rust和Kubernetes的分布式训练框架,提高训练稳定性和高效性。

>> Grok-1.5将在近期内面向早期测试人员和现有Grok用户在App Store平台推广应用。

总体来说,Grok-1.5相比Grok-1在算术逻辑和广义语言理解能力等方面有了明显提升,并支持了更长的输入上下文。它采用了优化后的训练系统,提高了模型训练的稳定性和效率。这对提升语言模型应用水平具有重要意义。

目录

相关文章

LLMs之Grok:Grok(一款具有00后特点般幽默、机智和实时的大语言模型)的简介、使用方法、案例应用之详细攻略

LLMs之Grok-1:Grok-1的简介、安装、使用方法之详细攻略

LLMs之Grok-1.5:Grok-1.5的简介、安装和使用方法、案例应用之详细攻略

Grok-1.5的简介

1、能力和推理:MATH、GSM8K、HumanEval

2、长篇上下文理解

3、Grok-1.5基础设施

4、展望未来

Grok-1.5的安装和使用方法

1、安装

Grok-1.5的案例应用


相关文章

LLMs之Grok:Grok(一款具有00后特点般幽默、机智和实时的大语言模型)的简介、使用方法、案例应用之详细攻略

LLMs之Grok:Grok(一款具有00后特点般幽默、机智和实时的大语言模型)的简介、使用方法、案例应用之详细攻略_grok-1怎么使用-CSDN博客

LLMs之Grok-1:Grok-1的简介、安装、使用方法之详细攻略

LLMs之Grok-1:Grok-1的简介、安装、使用方法之详细攻略_grok1 模型训练方法-CSDN博客

LLMs之Grok-1.5:Grok-1.5的简介、安装和使用方法、案例应用之详细攻略

LLMs之Grok-1.5:Grok-1.5的简介、安装和使用方法、案例应用之详细攻略-CSDN博客

Grok-1.5的简介

2024年3月28日(美国时间),xAI以“迅雷不及掩耳之势”正式发布Grok-1.5。Grok-1.5具备改进的推理能力和128K令牌的上下文长度。即将在X平台上推出。

Grok-1.5,是xAI最新的模型,能够理解长篇上下文和进行高级推理。Grok-1.5将在未来几天内提供给早期测试者和现有的Grok用户在X平台上使用。

两周前,xAI发布了Grok-1的模型权重和网络架构,向大家展示了直到去年11月xAI的进展。自那时以来,我们在最新的模型Grok-1.5中改进了推理和问题解决能力。

官网地址:Announcing Grok-1.5

1、能力和推理MATHGSM8KHumanEval

在Grok-1.5中最显著的改进之一是其在编码和与数学相关的任务中的表现。在我们的测试中,Grok-1.5在MATH基准测试中获得了50.6%的分数,在GSM8K基准测试中获得了90%的分数,这两个数学基准测试涵盖了从小学到高中竞赛题的广泛范围。此外,它在HumanEval基准测试中获得了74.1%的分数,该测试评估了代码生成和问题解决能力。

2、长篇上下文理解

Grok-1.5的一个新特性是其能够在其上下文窗口内处理长达128K令牌的上下文。这使得Grok的记忆容量增加了16倍,使其能够利用来自长度大大超过以往的文档的信息。

请注意,GPT-4的分数是从2023年3月的发布中获取的。对于MATH和GSM8K,我们呈现maj@1结果。对于HumanEval,我们报告pass@1基准分数。

该图显示了一个图表,可视化了模型从其上下文窗口中检索信息的能力。x轴是上下文窗口的长度,y轴是要从窗口中检索的事实的相对位置。我们使用颜色标记回忆率。整个图表都是绿色的,这意味着对于每个上下文窗口和要检索的事实的每个位置,回忆率都是100%。

此外,即使上下文窗口扩展,该模型也可以处理更长、更复杂的提示,同时保持其指示遵循能力。在“Haystack ”(NIAH)评估中,Grok-1.5展示了针对长达128K令牌的上下文中嵌入文本的强大检索能力,实现了完美的检索结果。

3、Grok-1.5基础设施

在大规模GPU集群上运行的尖端大型语言模型(LLMs)研究需要强大而灵活的基础设施。Grok-1.5建立在基于JAX、Rust和Kubernetes的自定义分布式训练框架上。该训练堆栈使我们的团队能够以最小的努力规划新的想法并在规模上训练新的架构。在大型计算集群上训练LLMs的一个主要挑战是最大程度地提高训练作业的可靠性和正常运行时间。我们的自定义训练协调器确保问题节点会自动被检测并从训练作业中排除。我们还优化了检查点、数据加载和训练作业重启,以最大程度地减少故障发生时的停机时间。如果你对我们的训练堆栈感兴趣,请申请加入我们的团队。

4、展望未来

Grok-1.5将很快提供给早期测试者,我们期待收到您的反馈,以帮助我们改进Grok。随着我们逐渐向更广泛的受众推出Grok-1.5,我们很高兴地宣布未来几天将推出几个新功能。

Grok-1.5的安装和使用方法

1、安装

等待官方开源中……

Grok-1.5的案例应用

持续更新中……

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/499955.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

labelme的安装与使用以及如何将labelme标注的json格式关键点标签转为yolo格式的标签

有任何问题我们一起交流,让我们共同学习 标注的json格式以及转换后的yolo格式示例希望得到您的指导背景及代码可用范围一、yolo关键点检测数据集格式二、labelme的安装和使用(一)labelme的安装(二)labelme的使用 三、j…

算法打卡day31|贪心算法篇05|Leetcode 435. 无重叠区间、763.划分字母区间、56. 合并区间

算法题 Leetcode 435. 无重叠区间 题目链接:435. 无重叠区间 大佬视频讲解:无重叠区间视频讲解 个人思路 和昨日的最少箭扎气球有些类似,先按照右边界排序,从左向右记录非交叉区间的个数。最后用区间总数减去非交叉区间的个数就是需要移除的…

Jenkins实现CICD

Jenkins实现CICD JenkinsCI简介环境安装新建任务源码管理构建配置发送邮件配置自动化项目定时构建 JenkinsCD简介配置ssh保证其可以免登录接下来配置github的webhook正式实现自动化打包master主分支的代码将前端三剑客代码文件发送到网站服务器对应的tomcat Jenkins面试题 Jenk…

JSON数据的类型

JSON 代表 JavaScript Object Notation。JSON是开放的标准格式,由key-value对组成。JSON的主要用于在服务器与web应用之间传输数据。 PostgreSQL提供了两种存储JSON数据的类型:json和jsonb; jsonb是json的二进制形式。 json格式写入快&#x…

书生浦语训练营2期-第一节课笔记

笔记总结: 了解大模型的发展方向、本质、以及新一代数据清洗过滤技术、从模型到应用的典型流程、获取数据集的网站、不同微调方式的使用场景和训练数据是什么,以及预训练和微调在训练优势、通信/计算调度、显存管理上的区别。 收获: 理清了预训练和微调…

T1 藻类植物 (15分)- 京东前端岗笔试编程题 题解

考试平台: 牛客网 题目类型: 选择题(40分) 3道编程题(60分) 考试时间: 2024-03-23 (两小时) T1 藻类植物 (15分) 题目描述 我们用 x i x_i xi…

霸榜京东数据库图书热卖榜!《图数据库:理论与实践》热销中

《图数据库:理论与实践》自2月上市以来,受到了数据库行业的广泛关注与热烈支持,问世两周便销量破千本!近期还荣登京东 “数据库图书榜”热卖榜第二名,广获好评! 在此,真挚的感谢各位读者的认可…

CMS(内容管理系统)

一、系统的编写可以在开源网站上下载一个相关项目,然后做2次开发 企业建站系统:MetInfo(米拓)、蝉知、SiteServer CMs等; B2C商城系统:商派Shopex、ECshop、HiShop、XpShop等; 门户建站系统:DedeCMS(织梦)、帝国CMS、PHPCMS、动易、CmsTop等; 博客系统:WordPres…

Android 开发 Spinner setSelection 不起作用

问题 Android 开发 Spinner setSelection 不起作用 详细问题 笔者进行Android项目开发,根据上一个页面用户选择数据,显示当前页面Spinner选项,调用 Spinner setSelection 不起作用。 相关java代码 spinner.setAdapter(adapter); …

使用kfed运维兵器修复ASM磁盘和磁盘组

欢迎关注“数据库运维之道”公众号,一起学习数据库技术! 本期将为大家分享“使用kfed运维兵器修复ASM磁盘和磁盘组” 的运维技能。 关键词:ORA-15053、ORA-15027、ORA-15040、ORA-01187、kfed repair、kfed merge、kfed read、strace 数据库的ASM磁盘或…

代码随想录训练营Day36:● 435. 无重叠区间 ● 763.划分字母区间 ● 56. 合并区间

435. 无重叠区间 题目链接 https://leetcode.cn/problems/non-overlapping-intervals/description/ 题目描述 思路 直接统计重叠区间的个数,就是需要删除的个数 public int eraseOverlapIntervals(int[][] intervals) {Arrays.sort(intervals,(a,b)-> Intege…

SpringBoot分布式锁自定义注解处理幂等性

SpringBoot分布式锁自定义注解处理幂等性 注解简介 注解(Annotation)是Java SE 5.0 版本开始引入的概念,它是对 Java 源代码的说明,是一种元数据(描述数据的数据)。 Java中的注解主要分为以下三类: JDK…

01_安装VMwareWorkstation虚拟机

环境:Win10 19045 软件版本:VMware-workstation-17.5.1 一、下载链接 Download VMware Workstation Pro 二、安装(无脑下一步) 安装位置自选,最好非系统盘。 增强型键盘驱动自选。 更新自选。 快捷方式自选。 三、…

MySQL学习笔记------DCL

DCL Data Control Language(数据控制语言),用来管理数据库用户、控制数据库的访问权限 一、管理用户 1、查询用户 USE mysql; select *from user; 2、创建用户 create user 用户名主机名 identified by 密码&a…

flume配置文件后不能跟注释!!

先总结:Flume配置文件后面,不能跟注释,可以单起一行写注释 报错代码: [ERROR - org.apache.flume.SinkRunner$PollingRunner.run(SinkRunner.java:158)] Unable to deliver event. Exception follows. org.apache.flume.EventDel…

计算机基础系列 —— 虚拟机代码翻译器(1)

“Most good programmers do programming not because they expect to get paid or get adulation by the public, but because it is fun to program.” ―Linus Torvalds 文中提到的所有实现都可以参考:nand2tetris_sol,但是最好还是自己学习课程实现一…

小程序中使用less

在vscode中安装插件 找到左下角齿轮的设置,点击右边图标,进入“settings.json” 加上以下代码配置 "less.compile":{"outExt": ".wxss"}

Charles抓包配置代理手机连接

Charles下载地址: Charles_100519.zip官方版下载丨最新版下载丨绿色版下载丨APP下载-123云盘123云盘为您提供Charles_100519.zip最新版正式版官方版绿色版下载,Charles_100519.zip安卓版手机版apk免费下载安装到手机,支持电脑端一键快捷安装https://www.123pan.com…

js用鼠标控制图片旋转任意角度-luckySheet

需求描述 最近有用户在使用luckySheet时,希望能够任意角度旋转图片,就像wps那样,wps如下图 wps的图片旋转 在网上只找到在canvas中进行旋转的库,没找到直接操作图片dom的库,决定直接写。 实现思路 1、点击时记录图片坐…

nginx详解(持续更新)

nginx定义 nginx安装 nginx目录 程序相关命令 服务相关命令 虚拟主机(server) 路由匹配(location) 代理(proxy_pass) 正向代理 反向代理 负载均衡(upstream) 负载均衡策略 动静分…