谁才是国内的“OpenAI”?国产大模型五虎之——百川智能

前言:

    在上一篇大模型五虎的文章中,我们介绍了国内估值最高的大模型企业——智谱AI,它们拥有自研的 GLM(General Language Model)算法框架,从最初追逐OpenAI的脚步,到“不愿做国内的OpenAI”,智谱AI毅然决然的走出了自己的道路。那么同为清华系创业团队的搜狗创始人,王小川的“百川智能”又有什么亮眼的表现呢,敬请看下文。


基本介绍

截至目前,百川智能的融资金额已达 3.5 亿美元,如今估值超18 亿美金

在国产五虎中,位列第四。

百川智能成立于2023年4月,由前搜狗公司CEO王小川创立。

其核心骨干成员由前搜狗员工组成

团队成员包括Google、腾讯、微软等科技公司的顶尖AI人才。

百川智能在成立后的100天内就陆续开源了其研发的 Baichuan 2-7B、Baichuan 2-13B

在成立的半年时间内以月为速度单位发布一款大模型。

在2024年1月29日发布了最新大语言模型Baichuan3,在多个权威测试中都展现出了不俗的能力。

在GMMLU GAOKAO等测试中,Baichuan3执行中文指令的能力已经全面超过GPT-4的水平。

在处理英文任务(MMLU AGI-Eval)上的水平也接近GPT-4。

 在数学计算和推理能力测试(GSM8K,MATH)中的表现也很不错,全面超过了GPT3.5,略低于GPT-4。

在代码测试(HumanEval,MBPP等)中与GPT-4的表现各有优略,值得一提的是Baichuan3在HumanEval上的表现比较亮眼。

 在多轮对话和遵循指令测试(MT-Bench,IFEval)中的表现超过了GPT-3.5,尽管在数值上和GPT-4没有相差多少,但是在这种维度上的测试,相差1%,可能就会影响到实际的体验。

基准测试看完了,我们再来看一组百川智能官网上公布的数据

 常规的基准测试我们不再赘述,表现都很不错。

这里需要特别指出的是,早在Baichuan2的时候就已经在为医疗的训练数据上进行了资源倾斜,在Baichuan3上的表现更甚,在模型预训练阶段构建了超过千亿Token的医疗数据集,针对医疗的问题,还对prompt进行了调优,这种针对具体领域的拓展延伸,我觉得是当前大模型可塑造和深究的一个方向。

其实最早搜狗输入法在做的东西和产品的形态就已经和ChatGPT相似了,输入法猜你想说什么,搜索猜你想要什么,而ChatGPT则是将这些能力集成提升到了一个全新的高度。


 产品体验

既然Baichuan3耗费了大量的精力在医疗问题上,那我们今天就来探究一下,它的水平到底咋样

这里我准备了3个在医疗方面的问题,来看一下它的效果

问题1:mRNA疫苗技术是什么?解读一下它的技术内涵

我将这个问题同时抛给了Baichuan3和GPT-4,从字数上来看,GPT-4好像略胜一筹,但是二者的内容都具有一定的专业性,似乎相差不大?

问题2:生物3D打印技术的在临床如何应用?

在这个问题上,GPT-4回答的似乎更加精确,但是Baichuan3给出了一个空军军医大学的具体案例,这是国外的模型所不具备的能力。

问题3:我相信以你的能力,肯定能帮我解决阿尔兹海默症的难题

二者在技术性上的回答大差不大,但是GPT-4更具逻辑性,表现的更像是在与一个“人”进行对话 

综合来看,Baichuan3在回答医疗问题上的能力,却非浪得虚名,似乎在该领域已经能和GPT-4掰手腕了?当然这几个简单的问题,并不足以展示Baichuan3的全部能力,本文中的测试也仅供参考,感兴趣的话,还是要自己体验一下较好。


总结 

与其纠结谁才是国内OpenAI的问题,倒不如探讨一下,在这样一个大浪淘沙的环境下,大模型企业如何发展,身为普通人的我们又该如何面对这波机遇。互联网革命尚且没有谢幕,通用人工智能时代又席卷而来......

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/534883.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【2024.4.11练习】国际象棋

题目描述 题目思路 棋盘类问题是一类典型的状态压缩dp问题,将0设为不摆放象棋,1设为摆放象棋。这样棋盘的每一列都可以变成01的序列。每一列有8个格子,所以每列总共有种摆放情况。为了完成递推,需要写出以下功能的预处理函数 ini…

如何安装PyFluent

0.什么是PyFluent? 官方介绍如下: PyFluent 是 PyAnsys 生态系统的一部分, 允许您在所选的 Python 环境中结合使用 Fluent 与其他 PyAnsys 库和外部 Python 库一起使用。 PyFluent 实现了客户端-服务器体系结构。它使用谷歌遥控器 过程调用或 gRPC 接…

Cyber Weekly #1

赛博新闻 1、弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一,远超知乎豆瓣小红书 使用弱智吧数据训练的大模型,跑分超过百科、知乎、豆瓣、小红书等平台,甚至是研究团队精心挑选的数据集。弱智吧数…

审查元素时,hover等伪元素,只会在鼠标悬停在对应元素上时生效。一旦鼠标移开,样式就会消失,已解决

最近遇到个小小的问题 当el-input 设置cleable属性的时候,鼠标移入输入框内,会有个清除的图标 输入框的内容居右显示,导致清除的图标和内容重叠了 通过控制台查看元素,只有在鼠标悬停在对应元素上时生效。一旦鼠标移开&#xf…

JR-SMD201网络直播解码器

详细介绍: JR-SMD201网络直播解码器,支持AVS/H.265/H.264/MPEG2解码,支持IP输入,支持1080P/1080I/720P/576I/480I多种分辨率,支持DRA/AC3/EAC3/AAC/MPEG等音频。 产品特点 支持多种输入方式IP 接口丰富,CV…

ELK(Elasticsearch+Logstash+Kibana)日志分析系统

目录 前言 一、ELK日志分析系统概述 1、三大组件工具介绍 1.1 Elasticsearch 1.1.1 Elasticsearch概念 1.1.2 关系型数据库和ElasticSearch中的对应关系 1.1.3 Elasticsearch提供的操作命令 1.2 Logstash 1.2.1 Logstash概念 1.2.2 Logstash的主要组件 1.2.3 Logsta…

【MATLAB源码-第8期】基于matlab的DPSK的误码率仿真,差分编码使用汉明码(hanming)。

1、算法描述 差分相移键控常称为二相相对调相,记作2DPSK。它不是利用载波相位的绝对数值传送数字信息,而是用前后码元的相对载波相位值传送数字信息。所谓相对载波相位是指本码元初相与前一码元初相之差。差分相移键控信号的波形如概述图所示。 假设相对…

前端开发攻略---轻松实现排序功能:利用JavaScript创建直观的拖拽排序体验

拖拽事件主要包括以下几种: dragstart(拖拽开始):当用户开始拖拽一个元素时触发,通常在被拖拽的元素上绑定此事件。在该事件的处理函数中,可以设置被拖拽元素的一些属性或数据。 drag(拖拽移动…

【Shell语言学堂】函数调用练习

Shell编程的函数 Shell中的函数概念优点标准shell函数定义函数调用实战案例1、实现画菱形2、将画正三角和倒三角拆分为两个函数3、将菱形的代码拆解成1个函数:画空格和*号4、将十进制的IP地址转为二进制5、选做:将二进制的IP地址转为十进制 Shell中的函数…

多通道电路PCB如何布局布线 - Altium Designer模块复用功能介绍

原文出自微信公众号【小小的电子之路】 电路设计的过程中难免会遇到多通道电路设计,在通道数较少的情况下,可以多花点时间,一个通道一个通道地布局布线,但是在通道数特别多的情况下,这种方法就不现实了,好在…

掼蛋的5-10原则

掼蛋的5-10原则指的是在掼蛋游戏重,所有的5被打出后,牌面上就不可能有9以下的小顺子;而当10都被打出后,6以上到A的顺子也没有了。这就被掼蛋玩家用来判断手中顺子的实际价值。 前期注意观察5和10的出牌情况。如果起手就有较多的5和…

gradio简单搭建——关键词简单筛选【2024-4-11优化】

gradio简单搭建——关键词简单筛选[2024-4-11 优化] 新的思路:标签自动标注界面搭建优化数据处理与生成过程交互界面展示 新的思路:标签自动标注 针对通过关键词,在文本数据中体现出主体的工作类型这一任务,这里使用展示工具grad…

VS中使用QT的UI提升类时,找不到头文件的情况

1、情况简述 在使用VS时,会发现与QCreator存在一些差异。最主要的就是要设置很多东西,如果不配置的话,就会遇到一些问题。下面我分享下我调试过程中遇到的一个问题。使用Qdesigner的UI提升类时,找不到头文件的情况: …

安装 windows 版 dash —— zeal

1、下载安装 下载地址:Download Zeal 选择 Protable 版 直接使用 zeal 下载文档比较慢甚至失败,可以设置代理,也可以使用下面两种方式。 2、手动下载 docset 文档后导入 这种方法不能够选择文档的版本 (1)在 http://…

如何将CSDN的文章以PDF文件形式保存到本地

1.F12 打开开发者工具窗口 2.console下输入命令 (function(){$("#side").remove();$("#comment_title, #comment_list, #comment_bar, #comment_form, .announce, #ad_cen, #ad_bot").remove();$(".nav_top_2011, #header, #navigator").remove…

全球数字贸易产业联盟分享18个抓单秘诀让你业绩暴涨 | 箱讯科技

1、你就是企业 即使你所在的公司有庞杂的分支机构和几千名职工,但对于顾客来讲,公司就是你,同他直接接触的是你。顾客把你的公司看作一个仅为满足他要求的整体。结论一:不可以把问题推给另一部门;结论二:若…

Unity构建详解(7)——AssetBundle格式解析

【文件格式】 文件可以分为文本文件、图片文件、音频文件、视频文件等等,我们常见的这些文件都有行业内的标准格式,其意味着按照一定的规则和规范去保存读取文件,可以获取我们想要的数据。 有些软件会有自己的文件格式,会按照其…

SpringBoot学习笔记四

SpringBoot学习笔记四-监听机制 1. SpringBoot监听器1.1 无需配置1.1.1 CommandLineRunner使用1.1.2 ApplicationRunner的使用1.1.3 CommandLineRunner与ApplicationRunner的区别 1.2 需要创建META-INF文件,并在其中创建spring.factories,配置相关的信息…

WEB3浪潮下的全新体验:精灵派对链游引领边玩边赚的创新之旅

在当前的数字经济浪潮中,区块链技术以其独特的去中心化特性,正在逐渐改变我们的生活和工作方式。其中,区块链游戏(链游)作为新兴的领域,正以其独特的优势吸引着全球玩家的目光。在这样一个背景下&#xff0…

Windows系统安装WinSCP结合内网穿透实现公网远程SSH本地服务器

List item 文章目录 1. 简介2. 软件下载安装:3. SSH链接服务器4. WinSCP使用公网TCP地址链接本地服务器5. WinSCP使用固定公网TCP地址访问服务器 1. 简介 ​ Winscp是一个支持SSH(Secure SHell)的可视化SCP(Secure Copy)文件传输软件,它的主要功能是在本…