百度文心一言正式亮相

OpenAI 刚发布了 GPT-4,百度预热已久的人工智能生成式对话产品也终于亮相了。昨天下午,文心一言 (ERNIE Bot)—— 百度全新一代知识增强大语言模型、文心大模型家族的新成员,正式在百度总部 “挥手点江山” 会议室里发布。

发布会一开场,百度 CEO 李彦宏先给大家打了一剂预防针:

从某种意义上说百度为此(发布文心一言)已经准备了多年,我们十几年前就开始投入 AI 研究,2019 年就推出了文心大语言模型,今天的文心一言是过去多年努力的延续。

但也不能说我们完全 ready 了,文心一言要对标 ChatGPT、甚至是对标 GPT-4 的门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。我自己测试感觉还是有很多不完美的地方。

李彦宏指出:“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”

文心一言,能做什么?

文心一言作为国内几个大厂中诞生出的首个生成式 AI 产品,到底能实现什么样的功能呢?百度 CEO 李彦宏也没有藏着掖着,在发布会一开始就展现了文心一言的 5 个使用场景,并且针对这些使用场景一一进行了功能展示。

  • 文学创作;

  • 商业文案的创作;

  • 数理逻辑的推算;

  • 中文的理解;

  • 多模态生成;

目前用户在体验 ChatGPT 这样的生成式 AI 时会发现一个问题,那就是即便有事实依据,AI 依然会一本正经地胡说八道(例如前段时间 Google Bard 出现的失误),如果用户没有经过验证,轻信了 AI 生成的内容,反而会铸成大错。那么面对这样的问题,文心一言能否轻松应对呢?

场景一:在第一个场景对话中,文心一言准确地提供了《三体》作者、核心内容、电视剧演职人员、甚至是演员本人的共同点与差异信息,在保证事实性问题不出错的情况下,亦展现了在续写内容方面的创作能力。

场景二:针对商业文案创作,现场则是演示三轮对话,涉及了给公司起个名字、写 Slogan,以及写篇新闻稿。从现场的演示来看,文心一言非常了解国人的喜好,以及中文字词中所蕴含的深意。以给科技服务公司取名字这个环节为例,给出的答案完全符合国人对于这类公司取名的畅想,客户通过名称一眼就能知道公司类型甚至是业务方向。

场景三:在数理逻辑推演环节,则是演示了一个家喻户晓的鸡兔同笼问题,但百度为了展示文心一言的能力,偷偷设置了一个 “陷阱”,给出了一个完全无解的题目。不过这并没有难倒文心一言,它立刻发现题目出错,后来经过修改,文心一言准确地回答出问题,并给出了简单的解题思路。

场景四:在发布会期间,百度 CEO 李彦宏也大方承认,目前文心一言虽然也支持英文问答,但实力依然有限。而主打的中文理解,无论是成语「洛阳纸贵」的含义,还是成语背后隐含的经济原理,甚至是对 “藏头诗” 这个词的理解,以及最后生成的诗句,在这一轮则是展现的淋漓尽致。

场景五:多模态生成是前几天 GPT-4 发布时着重增强的一大特性,当时 OpenAI 展示了从草图生成代码的能力。文心一言在这个环节也是 Show 了一把多模态生成,除了之前几个场景中所展示的文字对话能力,在场景五中还展示出了图像、视频和语音(方言)生成方面的能力,目前火热的 ChatGPT 还无法实现后面列举出的这几个功能。

与 Bing Chat 和 ChatGPT 的对比

相比 ChatGPT 和 Bing Chat,“文心一言” 最大的不同点在于多模态生成,即可以通过语言生成海报、语音甚至视频内容。发布会演示中,李彦宏展示了使用文心一言生成活动海报、方言语音,并根据提问内容生成与活动相关的视频。不过生成视频的成本较高,现阶段尚未对所有用户开放。

图片、视频的生成能力确实让我们眼前一亮,李彦宏也表示,多模态生成式 AI 是一个明确的发展趋势。

演示过程中,李彦宏多次强调百度在中文语言的处理上,处于独一无二的位置。

下面的例子展示了用发布会中演示的内容去询问 ChatGPT(3.5 版)以及 Bing Chat 的回答。

首先是关于《三体》的提问,Bing Chat 和文心一言均能正确回答作者是谁、来自哪里的问题,而 ChatGPT 则把刘慈欣的籍贯错标成了山东。

Bing Chat 的回答还显示其信息来源是百度百科。

而在关于 2023 年初上演的《三体》电视剧版演员的问题中,信息库停留在 2021 年的 ChatGPT 再次犯错,表示《三体》电视剧暂未开拍,而 Bing Chat 则在豆瓣中找到了答案。

在商业文案创作方面,三者均可以给出它们的看法,ChatGPT 还贴心地附上了英文名。

而 Bing Chat 则在第一次询问时识别错了问题含义,没有提供准确的公司名,而是提供了如何起一个公司名的解决方案。

虽然在此前的使用中,不论是 ChatGPT 还是 Bing Chat,它们在做数学题时并不能让我们完全放心。不过百度发布会中提到的鸡兔同笼问题并没有难倒二者,均准确地做出了解答。

可以看到,Bing Chat 的解读像是一位循循善诱的老师,而文心一言的回答则有点像课后的参考答案。

来到中文理解方面,文心一言的优势就体现出来了。

在询问「当时洛阳的纸到底有多贵」时,ChatGPT 误以为询问的是唐代的物价,因此返回的信息是洛阳的纸一点都不贵,Bing Chat 识别上没有问题,但也没有给出准确数据。

而文心一言给出两三千文的价格,至少与搜索得到的数据是一致的。

相信你也注意到了,且不说写的内容如何,ChatGPT 和 Bing Chat 都没有理解什么是藏头诗,相比下来,百度文心一言的表现确实出色。

由此可见,文心一言在中文领域的表现确实要优于 ChatGPT、Bing Chat。不过,李彦宏在发布会中也提到,虽然中文方面优势明显,但文心一言针对英文语种、代码场景的训练还不够多,表现也不够好,相信接下来百度会迅速提升。

技术架构 & 特性

百度首席技术官王海峰在发布会上详解了文心一言背后的文心大模型及技术特性。

百度在人工智能四层架构中有全栈布局:包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用;文心一言则位于模型层。

王海峰表示,文心一言能迅速推出主要是基于百度十一年来的积累,且四层之间形成了层到层的反馈、端到端的优化。尤其是框架层的飞桨和模型层的文心大模型之间的协同优化,在开发文心一言的过程中起到了至关重要的作用。

根据介绍,文心一言是新一代知识增强大语言模型,基于 ERNIE 及 PLATO 系列模型研发;采用了六项核心技术,包括:监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是同类大型语言模型普遍具备的能力,ERNIE 和 PLATO 中已经有应用和积累,在一言中又有了进一步强化和打磨;后三项则是百度已有特色技术的再创新。

文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及 5500 亿事实的知识图谱等。但王海峰也坦言,目前大模型的训练还不够充分。将来随着真实用户的反馈越来越多,文心一言的效果和能力都会逐渐提升。

体验途径

百度已公布文心一言的邀请测试方案。

3 月 16 日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户

企业客户则可以使用百度智能云开放的「文心一言」 API 接口
(https://cloud.baidu.com/survey_summit/wenxin.html?track=C896034 ),尚未获取 API 的企业可在百度智能云平台进行预约。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/2427.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux第一个小程序git三板斧

目录 1.Linux项目自动化构建工具 - make/makefile 1.1.makefile原理 1.2.项目清理 2.第一个小程序 - 进度条 3.git三板斧 1.Linux项目自动化构建工具 - make/makefile make是一条命令,makefile是一个文件,两个搭配使用,完成项目自动化构建。 …

HashData携手新炬网络 共推国产云数仓产业发展

3月22日,酷克数据宣布与国内知名IT智能运维服务商新炬网络签署战略合作协议,新炬网络成为酷克数据核心战略合作伙伴。 双方约定,将通过优势互补、资源共享的方式,建立长期合作模式和信息共享机制,在数据库相关领域展开…

Prometheus监控实战之Blackbox_exporter黑盒监测

1 Blackbox_exporter应用场景 blackbox_exporter是Prometheus官方提供的exporter之一,可以提供HTTP、HTTPS、DNS、TCP以及ICMP的方式对网络进行探测。 1.1 HTTP 测试 定义 Request Header信息 判断 Http status / Http Respones Header / Http Body内容 1.2 TC…

第二十二章 opengl之高级OpenGL(几何着色器)

OpenGL使用几何着色器用点造物体爆破物体法向量可视化在顶点和片段着色器之间有一个可选的几何着色器(Geometry Shader), 几何着色器的输入是一个图元(如点或三角形)的一组顶点。几何着色器可以在顶点发送到下一着色器阶段之前对它们随意变换…

基于YOLOv5的疲劳驾驶检测系统(Python+清新界面+数据集)

摘要:基于YOLOv5的疲劳驾驶检测系统使用深度学习技术检测常见驾驶图片、视频和实时视频中的疲劳行为,识别其闭眼、打哈欠等结果并记录和保存,以防止交通事故发生。本文详细介绍疲劳驾驶检测系统实现原理的同时,给出Python的实现代…

第十四届蓝桥杯三月真题刷题训练——第 19 天

第 1 题:灌溉_BFS板子题 题目描述 小蓝负责花园的灌溉工作。 花园可以看成一个 n 行 m 列的方格图形。中间有一部分位置上安装有出水管。 小蓝可以控制一个按钮同时打开所有的出水管,打开时,有出水管的位置可以被认为已经灌溉好。 每经过一分…

一文带你看懂电压放大器和功率放大器的区别

很多人对于电压放大器和功率放大器总是分不太清,在实际应用过程中,电压放大器和功率放大器所起到的作用都是相同的。对于功率放大器和电压放大器的区别,今天就让安泰电子来带我们一起看看。功率放大器和电压放大器的主要区别是:功…

花青染料Sulfo-Cyanine7 N3,Cy7 azide,Sulfo-Cy7 N3,用于点击化学的水溶NIR azide染料

●中文名:磺化花青素Cyanine7叠氮,磺化花青素Cy7叠氮●英文名:Sulfo-Cyanine7 azide,Sulfo-Cyanine7 N3,Sulfo-Cy7 azide,Sulfo-Cyanine7 N3【产品理化指标】:CAS号:N/A分子式&#…

应用层协议 HTTP HTTPS

目录 应用层 再谈 "协议" 序列化和反序列化 关于 json库 request序列化 request反序列化 response序列化 response反序列化 PS:命令宏 HTTP协议 认识URL urlencode和urldecode HTTP协议格式 HTTP请求 HTTP响应 请求方法 ​编辑 HT…

自动化测试学习(七)-正则表达式,你真的会用吗?

目录 一、正则表达式在python中如何使用 二、用正则表达式匹配更多模式 三、常用字符分类的缩写代码 总结 所谓正则表达式(regex),就是一种模式匹配,学会用正则匹配,就可以达到事半功倍的效果。 一、正则表达式在…

幸福的烦恼:显卡算力太高而pytorch版本太低不支持

NVIDIA GeForce RTX 3090 with CUDA capability sm_86 is not compatible with the current PyTorch installation. The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60 sm_70.写在最前面项目场景:问题描述原因分析:解决方案&am…

Linux(网络基础---数据链接层)

文章目录0. 前言1. 以太网的帧格式2. 再谈局域网原理3. 汇总整体通信流程,补全细节3-1 理解MAC地址和IP地址3-2 MTU1. 认识MTU2. MTU对IP协议的影响3. MTU对UDP协议的影响4. MTU对于TCP协议的影响3-3 ARP协议1. 基本概念2. ARP协议的作用3. ARP数据报的格式4. 简述a…

ChatGPT能够改变时代吗?一点点思考

都知道ChatGPT的出现对整个世界产生了剧烈的影响,前不久出的ChatGPT4更是在ChatGPT3.5的基础上展现了更强的功能。比如说同一个问题,ChatGPT3.5还是乱答的,ChatGPT4已经能给出正确解了。当然这只能说明技术是进步的。 虽然如此,很…

图像识别模型

一、数据准备 首先要做一些数据准备方面的工作:一是把数据集切分为训练集和验证集, 二是转换为tfrecord 格式。在data_prepare/文件夹中提供了会用到的数据集和代码。首先要将自己的数据集切分为训练集和验证集,训练集用于训练模型…

内存泄漏定位工具之 valgrind

内存泄漏检测工具 文章目录内存泄漏检测工具一、valgrind介绍1. memcheck2. cachegrind3. helgrind二、源码下载三、命令操作1.memcheck 工具四、虚拟机下使用1. x86编译2. 正常程序测试3. 申请内存不释放测试4. 内存越界的测试5. 读写已经释放的内存五、ARM平台使用1.交叉编译…

【web前端开发】CSS背景相关内容

文章目录背景颜色背景图片背景平铺背景位置background(复合属性)背景颜色 属性名:background-color 取值:表示颜色的取值都可以填写,如:rgb注意点: 背景颜色默认是透明的背景颜色不影响盒子的大小 实用技巧:在平时使用一些盒子时,可以给盒子设置背景颜色,这样可以看清盒子的…

网络编程套接字( TCP )

目录 1、实现一个TCP网络程序(单进程版) 1.1、服务端serverTcp.cc文件 服务端创建套接字 服务端绑定 服务端监听 服务端获取连接 服务端提供服务 服务端main函数命令行参数 服务端serverTcp.cc总代码 1.2、客户端clientTcp.cc文件 客户端main函数命令行…

Springboot Long类型数据太长返回给前端,精度丢失问题 复现、解决

前言 惯例,收到兄弟求救,关于long类型丢失精度的问题: 存在一个初学者不会,就会有第二个初学者不会,所以我出手。 正文 不多说,开搞。 如题, 后端返回的数据 给到 前端, Long类型数…

Flutter内阴影

前言 在前几天的业务需求中,UI给出的页面中有新拟态的按钮,就是带内部阴影的按钮,如果是利用css中box-shadow的属性,那么实现起来很简单,但是奈何Flutter中的Container的BoxShadow不具备inset内部阴影的功能&#xff…

【Linux内网穿透】使用SFTP工具快速实现内网穿透

文章目录内网穿透简介1. 查看地址2.局域网测试连接3.创建tcp隧道3.1. 安装cpolar4.远程访问5.固定TCP地址内网穿透简介 是一种通过公网将内网服务暴露出来的技术,可以使得内网服务可以被外网访问。以下是内网穿透的一些应用: 远程控制:通过内…