千帆大模型平台升级十大能力,企业级 RAG 全面升级

月 5 日,2024 世界人工智能大会(WAIC)期间,百度智能云大模型助力新质生产力发展论坛在在上海世博展览馆举办。会上,百度智能云宣布文心大模型 4.0 Turbo(ERNIE 4.0 Turbo)面向企业客户全面开放;文心旗舰款模型 ERNIE 4.0 和 ERNIE 3.5 宣布大幅降价;百度智能云千帆大模型平台针对模型效果、推理性价比以及 AI 原生应用开发提效发布十余项能力升级。

(百度副总裁谢广军:ERNIE 4.0 Turbo 面向企业客户开放)

ERNIE 4.0 Turbo 面向企业客户开放,文心旗舰模型大幅降价

大模型日均调用量突破 5 亿次、二季度环比增长 150%;累计服务 15 万家企业用户、累计帮助用户精调了 2.1 万个大模型;帮助用户开发出了 55 万个 AI 原生应用。这是百度智能云千帆平台交出的 2024「年中报」,这些数据说明,大模型已经真正进入到了指数级增长的阶段。

百度副总裁谢广军表示,在模型方面,文心系列最新旗舰版大模型—— ERNIE 4.0 Turbo 面向企业客户全面开放,输入输出价格分别低至 0.03 元/千 Tokens、0.06 元/千 Tokens。

此外,ERNIE 4.0、ERNIE 3.5 两款旗舰模型大幅降价;ERNIE Speed、ERNIE Lite 两款主力模型持续免费,进一步帮助客户降低大模型使用门槛和试错成本,加速业务创新。

谢广军表示,「用好」模型,与用「好模型」同样重要。千帆 ModelBuilder 作为「双一流平台」,不仅为用户提供了一流的模型,也为用户提供了一流的工具链。

千帆 ModelBuilder 发布全新特性,模型效果更好、推理性价比更高

在大模型工具链方面,ModelBuilder 业界首发 DPO(Direct Preference Optimization,直接偏好优化)、KTO(Kahneman-Taversky Optimization)两类偏好对齐训练方法,帮助用户在无需构建强化学习或奖励函数的条件下,直接利用人类对模型生成文本片段的偏好排序来进行模型优化,大幅提升模型精调效率。

在模型推理方面,ModelBuilder 新增支持 wint8、ptq 等模型量化压缩算法,在不损失模型性能的前提下,通过将模型参数、权重等数值转换为更轻量级的表示方式,从而大幅减少模型推理运算量与延迟,极大提升模型在实际应用场景中的性价比。

此外,针对企业精调专用模型经常遇到的特定场景数据欠缺、大模型通用能力被遗忘等问题, ModelBuilder 全新推出混合文心大模型高质量数据功能,支持用户将文心大模型通用混合语料、文心大模型垂直领域语料与业务数据进行融合,精调出更稳定、效果更好的专用大模型。

千帆 AppBuilder 新增支持私有化部署,全面升级企业级 RAG

千帆 AppBuilder 作为企业级 AI 原生应用开发平台,支持开发者使用预置组件轻松定制自己的业务流程。目前,包含大模型能力组件,AI 能力组件,第三方 API 以及基础云组件等 AppBuilder 官方组件已更新至 60+ 个。开发者还可以集成、扩建自己特色的组件,灵活选用符合业务特点的不同规格大模型,轻松构建场景化的 AI 原生应用。

全新升级的企业级检索增强生成(RAG),针对企业海量知识检索、自定义策略、企业级安全保障三大业界通用难题进行了全面升级:

  • 新增云存储服务支持,实现资源的弹性扩缩容,打破传统 RAG 普遍使用公共资源池并限制资源上传数量的瓶颈,极大提升检索服务的可扩展性;
  • 针对传统 RAG 在知识预处理环节遇到的系统无法理解文档内容,仅根据内容长度进行简单切片,影响最终知识检索准确性等问题,AppBuilder 此次全面开放了包括各类文档解析、切片策略、多种检索与召回策略在内的各种 RAG 调配功能和策略选项,以产品化方式开放百度企业服务经验,业界唯一;
  • 基于全栈云技术研发投入,持续提升服务安全性与稳定性,保障客户知识检索业务的生产级使用。

此外,千帆 AppBuilder 针对传统 RAG 难以触及公网内容、资源,检索结果时效性不足等问题,全新推出「RAG with 百度搜索」功能,将百度搜索在时效性、客观性方面的优势,与 RAG 在私域知识响应、语言灵活性方面的优势进行能力互补,快速高质量响应用户需求,同时,实现文本、图像、视频等多模态内容的流畅交互体验。

加持百度搜索后的 RAG 还支持用户使用小型专家模型实现智能助手的准确问答,针对 PC、IoT 设备、车机等端侧设备智能算力有限的特点,提供不同尺寸模型进行适配,从而实现性能和效价比的最佳组合。

会上,百度智能云还宣布千帆 AppBuilder 全面支持私有化部署,满足企业数据域内管理、业务高度定制化以及自主可控等要求。在部署方式上,百度智能云同时支持 AppBuilder 与大模型全部私有化,和 AppBuilder 私有化结合调用公有云上大模型的混合云部署方式,满足不同客户的业务需求。

在水务领域,北京污水宝科技有限公司通过千帆 AppBuilder 快速构建了 AI 问答应用——污水宝 AI 助理,无需复杂的开发过程,即可实现环保领域工程信息的智能问答。污水宝支持通过自然语言获取项目线索、项目进度和联系方式等工程信息,方便用户和企业进行相关业务咨询。

百度智能云千帆行业场景解决方案正式发布,加速大模型行业落地

为了进一步降低行业客户落地大模型门槛,百度智能云此次推出千帆行业场景解决方案。基于百度智能云在各行业场景中的最佳实践,打造了场景模型、模型精调样板间、Prompt 模板、应用样板间等参考「样例」,方便有相似业务诉求的客户直接使用或一键复制即可完成大模型应用开发。

「目前,千帆平台已经优先上线了包括教育、人事、企业服务、文娱、医疗在内的 5 大行业,20 多个场景解决方案。」谢广军表示。

在医疗领域,杭州全诊医学基于百度智能云千帆平台打造了 AI Agent 应用——AI 医生助理,在预诊、诊间、住院、手术等多个医疗场景中为医护人员提供病史采集、病历书写、诊疗辅助等支持,大幅提升医护人员工作效率、改善病患就医体验。目前,AI 医生助理服务已经覆盖 45 家三甲医院,105 个区县超 1.5 万家诊所,每日生成门诊病历草稿多达 15 万份,病历质量提升超过 45%,患者服务数量因此提升了 1.5 倍!

在教育领域,中国高科集团旗下英腾教育面向医学考试场景,联合百度智能云基于千帆平台打造了业内首个 AI 医学考试应用产品考试宝典。通过对自有垂类高度结构化数据,覆盖 1800+ 医学考试科目超过 10 亿的医学文本 tokens,以及英腾教育积累的百亿级专业知识数据进行高效处理和学习,考试宝典能够帮助考生制定个性化的学习计划、精准答疑、依托测评精准定位知识薄弱环节,以及智能推荐学习重点,助力考生大幅提升备考效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/783174.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

人工智能在三级淋巴结:肿瘤浸润淋巴细胞领域的系统研究进展|顶刊速递·24-07-08

小罗碎碎念 本期文献主题:人工智能在三级淋巴结/肿瘤浸润淋巴细胞领域的系统分析 关于三级淋巴结和肿瘤浸润淋巴细胞的文献,会是接下来的分析重点,期间也会穿插临床文献&项目复现的推文。 另外再说点科研道路上的题外话,也算是…

GitLab CI/CD实现项目自动化部署

1 GitLab CI/CD介绍 GitLab CI/CD 是 GitLab 中集成的一套用于软件开发的持续集成(Continuous Integration)、持续交付(Continuous Delivery)和持续部署(Continuous Deployment)工具。这套系统允许开发团队…

一手洞悉泰国slot线上游戏投放本土网盟CPI计费广告优势

一手洞悉泰国slot线上游戏投放本土网盟CPI计费广告优势 ​在泰国这个拥有独特文化背景和审美观念的国家,Slots游戏以其丰富的玩法和刺激的体验迅速赢得了玩家们的喜爱。然而,要在竞争激烈的市场中脱颖而出,有效的推广策略显得尤为重要。本土…

JVM专题之垃圾收集器

JVM参数 3.1.1 标准参数 -version -help -server -cp 3.1.2 -X参数 非标准参数,也就是在JDK各个版本中可能会变动 ``` -Xint 解释执行 -Xcomp 第一次使用就编译成本地代码 -Xmixed 混合模式,JVM自己来决定 3.1.3 -XX参数 > 使用得最多的参数类型 > > 非…

Docassemble interview 未授权任意文件读取漏洞复现(CVE-2024-27292)

0x01 产品简介 Docassemble是一款强大的开源工具,主要用于自动化生成和定制复杂文档,特别是在法律文档处理领域表现出色。由Jonathan Pyle个人开发者开发,是一个免费的开源专家系统,用于指导访谈和文档组装。Docassemble基于Python编写,充分利用了Python的灵活性和广泛的…

【论文阅读】-- Visual Traffic Jam Analysis Based on Trajectory Data

基于轨迹数据的可视化交通拥堵分析 摘要1 引言2 相关工作2.1 交通事件检测2.2 交通可视化2.3 传播图可视化 3 概述3.1 设计要求3.2 输入数据说明3.3 交通拥堵数据模型3.4 工作流程 4 预处理4.1 路网处理4.2 GPS数据清理4.3 地图匹配4.4 道路速度计算4.5 交通拥堵检测4.6 传播图…

Spring Cloud: OpenFeign 超时重试机制

超时重试是一种用于网络通信的常用策略,目的是在请求未能在规定时间内获得响应或响应超时的情况下,重新发送请求。具体来说,当发起请求后,如果在设定的时间内未能收到预期的响应,就会启动超时重试机制,重新…

EPICS数据库示例

本文目标是使用EPICS数据库示例帮助新手理解如何使用不同的示例。 1、使用seq和mbbo的简单选择器 这个简单示例展示了如何使用一个mbbo和一个seq来旋转哪个值将被设置到一个PV。 # 这个mbbo记录将选择将运行seq的哪段 record(mbbo, "CHOOSE") {field(VAL, "…

LVS+Nginx高可用集群--基础篇(二)

1.虚拟主机-使用nginx为静态资源提供服务 静态资源服务器:主要包括两类资源,网页;图片,音频等; 也可以通过别名设置静态资源路径。 配置代码: server {listen 88;server_name localhost;locatio…

DFS回溯剪枝|KMP通过数组记录减少判断子字符串|思路

KMP|DFS回溯剪枝 #1、NC149kmp 初步思路: 两层for循环,一个T的字符开始与 S的字符比较,挨个比较,遇到不同就continue当前T的字符,重复步骤》效率太低,超时 eg: TABSABABABD SABABD S!A时&#…

四川蔚澜时代电子商务有限公司持续领跑抖音电商

在当今这个数字化飞速发展的时代,电子商务已成为推动经济增长的重要引擎。而在众多电商平台中,抖音电商以其独特的社交属性和年轻化的用户群体,逐渐崭露头角。四川蔚澜时代电子商务有限公司正是这股潮流中的佼佼者,他们专注于抖音…

创建一个AXIS的初始IP核

参考自:https://www.cnblogs.com/milianke/p/17936380.html 以该博主文章为主,本文章做补充。 注意的点: edit ip 在导出axis的主机和从机的时候,记得选择edit ip,这样才能看到从机和主机的源代码,然后…

2024平价蓝牙耳机哪个牌子好?盘点热门平价蓝牙耳机推荐

2024年来,蓝牙耳机市场逐渐走向平价,这使得越来越多的消费者能够轻松拥有一副高性价比的蓝牙耳机。然而,在如此丰富的选择中,2024平价蓝牙耳机哪个牌子好?成为了许多人的烦恼。为了帮助大家更好地了解市场上的热门产品…

8、开发与大模型对话的独立语音设备

一、设计原理 该系统的核心部分主要由ESP32-WROVER开发板和ESP32-CAM摄像头、MAX9814麦克风放大器模块、MAX98357功放、声音传感器和SU-03T语音识别芯片构成。通过使用ESP32-WROVER开发板,用户可以实现通过语音与ai进行交互并进行人脸识别。 系统中,从外部输入电源中获取电源…

HTML5使用<output>标签:显示一些计算结果

HTML5 提供的 output 标签&#xff0c;用于显示出一些计算的结果或者脚本的其他结果。output 标签必须从属于某个表单&#xff0c;也就是说&#xff0c;必须将 output 标签写在表单内部&#xff0c;或者在该元素中添加 form 属性。 output 标签语法&#xff1a; <output f…

盘点2024年10款超级好用的项目管理软件,建议收藏!

今天猴哥整理并分享国内外使用最广泛的10大项目管理工具软件&#xff0c;同时探讨如何选择适合自己的项目管理工具所需考虑的要素。在国内外市场上&#xff0c;有非常多的项目管理软件可供选择。然而&#xff0c;逐一尝试这些软件将耗费大量时间&#xff0c;因此需要寻找更好更…

vue3中使用 tilwindcss报错 Unknown at rule @tailwindcss

解决方法&#xff1a; vscode中安装插件 Tailwind CSS IntelliSense 在项目中的 .vscode中 settings.json添加 "files.associations": {"*.css": "tailwindcss"}

基于CentOS Stream 9平台搭建MinIO以及开机自启

1. 官网 https://min.io/download?licenseagpl&platformlinux 1.1 下载二进制包 指定目录下载 cd /opt/coisini/ wget https://dl.min.io/server/minio/release/linux-amd64/minio1.2 文件赋权 chmod x /opt/coisini/minio1.3 创建Minio存储数据目录&#xff1a; mkdi…

我是售前工程师转大模型了,不装了我摊牌了

有无售前工程师的朋友&#xff0c;心里的苦谁懂呀&#xff0c;售前工程师是项目开发人员与业务销售人员的桥梁&#xff0c;在业务销售人员眼中&#xff0c;他们是技术人员&#xff0c;在项目实施中的开发人员眼中&#xff0c;他们是专注技术的销售人员&#xff0c;在用户眼中&a…

vue3关于在线考试 实现监考功能 推流拉流

vue3 关于在线考试 实现监考功能&#xff0c; pc端考试 本质是直播推流的功能 使用腾讯云直播: 在线文档 index.html <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><link rel"icon" href"/f…