知乎版ChatGPT「知海图AI」加入国产大模型乱斗,称效果与GPT-4持平

        “2023知乎发现大会”上,知乎创始人、董事长兼CEO周源和知乎合作人、CTO李大海共同宣布了知乎与面壁智能联合发布“知海图AI”中文大模型。

        周源据介绍,知乎与面壁智能达成深度合作,共同开发中文大模型产品并推进应用落地。目前,知乎和面壁智能合作自研的“知海图AI”中文大模型已经运用进了知乎热榜,知乎首个大模型功能“热榜摘要”上线并开启内测。


“知海图AI”借力知乎语言数据库优势,称与GPT-4效果持平

        在知乎创始人、董事长兼 CEO 周源看来,AI 时代的生产力要素可以分为三层,从上到下依次是应用场景、专有数据、基础模型。“知海图AI”具备必须的生产力要素基因。

        基础模型方面,在知乎与面壁智能合作自研的“知海图AI”中文大模型面世之前,面壁智能已在 2020 年底发布了首个中文大语言模型 CPM-1,之后又陆续发布了 CPM-2、CPM-3 和 CPM-Ant 等模型。在应用场景在上,以问答形式为主,知乎搭建了专业、多元、有价值的“讨论场”。专有数据方面,知乎的运营模式决定了其积累了大量高质量的内容、关系和知识图谱,在当前国内互联网高质量内容匮乏的情况下,知乎的优势得天独厚,的确具备构建一个大模型的数据量。

        目前,知乎和面壁智能合作自研的“知海图AI”中文大模型,已经运用进了知乎热榜,知乎首个大模型功能“热榜摘要”上线并开启内测。

        在知乎这个场景里面,答主的回答千奇百怪、非常开放,甚至会出现观点跟提问没有关系的情况。这对整个大模型很有挑战。知乎称,“知海图AI”利用超强的语言理解能力对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户,给大家直观清晰的回答。

        面壁智能联合创始人、CTO 曾国洋表示,“在这个场景(知乎凌乱的问答区)下抽了40个提问去做评测。评测以后,发现跟GPT-4在这方面基本持平,我们稍微差一些,但还是蛮不错的。

国产大模型开启乱斗,资源禀赋各不相同

        人工智能激战正酣,当前各个大厂、创业企业开启乱斗,根据统计,目前国内至少有 15 个大大小小的 AI 大模型正在研发,当然各家资源禀赋各不相同。

国内已经宣布AI大模型项目的企业/机构

        阿里系AI大模型“通义”系列,特点在于“借力阿里超强的中间件优势,构建完整生态”,“通义”系列大模型将深入到电商、设计、医疗、法律、金融等行业,服务超过200个场景。阿里通义大模型打造了国内首个AI统一底座,根据研报梳理,阿里大模型相关受益标的主要包括:恒生电子、千方科技、石基信息、众信旅游、卫宁健康、金桥信息、亚康股份、神州数码、易点天下、丝路视觉等。

        腾讯系的混元AI大模型于2022年12月推出,是目前国内首个低成本、可落地的NLP万亿大模型,且登顶自然语言理解任务榜单CLUE。腾讯的数据、人才和硬件储备是布局AIGC领域的三大优势:数据方面,腾讯现有产品或带来多样化、真实度高的数据和应用场景;此外硬件方面腾讯拥有高性能网络平台、成熟的太极机器学习平台,为模型训练提供坚实基础。在生态链方面,腾讯系持股或与腾讯有重要合作标的,其中互联网传媒领域的有:世纪华通、完美世界、三七互娱、巨人网络、掌趣科技、电魂网络等;版权领域的有:华策影视、新媒股份、博纳影业、中文在线、平治信息;计算机领域的有:金山办公、泛微网络、四维图新、博思软件、长亮科技、超图软件等。

        华为系的盘古大模型,首次兼顾了图像判别与生成能力,能同时满足底层图像处理与高层语义的理解需求。盘古NLP大模型的可以赋能智能营销领域,比如,盘古NLP大模型可以通过文本匹配、意图识别等关键技术更好地服务销售环节,取代目前逐渐上升的人力成本和低成功率的智能客服与营销系统,帮助服务人员快速提升业务水平。对于华为盘古大模型生态链,在算力环节主要关注的是给华为做AI芯片服务的整机厂商,主要有神州数码、拓维信息、四川长虹、同方股份、广电运通、紫光股份等。

        百度系的“文心千帆”大模型平台,不仅包括文心一言,还包括百度全套文心大模型、相应的开发工具链。未来,文心千帆还会支持第三方的开源大模型。从平台定位上看,文心千帆为一站式企业级大模型平台,平台作为文心大模型服务的唯一入口,为B端企业用户,提供数据管理、自动化模型定制微调以及推理服务云端部署一站式大模型定制服务,并提供文心一言企业级推理云服务。从应用场景上看,文心千帆可应用于智能对话、智能输入法等通用场景以及电销领域商品介绍、推广文章等特定场景。根据研报梳理,目前百度AI生态链主要受益标的包括三六零、科大讯飞、拓尔思、万兴科技、格灵深瞳、云从科技、淳中科技、海康威视、大华股份等。

        目前,BAT 其中两家 AI 大模型已经进入试用阶段,压力给到其他厂商研发团队。在这场军备竞赛中,不乏有赶这场“AI 淘金热”的队伍,也有想“给淘金者卖水”的组织,训练 AI 大模型需要大量的计算资源和数据进行训练,这时候各家大厂/初创团队便要凭本事吃饭,这些平台将在竞争中重新审视系统性、结构工整的知识类内容,这有利于我国科技和生产力的发展,所以大模型竞争越多越好,最终由用户来做选择。


大厂拿所掌握数据投喂AI模型,引发数据安全担忧

形势一片火热,不乏理中客。

        互联网分析师张京科指出,如今由ChatGPT所引领的大模型浪潮,是科技领域的一次跨时代进步,但也存在巨大的用户隐私安全风险。

        ChatGPT于2022年11月发布后,其母公司OpenAI估值已涨至290亿美元,上线两个月后,用户数量达到1亿。伴随“尝鲜”热潮而来的是潜在安全风险的讨论。ChatGPT是一个生成式预训练变换模型,该模型前期的训练过程是基于人类反馈的监督学习和强化学习,在与用户大量的交互过程中聊天模型本身会将用户“喂”给它的数据作为训练数据,从而不断“进化”。

        “如今,互联网公司正在尝试用自己掌握的大数据投喂AI模型,很多时候厂商会以格式条款的协议获得用户各种隐私信息的授权,面对这些APP签订的协议,用户几乎没有选择的余地。各大互联网巨头源源不断地以用户信息投喂献祭,很多用户也不介意类似的隐私安全风险。”

        张京科指出,这意味着用户所有的隐私、喜好、聊天、关系链,甚至密码等等,未来有可能因为一个小小的安全漏洞或者运营事故,而大白于天下。为此,应制定更严格的用户大数据使用标准等措施提前进行预防。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/12957.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

vue 报错 error:03000086:digital envelope routines::initialization error解决方案

目录 1. 引言: 2. 更换版本出现问题: 3. 出现原因: 4. 解决办法: -> 4. 1 删了 再换回16.15版本 -> 4.2 指令修改(好使) ---> 4.2.1效果如图 -> 4.3 其他指令就别试了 压根不好使 1. 引言: npm出现问题 , 卸载后 装了个新node 18.15版本 2. 更换版本…

JavaScript【三】JavaScript中的数组

文章目录 🌟前言🌟数组🌟声明:🌟 隐式创建:🌟 实例化构造函数: 🌟 注意:一个值为数组的长度。🌟 访问:🌟 遍历&#xff1a…

SpringCloud+RabbitMQ+Docker+Redis+搜索+分布式,系统详解springcloud微服务技术栈(Eureka、Ribbon)

微服务技术栈导学 微服务技术是分布式架构(把服务做拆分)的一种 而springcloud仅仅是解决了拆分时的微服务治理的问题,其他更复杂的问题并没有给出解决方案 一个完整的微服务技术要包含的不仅仅是springcloud 微服务技术栈 包括什么 …

深度学习中的各种不变性

不变性 平移不变性(Translation Invariance)旋转不变性(Ratation Invariance)尺度不变性(Size Invariance)光照不变性(Illumination Invariance)仿射不变性(Affine Invar…

springcloud2.1.0整合seata1.5.2+nacos2.10(附源码)

springcloud2.1.0整合seata1.5.2nacos2.10(附源码) 1.创建springboot2.2.2springcloud2.1.0的maven父子工程如下,不过多描述: 搭建过程中也出现很多问题,主要包括: 1.seataServer.properties配置文件的组…

第二部分——长难句——第一章——并列句

conjunction(and,but,if,when(while)) 想把两个句子(多件事)连在一块,就必须加上连词。 所以长难句到底是啥? 所以长难句(直白表达,并不是语法表述)就是几个简单句多家上几个连接词就齐活了&am…

【vue2】使用vue-admin-template动态添加路由的思路/addRoutes的使用

😉博主:初映CY的前说(前端领域) ,📒本文核心:用原生js实现省市区联动 【前言】在通用的后台管理项目的开发中,不仅仅是会涉及到对表单数据等的增删改查操作还会涉及到一些关于权限管理的问题。我们将基于一个RBAC的思维…

C++STL大全----容器篇(上)

(一)概念 STL,英文全称 standard template library,中文可译为标准模板库或者泛型库,其包含有大量的模板类和模板函数,是 C 提供的一个基础模板的集合,用于完成诸如输入/输出、数学计算等功能。…

2023-04-21 学习记录--C/C++-实现升序降序(冒泡法/沉底法)

合抱之木,生于毫末;九层之台,起于累土;千里之行,始于足下。💪🏻 一、冒泡法(沉底法) —— 升序 ⭐️ (一)、思路 从左到右: 1、第一个与第二个比较&#xff0…

RK3568平台开发系列讲解(调试篇)IS_ERR函数的使用

🚀返回专栏总目录 文章目录 一、IS_ERR函数用法二、IS_ERR函数三、内核错误码沉淀、分享、成长,让自己和他人都能有所收获!😄 📢本篇将介绍 IS_ERR 函数的使用。 一、IS_ERR函数用法 先看下用法: 二、IS_ERR函数 对于任何一个指针来说,必然存在三种情况: 一种是合…

微信小程序开发(学习记录1.0)

首先,把遇到的问题贴出来,主要是这个解决问题的思路,供大家参考。 现在的问题是将下面的导航栏做出来,但是在自己做的时候 遇到的问题 在app.json文件中输入tarBar,就会生成模板代码,默认会生成一个list的模…

树莓派 QT项目开机自启动

我自己用qt设置了一个界面,如何让他开机自启动呢? 目录 1.生成qt项目的可执行文件 2. 编写一个自启动脚本 3.重启树莓派 1.生成qt项目的可执行文件 QT项目的可执行文件就是.exe文件。首先在qt中打开,点击红色方框图标,选择Re…

Oracle函数记录

一、各个函数介绍 1.OVER(PARTITION BY… ORDER BY…)--开窗函数 1.开窗函数用于为行定义一个窗口(这里的窗口是指运算将要操作的行的集合),它对一组 值进行操作,不需要使用GROUP BY子句对数据进行分组,能够在同一…

软件测试?月薪20k+?不会自动化测试的我真的很难....

做自动化测试后悔吗? 后悔,真的后悔! 后悔没有早点学..... 虽然现在网上到处都在散播35的焦虑,姑且信之,那么反问你,如果你30岁了,那么给你5年,能够在某个领域成为专家呢&#xf…

《花雕学AI》ChatGPT跟人类的思考方式有什么不同?

一、ChatGPT是一个基于GPT-3.5的对话语言模型,它可以根据用户的输入生成多轮对话,也可以生成文本、代码、音乐等内容。ChatGPT的思考方式是利用大量的数据和强大的算力来学习语言的联合概率分布,从而能够根据上下文和目标生成合理和有趣的回复…

python文本自动伪原创-ai一键伪原创

chatgpt批量伪原创的优势 ChatGPT是一个由OpenAI开发的强大的自然语言处理模型,它具有批量伪原创的优势,以下是这些优势: 模型能够处理大量的数据:ChatGPT通过训练大规模的语言模型来生成伪原创文本。这个模型拥有一个庞大的语料…

GaussDB工作级开发者认证—第二章GaussDB数据库应用程序开发指引

一. 驱动概述 GaussDB客户端接入认证,GaussDB支持以下三种认证方式:基于主机的认证口令认证SSL加密 二. JDBC接口介绍 1. JDBC概述 Java数据库连接(JDBC)是Java标准,它提供了从Java连接到关系数 据库的接口&#x…

数据挖掘:心脏病预测(测评指标;EDA)

目录 一、前期准备 二、实战演练 2.1分类指标评价计算示例 2.2数据探索性分析(EDA) 2.2.1 导入函数工具箱 2.2.2 查看数据信息等相关数据 判断数据缺失和异常 数字特征相互之间的关系可视化 类别特征分析(箱图,小提琴图&am…

5.2 中心极限定理

学习目标: 要学习中心极限定理,我会采取以下几个步骤: 学习基本概念:了解什么是随机变量、样本、总体、概率密度函数等基本概念,为学习中心极限定理打下基础;学习正态分布:中心极限定理的核心…

windows搭建ftp及原理(小白向)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 环境一、实验步骤1.1安装ftp 二、ftp实验引发的思考1.简单阐述ftp的原理2.ftp建立的流程 总结 环境 windwos任意环境不需要server windows10 提示:以下…