“我是谁?”、“从哪里来?”、“要到哪里去?”。哲学史上,柏拉图提出的灵魂三问,是人们深刻、简明把握事物发展方向的思考路径。
当下,AI大模型热度比酷暑的热浪还高。但在众多大模型里,开一场发布会,讲清楚“我是谁”的居多,关于AI大模型“从哪里来,到哪里去”,或者说“做什么,为谁做”的进一步思考,却很少见得到。
7月13日,在京东全球科技探索者大会(JDD)上,京东对这一问题率先给出了自己的答案。
19世纪80年代,电力成了时髦的新技术。
在“十天一项小发明,半年一项大发明”的爱迪生实验室,白炽灯和供电基建连续突破,但对应的直流电技术,却有着显而易见的不便——不能远距离传输、功率受限。
直到1887年,凭借尼古拉·特斯拉的交流电机技术,电力才找到了适合于工业的方式,美国工业的新格局得以奠定,乃至于第二次工业革命随后席卷全球。
所以直流和交流的讨论,其实不是技术路线之争。它揭示了一个真相——新技术想要大规模应用,成为时代的动力,首先应当立足产业,解决难题。
在经历了两次工业革命后,新技术“到哪里去”的问题,落在了AI大模型身上。
半年来,国内爆炸式地发布了80多个大模型产品,讲得夸张一点,人称“AI百模大战”。
百模大战,反映了行业的热度,但凡是比较热的潮流,有时候就免不了“一哄而上”的“赶热闹”。
大模型,也有这个问题。
大多数大模型产品,研发的时候都是基于通用场景的,做出来的结果,就难免同质化。为了避免同质化,各平台的办法就是拼速度,比参数。
这有点像在荒原上跑步,如果大方向没确定,就只好拼一拼谁抢跑快,谁装备好,谁的起跑姿势更优美。
但也有例外——京东的判断,就完全不一样。
京东集团CEO许冉表示,京东看待大模型和其他技术创新,除了追求技术的先进性,还格外关注产业厚度——看重技术能在多少产业场景中切实应用,为社会创造多少价值。
京东集团技术委员会主席、京东云事业部总裁曹鹏,用一句话定性了京东的大模型:
“京东言犀大模型源于产业,服务产业。”
由此,京东作为有战略、有侧重、有方向的互联网企业,它的大模型同样有战略、有侧重、有方向——它应该是个创新工具,把新技术在产业里落地,才是京东大模型的最终目的和战略方向。
这意味着,京东言犀大模型靠的不仅是“达到千亿级”的基座参数领先,它更要围绕内容生成、⼈机对话、用户意图理解等几个大类任务,为更精细、更复杂的业务应用做准备。
这种准备到了什么程度?
京东言犀大模型基于京东优质供应链场景,融合了70%的通用数据与30%复杂场景生长的原生数据。
其数据内核,既覆盖了零售、物流、金融、健康、工业等京东产业实践数据,也结合了城市、政务、制造、航空、交通、能源等多产业数智化脱敏数据。
各产业每年产生的14亿优质交互数据,为京东言犀大模型驱动产业AI落地,提供了充足数据动能。
在AI大模型上的研发打磨,京东已历经三年积累。
早在2021年,京东就推出了十亿级模型K-PLUG。如今,K-PLUG生成的商品文案已覆盖京东超3000个品类、累计生成30亿字。其中,人工审核通过率超过95%,带来超过3亿元GMV。
2022年,进一步加码的京东推出百亿级模型Vega,实现了对情感分析、语义匹配、语法纠错、智能问答、常识推理等多种产业下游自然语言处理任务的适配。
为了在AI产业化方向上加码布局,京东为之准备了充足的应用能力和技术实力。
比如为在新型算力上持续发力,2021年京东在重庆落地了全国首个基于SuperPOD架构的超大规模计算集群——天琴α,算力总规模达到135TFLOPS(每秒浮点运算次数),使得推理提速6.2倍,推理成本节省90%。
京东探索研究院院长、京东科技智能服务与产品部总裁何晓冬透露,一般生成式语言模型生成的内容正确率是85%左右,C端用户或许觉得能用,但商用是不可接受的。京东的预训练模型正确率达到95%以上,足以为有效商用保驾护航。
为了确保大模型的方向,能够真正“向产业去”,京东提出了一个明确的“三步走”战略:
第一步,基于内部实践构建通用大模型;第二步,在零售、金融、健康、物流等京东内部高复杂场景大规模锤炼;第三步,针对严肃商业场景将大模型能力对外开放。
看得出,在这三步中,第一步当然是基础,但更重要的是第二三步——始终致力于围绕行业需求,创新提升AI技术并走进产业场景解决实际问题,最终借助大模型助力突破供应链价值,实现产业效率再跃升。
发生在欧洲的第一次工业革命,助力英国工业制造及商业运输等迅速崛起,并带来国运逆袭。
发生在美国等国家的第二次工业革命浪潮,则诞生了通用电气、福特汽车、AT&T等大批知名企业。
可见,时代浪潮越大,对企业、产业乃至国家实力跃迁的红利也会更大。
不过,产业泡沫的诱惑、未来投入的风险等,往往导致真心出海抓“鱼”者稀少,能够大规模落地应用的“鱼”就越显得珍贵。
生产制造和零售流通产业,作为引领中国经济变革的最强启动器,与国民生产生活息息相关。且生产流程、数据等丰富成熟,更适合接受AI大模型的深入改造。
但隔行如隔山的状况下,不同的垂类行业及较长的产业链条,要求AI大模型不仅要顾及到行业专业知识,还要对上下游个性化业务场景具有深入理解。
且动辄上千亿参数的通用大模型算力成本,往往更高。因此,产业需要更适应自身成本需求和应用实际的“专业化大模型”。
同时,智慧城市、金融、健康及高端制造等领域,因为本身数字化程度相对较高,在数据的采集、分析和应用上,本已有基础,因此更有希望更快步入AI智能化。但相应的,这些领域对AI智能化的适配标准,也会更高。
产业AI浪潮里,无疑十分需要懂产业、懂业务、懂数字化、更懂大模型的“捕鱼人”。
京东,正是这样一个久经历练的企业。它拥有零售、物流、健康、工业品等广泛实体业务,深度参与着庞大而复杂的产业生态。比如零售一开始就是自营,对客服、采购采销等整个上下游的业务内容都是躬身入局。
一方面,这让京东获得了大量优质的数据积累;另一方面,也加深了京东对产业布局、业务理解及各垂类行业专业知识的能力积累。
同时,作为一个高度数据化、超大规模的新型实体企业,京东数字化构建和运营能力,也不可小觑。
在数智物流实践中,数字化供应链产品“京东物流超脑”通过算法+基于大模型的文本和数据分析,具备实时自动生成全局最优的供应链解决方案的能力,比如针对双11大促布局堵点,迅速分析建议增加货架,进而实现供应链降本增效。
在金融、健康等重要领域,京东也基于自身业务的优势沉淀,率先为其带来了AI数智化的提效赋能。
京东科技AI增长营销平台,融入京东金融对行业理解、营销流程、运营策略等知识的多年积累,可迅速解决诸如关键性任务、用户体验等问题,大幅优化营销运营流程。
以往,涉及产品/研发/算法/设计/分析师等5类以上职能才能完成的流程,压缩至1人;一个入口的全新交互模式,可将操作效率提升超过40倍。
京东健康的健康助手及辅助诊疗等产品,则借助大模型的多轮交互、图文多模态等能力,实现累计超3千万高质量临患对话,百万级规模医学知识图谱,覆盖线上140余科室的医疗专家团队,带来了医疗服务颠覆性新供给的可能。
每一次浪潮袭来,都不会是无根之木、无源之水。它们都是从生产、制造到流通、零售的细微业务场景的颠覆性转变的积聚,推动了从场景到产业的全面进步。
产业改造是宏大命题、长周期赛跑,但离不开一个个具体业务场景的精细化覆盖。
正如曹鹏所言,“技术只有放到场景里,才能够产生实际的价值。”
为此,京东不只是在关键产业战略上排兵布阵,更在营销、零售等领域的高频次业务场景上不断实战演练,各个击破。
比如针对智能营销实践,京东AI大模型致力于反复打磨智能导购、智能客服等应用场景。
以前的机器人客服,只能回答一些基础售前售后问题,且总是“驴头不对马嘴”,导致转人工成本难以降低。
AI大模型介入后,完全能够更智能地解答商品相关问题,给出过往大多数情况的解决方案,提升智能客服效率并降低人力成本。
京东云AIGC内容营销平台,则通过智能理解商品特征,帮助商家自动化生成商品文本、图片等营销素材,极大地提升商家营销工作效率和营销内容质量。
仅需一张商品图片,就可以快速生成电商运营需要的商品主图、营销海报图和商品详图等,满足快速开店、上品、营销的需求,每套图成本降低90%,周期从7天缩短到半天。
零售是京东最核心的业务场景,也是供应链最丰富、最具想象力的场景。京东的AI探索,就围绕人、货、场三个核心要素展开。
在用户购买的全链路上,AIGC能够根据用户喜好进行智能推荐,并通过不断创新交互模式,深入挖掘用户的多元化需求,优化用户体验。
在零售端的货品业务运营层面,无论是已有商品及交易的各类数据沉淀,还是上新品类的趋势及触达,都有着极为精细、复杂且庞大的数据洞察诉求。
此外,依赖于人力采销运营经验的搭售交易,也往往导致经营效率瓶颈明显、资源粗放式利用的弊端。
京东集团副总裁、京东零售技术研发与数据中心负责人尚鑫透露:京东AI大模型技术可以通过更强大、智能的数据分析,及搭售交易的智能拟合能力,不断提升零售效率及用户体验,并进一步压缩经营成本;甚至通过前瞻性趋势分析,大幅降低上新风险。
AI大模型浪潮中,不乏企业追逐泡沫,但也有像京东这样不仅致力于紧跟浪潮、顺应浪潮,更专注于对产业场景应用一点点吃透打通的“出海打渔”的务实派。
因为京东相信,越是能经受得住浪潮泡沫的诱惑,越是能沉下心来深入产业场景“打捞”实干,最终京东AI大模型捕获的应用之“鱼”,才会对产业、商家及用户愈加珍贵。
任何致力于改造产业的能力“涌现”,都不是一朝一夕的结果。就像大模型一样,都是经过长期训练后,从量到质的不断突破积累的产物。
比如在门类复杂、场景多元且可大规模商业协同应用的高门槛、高标准下,将大模型能力迁移到产业领域中,必然需要调优与二次训练。
京东观察到,垂直行业往往面临场景样本少、数据分布不均等问题。持续积累高质量的行业数据,离不开更强大的数据平台和更强的智能交互能力。
前者,需要支持更多维度的行业数据管理;后者,则需要不断积累垂类行业的专有数据。
京东认为,只有当数据平台不断实现知识输出,智能平台不断反馈高质量协同数据,构建起循环增长飞轮,才能实现高质量行业数据的积累。
为此,京东构建了包括言犀大模型开放计算平台和向量数据库在内的数字基础设施,并打造出全新升级的优加DaaS3.0和言犀智能服务3.0,两个积累高质量行业数据的数据平台。
其中,言犀大模型开放计算平台的丰富行业知识库,沉淀了100多种训练和推理优化工具,可以为用户提供更高效的大模型开发环境。
之前需要10余人的科学家团队工作,现在只需要1-2个算法人员;不到一周时间,即可完成从数据准备、模型训练、到模型部署的全流程,极大提升研发效率。
相比传统方式,已服务于超过100家大中型企业用户的京东向量数据库Vearch,其模型训练可优化模型推理效率,推理成本降低80%。
可以实现更多维的数据积累、更易用的人机交互和更简单的系统管理的优加DaaS3.0,则为企业未来从“数据决策”向“知识决策”转型提供了强力支撑。
言犀智能服务3.0,以更丰富的交互渠道、更生动的交互效果和更专业的交互内容,诠释了真正的智能交互产品力。
可以说,正是基于高效数据技术基建及智能产品的打造,京东才会自信地认定:培养适合垂类行业自己的大模型应用,成为可能。
为支撑大模型落地行业,京东已经形成了成熟的应用产品及解决方案的规划打造能力。
比如零售云3.0全场景解决方案,通过将人货场全链路数据化、可视化的融合贯通,帮助企业精准触达消费者、优化经营效率。
京东数字城市解决方案3.0,则实现了对更复杂的民生数据、产业数据的智能管理和知识化沉淀表达,且以更智能、更深度的交互效率,适应城市更快速的分钟级应急处置响应、更精准的毛细血管事件管理。
京东历时5年打造的供应链产品京慧,在大模型加持下,在销量预测、库存、供应及补货计划方面更具表现力,能帮助用户快速定位并解决供应链问题。
目前,京慧已累计服务100+家大型客户和2400+家中小客户,在汽车、消费品、3C等6大行业均有广泛应用。
京东相信,由大模型带来的产业智能,必将优先在数字化领先的场景发生。从而,在推动城市、产业、品牌商及各行业数字化创新方向上,京东始终坚持产业AI的能力积累和大模型未来落地可能。
京东联合智云天工、常州移动打造的“5G+AI工业制造云平台”,将不同地区企业的核心能力与数据以平台方式聚集。
其一方面触达消费者,将购买需求聚合为订单统一下发;另一方面通过拆解产能,将产品分解为各个零部件,精准匹配本地或省外等地区生产力,帮助企业消化剩余产能。
目前,这一平台已连入18个行业、700多家企业的产能数据,累计连接设备6万多台,帮助企业总计消化剩余产能15亿元。
大模型的竞争,是产业战略乃至国家科技战略的竞争。
而这种价值的比拼与扩张,显然是一场“马拉松”。不会停留于短期的声量大小,或你追我赶的一时输赢。
只有当AI大模型越来越深刻地塑造新的产业形态,并越来越激活更高效率的产业势能。这样的产业化AI比拼,才能奠定最终胜势。
早在2017年的京东JDD大会上,时任京东集团董事长的刘强东就提出:AI既是一种技术,也是一种思考方式。它将成为未来20年变革所有行业的核心力量。
京东的难能可贵之处,是它不止步于思考自己需要什么样的AI大模型,而是更深入思考国家及产业需要什么样的产业AI未来。
从京东的AI大模型开始,这或许是一场“中国更需要怎样的AI大模型”行业思考的开端。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
123?spm=1001.2014.3001.5501)这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】