大模型预测,下一个token何必是文字?

太快了太快了…

大模型的生成技能,已经到了普通人看不懂的境界!

它可以根据用户过去5年的体检报告,生成未来第1年、第2年、第3年的体检报告。

你看,这个生成的过程,是不是像极了ChatGPT,根据历史单词预测下一个单词。

图片

它能查看过去7天机组子部件的运行情况,生成未来3天每小时的子部件报告 。

图片

还能基于历史水文数据和未来7天气象数据,生成未来第1天、第2天……至第7天的每小时降水分析报告,包括详细降水量、降水分布。

图片

如今,大模型的生成内容,早已不只是文字/图像/视频了

如上生成的这些报告分析涉及诸多专业知识,普通人很难基于自己的知识储备评价其合理性和正确性。

最多只能评价一句:不明觉厉!

怎么说呢?“AI似乎正在生成一切”。

LLM+行业数据,路走错了?

简单理解大模型,就是Predict the Next “X”。ChatGPT是Predict the Next “Word”。

但行业需要的往往不是预测下一个字。

比如对于慢性病患者的健康管理规划,它需要基于一系列生理指标数据,从医学角度进行数据预测。举个不恰当的例子,这更像是用数学方法解题。

如果在大语言模型基础上投喂大量专业的医学语料,更像是用语文方法读题。尽管能理解相关的术语和指标,可是给出的预测结果大概率不准确。因为问题本身超出了“语言”范畴,不能用语文方法求解

如果“X“的模态从“文字Word”变成了“体检报告”,模型则可以根据历史体检报告数据去预测下一个体检报告,这才是一个健康管理大模型。

图片

它的逻辑更像是“种瓜得瓜、种豆得豆”。即输入“X”、输出“X”。

这里的“X”可能包含水文数据、健康报告、设备监测数值、设计推演等不同样式的专业数据。

它能基于音乐厅的几何模型和房间数据,从声源发射5000Hz频率射线,生成射线分布图,找到听觉最佳的音源摆放位置。

图片

如何预测“X”?

所以,这些能预测下一个X的行业大模型,如何构建出来?

通过刚刚发布的先知AIOS 5.0。其核心特点是基于各行各业场景的X模态数据,构建行业基座大模型。

解决了当前行业大模型只能将行业文本数据喂给大语言模型、生成下一个字的问题,让大模型能来到的领域更加广泛。

图片

先知是AI公司第四范式的核心产品。2015年,先知AIOS 1.0版本首次发布,通过高维、实时、自学习框架提升模型精度;2017年,先知AIOS 2.0版本利用自动建模工具HyperCycle,降低模型开发门槛;2020年发布的先知AIOS 3.0版本规范AI数据治理和上线投产;2022年,先知AIOS 4.0版本引入北极星指标,更大化发挥AI应用价值。

AIOS 5.0版本则从生成式AI+行业这一角度出发,给行业大模型提出了一种新思路。

而在公认的大模型应用落地元年里,行业大模型的发展和影响一定是此前的数倍。这种更具规模化的动向,由此也形成了AIGC趋势的下一个范式。

One More Thing:AIGC迈向新范式?

从图片、文字、视频,再到健康、水利……我们不难看出AIGC现在正以迅猛的速度朝着AI生成一切的方向飞奔。

通常来说,一切事物的发展似乎都需要一些范式来推动,而且不是新范式取代旧范式,而是它们之间互补使其更加深入和全面。

正如科学研究中的四种范式一般,即实验归纳、理论推演、计算机仿真和数据密集型科学发现,它们相互补充,共同推动了科学研究的进步。

那么若是以这种逻辑来看待AIGC,似乎类似的四种范式也已经开始出现。

AIGC的第一范式以文本生成为核心,通过智能客服、内容续写等应用,展示了AI在理解和生成自然语言方面的能力。这一阶段的AIGC技术,为后续的发展奠定了基础,使得机器能够与人类进行有效的交流和互动。

AIGC的第二范式将应用领域扩展到了图像生成

如生成对抗网络(GAN)、变分自编码器(VAE)等,可以学习从随机噪声生成逼真图像的映射。并能将输出结果用于艺术创作、图像增强、虚拟场景生成等领域。这一范式进一步展现了AI的想象力。

AIGC的第三范式则是聚焦在了视频生成,例如Gen2,例如Sora。

视频生成一定程度上反映了AI对于世界的理解。从Sora诞生以来,能否理解世界?是否是世界模拟器的说法一直争论不休。因为如果确定Sora可以理解世界,将意味着AGI大门正式开启。

图片

而AIGC的第四范式,就是以行业为主,技术将全面渗透到各个行业之中。

这一阶段的核心任务是将AI技术与行业知识深度融合。今年作为大模型应用落地的元年,我们看到AIGC技术开始在医疗、教育、金融等关键领域发挥重要作用。

具体怎么做才能更快推进AIGC扎入行业?各路玩家都还在不断尝试中。以大语言模型为底座?还是直接训练行业大模型?不同路线都有各自的底层逻辑,谁的路线更能跑通,还言之过早。

但可以确定的是——

在AI生成一切的进程中,那些能够率先利用AI技术的个人和行业,将能够更早地享受到技术带来的红利。他们将有机会引领行业变革,塑造未来的社会和经济格局。

而且也只有AIGC进入到了第四范式,才意味着完成了技术创新到商业创业的飞轮转换,意味着生成式AI开启新质生产力变革

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/501455.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

vue-v-for遍历index与id

一.遍历列表key的作用(index作为key) 虚拟DOM上有key,是虚拟的,但是真实DOM上没有,key是Vue内部的 当使用index作为key的时候,Vue会根据初识数据生成一个初始的虚DOM, 然后在页面上映射出真实DOM 如果向数据…

Webpack生成企业站静态页面 - 项目搭建

现在Web前端流行的三大框架有Angular、React、Vue,很多项目经过这几年的洗礼,已经都 转型使用这三大框架进行开发,那为什么还要写纯静态页面呢?比如Vue中除了SPA单页面开发,也可以使用nuxt.js实现SSR服务端渲染&#x…

CrossOver2024最新免费版虚拟机软件 Mac和Linux系统上运行Windows 应用/游戏 CrossOver是什么软件

CrossOver是一款由CodeWeavers公司开发的,运行在Mac和Linux操作系统下,能够模拟Windows系统应用运行环境的软件。它不需要用户单独安装Windows操作系统,就能让Windows平台上的应用程序在Mac和Linux上顺畅运行。CrossOver在技术上使用了Wine&a…

module ‘numpy‘ has no attribute ‘int‘

在 NumPy 中,如果遇到了错误提示 "module numpy has no attribute int",这通常意味着正在尝试以错误的方式使用 NumPy 的整数类型。从 NumPy 1.20 版本开始,numpy.int 已经不再是一个有效的属性,因为 NumPy 不再推荐使用…

五、基于KubeAdm搭建多节点K8S集群

如需查阅上一步骤,请点击下面链接:四、戴尔R630本地服务器Linux Centos7.9系统安装docker-ce-20.10.10-3.el7版本-CSDN博客文章浏览阅读727次,点赞12次,收藏13次。1、准备工作3、Linux Centos7.9系统的iDRAC远程管理、网络设置、SecureCRT远程登录终端、企业级静态ip地址配…

20240329-科技咨询:比亚迪第五代DMi;央视AI《周处除三害》;带屏幕苹果耳机爆火

一、比亚迪5月份即将推出第五代DMi技术 近日,比亚迪举行了2023年财报投资人沟通会。会议纪要显示,比亚迪董事长王传福在会上透露,今年5月将推出第五代DMI混动技术,预计馈电油耗将降至2.9升/百公里,而满油满电续航将达…

第十四届蓝桥杯省赛C++ C组所有题目以及题解(C++)【编程题均通过100%测试数据】

第一题《求和》【简单模拟】 【问题描述】 求1(含)至20230408(含)中每个数的和。 【答案提交】 这是一道结果填空的题,你只需要算出结果后提交即可。本题的结果为一个整数,在提交答案时只填写这个整数&…

“地干天知”干旱监测与预警技术研讨及系统产品发布

3月28日,由国家气候中心气象灾害风险管理室、北京慧天卓特科技有限公司主办的“地干天知”干旱监测与预警技术研讨及系统产品发布活动在北京市海淀区中关村壹号隆重举办。活动旨在面向公众讲解干旱监测与预警技术原理,展示监测范围和预警能力。来自国家气…

protobuf学习笔记(二):结合grpc生成客户端和服务端

上一篇文章大概讲了如何将自定义的protobuf类型的message转换成相应的go文件,这次就结合grpc写一个比较认真的客户端和服务器端例子 一、项目结构 client存放rpc服务的客户端文件 server存放rpc服务的服务端文件 protobuf存放自定义的proto文件 grpc存放生成的g…

【LeetCode: 面试题 16.05. 阶乘尾数 + 阶乘】

🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜,…

ThreadPool-线程池使用及原理

1. 线程池使用方式 示例代码: // 一池N线程 Executors.newFixedThreadPool(int) // 一个任务一个任务执行,一池一线程 Executors.newSingleThreadExecutorO // 线程池根据需求创建线程,可扩容,遇强则强 Executors.newCachedThre…

谷歌seo站内优化需要做什么?

说一个比较重要的点,那就是页面的标签优化,网站的title标签跟Descriptions标签的重要性不言而喻,但其他页面的标签也是同样重要,毕竟客户看见在谷歌搜索引擎里看见的就是你的页面标题以及描述 所以页面的标题以及描述是很重要的&a…

电机试验平台的结构

电机试验平台的结构通常包括以下部分: 1.电机:试验平台主要是为了对电机进行各种试验,因此电机是平台的核心组成部分。电机通常由定子和转子组成,根据试验需要可以是直流电机、交流电机或者是特殊类型的电机。 2.控制系统&#…

一次性了解C语言中文件和文件操作

P. S.:以下代码均在VS2019环境下测试,不代表所有编译器均可通过。 P. S.:测试代码均未展示头文件stdio.h的声明,使用时请自行添加。 文件及文件操作 前言1. 文件分类1.1 文本文件1.2 二进制文件1.3 文本文件和二进制文件的区别 2…

Linux:程序地址空间详解

目录 一、堆、栈、环境参数所在位置 二、进程地址空间底层实现原理 ​编辑 三、什么是地址空间 四、为什么要有进程地址空间 五、细谈写实拷贝的实现及意义 在C/C学习中,都学习过如上图所示的一套存储结构,我们大致知道一般存储空间分为堆区&#…

数据结构:归并排序

归并排序 时间复杂度O(N*logN) 如果两个序列有序,通过归并,可以让两个序列合并后也有序,变成一个有序的新数组 对于一个数组,如果他的左右区间都有序,就可以进行归并了 归并的方法 将数组的左右两个有序区间比较,每次都取出一个最小的,然后放入临时数组(不能在原数组上修改…

纯小白蓝桥杯备赛笔记--DAY8(必备排序算法)

冒泡排序 算法思想 每次将最大的一下一下地运到最右边&#xff0c;然后确定这个最大的&#xff0c;接着可以发现该问题变成一个更小的子问题。具体操作&#xff1a;从左向右扫描&#xff0c;如a[i]>a[i1]&#xff0c;执行swap操作。代码格式 #include<bits/stdc.h> …

Mamba: Linear-Time Sequence Modeling with Selective State Spaces(论文笔记)

What can I say? 2024年我还能说什么&#xff1f; Mamba out! 曼巴出来了&#xff01; 原文链接&#xff1a; [2312.00752] Mamba: Linear-Time Sequence Modeling with Selective State Spaces (arxiv.org) 原文笔记&#xff1a; What&#xff1a; Mamba: Linear-Time …

双非本,拿到美团测开实习了——经验分享

前言 最近是春招、暑期实习的高峰期&#xff0c;自己也凭借着持续的准备和一部分运气&#xff0c;较早拿到了美团的测开暑期实习。 以前接到美团的短信&#xff0c;都是外卖送达的通知&#xff0c;没想到自己有一天&#xff0c;也能收到offer录用的通知。虽然是测试开发的岗位…

考研数学|《1800》+《660》精华搭配混合用(经验分享)

肯定不行&#xff0c;考研数学哪有这么容易的&#xff01; 先说说这两本习题册&#xff0c;李永乐老师推出的新版660题&#xff0c;相较于18年前的版本&#xff0c;难度略有降低&#xff0c;更加适合初学者。因此&#xff0c;对于处于基础阶段的学习者来说&#xff0c;新版660…