(杂文)参加WAIC 2024 所思所感

受华为广办的邀请,在领导要求下, 我还是在这个炎热的暑假通过一个接近凌晨两点落地的飞机连夜从北京来到了上海,去“睁眼看世界”。

区别于纯学术会议和CCF类的会议,WAIC 更加的平易近人,有更多的工业界同行,有更多的产品宣传。

自2018年起,来到了第7届,我是第一次来到现场。 第一场论坛,去了昇腾的论坛,第一场演进就有幸听到了郑院士的演讲 《人工智能大模型的计算系统》。 郑老师的演讲 从 大模型生命周期的算力需求展开,以鹏城实验室的算力中心搭建为例,娓娓道来,提出了设计大模型计算机系统需要考虑的五个问题以及国产AI计算系统需要做好的10件事情:
1)多种精度运算性能的平衡。 是啊,我们在标准的FP16算力可观,FP64呢,混合精度,BF16,FP8 和英伟达还有多大的距离呢?
2) 网络平衡设计
3)内存平衡设计
4)IO子系统平衡设计
国产的芯片在追赶国外,但是配套的软件生态,差距可能并不比硬件差。我经历的每一个国产芯片厂家,哪怕是兼容CUDA生态已经非常好的芯片,对于新模型,也需要至少1-2周的调优,而这个调优又通常又没有构成一个良好的开源生态,使得难以快速适应全球大模型本身的高速演进。
5)国产AI计算系统需要做好的事情:
a) 编程框架
b)并行加速
c) 通信库
d) 算子库
e) AI 编译器
f) 编程语言
g) 调度器
h) 内存分配系统
i) 容错系统
j) 存储系统

从系统工程角度去看待大模型的全生命周期,是郑老的核心观点。大模型远远不是发布一个垂类的llama微调模型,而是一套完整的系统。 上述的各个环节,其实国内和美国头部是有差异,这个差异最大的体现是创新和生态上。 以编程框架为例,适配昇腾的时候我们一度因为NLP算子的成熟度问题,用mindspore重构了我们在之前用tensorflow和pytorch下写的CNN、RNN和PLM的一些模型。可以当昇腾过程中,逐步自己就对pytorch生态兼容了起来,然后喜欢乐见,大家愉快的拥抱了pytorch,迅速对接了学术圈和开源社区的成果。 这也反应了一个非常大的问题,国内的开源到底生命力在哪? 激烈的商业竞争,价格战最为底牌的惨烈厮杀,对于开源,对于行业,对于生态 主流厂商的心态到底如何。以为铸就了技术护城河,开源社区国内贡献最好的阿里,被拼多多用商业模式而不是创新技术反超的现象还在不断发生,企业创新就永远落在商业策略之后不止一个身位。 更遑论小厂,不管怎么重视研发,市场 或者 售前从客户那一个随机的想法,就可以让研发头破血流的投入。 专注技术的论证可能连声音都发不出,就被具备市场思维的研发大领导以没有市场观念给毙掉。 各种企业有各种企业的挣扎求生,KPI 或者 OKI 束缚我们的创新和 美团束缚快递小哥其实也没有本质的区别。

希望大模型的发展,我们的创新公司,靠着技术的先进性,不是拼补贴不是拼政策的赢一次。想想都热血沸腾。

讲座之后,我们和昇腾产品线有一个闭门会议,略过内容不谈,双方对对于大规模推理的性价比思考,达成了共识

因为临时决定参加,大部分论坛没法参加,特别遗憾的因果科学的论坛。我看到受邀嘉宾,大神云集,很想去听听Pearl 和 Rubin的演讲,毕竟今年在EMNLP也投了这方面的paper,去沾沾神运

大会的最后一天,我独自去看了展区。整个WAIC的主基调产品也是大模型,基本上各行各业都在讲一个和大模型的故事。从工业界的施耐德电气到金融的蚂蚁、中信到娱乐的B站,算力从云上到国产芯片,琳琅满目。 我的感觉就两点,一 AI时代确实来了,即时人工智能再一次陷入周期性低潮,也改变不了这些技术已经走入生活,而不是像之前一样停留在paper和实验室中。 二,这个时代才开始。 大家同质化而且稚嫩,像极互联网起家时候,门户网站称王的时代,商业模式简单粗暴,满口都是赋能和考虑用户价值,但实际考虑投入产出比,就买铲子和买培训的在赚钱。 哪怕是具身智能,也没法让我兴奋。反倒是一个做XR的现场体验,让我动了去京东购买的念头,尽管他的功能也就是个灵活的投影仪。 比较可惜的是我好不容易看到个web3的,发现展厅的人吃饭去了,场地规模也小,也是币圈链圈口碑不佳。 但是没有看到A/V/XR 以及web3和大模型的精彩结合的产品,让我有点失望,也对未来有一些期待。

露天有个站台,我听了 合合的多模态抽取以及RAG方案,金山的WPSAI,百度的文心编程。但最让我喜欢的其实是rwkv的坚持,这也许就是科研创新最原始的魅力吧。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/777846.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【文献解析】Voxelmap——一种自适应体素地图

Efficient and Probabilistic Adaptive Voxel Mapping for Accurate Online LiDAR Odometry 论文地址:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp&arnumber9813516 代码:GitHub - hku-mars/VoxelMap: [RA-L 2022] An efficient and probabili…

2024年7月6日 (周六) 叶子游戏新闻

自动电脑内部录音器AutoAudioRecorder: 是一款免费的自动音频录制软件,可直接将电脑内部所有的声音录制成 mp3/wav 文件,包括音乐、游戏直播、网络会议、聊天通话等音频源。 卸载工具 HiBitUninstaller: Windows上的软件卸载工具 《不羁联盟》制作人&…

Java中的日期时间类详解(Date、DateFormat、Calendar)

1. Date类 1.1 概述 java.util.Date类表示特定的瞬间,精确到毫秒。Date类的构造函数可以把毫秒值转成日期对象。 继续查阅Date类的描述,发现Date拥有多个构造函数,只是部分已经过时,我们重点看以下两个构造函数 1.2 Date类构造…

【踩坑】探究PyTorch中创建稀疏矩阵的内存占用过大的问题

转载请注明出处:小锋学长生活大爆炸[xfxuezhagn.cn] 如果本文帮助到了你,欢迎[点赞、收藏、关注]哦~ 目录 问题复现 原因分析 解决方案 碎碎念 问题复现 创建一个COO格式的稀疏矩阵,根据计算公式,他应该只占用约5120MB的内存&…

54、一维和二维自组织映射(matlab)

1、一维和二维自组织映射原理 一维和二维自组织映射(Self-Organizing Maps, SOM)是一种无监督的机器学习算法,通过学习输入数据的拓扑结构,将高维输入数据映射到低维的网格结构中,使得相似的输入数据点在映射空间中也…

win7系统快速安装python

下载安装包 建议选择python3.8左右的,我下载的是3.7.8,最新版本的pythonwin7可能不支持 python网址 下拉寻找 安装python 1.双击安装包 更换完地址选择安装(install) 安装完成后点击close即可 测试是否安装成功 1.winr快捷键打开黑窗口输入cmd …

七大排序-冒泡排序,插入排序,希尔排序(一)

目录 排序冒泡排序插入排序冒泡排序和插入排序的对比希尔排序 排序 先写单趟,再写多趟,这样比较好写 排序可以理解为对商品价格的排序,对数字大小的排序,排序再生活中随处可见 冒泡排序 冒泡排序就是两个相邻的数交换&#xff…

跨界客户服务:拓展服务边界,创造更多价值

在当今这个日新月异的商业时代,跨界合作已不再是新鲜词汇,它如同一股强劲的东风,吹散了行业间的壁垒,为企业服务创新开辟了前所未有的广阔天地。特别是在客户服务领域,跨界合作正以前所未有的深度和广度,拓…

mysql 9 新特新

mysql9新特性 新特性Audit Log NotesC API NotesCharacter Set SupportCompilation NotesComponent NotesConfiguration NotesData Dictionary NotesData Type NotesDeprecation and Removal NotesEvent Scheduler NotesJavaScript ProgramsOptimizer NotesPerformance Schema …

微机原理与单片机 知识体系梳理

单片机笔记分享 我个人感觉单片机要记的东西很多,也很琐碎,特别是一些位、寄存器以及相关作用等,非常难以记忆。因此复习时将知识点整理在了一起做成思维导图,希望对大家有所帮助。内容不是很多,可能有些没覆盖全&…

Python人形机踊跃跨栏举重投篮高维数动作算法模型

🎯要点 🎯运动功能: 1 m / s 1 m / s 1m/s上台阶、站立平衡、 1 m / s 1 m / s 1m/s行走、坐椅子、 5 m / s 5 m / s 5m/s跑步、 1 m / s 1 m / s 1m/s爬行、穿越森林、取物、穿越迷宫、 1 m / s 1 m / s 1m/s上滑梯、 5 m / s 5 m / s 5m/s…

iOS多target时怎么对InfoPlist进行国际化

由于不同target要显示不同的App名称、不同的权限提示语,国际化InfoPlist文件必须创建名称为InfoPlist.strings的文件,那么多个target时怎么进行国际化呢?步骤如下: 一、首先我们在项目根目录创建不同的文件夹对应多个不同的targe…

自然之美无需雕琢

《自然之美,无需雕琢 ”》在这个颜值至上的时代,但在温馨氛围中,单依纯以一种意想不到的方式,为我们诠释了自然之美的真谛。而医生的回答,如同一股清流耳目一新。“我说医生你看我这张脸,有没有哪里要动的。…

09 docker 安装tomcat 详解

目录 一、安装tomcat 1. tomcat镜像的获取 2. docker创建容器实列 3. 访问测试 404错误 4. 解决方案 5. 使用免修改版容器镜像 5.1. 运行实列的创建 5.2. 出现问题及解决: 6. 验证 OK 一、安装tomcat 1. tomcat镜像的获取 docker search tomcat #docker …

最灵活且易用的C++开源串口通信调试软件

这款C开源串口调试软件,集成了丰富的功能,为用户提供高效、便捷的串口通信调试体验。以下是其核心功能亮点: 基础功能: 数据交互自如:支持串口数据的轻松读取与发送,让数据交换变得简单直接。 灵活配置参…

【后端面试题】【中间件】【NoSQL】MongoDB查询优化3(拆分、嵌入文档,操作系统)

拆分大文档 很常见的一种优化手段,在一些特定的业务场景中,会有一些很大的文档,这些文档有很多字段,而且有一些特定的字段还特别的大。可以考虑拆分这些文档 大文档对MongoDB的性能影响还是很大的,就我个人经验而言&…

【TB作品】基于ATmega48的开机登录程序设计

使用Proteus仿真软件设计一个开机登录程序,单片机选用ATmegga48. 基础要求: 1.程序启动后在LCD1602液晶屏上提示用户通过独立按键输入密码(6位)。 2.密码输入错误则在屏幕上提示密码错误,密码输入正确则在屏幕上提示密 码正确后等待约3秒后进入主界面,在屏幕中央显示HelloWorld…

基于RK3588的8路摄像头实时全景拼接

基于RK3588的8路摄像头实时全景拼接 输入:2路csi转8路mpi的ahd摄像头,分辨率1920 * 1080 8路拼接结果: 6路拼接结果: UI界面: UI节目设计原理

数字时代如果你的企业还未上线B端系统助力则后果很严重

**数字时代如果你的企业还未上线B端系统助力则后果很严重** 数字化浪潮席卷全球,企业对于数字化转型的重视程度日益提高。B端系统,作为企业数字化转型的核心组成部分,其重要性不言而喻。如果你的企业还未上线B端系统助力,那么后果…

异步主从复制

主从复制的概念 主从复制是一种在数据库系统中常用的数据备份和读取扩展技术,通过将一个数据库服务器(主服务器)上的数据变更自动同步到一个或多个数据库服务器(从服务器)上,以此来实现数据的冗余备份、读…