AI算力专题:AI时代领先者,大装置+大模型推动AGI落地

今天分享的是AI算力系列深度研究报告:《AI算力专题:AI时代领先者,大装置+大模型推动AGI落地》。

(报告出品方:中银证券)

报告共计:28

四核驱动引领智慧科技新潮流

商汤是一家行业领先的人工智能软件公司,以“坚持原创,让 AI 引领人类进步”为使命。长期投入于原创技术研究,不断增强行业领先的全栈式人工智能能力,其优势领域涵盖感知智能、决策智能、智能内容生成和智能内容增强等关键技术领域,除此以外还具备 AI 芯片、AI 传感器及 AI 算力基础设施等相关能力。其主要业务分为四个部分:智慧商业、智慧城市、智慧生活、智能汽车,紧紧围绕公司自研的 SenseCore AI 大装置作为大模型生产的核心平台,带动公司不断向前发展,成为 AI行业头部企业。

围绕大装置+大模型,打造 AI 商业新模式

持续升级的 SenseCore大装置与大模型

商汤的 SenseCore 以 Alaas 的模式面向行业伙伴提供服务,其目前可有效支持最多 20 个千亿参数量大模型(以千卡并行)同时训练,最高可支持万亿参数超大模型的训练。2023年以来,共有超1.000 个参数两数十亿至上千亿的大模型在大装置上完成训练,实现了领跑行业的技术迭代速度。并且公司投入了约 10,000张 GPU在大语言模型的研发上,使其能力实现高速发展:投入了约 2.000张 GPU在文生图模型的研发上,实现了文生图能力的快速选代。

商汤的 Alaas 生态具体包括底层计算基础设施服务(Iaas)与深度学习平台服务(Paas)、模型部署及推理服务(MaaS)三大部分的能力。

在 laaS 层面,SenseCore 提供高性能计算资源,以支持大型模型训练所需的强大算力。位于上海临港的商汤 AIDC 上线 GPU数量约3万块,算力规模高达 6000P FLOPS。

在 PaaS 层面,SenseCore 提供易用的开发工具和深度学习平台,协助内外部高效构建和优化模型。公司与多家科研机构合作推进 AI开源平台建设,自 2018年开源计算机视觉框架 OpenMMLab(8.7万 GitHub 星标)开始,已扩展到决策智能、大语言模型、数据平台、高性能训练和推理框架、AI智能体框架等更多 AI工具的开源。IntemLM-7B(70亿参数)的部分训练数据、训练代码及基模型权重已经向学术界及工业界开放、支持商用。近期公司还将开源能力更加强大的 InternLM-20B 模型 (200亿参数)。

在 MaaS 层面,SenseCore 支持用户将训练好的 AI 模型一键跨平台部署到云端、边缘设备或混合环境中。公司针对 30款芯片、100多种平台进行了常规模型的适配和优化,以支持大规模的实时推理此外,SenseCore 拥有一支经验丰富的模型训练支持团队,协助用户优化模型架构、选择合适的算法和参数,确保模型性能达到最优。

SenseCore Al大装置持续升级

目前我国智能算力处于高增长阶段,截至 2023年 11月,国内投入运营、在建和筹备中的人工智能计算中心已超过 30 家。其中位于上海临港的商汤人工智能计算机中心(AIDC)的上线 GPU 数量约 3万块,算力规模高达 6,000PFLOPS。商汤作为亚洲目前最大的智能计算平台之一,就国内市场而言,其智算中心在算力质量方面仍位居第一梯队。

在持续升级公司智能计算基础设施 SensecCore AI 大装置外,商汤联合多家国内顶尖科研机构于 2023 年 6 月发布了国内首个超越 GPT-3.5-turbo 性能的预训练大模型 InternLM,该基模型参数量 达 1040 亿,使用 1.6 万亿 token 的多语言语料训练,在其基础商汤上发布了商量 2.0,并于 2023 年 9 月升级至 3.0。2023 年 10 月,中文通用大模型综合性评测基准 SuperCLUE 发布 9 月总排行榜和 各个分类任务榜单,商汤商量 SenseChat 3.0 位列中文大模型总榜排名第一。 目前,商汤大语言模型的原始语料数据积累以及对语料进行清洗和试验的能力行业领先,其中 InternLM-7B 在多个模型测试榜单高踞榜首,成为性能最好的轻量级基模型。在文生图模型方面, 秒画 3.0 核心算法在 COCO benchmark 上超过了谷歌的 Imagen 与 OpenAI 的 DALL·E 2,出图效果 跻身全球前列,为国内领先。

人工智能应用场景持续拓展

商汤日日新 SenseNova 大模型体系以低成本解锁通用人工智能的任务和能力,推动高效率、低成本规模化的 AI 创新和落地,打通商业价值循环,解决长尾应用问题,推动人工智能进入工业化发展阶段。我们预计,SenseNova大模型体系未来应用主要是两个方向,2B和2B2C:2B模式发展较快已有大量客户项目落地。

商汤日日新大模型体系的 2B 客户覆盖多个领域,如金融、地产、能源、教育等,商汤根据每个公司的具体要求进行行业大模型的定制化和私有化部署。例如,在金融领,商汤与银行、保险、券商等客户展开合作,利用数字人进行智能客服、智慧营销等工作,并通过接入大语言模型能力,提供投研分析、研报撰写等新功能,实现降本增效:在医疗健康领域,商汤打造了中文医疗健康语言大模型“大医”。“大医”内嵌医学“场景集市”,包含 13 个预设场景,并支持提示工程自定义长程记忆存取和医学知识库查询总结等个性化功能,帮助医疗健康产业链上下游机构根据实际需求打造专属医疗健康大模型。

此外,商汤日日新 SenseNova 大模型体系还能为客户提供 API 接口和服务,包括图片生成,自然 语言生成,视觉感知通用任务与标注服务,客户可根据实际应用需求,调用“日日新 SenseNova” 大模型的各项 AI 技术能力,低门坎、低成本、高效率地实现各类 AI 应用。同时商汤将持续搭建升 级自有 2C 大模型应用平台,并打造多样性的 AI 用户社区。

智慧医疗

在医疗领域,公司以成为“AI 驱动的'未来医院”设计赋能者”为战略目标,向医院客户提供多种智能化产品及服务,包括智能辅助临床诊疗、智慧就医助手、智慧医院管理服务、智慧科研服务智慧医联体服务等。公司的 SenseCare 智慧诊疗平台已获得国内 NMPA 三类、二类医疗器械注册证欧盟 CE、新加坡、沙特、阿联酋等国内外医疗器械认证共计 22 项,并落地了上海交通大学医学院附属瑞金医院、四川大学华西医院、郑州大学第一附属医院等大型头部医院在内的上百家医院与医疗机构。

智慧能源

凭借先进的人工智能技术以及在能源行业的多年深耕,商汤已经成功构建了覆盖能源生产、传输、存储等多个产业链条的数字能源产品矩阵,并与光伏、电网及锂电池企业达成战略合作,助力企业降本增效、创新运维管理范式。

2023 年,公司与南方电网数字电网集团签署战略合作。双方将以多模态大模型、语言大模型、视觉大模型为基础,共同探索大模型技术与新型电力系统的创新结合点,在复杂场景调度运行决策、精细化源荷预测、电力数据智能处理等多场景开展应用。双方于 2020年便在电网换流站开展首个工业级视觉定位 AR 技术试点研究,以 AI+AR 技术助力实现智能电网巡检,提高电力运维效率。借助 AR 巡检,可帮助实现换流站设备运维作业智能辅助与闭环管控,以及实现换流站运维远程指挥、安全监管和智能协助。

报告共计:28

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/360615.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

幻兽帕鲁服务器多少钱——幻兽帕鲁服务器价格介绍

2024年幻兽帕鲁服务器价格表更新,阿里云、腾讯云和华为云Palworld服务器报价大全,4核16G幻兽帕鲁专用服务器阿里云26元、腾讯云32元、华为云26元,阿腾云atengyun.com分享幻兽帕鲁服务器优惠价格表,多配置报价: 幻兽帕鲁…

2023年09月CCF-GESP编程能力等级认证Python编程二级真题解析

一、单选题(共15题,共30分) 第1题 我国第一台大型通用电子计算机使用的逻辑部件是 ( )。 A:集成电路 B:大规模集成电路 C:晶体管 D:电子管 答案:D 第2题 下列流程图的输出结果是( )? A:5 12 B:12 5 C:5 5 D:12 12 答案:B 第3题 如果要找出整数 a …

【经典项目】Java小游戏 —— 弹力球

一、功能需求 设计一个Java弹球小游戏的思路如下: 创建游戏窗口:使用Java图形库(如Swing或JavaFX)创建一个窗口,作为游戏的可视化界面。 绘制游戏界面:在游戏窗口中绘制游戏所需的各个元素,包括…

在Mixamo网站上,下载的动画导入unity给自己的模型添加后出错怎么解决

在Mixamo网站上,下载的动画导入unity给自己的模型添加后出错 一、在Mixamo下载的模型可以正常使用二、在自己的模型和unity自带模型上就出错1.解决方法2.解决成功 注意 一、在Mixamo下载的模型可以正常使用 二、在自己的模型和unity自带模型上就出错 1.解决方法 选…

Python XPath解析html出现⋆解决方法 html出现#123;解决方法

前言 爬网页又遇到一个坑,老是出现乱码,查看html出现的是&#数字;这样的。 网上相关的“Python字符中出现&#的解决办法”又没有很好的解决,自己继续冲浪,费了一番功夫解决了。 这算是又加深了一下我对这些iso、Unicode编…

Log4j2-11-log4j2 Layout 布局入门介绍

Layout 布局 Appender使用Layout将LogEvent格式化为一种表单,以满足将要消费日志事件的任何需求。 在Log4j中。x和Logback布局被期望将事件转换为字符串。 在Log4j 2布局返回一个字节数组。这使得Layout的结果可以在更多类型的appender中使用。然而,这…

1.30号c++

浅拷贝和深拷贝(重点) 1> 每个类中系统都会提供一个默认的拷贝构造函数,如果程序员显性定义出拷贝构造函数,则系统取消默认提供。 2> 系统提供的拷贝构造函数,是将一个类对象的所有数据成员给另一个对象的所有…

###C语言程序设计-----C语言学习(8)## 斐波那契数列问题,素数问题,人数分配问题。

前言:感谢您的关注哦,我会持续更新编程相关知识,愿您在这里有所收获。如果有任何问题,欢迎沟通交流!期待与您在学习编程的道路上共同进步。 今天,我们主要分享三个问题如何用C语言去求解,1.斐波…

图片怎么裁剪成想要的尺寸?教你快速图片裁剪的方法

图片怎么裁剪成想要的尺寸?图片裁剪属于我们日常生活中比较常见的图片处理方式了,不管是改变图片打下,还是需要将图片中一些不需要的部分裁减掉,都需要用到这个功能,除了使用软件之外,我们还可以通过在线裁…

【Django自学】Django入门:如何使用django开发一个web项目(非常详细)

测试机器:windows11 x64 python版本:3.11 一、安装Django 安装步骤非常简单,使用pip安装就行 pip install django安装完成之后,python的 Scripts 文件夹下,会多一个 django-admin.exe (管理创建django项目的工具)。…

超声波风速风向传感器的优势及应用

TH-WQX2随着科技的不断发展,传感器技术日益成为众多领域中不可或缺的一部分。其中,超声波风速风向传感器凭借其独特的优势,在气象、能源、环保等领域中发挥着越来越重要的作用。 首先,超声波风速风向传感器无需机械转动部件&#…

【Vue】2-10、Vue 组件

一、组件化开发 组件化开发指的是根据封装的思想,把页面上可重用的 UI 结构封装为组件,从而方便项目的开发和维护。 二、Vue 组件的组成 template:组件的模板结构script:组件的 JavaScript 行为style:组件的样式 &…

Vim实战:使用 Vim实现图像分类任务(二)

文章目录 训练部分导入项目使用的库设置随机因子设置全局参数图像预处理与增强读取数据设置Loss设置模型设置优化器和学习率调整策略设置混合精度,DP多卡,EMA定义训练和验证函数训练函数验证函数调用训练和验证方法 运行以及结果查看测试完整的代码 在上…

C++提取ICO图标(PE文件资源提取)

最近需要写一个提取EXE或者DLL图标资源的功能, 网上找了很久, 要么功能不好用, 最后结果如下: 1.很多是加载为HICON句柄后转换为图片保存, 全损画质..., 2.后来找了个还能用的, 详见 https://github.com/TortoiseGit/TortoiseGit/blob/master/src/Utils/IconExtractor.cpp …

git远程仓库基本操作

目录 gitremote (查看远程仓库) git remote add [仓库名] [url] git clone [url](克隆远程仓库到本地) git push [名][分支名](提交到远程仓库)​编辑 git pull [名][分支名]从远程仓库拉取​编辑 注意操作…

opencv学习 特征提取

内容来源于《opencv4应用开发入门、进阶与工程化实践》 图像金字塔 略 拉普拉斯金字塔 对输入图像进行reduce操作会生成不同分辨率的图像,对这些图像进行expand操作,然后使用reduce减去expand之后的结果,就会得到拉普拉斯金字塔图像。 …

Java 代理详解

Java 代理详解 文章目录 Java 代理详解1. 代理模式2. 静态代理3. 动态代理3.1. JDK 动态代理机制3.1.1. 介绍3.1.2. JDK 动态代理类使用步骤3.1.3. 代码示例 3.2. CGLIB 动态代理机制3.2.1. 介绍3.2.2. CGLIB 动态代理类使用步骤3.2.3. 代码示例 3.3. JDK 动态代理和 CGLIB 动态…

SD-WAN和专线混合组网:企业出海网络解决方案

目前,有很多国内企业涉足海外业务,如跨境电商、游戏、社交网络、区块链等。都会使用海外服务器。同时,这些企业在国内还有自己的机房,IDC或者使用国内其他云厂商的机房。如果他们想要相互通信或传输数据该怎么办?在成本…

最小步数模型

AcWing 1107. 魔板 #include <bits/stdc.h> using namespace std;char g[2][4]; const int N 10; unordered_map<string, pair<char, string> > pre; unordered_map<string, int> d;void Set(string s) {for(int i0; i<4; i) g[0][i] s[i];for(in…

骨传导如何使用,跟传统耳机有什么不同吗?

骨传导耳机的使用方法跟传统耳机是一样的&#xff0c;都是通过蓝牙连接来使用&#xff0c;不同的是&#xff0c;有些骨传导耳机自带内存&#xff0c;可以当做MP3来使用&#xff01; 此外&#xff0c;骨传导耳机的佩戴方式和传声方式跟传统耳机也有所不同&#xff0c;首先骨传导…