走向边缘智能,美格智能携手阿加犀成功在高算力AI模组上运行一系列大语言模型

近日,美格智能发挥软硬件一体协同开发能力,融合阿加犀卓越的AI优化部署技术,在搭载高通QCS8550平台的高算力AI模组上,成功运行了一系列大语言模型,包括LLaMA-2、通义千问Qwen、百川大模型、RedPajama、ChatGLM2、Vicuna,展现出卓越的边缘端大模型部署能力。

111401.jpg

▌构建智算底座,加速大模型端侧部署

大模型和生成式AI的浪潮席卷全球,带来人工智能新纪元。大模型诞生之初主要是与云端绑定,而随着应用场景的拓展,AI开始赋能千行百业,大模型也需要在越来越多的终端设备上运行。如果说生成式AI是正在高速向前行驶的列车,那算力就是燃料。终端侧AI的落地应用,离不开硬件和设备算力的升级。

今年,高通推出了AI算力芯片QCS8550,整合了强大的NPU算力和边缘侧AI处理技术、Wi-Fi 7连接技术以及增强型图形和视频处理能力,提供高速、低功耗的AI计算平台,为终端侧AI赋能。

111402.jpg

基于高通QCS8550芯片平台,美格智能推出了高算力AI模组SNM970,综合AI算力高达48Tops,并支持混合精度计算,为IoT设备打造全新的智算底座。高算力AI模组是承载端侧AI无限创造空间的最佳形式,为海量碎片化场景提供稳定的通信能力和强大的边缘算力,让终端开发者能够基于标准化的模组完成低成本、短流程的产品设计和制造,降低大模型的开发和使用成本。

另一方面,AI从芯片到应用还需要解决跨平台迁移、异构芯片效率丢失、碎片化的场景需求等挑战。阿加犀具备成熟的AidLux平台和行业领先的开箱即用AI工具链,能够全面提升边缘设备的AI性能和模型执行效率,为AI项目在丰富场景中快速落地提供专业支持,进一步推动AI应用的终端部署。

此次,美格智能高算力AI模组产品团队携手阿加犀,在基于高通骁龙800系列平台的自研高算力AI模组上成功运行一系列大语言模型,成功验证了算力模组作为未来大模型边缘AI算力底座的通用性,对边缘端生成式AI的支持进一步成熟,有望将生成式AI拓展至更多领域。

微信图片_20231114141224.jpg

美格智能提供具备出色能效比、强大的计算能力的算力模组,结合阿加犀独有的AI工具链带来的领先的SoC性能调度能力,二者强强联合发挥出模组的极致性能,让多个参数达70亿的语言大模型,包括LLaMA-2、通义千问Qwen、百川大模型、RedPajama、ChatGLM2、Vicuna,都能在算力模组上保持高效运行。

▌高算力AI模组,让AI触手可及

美格智能高算力AI模组产品专为终端侧、边缘侧AI应用设计,依靠强大的软硬件一体研发能力,美格智能持续推进高算力AI模组的AI硬件不断升级,至今已经历经多代产品演进,涵盖入门级、中端、旗舰级多层次产品,包括SNM930、SNM950、SNM960、SNM970、SNM972等系列,对应AI算力覆盖14Tops~48Tops。

111403.jpg

同时,美格智能研发团队在AI应用场景开发、AI性能优化和AI低功耗程序研发等领域的设计研发能力处于行业领先水平,相关算力产品在各类核心场景大规模应用,让智慧零售、智能机器人、智慧交通、智慧农业、智能制造等各行各业快速于边缘端部署大模型,以AI驱动业务创新。

针对AI边缘计算领域,美格智能基于高算力AI模组SNM972,助力客户打造SoC阵列服务器产品。该模组采用MiniPCIe封装方式,支持16GB LPDDR5X + 256GB UFS 4.0内存,并支持混合精度计算,支持ONNX、Pytorch、CAFFE、TensorFlowLite等模型框架,可轻松赋能各类AI场景。

1114.5.jpg

方案中每个算力节点采用刀片+阵列式设计,内部实现模块化及热插拔设计,可以实现不停机维护。最高可配置80路算力模组,单颗模组内部支持Android虚拟化,可虚拟出多路计算单元,更好地进行算力配置,为实时互动云计算、边缘AI云计算、云渲染等业务场景提供最佳算力底座。

AI正在改变世界,美格智能始终以市场需求为导向,与合作伙伴紧密合作,围绕高算力AI模组打造更多适配行业的解决方案,拉近大模型和应用之间的距离,把握智慧先机,实现让AI触手可及的目标,赋能数字经济发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/270451.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux驱动

字符设备驱动模型 在字符设备中使用struct cdev这种结构来描述设备。 应用程序:读写文件,点灯;获取按键。用一些接口调用驱动程序去实现一些引用。 open这些函数,是C库实现的。从而进入内核,C库怎么进入内核&#xf…

【开源】基于JAVA语言的企业项目合同信息系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 合同审批模块2.3 合同签订模块2.4 合同预警模块2.5 数据可视化模块 三、系统设计3.1 用例设计3.2 数据库设计3.2.1 合同审批表3.2.2 合同签订表3.2.3 合同预警表 四、系统展示五、核心代码5.1 查询合同…

【大厂面试】之 美团(一面经含答案)

美团 一面 tcp三次握手,四次挥手。time-wait、close-wait状态。MSL代表什么?为什么time-wait是2MSL,可不可以更长?如果不设置time-wait有什么影响 time-wait是主动关闭方的一个状态;close-wait是被动关闭方的一个状态…

微擎模块 出现Error: template source ‘common/message’ is not exist!解决方法

今天有会员反馈微课堂分销中心打不开,错误提示模板找不到:Error: template source ‘common/message’ is not exist!,看了下这模板应该微擎框架通用的,进公众号会员管理-会员中心网址居然也打不开,提示一样的错误&…

多播ip地址配置和通信理解

经常有朋友问,为什么相同局域网的ip需要相同网段,为什么组播的网段可以不同? 比如: 在您的局域网(192.168.1.0/24 网段)中设置多播组时,您可以选择一个在本地网络范围内尚未使用的多播组地址。…

绿色装配式建筑——气膜建筑

伴随新时代的到来和发展理念的深入实施,装配式绿色建筑已经成为建筑业发展的主流趋势。本文将深入分析气膜建筑,采用绿色建筑技术和装配式的建筑模式,形成了一套完善的建筑体系。 气膜建筑以气膜结构为主体,采用新型高强度柔性薄膜…

批量归一化

目录 一、BN层介绍 1、深层神经网络存在的问题 2、批量归一化的解决方案 3、BN层作用位置 4、BN层在做什么 5、总结 二、批量归一化从零实现 1、实现批量归一化操作 2、创建BN层 3、对LeNet加入批量归一化 4、开始训练 三、简明实现 1、对LeNet加入批量归一化 2…

【Spring实战】02 配置多数据源

文章目录 1. 配置数据源信息2. 创建第一个数据源3. 创建第二个数据源4. 创建启动类及查询方法5. 启动服务6. 创建表及做数据7. 查询验证8. 详细代码总结 通过上一节的介绍,我们已经知道了如何使用 Spring 进行数据源的配置以及应用。在一些复杂的应用中,…

mybatis的二级缓存使用以及禁用

目录 mybatis 二级缓存配置有两处 全局设置 mapper 设置 测试代码 执行结果 源码执行逻辑 创建 SqlSession 二级缓存配置是否添加 解析 cache 标签 XMLMapperBuilder MapperBuilderAssistant CacheBuilder PerpetualCache SerializedCache LoggingCache 将 cach…

电商数据分析-01-电商数据分析指标

电商数据指标 电商数据分析涉及多个指标,这些指标可以帮助企业了解其业务表现、用户行为和市场趋势。以下是一些常见的电商数据分析指标: 销售指标: 总销售额(GMV): 衡量特定时期内所有销售交易的总值。 平…

算法学习系列(十一):KMP算法

目录 引言一、算法概念二、题目描述三、思路讲解三、代码实现四、测试 引言 这个KMP算法就是怎么说呢,就是不管算法竞赛还是找工作笔试面试,都是非常爱问爱考的,其实也是因为这个算法比较难懂,其实就是很难,所以非常个…

【环境配置】虚拟环境配置

创建虚拟环境 conda create -n pytorch python3.9安装成功提示 激活虚拟环境 activate pytorch安装pytorch 查看 python 版本——python 退出 python——exit() 对照 python 与 pytorch 的对应关系 pytorch 地址: https://pytorch.org/get-started/previous-…

Python in Visual Studio Code 2023年12月发布

作者:Courtney Webster 排版:Alan Wang 我们很高兴地宣布 Visual Studio Code 的 Python 和 Jupyter 扩展将于 2023 年 12 月发布! 此版本包括以下公告: 可配置的调试选项已添加到“运行”按钮菜单可以使用 Pylance 显示类型层次…

JAVA JDK8时间类之Period、Duration、ChronoUnit的使用【详解】

JAVA JDK8时间类之Period、Duration、ChronoUnit的使用 1. Duration1.1 简介:用于时间间隔(秒、毫秒、纳秒等)1.2 案例 2. Period时间间隔(年、月、日)2.1 简介2.2 案例 3. ChronoUnit3.1 简介案例 4. 案例所有代码: 1. Duration 1.1 简介:用…

边缘计算AI智能盒子的视频源必须是固定点监控摄像头吗?

边缘计算AI盒子的视频输入源,要求是RTSP或者GB28181,可以是固定点监控摄像头(枪机、球机等),也可以是移动摄像头,例如执法记录仪、智能安全帽、布控球等,但由于RTSP输入要求摄像头有固定IP&…

中庸 原文与译文

《中庸》是中国古代论述人生修养境界的一部道德哲学专著,是儒家经典著作之一,原属《礼记》第三十一篇,相传为战国时期子思所作。 其内容肯定“中庸”是道德行为的最高标准,认为“至诚”则达到人生的最高境界,并提出“…

算法——哈希表

哈希表简介 **是什么:**存储数据的容器有什么用:快速查找某个元素,时间复杂度O(1),空间复杂度O(n)**什么时候使用哈希表:**频繁查找某一个数(这里不要忘了之前的二分,时间复杂度O(logN)&#x…

sqlilabs第三十二三十三关

Less-32(GET - Bypass custom filter adding slashes to dangerous chars) 手工注入 由 宽字符注入可知payload 成功触发报错 http://192.168.21.149/Less-32/ ?id1%df 要写字符串的话直接吧字符串变成ascii码 注意16进制的表示方式 自动注入 sqlmap -u http:…

三相电机转差率为负值的情形

1.电机开始发电的特征 注意,电机因为有输入频率对原始旋转磁场的影响,在正常工作时,应该处于稳态,因为旋转磁场决定了这个系统的运转方向和运转的大致频率区间。它会处于力矩平衡态。但是,如果,此时电机处…

智能优化算法应用:基于指数分布算法3D无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用:基于指数分布算法3D无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用:基于指数分布算法3D无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.指数分布算法4.实验参数设定5.算法结果6.…