科技云报道:打造生成式AI应用,什么才是关键?

科技云报道原创。

生成式AI作为当前人工智能的前沿领域,全球多家科技企业都在加大生成式AI的研发投入力度。

随着技术、产品及应用等方面不断推出重要成果,如今有更多的行业用户在思考该如何将生成式AI应用落地。
在这里插入图片描述

但开发生成式AI应用是一个充满挑战的系统工程,并不是单纯的产品和服务拼接,涉及基础设施领域一系列的挑战。

亚马逊云科技大中华区产品部总经理陈晓建表示,当我们谈论生成式AI时,大多数人都在谈论基础模型,而整个生成式AI应用就像是浮在海面的冰山,露在海面上方能被大多数人看到的冰山一角就像是基础模型,而在冰川的底部,同样需要大量的基础模型以外的服务来支撑,如加速芯片、数据库、数据分析、数据安全服务等等。

那么,想要构建一个成功的生成式AI应用,需要哪些基础设施助力?业界是否有一些最佳实践可以参考呢?

生成式AI应用构建的关键
高性价比的基础设施

都说算力、算法和数据是人工智能发展的三要素,想要让这些要素更好地与生成式AI应用匹配,高性价比的基础设施必不可少。

AI高性能芯片为生成式AI训练提供算力支撑
人工智能的发展从深度学习时代进入到大模型时代,大规模预训练模型的参数量呈现指数级上升,需要高性能算力的支撑。

目前,大规模预训练模型训练算力是以往的10到100倍,当前主流生成式AI模型的训练广泛使用到英伟达Tensor Core GPU芯片,如微软斥资数亿美元购买数万颗英伟达A100芯片以帮助Open AI打造ChatGPT。

AI计算集群为生成式AI模型训练降低成本
AI计算集群能够提供大规模算力、持续提高算力资源利用率、提升数据存储和处理能力,进一步降低模型训练门槛和成本,推动生成式AI模型的落地进程。

当前较为典型的AI计算集群,例如基于英伟达最新GPU芯片H100 Tensor Core的Amazon EC2 P5实例,与上一代相比速度快6倍,训练成本节省40%;

基于亚马逊云科技自研的机器学习推理芯片Amazon Inferentia2推出的Amazon EC2 Inf2实例,与其他类似的EC2实例相比性价比高40%;

基于自研机器学习训练芯片Amazon Trainium推出的Amazon EC2 Trn1实例,与同类实例相比训练成本节省高达50%。

这也是为什么有越来越多的客户,比如Airbnb、OPPO、Sprinklr 和 Autodesk等,会选择使用亚马逊云科技的自研芯片来承载他们的生成式AI应用。

基础模型服务为构建生成式AI提升效率
生成式AI的核心是利用机器学习领域的基础模型驱动的,从RNN、CNN到VAE、GAN,每种模型都有其独特的优点和应用领域,这些模型在很大程度上决定了AI系统的表现。

然而,基础模型的发展和迭代速度正超越以外任何一项技术,基本以月甚至天为单位持续迭代。

在众多的基础模型中,应该如何便捷安全的选择最适合自己业务场景的基础模型,是每一家企业在构建生成式AI应用时面临的挑战。

事实上,借助专门构建的生成式AI工具和基础设施,可以帮助企业快速构建高性价比的生成式AI应用。

例如,亚马逊云科技Amazon Bedrock是一项无服务器服务,提供了广泛的模型选择、数据隐私,并且能够自定义模型,无需管理任何基础设施。

该服务提供的基础模型来自Meta, Anthropic, Stability AI, AI21 Labs, Cohere等第三方领先提供商以及自身的Amazon Titan模型等,近期还加入了Meta的下一代开源大模型Llama2以及Anthropic的Claude2等热门基础模型。

同时,Amazon Bedrock与Amazon SageMaker Jumpstart结合,用户可以从Amazon SageMaker Jumpstart中选择开源的基础模型,然后根据自身需求可以选择全量微调,轻量微调等不同方式,进一步确定微调框架,利用分布式训练实现微调,从而更好的评估微调效果。
在这里插入图片描述

云原生服务加速生成式AI应用构建
人工智能预训练模型的开发对于云服务有较大需求,AI云服务可以提供人工智能开发模块,通过多元化的服务模式,降低开发者的开发成本和产品开发周期,为模型开发提供AI赋能。

尤其是借助云原生服务,可以加速AI应用构建,助力业务敏捷创新。

比如,以微服务化和事件驱动架构为核心的设计框架,松耦合的去处理每个功能模块之间的互相依赖;Serverless First能够简化运维、提升效率;在DevOps、基础设施即服务、自动化等现代应用治理理念持续投入,可以促进企业内部的应用资产与实践的分享,构建高效敏捷的构建者文化等等。

数据服务为生成式AI打造基座
数据作为生成式AI的关键,也将推动生成式AI的广泛应用,对于所有的组织企业来说都十分重要。

首先,面向生成式AI构建强大的数据“基座”,需要一套全面的服务,以便能够存储用于构建和微调模型的各种类型的数据;

其次,还需要服务间的集成,以打破数据孤岛,确保能够随时访问所有数据;

最后,还需要在构建生成式AI应用程序的整个生命周期中,确保数据安全并对其进行管理。

以亚马逊云科技为例,针对生成式AI领域的用户个人信息、会话信息管理、私域知识库等应用场景都提供了专门构建的数据库。

在数据集成方面,亚马逊云科技已经在Amazon S3、Amazon Aurora、Amazon Redshift、Amazon SageMaker、Amazon EMR、Amazon Athena、Amazon Kinesis等各项服务之间,实现了深度的数据集成,帮助企业执行分析和机器学习,且无需移动数据。

在数据治理方面,亚马逊云科技Amazon DataZone让客户能够跨组织边界发现、访问、共享和治理大规模数据,并减少企业内部成员访问数据和使用分析工具时繁重的工作量。

构建生成式AI
应用的行业实践

目前,由生成式AI引导的企业变革序幕全面展开,以多元应用不断创新AI应用范式,并将实践成果逐步延伸至智慧教育、智能制造、医疗等领域,真正成为人们生产生活的得力助手。

其中,在行业类应用场景中,AI助手类应用得到了广泛运用,比如在协同办公赛道就掀起了新风口:

钉钉接入千问大模型,用户可以唤起10余项AI能力如:自动整理群聊要点、生成待办、预约日程、写文案、生成海报、一键生成讨论要点等。

飞书宣布推出智能助手“My AI”,功能包括汇总会议纪要、创建报告、优化和续写文字内容等功能。

金山办公推出“WPS AI”,支持内容生成、公式生成、制作PPT、扫描识别并分析文件等功能。

而在金融、医疗、工业等领域,最具前景的应用则来自于数据挖掘和知识洞察(Insight)类工具。

但无论是哪种形式的生成式AI的应用落地,背后都离不开强大的基础设施作为支撑。

金山办公软件股份有限公司的 AI 研发总监刘强表示,今年起WPS开始将大语言模型的能力全面引入产品,致力于开发新一代办公软件。

而在构建生成式AI应用的过程中,基础模型性能有限,数据隐私与安全难以保障,高额管理成本等现实情况成为了摆在金山办公面前的重重障碍。

亚马逊云科技Amazon Bedrock中支持的领先大语言模型,在多个文字处理场景中符合金山办公的需求。

除多种模型选择外,Amazon Bedrock还在数据安全层面给金山办公提供了充分的支持,极大地提高了金山办公的内部开发效率,助力金山办公进一步革新办公体验。

西门子中国也借助了一系列云基础设施、大数据、机器学习等技术,来构建生成式AI应用。

据西门子中国大禹团队介绍,长期以来企业内部资源的检索和调用都存在结构散乱、检索速度慢、交互不便等问题。因此,大禹团队决定将大数据库和生成式 AI 应用于一个全新的“智能知识库”,从根本上提升知识库的可用性。

在亚马逊云的技术支持下,西门子中国大禹团队通过一个智能知识库暨智能会话机器人的解决方案,三个月时间就上线了生成式AI对话机器人“小禹”,实现了快速、精准的查询和回复。

在整个解决方案中,包括预训练大语言模型,Amazon OpenSearch Service的向量数据服务,以及相关系统集成等,这些核心关键能力让解决方案指南能实现目标知识库约80%功能,西门子中国根据企业内部需求再做20%定制化开发,最终形成完整的解决方案。

同时,Amazon OpenSearch Service的无服务器特性,让开发人员不需要管理集群或担心生产规模,可以快速推动部署。

基于Amazon SageMaker上提供的丰富的模型开发和训练工具,也保证了开发人员可以在云端轻松实现大语言模型的调优以及测试更多不同类型的开源模型。

结语

生成式AI正在成为企业新一轮业务创新的重要工具,成为下一代的生产力工具。

总体来看,高性价比的云基础设施技术如同一艘航母,能够为企业提供坚实的底座,让企业摆脱基础设施的束缚,更好、更高效地专注于创新。
【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/110589.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

线段树 区间赋值 + 区间加减 + 求区间最值

线段树好题:P1253 扶苏的问题 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 区间赋值 区间加减 求区间最大。 对于区间赋值和区间加减来说,需要两个懒标记,一个表示赋值cover,一个表示加减add。 区间赋值的优先级大于区间加…

No authorization token was found

今天遇到了一个问题,我把前后端逻辑都理了一遍,开始怀疑后端,后端肯定没错了,把前端理了一遍,ok前后端没错,我错。登录哪里需要的token????把我搞懵逼了。 测…

出租屋智能视频监控系统方案:全面保卫租客安全

除了我们常见的家庭、社区、园区等智能监控,出租房作为很多人的暂住所也极易发生盗窃等事件,为保障大众租户的财产安全,旭帆科技特地针对出租屋制定了智能监控系统方案。 1、安装智能安防摄像头 高清晰度、夜视功能良好的智能摄像头&#xf…

CSS 滚动驱动动画与 @keyframes 新语法

CSS 滚动驱动动画与 keyframes 在 CSS 滚动驱动动画相关的属性出来之后, keyframes 也迎来变化. 以前, keyframes 的值可以是 from, to, 或者百分数. 现在它多了一种属性的值 <timeline-range-name> <percentage> 建议先了解 animation-range 不然你会对 timeli…

Matlab中的app设计

1.窗口焦点问题&#xff1a; 窗口焦点问题&#xff1a;确保你的应用程序窗口正常处于焦点状态。有时&#xff0c;其他窗口的弹出或焦点切换可能导致应用程序最小化。点击应用程序窗口以确保它处于焦点状态。 窗口管理&#xff1a;确保你的 MATLAB 或操作系统没有未处理的错误或…

OpenCV学习笔记

一、OpenCV基础 &#xff08;一&#xff09;图像的读取、显示、创建 https://mp.weixin.qq.com/s?__bizMzA4MTA1NjM5NQ&mid2247485202&idx1&sn05d0b4cd25675a99357910a5f2694508&chksm9f9b80f6a8ec09e03ab2bb518ea6aad83db007c9cdd602c7459ed75c737e380ac9c3…

KT6368A蓝牙芯片的4脚也就是蓝牙天线脚对地短路了呢?是不是坏了

一、问题简介 KT6368A芯片的4脚&#xff0c;也就是蓝牙天线脚&#xff0c;万用表测量对地短路了呢&#xff1f;是不是芯片坏掉了&#xff0c;能不能重新寄样品给我。 详细说明 首先&#xff0c;芯片没有坏&#xff0c;遇到自己不懂的地方&#xff0c;不要轻易的去怀疑。 而是…

前后端分离项目(六):数据分页查询(前端视图)

&#x1f680; 优质资源分享 &#x1f680; &#x1f9e1; Python实战微信订餐小程序 &#x1f9e1;进阶级本课程是python flask微信小程序的完美结合&#xff0c;从项目搭建到腾讯云部署上线&#xff0c;打造一个全栈订餐系统。 &#x1f49b;Python量化交易实战&#x1f49…

企业内部外网向内网传输文件如何实现高效安全?

随着信息技术的发展&#xff0c;企业内部外网隔离已成为一种常见的网络安全措施&#xff0c;旨在防止外部攻击者入侵内部网络&#xff0c;保护企业的核心数据和业务系统。然而&#xff0c;企业内外网隔离也带来了一些问题&#xff0c;其中之一就是如何实现内外网之间的文件传输…

如何在实践中建立持久有效的6S管理呢?

提起6S管理&#xff0c;很多人可能认为是老旧的概念。然而&#xff0c;在三一集团&#xff0c;整理、整顿、清扫、清洁、素养和安全这12个字被执行到极致&#xff0c;甚至形成了一个共识&#xff1a;“搞不好6S的总经理是不合格的总经理”。这是因为三一集团高层通过多年的实践…

ROS常用命令及多机(TX2 与虚拟机)通信步骤

目录 ROS常用命令 常用命令 ROS多机通信步骤 虚拟机中添加镜像源 TX2中添加镜像源 ROS常用命令 rostopic list 命令查看当前系统中有哪些 topic。 rostopic info 命令查看该 topic 的信息&#xff0c;包括它的数据类型、发布者数量等。 rostopic hz 命令查看该 topic 的发布…

Mybatis @MapKey注解返回指定Map源码解析与用例

文章目录 前言技术积累什么是MyBatisMapKey注解 用例展示MapKey注解源码解析写在最后 前言 最近在开发的一个业务功能需要从一批数据中根据业务字段提取数据&#xff0c;对于这个需求可能有的同学就直接用for或者stream循环的方式进行处理了。但是&#xff0c;作为一个资深的搬…

场景交易额超40亿,海尔智家三翼鸟开始收获

文 | 螳螂观察 作者 | 余一 随着双十一的到来&#xff0c;国内的消费情绪再次被点燃。在这类大促之下&#xff0c;品牌们就像一个个天体&#xff0c;不断引动着市场潮汐&#xff0c;期待自己能触发更大的“海潮效应”。 所谓“海潮效应”是指&#xff0c;海水因天体的引力而…

Linux的基础常用指令

常用指令汇及其功能 ls 列出当前文件夹有哪些文件 ls -a显示所有文件&#xff0c;包含隐藏的文件和文件夹pwd显示当前是在哪个文件夹下mkdirmkdir名字→创建文件夹cdcd名字→进入某个指定文件夹cd .. 退回上层文件夹(cd后有空格) Tab键自动补全&#xff1a;文件或文件名太长&a…

【原创】java+swing+mysql志愿者管理系统设计与实现

摘要&#xff1a; 志愿者管理系统是一个用于管理志愿者以及活动报名的系统&#xff0c;提高志愿者管理的效率&#xff0c;同时为志愿者提供更好的服务和体验。本文主要介绍如何使用javaswingmysql去实现一个志愿者管理系统。 功能分析&#xff1a; 系统主要提供给管理员和志…

CSS中的栅格布局

CSS中的栅格布局 在写前端项目的时候&#xff0c;我之前一直习惯使用flex布局&#xff0c;flex布局写起来比较随心&#xff0c;几乎可以实现任意形式的页面布局。不过自从B占看到某位大佬的grid布局后&#xff0c;发现布局居然还可以这么玩&#xff0c;正好自己在写一个vue3的…

github搜索技巧探索

毕设涉及到推荐系统&#xff0c;那么就用搜索推荐系统相关资料来探索一下GitHub的搜搜技巧 文章目录 1. 基础搜索2. 限定在特定仓库搜索3. 按照语言搜索4. 按照star数量搜索5. 搜索特定用户/组织的仓库6. 查找特定文件或路径7. 按时间搜索8. 搜索不包含某个词的仓库9. 搜索特定…

pytorch 入门 (五)案例三:乳腺癌识别-VGG16实现

本文为&#x1f517;小白入门Pytorch内部限免文章 &#x1f368; 本文为&#x1f517;小白入门Pytorch中的学习记录博客&#x1f366; 参考文章&#xff1a;【小白入门Pytorch】乳腺癌识别&#x1f356; 原作者&#xff1a;K同学啊 在本案例中&#xff0c;我将带大家探索一下深…

用大白话聊聊SpringBoot的自动配置原理(面试题详解)

首先&#xff0c;SpringBoot的自动配置不等于自动装配&#xff01; 自动配置是Auto-Configuration&#xff0c;针对的是SpringBoot中的配置类&#xff0c; 而自动装配是Autowire&#xff0c;针对的是Spring中的依赖注入。 进入主题&#xff1a; 自动配置简单来说就是自动去把…

Cesium 问题:在 cesium 中加载 geojson 文件,绘制带边框的多边形并设置贴地后,边框不展示,该怎么配置呢?

文章目录 问题分析问题 在 cesium 中加载 geojson 文件,绘制带边框的多边形并设置贴地后,边框不展示,该怎么配置呢? 代码如下: var promise = Cesium.GeoJsonDataSource.load(data/obstacle/ExOceanData/result.geojson