首次发布亚马逊云科技生成式AI技术堆栈,re:Invent大会重磅发布

 亚马逊云科技总是在不断重构,以推动创新,而今年re:Invent的主角毫无疑问是生成式AI。这从亚马逊云科技副总裁、首席布道师Jeff Barr在re:Invent 2023之前就迫不及待地写了一篇关于PartyRock的体验试玩教程即可窥见一斑。

 事实也确实如此。在Las Vegas,不管是个人开发者,还是企业架构师,亦或是大学教授,无论是来自传统行业还是创新公司,人人都在谈论亚马逊云科技通过重构生成式AI而即将到来的创新。

 首次发布亚马逊云科技生成式AI技术堆栈

 在re:Invent 2023最新发布中,亚马逊云科技首次发布了生成式AI技术堆栈,包括底层负责训练和推理的基础设施层,中间微调模型需求的工具服务层,以及上层构建生成式AI应用层三个重要层级。通过对这三个层级的不断重构,亚马逊云科技能够为用户提供更具性价比和安全性的技术与服务。

 “我们独特的生成式人工智能堆栈为客户提供了比其他云更大的优势。”对此,亚马逊云科技CEO Adam Selipsky表示,“并非所有竞争对手都选择在每一层进行创新”。

 自研+合作,基础设施层的持续创新

 生成式AI并不能单独创造价值,它需要硬件的支持。高性价比的基础设施是生成式AI应用构建的关键。Adam Selipsky曾在采访中强调了在这一领域创新的重要性,“新一代人工智能工作负载的计算密集程度非常高,因此性价比绝对至关重要。”

  新一代Amazon Trainium2芯片发布

 此前,亚马逊云科技已通过多代Graviton、Trainium和Inferentia自研芯片证明了在这一领域创新的价值。今年,亚马逊云科技如约带来了全新一代的Amazon Graviton4和Amazon Trainium2芯片。其中,Amazon Trainium2芯片专为基础模型的高性能训练打造,其性能较上一代提升多达4倍,内存提升3倍,能效提升多达2倍。

 Trainium2实例能在EC2 UltraClusters中扩展多达100,000个芯片,提供高达65 exaflops的算力,可在极短的时间训练基础模型(FMs)和大语言模型(LLMs),并支持按需获取性能。

 亚马逊云科技方面透露,有了这一级别的规模,训练完成一个具有3千亿参数的大语言模型将从几个月缩短至几周。明星生成式AI企业Anthropic正计划使用Trainium2训练下一代复杂Claude模型。

  首家推出NVIDIA GH200 NVL32实例

 备受关注的还有与NVIDIA的合作。NVIDIA创始人、CEO Jensen Huang现身会场,与Adam Selipsky共同宣布双方扩大战略合作,将联合推出先进的基础设施、软件及服务,推动客户在生成式AI的创新。合作内容包括:

  • 亚马逊云科技推出首款结合NVIDIA Grace Hopper Superchip与Amazon UltraCluster扩展功能的云AI超级计算机;

  • NVIDIA DGX Cloud率先配备NVIDIA GH200 NVL32,并首次在亚马逊云科技上提供此AI训练即服务;

  • 英伟达和亚马逊云科技在Project Ceiba上合作,打造全球最快的GPU驱动AI超级计算机以及最新的NVIDIA DGX Cloud超级计算机,用于英伟达的AI研发以及自研模型开发服务;

  • 配置NVIDIA GH200、H200、L40S以及L4 GPU等芯片的全新Amazon EC2实例,大幅提升生成式AI、HPC高性能计算、设计以及模拟类工作负载的性能;

  • 在亚马逊科技上运行的英伟达软件,包括NeMo LLM框架、NeMo Retriever以及BioNeMo,加速自研模型、语义检索、新药研发等应用的生成式AI发展。

 这意味着,亚马逊云科技将成为第一家在云端配备英伟达GH200 Grace Hopper超级芯片的云厂商,并将在其平台上推出英伟达DGX Cloud NVIDIA AI“训练即服务”。此外,双方还将基于Project Ceiba合作,构建全球最快的GPU驱动的AI超级计算机,以及更多基于英伟达芯片的云实例。

 Amazon Bedrock全新功能发布,工具服务层再进化

 作为基于Amazon Bedrock的可共享生成式AI应用程序构建游乐场,PartyRock只是re:Invent的开胃前菜。这背后“人人可以构建”的理念才是让所有开发者为之兴奋的关键。

 这一精神的集大成者Amazon Bedrock,本次除Amazon Titan Family,还上线了Anthropic Claude 2.1,Meta Llama 2 70B和Stability AI Stable Diffusion XL 1.0等几乎所有业界领先模型的最新版本,以及构建生成式AI所以需要的广泛功能。

 亚马逊云科技数据和人工智能副总裁Swami Sivasubramanian博士如此概括Amazon Bedrock的创新价值,“各行各业都在将生成式AI融入各自的业务,但没有一个大模型能够适合所有的场景。利用Amazon Bedrock,客户可选择任何合适的模型来进行快速创新。”

 Amazon Bedrock迎来两大功能更新

 在re:Invent 2023现场,Amazon Bedrock带来了全面更新,包括模型的微调、检索增强生成(RAG)以及基于Amazon Titan大模型的预训练,以及正式推出了Agents和Guardrails两大功能,进一步降低了生成式AI应用的构建门槛。

 在便捷程度上,开发者使用Agents功能,无需设计提示、管理会话上下文或手动编排系统,仅需提供自然语言指令即可轻松便捷地让生成式AI应用程序跨公司系统和数据源执行类似处理销售订单这样的多步骤任务。

 在安全体验上,为提供所问即所答的用户体验,并更安全地使用生成式AI技术,开发人员可以借助Guardrails功能为所有应用程序提供跨基础模型的一致的AI安全级别,以一种简化的方式在生成AI应用程序中强化关键策略和规则,实施跨模型的保护措施。这以功能并不局限于亚马逊云科技的Titan模型,还适用于Bedrock上的其他模型。

 亚马逊云科技负责任AI伦理高级实践经理Diya Wynn在接受采访时指出,“安全性至关重要。当我们考虑到人工智能时,负责任的AI应该是设计之初就要考虑的。如果我们等到事后再考虑这些因素,可能会导致一些灾难性的影响。”

 Amazon Bedrock从设计之初就考虑了负责任。客户数据在传输过程中和静态时都经过加密,因此所有有价值的客户数据都是始终安全且私密的,不会被亚马逊云科技及第三方提供商用于训练基础模型。

 目前,Amazon Bedrock已服务了上万用户,Salesforce、MongoDB等企业已经率先使用Amazon Bedrock应用生成式AI。

 Amazon Q发布,完善应用层版图

 Amazon Q是re:Invent 2023上最激动人心的发布之一。和ChatGPT这样面向C端的通用聊天机器人不同,Amazon Q专门针对办公场景,可为员工提供信息和建议,帮助他们简化任务、加速决策和解决问题,从而推动企业创新。这不仅代表着亚马逊云科技正式加入聊天机器人的竞争,也拉开了企业级生成式AI时代的序幕。

 Amazon Q 改变了开发者和IT人员在亚马逊云科技上构建、部署和运维应用程序和工作负载的方式。客户可以通过亚马逊云科技管理控制台、文档页面、IDE、Slack或其他第三方对话应用程序的聊天界面进行访问,且业务内容永远不会被使用来训练底层模型。对此,Swami Sivasubramanian博士表示,“Amazon Q是我们生成式AI堆栈的应用层的强大补充,为每个组织打开了新的可能性。”

 Amazon Q展现了高度的灵活性。当前,开发者为跟上生成式AI技术迭代的速度,快速设计和交付新功能,管理应用程序和工作负载端到端的生命周期,并在维护既有产品和构建新功能之间平衡优先级,往往需要投入大量的精力,做大量的工作。Amazon Q完全支持根据客户业务定制,以帮助企业级开发者专注于开发本身。

 Adam Selipsky现场展示了一段高性能视频编码与转码应用示例。在被问及哪种EC2实例最适合当前用例时,Amazon Q列出了一份涵盖性能与成本因素的清单。

 Amazon Q还具有出色的代码转换能力。此前由5名亚马逊开发者组成的团队使用Amazon Q代码转换,将1,000个生产应用程序从Java 8升级到Java17仅用了两天,每个应用程序升级的平均时间不足10分钟。

 此外,Amazon Q还可以与Amazon CodeCatalyst结合,在受支持的IDE当中,为用户代码生成测试,借此衡量其质量水平,加速功能开发。

 不过,受限于合规政策,尽管他表示,“我坚信这将是一场生产力层面的变革,希望来自不同行业、从事不同岗位的人们都能从Amazon Q身上获益”,但Amazon Q进入中国仍需要时间。

 re:Invent 2023落下帷幕,生成式AI单点竞争的时代也已经结束。随着亚马逊云科技生成式AI技术堆栈图景的揭开,一个AI使人人受益的时代即将到来。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/233522.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

什么是HTML?

✨前言✨ 本文主要介绍什么是HTML以及W3C 🍒欢迎点赞 👍 收藏 ⭐留言评论 📝私信必回哟😁 🍒博主将持续更新学习记录收获,友友们有任何问题可以在评论区留言 文章目录 什么是HTMLHTML发展史HTML的特点什么…

编程怎么学才能快速入门,分享一款中文编程工具快速学习编程思路,中文编程工具之分组框构件简介

一、前言: 零基础自学编程,中文编程工具下载,中文编程工具构件之扩展系统菜单构件教程 编程系统化教程链接 https://jywxz.blog.csdn.net/article/details/134073098?spm1001.2014.3001.5502 给大家分享一款中文编程工具,零基础…

Linux权限命令详解

Linux权限命令详解 文章目录 Linux权限命令详解一、什么是权限?二、权限的本质三、Linux中的用户四、linux中文件的权限4.1 文件访问者的分类(人)4.2 文件类型和访问权限(事物属性) 五、快速掌握修改权限的做法【第一种…

windows下分卷解压文件

我的文件是这样的: 存放路径为:C:\Users\Luli_study\MICCAI_MMAC\fudanuniversity\DDR dataset 首先要进入分卷文件的目录cd: 第一步:cd /path/o/分卷问文件目录 第二步: 执行之后的结果(红色框出来的): …

如何掌握构建 LMS 网站的艺术

目录 什么是学习管理系统 (LMS) 在线课程和 LMS 网站的好处 为什么 WordPress 对于 LMS 网站很重要 统一学习中心 多功能性和可扩展性 提高教育参与度 简化管理和监控 节省时间和费用 技能评估和绩效监督 持续学习和技能提升 使用 WordPress 插件构建成功的 LMS 课程 专注于您的…

力扣257. 二叉树的所有路径(递归回溯与迭代)

题目: 给你一个二叉树的根节点 root ,按 任意顺序 ,返回所有从根节点到叶子节点的路径。 叶子节点 是指没有子节点的节点。 示例 1: 输入:root [1,2,3,null,5] 输出:["1->2->5","…

【小白专用】Sql Server 连接Mysql 更新23.12.09

目标 已知mysql连接参数(地址和用户),期望通过Microsoft Sql Server Management Studio (以下简称MSSSMS)连接Mysql,在MSSSMS中直接查询或修改Mysql中的数据。 一般是选最新的版本下载。 选64位还是32位&a…

java--包装类

1.包装类 ①包装类就是把基本类型的数据包装成对象。 ②自动装箱:基本数据类型可以自动转换为包装类型。 ②自动拆箱:包装类型可以自动转换为基本类型。 2.包装类的其他常见操作 ①可以把基本类型的数据换成字符串类型。 ②可以把字符串类型的数值转…

轻量封装WebGPU渲染系统示例<45>- 材质组装流水线(MaterialPipeline)灯光、阴影、雾(源码)

当前示例源码github地址: https://github.com/vilyLei/voxwebgpu/blob/feature/material/src/voxgpu/sample/MaterialPipelineFog.ts 当前示例运行效果: 此示例基于此渲染系统实现,当前示例TypeScript源码如下: export class MaterialPipelineFog {pr…

9.MySQL 索引

目录 ​​​​​​​概述 概念: 单列索引 普通索引 创建索引 查看索引 删除索引 唯一索引 创建唯一索引 删除唯一索引 主键索引 组合索引 创建索引 全文索引 概述 使用全文索引 空间索引 内部原理 相关算法: hash算法 二叉树算法 …

阿里二面:消息队列的事务消息可以用 TCC 模式实现吗?

大家好,我是君哥。 消息队列的主要功能是系统间解耦,实现流量的削峰填谷。主流的消息队列一般有三个核心操作:消费者发送消息,Broker 保存消息,消费者消费消息。如下图: 对于一个完整的事务消息&#xff0…

【Angular 开发】Angular 信号的应用状态管理

自我介绍 做一个简单介绍,年近48 ,有20多年IT工作经历,目前在一家500强做企业架构.因为工作需要,另外也因为兴趣涉猎比较广,为了自己学习建立了三个博客,分别是【全球IT瞭望】,【架构…

基于PaddleOCR银行卡识别实现(四)之uni-app离线插件

目的 在前三篇文章中完成了银行卡识别整个模型训练等工作,通过了解PaddleOCR的端侧部署,我们也可以将银行卡号检测模型和识别模型移植到手机中,做成一款uni-app手机端离线银行卡号识别的应用。 准备工作 为了不占用过多篇幅,这…

内存学习——堆(heap)

目录 一、概念二、自定义malloc函数三、Debug运行四、heap_4简单分析4.1 heap管理链表结构体4.2 堆初始化4.3 malloc使用4.4 free使用 一、概念 内存分为堆和栈两部分: 栈(Stack)是一种后进先出(LIFO)的数据结构&…

class072 最长递增子序列问题与扩展【算法】

class072 最长递增子序列问题与扩展【算法】 code1 300. 最长递增子序列 // 最长递增子序列和最长不下降子序列 // 给定一个整数数组nums // 找到其中最长严格递增子序列长度、最长不下降子序列长度 // 测试链接 : https://leetcode.cn/problems/longest-increasing-subsequen…

【Java 基础】29 序列化

文章目录 1.定义2.目的3.使用1)序列化2)反序列化 3.应用场景4.注意事项总结 1.定义 序列化(Serialization)是将对象的状态转换为字节流的过程,以便将其存储到文件、数据库或通过网络传输 说简单点,序列化就…

关于DNS服务器地址总是127.0.0.1且无法解析域名地址

问题 笔者尝试nslookup解释域名时,出现服务器变成本地环回口地址,导致无法解析域名 C:\Users\Zsy>nslookup www.baidu.com 服务器: UnKnown Address: 127.0.0.1*** UnKnown 找不到 www.baidu.com: Server failed排查思路 尝试关闭虚拟网卡&#…

SQL语句的执行顺序怎么理解?

SQL语句的执行顺序怎么理解? 我们常常会被SQL其书写顺序和执行顺序之间的差异所迷惑。理解这两者的区别,对于编写高效、可靠的SQL代码至关重要。今天,让我们用一些生动的例子和场景来深入探讨SQL的执行顺序。 一、书写顺序 VS 执行顺序 SQ…

JS生成用户登录图形验证码

生成用户登录图形验证码的过程可以通过几个步骤来实现&#xff0c;包括创建画布&#xff0c;生成随机验证码文本&#xff0c;将验证码文本绘制到画布上&#xff0c;以及添加一些噪点和线条来增加复杂性。 HTML 首先&#xff0c;在HTML文件中创建一个<canvas>元素和一个…

c#生成二维码二维码中间添加定制LoGo

&#x1f680;介绍 &#x1f340;QRCoder是一个开源的.NET库&#xff0c;用于生成QR码&#xff08;Quick Response Code&#xff09;。这个库是用C#编写的&#xff0c;并且可以在.NET框架的各种版本上使用&#xff0c;包括.NET Framework, .NET Core, Mono, Xamarin等。QRCode…