做好“关键基础设施提供商”角色,亚马逊云科技加快生成式AI落地

一场关于生产力的革命已在酝酿之中。全球管理咨询公司麦肯锡在最近的报告《生成式人工智能的经济潜力:下一波生产力浪潮》中指出,生成式AI每年可能为全球经济增加2.6万亿到4.4万亿美元的价值。在几天前的亚马逊云科技纽约峰会中,「生成式AI」同样是全场提及频率最高的关键词。

「如今,大模型可以在大量无标注数据中进行预训练,实现开箱即用,以处理各种通用性问题。此外,只需相对少量的标注数据进行微调,它们就能用于特定领域的应用。」亚马逊云科技数据库、数据分析和机器学习全球副总裁Swami Sivasubramanian表示,「通过微调轻松定制预训练模型的能力,绝对是游戏规则的改变。」

一场关于生产力的革命已在酝酿之中。全球管理咨询公司麦肯锡在最近的报告《生成式人工智能的经济潜力:下一波生产力浪潮》中指出,生成式AI每年可能为全球经济增加2.6万亿到4.4万亿美元的价值。在几天前的亚马逊云科技纽约峰会中,「生成式AI」同样是全场提及频率最高的关键词。

「如今,大模型可以在大量无标注数据中进行预训练,实现开箱即用,以处理各种通用性问题。此外,只需相对少量的标注数据进行微调,它们就能用于特定领域的应用。」亚马逊云科技数据库、数据分析和机器学习全球副总裁Swami Sivasubramanian表示,「通过微调轻松定制预训练模型的能力,绝对是游戏规则的改变。」

206ccfb5938647bd9266dbfd7fe1c3b1.png

 

凭借过去数年的客户需求洞察和技术积累,亚马逊云科技将大量的AI能力集成到了简单易用的产品之中,希望以最简洁的方式将技术进步输送到各行各业。在这场技术盛会上,亚马逊云科技一口气推出了七项生成式AI新功能。

 

最强的生成式AI大模型,在这里轻松调用

今年4月,亚马逊云科技发布了全托管基础模型服务「Amazon Bedrock」,以「关键基础设施提供商」的角色加入了大模型之战。

 

从希望应用大模型的企业角度来说,自研大模型需要数十亿美元和多年的训练,更优的解决方案是对一些已经非常强大的开源基础模型进行定制化的微调,以满足自身的多样化业务需求。Amazon Bedrock的重要价值就在于此。这项服务可以让所有人都可以基于已有的大模型、专用的AI算力和工具,再结合自己的数据开始构建生成式AI应用。

在最新扩展后的Amazon Bedrock中,汇聚了来自一批顶级大模型供应商的最新成果:

 

目前,Amazon Bedrock提供了Anthropic最新语言模型Claude 2、AI21的JURASSIC-2、亚马逊自研的Amazon Titan系列模型的访问。Stability AI也在Amazon Bedrock中首发了最新版的文生图模型套件Stable Diffusion XL 1.0。此外,Cohere成为了最新加入Amazon Bedrock的基础模型供应商,并带来了文本生成模型Command和文本理解模型EMBED。

相比于其他的一站式的大模型服务平台,Amazon Bedrock的优势在于,用户可将其与亚马逊云科技平台的其余部分集成在一起,更轻松地访问存储在Amazon S3对象存储服务中的数据,并能够从亚马逊云科技访问控制和治理策略中受益。

生成式AI让云计算服务的竞争格局发生了改变,除了原有的存储、计算、网络等基础设施,模型、框架和应用层面的能力提供变得更为重要。在过去一段时间,我们见到了「模型即服务」这种全新商业的诞生。如同Amazon Bedrock这样的一系列平台,正在将大模型变为直接可用的服务,帮助各行各业的用户接入生成式AI,撬动了一个全新的蓝海市场。

 

推动生成式AI走完落地的「最后一公里」

在今天,即使生成式AI模型的功能已经如此强大,它们仍然无法代替人类「执行」一部分关键的、个性化的任务。这恰恰是「生成式AI」转化为「生产力」过程中非常关键的一步。

问题并非不能解决:模型通常可以附加API、插件、数据库以扩展功能,为用户自动完成某些特定的任务。比如ChatGPT此前就推出了插件机制,还为开发者提供了开放平台,允许更多用户根据自己的需求、想法和专业能力进行扩展。为了简化这一环节所需的工作,亚马逊云科技正式推出了Amazon Bedrock Agents。

 

Amazon Bedrock Agents可以扩展基础模型以理解用户请求,将复杂任务分解为多个步骤,开展对话以收集更多信息,并采取行动来满足用户请求。开发者只需点击几下,就能创建完全托管的Agents:

该功能创建的对话式智能体可根据专有数据提供个性化的最新答案并执行操作,帮助企业加速交付生成式AI应用程序,推动解决生成式AI落地的「最后一公里」问题。比如,企业可以使用Amazon Bedrock Agents创建一个可以处理订单的客户服务聊天机器人,利用其内部信息(包括客户资料和退货政策)来定制化服务于每个订单。

如果做个比喻的话,Amazon Bedrock Agents就像是一个得力的助手。或许在不久的将来,我们就能享受这一功能所提供的用户端服务:不只是显示有哪些合适的航班、推荐口碑好的餐厅,还能直接帮忙预订、跟进。

 

生成式AI时代的搜索技术变革

在解决大模型落地挑战的火热讨论中,「向量搜索」和「向量数据库」的概念开始被越来越多的人熟知。这是检索技术层面在生成式AI时代正在发生的变革。

首先,伴随数据规模的增长,关键词检索已经不能满足需求,向量检索可作对传统搜索技术的补充。通过将数据表示为向量,模型可以快速分析和理解大量信息,准确地识别和匹配相似的项目。

其次,经过预训练的大模型固然能力出众,但也存在一些不足,比如缺乏领域知识、缺乏长期记忆、缺乏事实一致性的问题。而在数据规模不断增长、算力日益珍贵的现状下,向量数据库可作为大模型的「超级大脑」,打一份小抄,相对较低的成本补充动态知识,满足用户不断增长的需求。

 

对于这一方向,亚马逊云科技早早发力,此前已上线多项支持向量的数据存储服务,包括Amazon Aurora PostgreSQL兼容版关系型数据库,兼容PostgreSQL的Amazon RDS(Amazon Relational Database Service)关系型数据库等。

在这一次的峰会上,亚马逊云科技又推出了适用于Amazon OpenSearch Serverless的向量引擎。该向量引擎支持简单的API调用,可用于存储和查询数十亿个Embeddings。

 

该引擎由Amazon OpenSearch项目中的k最近邻(kNN)搜索功能提供支持,为客户提供无服务器环境下的语义搜索服务。即使向量从原型设计期间的几千个增长到数亿甚至更多,引擎也能无缝扩展,无需重新索引或重新加载数据来扩展基础设施。

顺应大模型时代的广泛需求,亚马逊云科技还正式宣布,平台上所有的数据库未来都将具有向量功能,帮助客户简化运营,方便集成数据。

 

让生成式AI落地多重加速

在这些重磅发布之外,为了加速生成式AI的训练和应用,亚马逊云科技已推出了一系列服务和工具。

最新动态是,两项关键服务已正式可用:其中一项服务是关于计算基础设施,基于英伟达H100 Tensor Core GPU的Amazon EC2 P5实例已正式可用,满足客户在运行工作负载时对高性能和高扩展性的需求。

 

很多业界知名的生成式AI模型同时涵盖问题回复、代码生成、视频和图像生成、语音识别等功能,规模通常有千亿或万亿参数,训练时间甚至长达数月。这势必会成为普遍影响生成式AI落地速度的因素之一。

与上一代基于GPU的实例相比,Amazon EC2 P5实例使得训练最高提速6倍,曾经的几天训练时间可缩短到几小时,帮助客户降低高达40%的训练成本。

另外一项服务是有关于开发工具。去年,亚马逊云科技推出了AI编程助手Amazon CodeWhisperer预览版,获得了开发者的高度关注。数据表明,与未使用该编程助手的开发者相比,使用者完成任务的速度平均快57%。现在,Amazon CodeWhisperer已经正式可用,并且实现了与Amazon Glue的集成。

从此以后,开发者可以用自然语言编写特定任务,Amazon CodeWhispere会直接在Amazon Glue Notebooks中推荐一个或多个可完成此任务的代码片段,用户可以选择「接受最推荐的建议」、「查看更多建议」或「继续自己编写代码」。也就是说,即使完全不会写代码,你也可以尝试用「说人话」的方法构建出完整的应用程序。

 

 

写在最后

技术的发展往往超乎人们的预设。曾几何时,研究者们还需要花费数月的时间进行数据准备、数据处理和模型训练,不得不投入极其高昂的成本,只为了完成某一项特定的任务。

在这场浪潮中,亚马逊云科技选择的路线是做好「关键基础设施提供商」的工作。它的优势在于过去20年在人工智能技术上的深厚积累,在于对于超过10万家客户的深刻理解,在于打磨多年的高可用、强大的基础设施。这些都会有力地推动亚马逊云科技加快生成式AI落地的征程,帮助到每一位开发者或创业团队。

凭借过去数年的客户需求洞察和技术积累,亚马逊云科技将大量的AI能力集成到了简单易用的产品之中,希望以最简洁的方式将技术进步输送到各行各业。在这场技术盛会上,亚马逊云科技一口气推出了七项生成式AI新功能。

 

最强的生成式AI大模型,在这里轻松调用

今年4月,亚马逊云科技发布了全托管基础模型服务「Amazon Bedrock」,以「关键基础设施提供商」的角色加入了大模型之战。

 

从希望应用大模型的企业角度来说,自研大模型需要数十亿美元和多年的训练,更优的解决方案是对一些已经非常强大的开源基础模型进行定制化的微调,以满足自身的多样化业务需求。Amazon Bedrock的重要价值就在于此。这项服务可以让所有人都可以基于已有的大模型、专用的AI算力和工具,再结合自己的数据开始构建生成式AI应用。

在最新扩展后的Amazon Bedrock中,汇聚了来自一批顶级大模型供应商的最新成果:

 

目前,Amazon Bedrock提供了Anthropic最新语言模型Claude 2、AI21的JURASSIC-2、亚马逊自研的Amazon Titan系列模型的访问。Stability AI也在Amazon Bedrock中首发了最新版的文生图模型套件Stable Diffusion XL 1.0。此外,Cohere成为了最新加入Amazon Bedrock的基础模型供应商,并带来了文本生成模型Command和文本理解模型EMBED。

相比于其他的一站式的大模型服务平台,Amazon Bedrock的优势在于,用户可将其与亚马逊云科技平台的其余部分集成在一起,更轻松地访问存储在Amazon S3对象存储服务中的数据,并能够从亚马逊云科技访问控制和治理策略中受益。

生成式AI让云计算服务的竞争格局发生了改变,除了原有的存储、计算、网络等基础设施,模型、框架和应用层面的能力提供变得更为重要。在过去一段时间,我们见到了「模型即服务」这种全新商业的诞生。如同Amazon Bedrock这样的一系列平台,正在将大模型变为直接可用的服务,帮助各行各业的用户接入生成式AI,撬动了一个全新的蓝海市场。

 

推动生成式AI走完落地的「最后一公里」

在今天,即使生成式AI模型的功能已经如此强大,它们仍然无法代替人类「执行」一部分关键的、个性化的任务。这恰恰是「生成式AI」转化为「生产力」过程中非常关键的一步。

问题并非不能解决:模型通常可以附加API、插件、数据库以扩展功能,为用户自动完成某些特定的任务。比如ChatGPT此前就推出了插件机制,还为开发者提供了开放平台,允许更多用户根据自己的需求、想法和专业能力进行扩展。为了简化这一环节所需的工作,亚马逊云科技正式推出了Amazon Bedrock Agents。

 

Amazon Bedrock Agents可以扩展基础模型以理解用户请求,将复杂任务分解为多个步骤,开展对话以收集更多信息,并采取行动来满足用户请求。开发者只需点击几下,就能创建完全托管的Agents:

该功能创建的对话式智能体可根据专有数据提供个性化的最新答案并执行操作,帮助企业加速交付生成式AI应用程序,推动解决生成式AI落地的「最后一公里」问题。比如,企业可以使用Amazon Bedrock Agents创建一个可以处理订单的客户服务聊天机器人,利用其内部信息(包括客户资料和退货政策)来定制化服务于每个订单。

如果做个比喻的话,Amazon Bedrock Agents就像是一个得力的助手。或许在不久的将来,我们就能享受这一功能所提供的用户端服务:不只是显示有哪些合适的航班、推荐口碑好的餐厅,还能直接帮忙预订、跟进。

 

生成式AI时代的搜索技术变革

在解决大模型落地挑战的火热讨论中,「向量搜索」和「向量数据库」的概念开始被越来越多的人熟知。这是检索技术层面在生成式AI时代正在发生的变革。

首先,伴随数据规模的增长,关键词检索已经不能满足需求,向量检索可作对传统搜索技术的补充。通过将数据表示为向量,模型可以快速分析和理解大量信息,准确地识别和匹配相似的项目。

其次,经过预训练的大模型固然能力出众,但也存在一些不足,比如缺乏领域知识、缺乏长期记忆、缺乏事实一致性的问题。而在数据规模不断增长、算力日益珍贵的现状下,向量数据库可作为大模型的「超级大脑」,打一份小抄,相对较低的成本补充动态知识,满足用户不断增长的需求。

 

对于这一方向,亚马逊云科技早早发力,此前已上线多项支持向量的数据存储服务,包括Amazon Aurora PostgreSQL兼容版关系型数据库,兼容PostgreSQL的Amazon RDS(Amazon Relational Database Service)关系型数据库等。

在这一次的峰会上,亚马逊云科技又推出了适用于Amazon OpenSearch Serverless的向量引擎。该向量引擎支持简单的API调用,可用于存储和查询数十亿个Embeddings。

 

该引擎由Amazon OpenSearch项目中的k最近邻(kNN)搜索功能提供支持,为客户提供无服务器环境下的语义搜索服务。即使向量从原型设计期间的几千个增长到数亿甚至更多,引擎也能无缝扩展,无需重新索引或重新加载数据来扩展基础设施。

顺应大模型时代的广泛需求,亚马逊云科技还正式宣布,平台上所有的数据库未来都将具有向量功能,帮助客户简化运营,方便集成数据。

 

让生成式AI落地多重加速

在这些重磅发布之外,为了加速生成式AI的训练和应用,亚马逊云科技已推出了一系列服务和工具。

最新动态是,两项关键服务已正式可用:其中一项服务是关于计算基础设施,基于英伟达H100 Tensor Core GPU的Amazon EC2 P5实例已正式可用,满足客户在运行工作负载时对高性能和高扩展性的需求。

 

很多业界知名的生成式AI模型同时涵盖问题回复、代码生成、视频和图像生成、语音识别等功能,规模通常有千亿或万亿参数,训练时间甚至长达数月。这势必会成为普遍影响生成式AI落地速度的因素之一。

与上一代基于GPU的实例相比,Amazon EC2 P5实例使得训练最高提速6倍,曾经的几天训练时间可缩短到几小时,帮助客户降低高达40%的训练成本。

另外一项服务是有关于开发工具。去年,亚马逊云科技推出了AI编程助手Amazon CodeWhisperer预览版,获得了开发者的高度关注。数据表明,与未使用该编程助手的开发者相比,使用者完成任务的速度平均快57%。现在,Amazon CodeWhisperer已经正式可用,并且实现了与Amazon Glue的集成。

从此以后,开发者可以用自然语言编写特定任务,Amazon CodeWhispere会直接在Amazon Glue Notebooks中推荐一个或多个可完成此任务的代码片段,用户可以选择「接受最推荐的建议」、「查看更多建议」或「继续自己编写代码」。也就是说,即使完全不会写代码,你也可以尝试用「说人话」的方法构建出完整的应用程序。

 

 

写在最后

技术的发展往往超乎人们的预设。曾几何时,研究者们还需要花费数月的时间进行数据准备、数据处理和模型训练,不得不投入极其高昂的成本,只为了完成某一项特定的任务。

在这场浪潮中,亚马逊云科技选择的路线是做好「关键基础设施提供商」的工作。它的优势在于过去20年在人工智能技术上的深厚积累,在于对于超过10万家客户的深刻理解,在于打磨多年的高可用、强大的基础设施。这些都会有力地推动亚马逊云科技加快生成式AI落地的征程,帮助到每一位开发者或创业团队。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/60283.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

熟练掌握ChatGPT解决复杂问题——学会提问

目录 引言 一、5W1H分析法 1. 简单的问题(what、where、when、who) 2.复杂的问题(why、how) 2.1 为什么(Why)——原因 2.2 方式 (How)——如何 二、如何提问得到更高质量的答案…

pycharm运行pytest无法实时输出信息

需要去掉控制台输出。根据查询相关信息显示pycharm运行pytest无法实时输出信息,需要去掉pycharm里面的运行模式,点击减号,再点击加号,添加python执行文件即可实时输出信息。 问题描述: 使用pycharm运行代码时&#x…

uniapp 持续获取定位(登录状态下才获取)(不采用定时器)(任意页面都可监听定位改变)

基于上次文章做了优化和改良,保证在登录状态下才获取定位信息 uniapp 小程序实时且持续获取定位信息(全局设置一次)(单页面监听定位改变)(不采用定时器)_uniapp小程序定位_前端小胡兔的博客-CSDN博客本篇文章实现了uniapp 微信小程序实时获取定位信息,小程序打开即可持续获取定…

2023年第四届“华数杯”数学建模思路 - 案例:退火算法

## 0 赛题思路 (赛题出来以后第一时间在CSDN分享) https://blog.csdn.net/dc_sinor?typeblog 1 退火算法原理 1.1 物理背景 在热力学上,退火(annealing)现象指物体逐渐降温的物理现象,温度愈低&#…

C++ 数组作为函数参数

数组元素和数组名都可以作为函数的参数以实现函数间数据的传递和共享。 可以用数组元素作为调用函数时的实参,这与使用该类型的一个变量(或对象)作实参是完全相同的。 如果使用数组名作为函数的参数,则实参和形参都应该是数组名…

企业上云实施路线图

企业上云步骤主要分为规划、设计、实施、验证、运维五个阶段。https://articles.e-works.net.cn/cloud/article144684.htm

XXL-JOB定时任务框架(Oracle定制版)

特点 xxl-job是一个轻量级、易扩展的分布式任务调度平台,能够快速开发和简单学习。开放源代码并被多家公司线上产品使用,开箱即用。尽管其确实非常好用,但我在工作中使用的是Oracle数据库,因为xxl-job是针对MySQL设计的&#xff…

group normalization

1、 Theory look for this link for more information, actually only this image can illustrate the group normalization.you can ignore the rest of this artical. 2、 Code check this link for detailed about the formulation and the theory of the group normalzi…

问题解决和批判性思维是软件工程的重要核心

软件工程的重心在于问题解决和批判性思维(合理设计和架构降低复杂度),而非仅局限于编程。 许多人误以为软件工程就只是编程,即用编程语言编写指令,让计算机按照这些指令行事。但实际上,软件工程的内涵远超…

git 公钥密钥 生成与查看

1.什么是公钥 很多服务器都是需要认证的,ssh认证是其中的一种。在客户端生成公钥,把生成的公钥添加到服务器,你以后连接服务器就不用每次都输入用户名和密码了。 很多git服务器都是用ssh认证方式,你需要把你生成的公钥发送给代码仓…

模板方法模式(Template Method)

模板方法模式是一种行为设计模式,在超类中定义了一个算法的框架,而将一些步骤的实现延迟到子类中,使得子类可重定义该算法的特定步骤。 Template Method is a behavior design pattern. It defines an algorithm framework in the superclas…

Docker容器技术

前言 容器技术、虚拟化技术已经成为一种被大家广泛认可的服务器资源共享方式,容器技术可以在按需构建操作系统实例的过程当中为系统管理员提供极大的灵活性。由于hypervisor虚拟化技术仍然存在一些性能和资源使用效率方面的问题,因此容器技术&#xff0…

Python爬虫遇到重定向问题解决办法汇总

在进行Python爬虫任务时,遇到重定向问题是常见的问题之一。重定向是指在发送请求时,服务器会返回一个新的URL,将请求重新定向到该URL。为了帮助您解决这个问题,本文将提供一些实用的解决办法,并给出相关的代码示例&…

【H5移动端】常用的移动端方案合集-键盘呼起、全面屏适配、图片大小显示、300ms点击延迟、首屏优化(不定期补充~)

文章目录 前言键盘呼起问题靠近底部的输入项被键盘遮挡底部按钮被顶上去 全面屏适配图片大小显示问题解决300ms延迟首屏优化 前言 这篇文章总结了我在工作中做H5遇到的一些问题,包括我是怎么解决的。可能不是当下的最优解,但是能保证解决问题。 单位适…

五、JVM-垃圾回收算法

常见的回收算法:标记清除算法、复制算法、标记-整理算法、分代收集算法 1、标记清除算法 第一步:标记(找出内存中需要回收的对象,并且把它们标记出来) 第二步:清除 (清除掉被标记需要回收的对…

【Redis】——RDB快照

Redis 是内存数据库,但是它为数据的持久化提供了两个技术,一个是AOF日志,另一个是RDB快照: AOF 文件的内容是操作命令;RDB 文件的内容是二进制数据。 RDB 快照就是记录某一个瞬间的内存数据,记录的是实际…

Linux 命令学习:

1. vim 使用: 一般流程就是: vi XXXX文件路径 //进入文件,此时处在命令模式(即,vim认为我们现在键盘输入的不是字符,而是命令) i // 键盘输入 i 字符,进入输入模式&#xff…

【C语言】静态关键字static的用法(详解)

🎈个人主页:库库的里昂 🎐CSDN新晋作者 🎉欢迎 👍点赞✍评论⭐收藏 ✨收录专栏:C语言初阶 ✨其他专栏:代码小游戏 🤝希望作者的文章能对你有所帮助,有不足的地方请在评论…

Python导出SqlServerl数据字典为excel

sql代码 SELECTtableName D.name ,tableIntroduce isnull(F.value, ),sort A.colorder,fieldName A.name,catogary B.name,bytes A.Length,lengths COLUMNPROPERTY(A.id, A.name, PRECISION),scales isnull(COLUMNPROPERTY(A.id, A.name, Scale), 0),isOrNotNull Cas…

Spring Cloud +UniApp 智慧工地云平台源码,智能监控和AI分析系统,危大工程管理、视频监控管理、项目人员管理、绿色施工管理

一套智慧工地云平台源码,PC管理端APP端平板端可视化数据大屏端源码 智慧工地可视化系统利用物联网、人工智能、云计算、大数据、移动互联网等新一代信息技术,通过工地中台、三维建模服务、视频AI分析服务等技术支撑,实现智慧工地高精度动态仿…