全球AI模型百科全书,亚马逊云科技Bedrock上的100多款AI模型

今天小李哥给大家介绍的是亚马逊云科技上的AI模型管理平台Amazon Bedrock上的Marketplace,这是亚马逊云科技在今年re:Invent发布的一个全新功能,将亚马逊的电商基因带到了其云计算平台,让我们能够通过Amazon Bedrock访问100多种流行、新兴和专业的AI基础模型,可以说是AI模型的“百科全书”。我们现在可以在Amazon Bedrock中使用、测试和部署来自不同模型供应商(如IBM和Nvidia)的新模型,专业领域模型(如Upstages提供的适用于韩语处理的Solar Pro)以及Evolutionary Scale提供的ESM3蛋白质研究模型。大家在使用这些适用于不同场景的多样化AI模型的同时,不要忘了我们还可以访问Amazon Bedrock上的明星通用基础模型,例如Amazon、Anthropic和Meta提供的大语言模型。

通过Amazon Bedrock Marketplace部署的模型全面采用无服务器架构,可以通过Amazon Bedrock提供的标准API进行访问。Marketplace中可以兼容Converse API的模型,还可以将其与Amazon Bedrock上的其他功能,如Agents、知识库等工具一起集成使用。下图就是Marketplace上的多种模型类型截图。

Amazon Bedrock Marketplace的优势与特色?

随着生成式AI对开发者的项目以及企业业务带来革命性的变革,专门优化特定领域、语言或业务场景的模型需求正在飞速增长。然而精准找到和评估这些模型可能既复杂又昂贵,我们通常需要在不同的网站、模型供应商官网中发现这些模型,在抽象层中构建统一接口以在应用程序中统一集成它们,并创建复杂的安全和合规治理方案。

Amazon Bedrock Marketplace通过提供一个统一的集中平台,同时访问专业场景模型和通用大厂商模型,帮助开发者和企业解决这些应用开发挑战。

如何使用Amazon Bedrock Marketplace?

1. 登录亚马逊云科技Amazon Bedrock控制台中,导航到Foundation models页面,选择Model catalog。进入到Model Catalog后大家就可以根据特定的使用场景或希望交互的语言选择想要的模型,搜索选项包括无服务器Serverless模型(无需维护基础设施的模型)和Amazon Bedrock Marketplace上的模型。我们可以按模型厂商、模型的数据处理模态(例如文本、图像、向量化或音频)或任务类型(如分类或文本总结)进行筛选。

2. 比如我们想选择IBM Granite模型,首先我们可以搜索来自IBM Data and AI厂商的模型,并选择 模型版本 - Granite 3.0 2B Instruct,该模型主要用于集成企业用户的AI应用。选择该模型后,我们会进入到模型详情页面,可以查看模型供应商IBM为模型提供的官方介绍、定价和使用说明,包括示例API调用代码段。

3. Marketplace中的某些模型需要订阅才能使用。我们点击进入订阅页面可以查看模型定价和法律说明,在定价详情中包括了由供应商设定的模型使用价格。对于该模型,除了托管该模型的Amazon SageMaker基础设施成本之外没有模型额外的订阅成本,大家可以Amazon SageMaker定价页面上查看基础设施成本。我们点击 “订阅”(Subscribe)就可以开始使用该模型。

4. 在订阅完成后(通常需要几分钟),我们就可以可以开始部署模型到我们的账户内的SageMaker中。我们会跳转到部署的详情页面中,在本案例里我们使用默认设置和官方推荐的实例类型。

5. 打开高级设置(Advanced Settings)选项,我们可以选择在本账户的网络环境VPC中部署该模型,并添加用于访问S3存储桶和SNS短信通知服务的的IAM权限。如果我们没有选定现有的IAM权限,Amazon Bedrock Marketplace默认会为我们创建一个IAM权限角色。其他选择默认值后,点击Deploy进行部署。

6. 部署完成后,我们Marketplace模型部署页面中的模型状态将显示为“In Service”运行中,大家可以在部署页面中查看并编辑模型配置,可以执行的操作包括调整计算实例数量等。为了测试我们刚才的部署,我在模型交互对话框中打开模型,并输入提示词让模型生成一首诗歌。

在 Amazon Bedrock 中使用已部署的模型

7. 在模型交互对话框的页面中,我们可以在Marketplace类别下的Model Endpoints中,加载访问已部署的模型端点。我们还可以在Amazon Bedrock Agents、Amazon Bedrock 知识库、Amazon Bedrock提示词管理功能、Amazon Bedrock安全防护栏(Guardrails)等多种Bedrock AI功能中集成我们从Marketplace中部署的模型端点。

8. 比如小李哥从Marketplace中部署了一个用于图像生成的Stability AI Stable Diffusion 3.5 Large模型后,就可以在Amazon Bedrock模型交互图像生成页面中快速测试其图像生成能力。

如何通过AWS CLI和AWS SDK调用已部署的模型

对于已部署的模型,我们可直接通过亚马逊云科技,支持多种开发语言的SDK提供的Amazon Bedrock InvokeModel API进行访问。我们还可以使用亚马逊云科技命令行界面(AWS CLI),将模型端点的ARN资源名称作为我们要调用的模型ID,就可以调用模型生成回复了。对于应用于聊天场景的文生文模型,我们还可以使用Amazon Bedrock提供的统一标准API - Converse API进行内容生成,该API对模型差异进行了抽象处理,消除了模型的差异化,通过简单的参数改变就可以自由进行模型切换。

其他注意事项

Amazon Bedrock Marketplace目前在以下亚马逊区域可用:美国东部(弗吉尼亚北部、俄亥俄)美国西部(俄勒冈)、亚太地区(孟买、首尔、新加坡、悉尼、东京)、加拿大(中部)、欧洲(法兰克福、爱尔兰、伦敦、巴黎)、南美(圣保罗)。

另外在Amazon Bedrock Marketplace中,我们调用模型的收费,是向第三方模型提供商支付的,类型为软件订阅费用(某些模型订阅是免费的),总的费用还包括我们选择的计算实例类型和数量所产生的模型托管费用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/959370.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

八种排序算法【C语言实现】

系列文章目录 🎈 🎈 我的CSDN主页:OTWOL的主页,欢迎!!!👋🏼👋🏼 🎉🎉我的C语言初阶合集:C语言初阶合集,希望能…

在 vscode + cmake + GNU 工具链的基础上配置 JLINK

安装 JLINK JLINK 官网链接 下载安装后找到安装路径下的可执行文件 将此路径添加到环境变量的 Path 中。 创建 JFlash 项目 打开 JFlash,选择新建项目 选择单片机型号 在弹出的窗口中搜索单片机 其他参数根据实际情况填写 新建完成: 接下来设置…

PyQt5之QtDesigner的若干配置和使用

1.描述 QtDesigner是一个可视化工具,可以通过该工具设计页面 2.简单使用 1.下载PyQt5-tools pip install pyqt5-tools 2.打开designer.exe文件 我采用的是虚拟环境,该文件位于C:\Users\24715\anaconda3\envs\pyqt\Lib\site-packages\qt5_applicatio…

【高项】6.3 排列活动顺序 ITTO

输入 项目管理计划组件: ① 进度管理计划;② 范围基准 项目文件: ① 假设日志;② 活动属性;③ 活动清单;④ 里程碑清单 工具与技术 紧前关系绘图法(PDM) ① 完成到开始&…

Elasticsearch 自定义分成器 拼音搜索 搜索自动补全 Java对接

介绍 通常用于将文档中的文本数据拆分成易于索引的词项(tokens)。有时,默认的分词器无法满足特定应用需求,这时就可以创建 自定义分词器 来实现定制化的文本分析。 自定义分词器组成 Char Filters(字符过滤器&#x…

Leecode刷题C语言之完成所有交易的初始最少钱数

执行结果:通过 执行用时和内存消耗如下&#xff1a; long long minimumMoney(int** transactions, int transactionsSize,int* transactionsColSize) {long long total_lose 0;int res 0;for (int i 0; i < transactionsSize; i) {int cost transactions[i][0];int cas…

案例研究丨浪潮云洲通过DataEase推进多维度数据可视化建设

浪潮云洲工业互联网有限公司&#xff08;以下简称为“浪潮云洲”&#xff09;成立于2018年&#xff0c;定位于工业数字基础设施建设商、具有国际影响力的工业互联网平台运营商、生产性互联网头部服务商。截至目前&#xff0c;浪潮云洲工业互联网平台连续五年入选跨行业跨领域工…

C++——动态管理

目录 一、C/C内存分布二、C语言中动态内存管理方式&#xff1a;malloc/calloc/realloc/free三、C内存管理方式3.1 new/delete操作内置类型3.2 new和delete操作自定义类型 四、operator new与operator delete函数4.1 operator new与operator delete函数 五、new和delete的实现原…

three.js+WebGL踩坑经验合集(4.1):THREE.Line2的射线检测问题(注意本篇说的是Line2,同样也不是阈值方面的问题)

上篇大家消化得如何了&#xff1f; 笔者说过&#xff0c;1级编号不同的两篇博文相对独立&#xff0c;所以这里笔者还是先给出完整代码&#xff0c;哪怕跟&#xff08;3&#xff09;没有太大区别。 这里我们把线的粗细调成5&#xff08;排除难选中的因素&#xff09;&#xff…

Vue2下篇

插槽&#xff1a; 基本插槽&#xff1a; 普通插槽&#xff1a;父组件向子组件传递静态内容。基本插槽只能有一个slot标签&#xff0c;因为这个是默认的位置&#xff0c;所以只能有一个 <!-- ParentComponent.vue --> <template> <ChildComponent> <p>…

【Unity3D】aab包太大无法上传Google问题

目录 一、勾选Split Application Binary&#xff0c;Unity直接打aab包 勾选Split Application Binary选项的影响 不勾选Split Application Binary选项的影响 总结 2、导出Android工程打包aab 一、勾选Split Application Binary&#xff0c;Unity直接打aab包 超出150MB部分…

第6章 数据结构—列表与列表项讲解--总结

整理 野火 《FreeRTOS 内核实现与应用开发实战指南》—基于野火 STM32 全系列&#xff08;M3/4/7&#xff09;开发板 文章目录 第6章 数据结构—列表与列表项讲解--总结6.1 C 语言链表简介6.1.1 单向链表6.1.2 双向链表6.1.3 链表与数组的对比 6.2 FreeRTOS 中链表的实现6.2.1 …

强化学习-Deep Q Network

文章目录 Deep Q Networkzip(*batch)的内部实现假设&#xff1a;结果&#xff1a; Deep Q Network 这种方式很适合格子游戏。因为格子游戏中的每一个格子就是一个状态&#xff0c;这是离散的&#xff0c;但在现实生活中&#xff0c;很多状态并不是离散而是连续的。所以我们可以…

C语言-构造数据类型

1、构造数据类型 结构体、共用体、枚举。 2、结构体 1、结构体的定义 结构体是一个自定义的复合数据类型&#xff0c;它允许将不同类型的数据组合在一起。 struct 结构体名 {数据类型1 成员变量1;数据类型2 成员变量2;数据类型3 成员变量3;数据类型4 成员变量4; } 2、结构体变…

FPGA实现任意角度视频旋转(二)视频90度/270度无裁剪旋转

本文主要介绍如何基于FPGA实现视频的90度/270度无裁剪旋转&#xff0c;旋转效果示意图如下&#xff1a; 为了实时对比旋转效果&#xff0c;采用分屏显示进行处理&#xff0c;左边代表旋转前的视频在屏幕中的位置&#xff0c;右边代表旋转后的视频在屏幕中的位置。 分屏显示的…

Spark/Kafka

文章目录 项目地址一、Spark1. RDD1.1 五大核心属性1.2 执行原理1.3 四种创建方式二、Kafka2.1 生产者(1)分区器(2)生产者提高吞吐量(3) 生产者数据可靠性数据传递语义幂等性和事务数据有序2.2 Broker(1)Broker工作流程(2)节点服役和退役2.3 副本(1)Follower故障细…

win32汇编环境,函数的编写与调用、传值或返回值等

;运行效果 ;win32汇编环境,函数的编写与调用、传值或返回值等 ;函数在被调用的时候&#xff0c;如果此函数实体在前面&#xff0c;可以不用声明。如果实体在后面&#xff0c;则需要先声明。类似于下面的DlgProc函数&#xff0c;因为它的实体在后面&#xff0c;所以需要在调用之…

[Spring] Gateway详解

&#x1f338;个人主页:https://blog.csdn.net/2301_80050796?spm1000.2115.3001.5343 &#x1f3f5;️热门专栏: &#x1f9ca; Java基本语法(97平均质量分)https://blog.csdn.net/2301_80050796/category_12615970.html?spm1001.2014.3001.5482 &#x1f355; Collection与…

回顾2024,展望2025

项目 LMD performance phase2 今年修修补补&#xff0c;设计和做了很多item&#xff0c;有时候自己都数不清做了什么大大小小的item&#xff0c;但是for LMD performance phase2的go-live确实是最大也是最难的了&#xff0c;无论什么系统&#xff0c;只要用的人多了&#xff…

旅游风景的代码项目

敦煌莫高窟&#xff1a;用代码打开千年艺术的大门 ——一个零基础也能看懂的神奇项目 前言&#xff1a;当古老艺术遇上现代代码 想象一下&#xff0c;你坐在电脑前&#xff0c;指尖轻轻一点&#xff0c;就能穿越到敦煌莫高窟——看飞天的衣袂飘飘、听千年的驼铃声声。这不是科…