亚马逊云科技 re:Invent 2024重磅发布!Amazon Bedrock Data Automation 预览版震撼登场

AWS re:Invent 2024 已圆满落幕!
在本次大会中,隆重推出了一项全新功能:

Amazon Bedrock Data Automation(预览版)震撼登场!

New Amazon Bedrock capabilities enhance data processing and retrieval | AWS News Blogicon-default.png?t=O83Ahttps://aws.amazon.com/jp/blogs/aws/new-amazon-bedrock-capabilities-enhance-data-processing-and-retrieval/

简单总结

  1. Amazon Bedrock Data Automation(简称 BDA)是一项全托管服务,能够从文档、图片、音频、视频等非结构化多模态内容中提取有价值的信息。
  2. 它支持视频关键时刻摘要、不良图像内容检测、复杂文档自动分析等功能,帮助高效处理多样化内容。
  3. BDA既可独立使用,也可作为解析器应用于RAG工作流中的知识库配置,灵活适配多种场景。

亮点

  1. 传统的 RAG 主要依赖文本内容进行信息提取,而 BDA 的推出突破了这一限制。
  2. 它能够轻松处理非结构化的多模态内容,提取更多维度的信息。
  3. 这为构建基于多样化上下文的 RAG 提供了更丰富的可能性,让应用场景更加广泛!

亚马逊云科技官方文档通

Data automation - Amazon BedrockLearn about how to use Amazon Bedrock to automate processing of images, audio, video, and documentsicon-default.png?t=O83Ahttps://docs.aws.amazon.com/bedrock/latest/userguide/bda.html

Amazon Bedrock Data Automation(BDA)的综合用户指南

Parsing options for your data source - Amazon BedrockParsing refers to the interpretation of documents and their meaningful components. Amazon Bedrock Knowledge Bases offers the following options for parsing your data source during ingestion:icon-default.png?t=O83Ahttps://docs.aws.amazon.com/bedrock/latest/userguide/kb-advanced-parsing.html

在知识库中使用 BDA 进行数据解析的用户指南

Feature support by AWS Region in Amazon Bedrock - Amazon BedrockFor a list of AWS Regions that support Amazon Bedrock, see Amazon Bedrock endpoints and quotas . Amazon Bedrock features differ in their regional support.icon-default.png?t=O83Ahttps://docs.aws.amazon.com/bedrock/latest/userguide/features-regions.html这是关于 Amazon Bedrock 功能可用区域的相关指南。虽然目前文档中还没有明确提到 BDA 的内容,但未来很有可能会更新包含这部分信息。目前通过管理控制台,我们已经确认 BDA 在俄勒冈区域可以使用。

动手尝试

 打开 AWS 管理控制台,在俄勒冈区域的 Amazon Bedrock 服务页面中选择“Data Automation(数据自动化)”。

根据不同的使用场景,提供了两种输出类型,也可以将它们结合使用。 

  • 标准输出
  • 自定义输出

来试试这个DEMO吧。 

 来执行流程如下:

  1. 选择/上传文件
  2. 查看结果
  3. 创建项目/蓝图
  4. 使用资源

让我们尝试通过以下设置生成结果:

  • 选择示例演示或上传文件开始:使用示例演示
  • 选择资产文件类型:文档
  • 驾驶执照

 

作为结果的输出目标,需要创建一个 S3 存储桶。点击确认后,存储桶将自动创建,并开始生成结果。 

生成的结果如上。

标准输出

让我们查看结果的标准输出选项卡。其中有一个名为“Configuration(配置)”的部分,显示了生成标准输出结果所使用的设置。例如,可以看到以下设置被使用:

  • 文本格式:带有 Markdown 的文本
  • 输出格式:JSON

向页面下方滚动,可以看到一个名为“Results(结果)”的部分,其中显示了生成的结果。在文档级别的选项卡中,根据驾驶执照的图像,以带有 Markdown 的文本格式生成了结果。 

 在“Element Level”选项卡中,基于文档的各个元素,结果以带有 Markdown 的文本格式生成。

 点击“Results”中的“Download Results”按钮后,会下载一个名为 Results.zip 的文件。解压后可以看到一个名为 StandardOutputDocument.json 的文件。通过该文件,可以以之前在“Output Format”中选择的 JSON 格式查看生成的结果。

 移动到页面右上角,可以返回到“Configuration(配置)”部分。点击 Regenerate results 按钮,可以重新生成结果。点击 Add to project 按钮,可以将配置添加到新的项目或现有项目中。

尝试创建并添加到新项目中。点击按钮后,会弹出一个对话框,在其中输入项目名称并完成创建。

新的项目已成功创建,Configuration 的内容已被添加到项目中。

Custom output

让我们来查看结果的“自定义输出”选项卡。这是一个通过 BDA 从文档或图像中提取信息时,用于细化输出设置的功能。借助该功能,可以将提取的数据转换为特定的格式或结构。

蓝图(Blueprint)在这里就像一份“指令清单”,详细说明了如何从文件中提取信息以及如何转换输出。可以将蓝图比作一份“配方”,而 BDA 则根据这份配方处理数据。

在本次操作中,使用的是名为 US-Driver-License 的示例蓝图。由于示例蓝图无法直接编辑,如果需要调整,可以复制蓝图后进行修改。

 点击“复制蓝图”按钮后,会弹出如上图所示的对话框。输入蓝图名称后即可完成复制操作。

已跳转到自定义输出设置的目标蓝图页面。在这个页面上,可以通过图形界面(GUI)对刚刚复制的蓝图进行编辑。编辑完成后,可以将蓝图添加到项目中,或者选择保存蓝图以进行版本管理。

我切换回了自定义输出设置的主页面。在这里可以看到示例蓝图以及刚刚复制的蓝图列表,一目了然地管理和选择需要使用的蓝图。

UseCase

提供了三个使用场景,并为每个场景指出了应该选择“标准输出”、“自定义输出”或“两者结合”中的哪种方式:

  • RAG 索引
  • 智能文档处理
  • 媒体分析

API

Using the Bedrock Data Automation API - Amazon BedrockThe Amazon Bedrock Data Automation (BDA) feature provides a streamlined API workflow for processing your data. For all modalities, this workflow consists of three main steps: creating a project, invoking the analysis, and retrieving the results. To retrieve custom output for your processed data, you provide the Blueprint ARN when you invoke the analysis operation.icon-default.png?t=O83Ahttps://docs.aws.amazon.com/bedrock/latest/userguide/bda-using-api.html

以下是关于通过 API 使用 BDA 的用户指南。通过调用已创建的项目 API,可以实现以下功能:

  • 从非结构化多模态内容中提取有价值的信息
  • 作为解析器,用于设置 RAG 工作流的知识库

总结

在实际操作中,我对 BDA 的使用有了以下几点认识:

  • 项目:是标准输出和自定义输出设置的集合
  • 蓝图:相当于自定义输出的“配方”
  • 自定义输出界面:可以查看示例蓝图和自定义蓝图
  • 演示界面:可以查看不同资产类型的标准输出和自定义输出结果,并验证修改设置后的效果
  • API 调用:通过调用创建的项目 API,可从非结构化多模态内容中提取信息,或者在设置 RAG 工作流知识库时作为解析器使用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/939948.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

JAVA:组合模式(Composite Pattern)的技术指南

1、简述 组合模式(Composite Pattern)是一种结构型设计模式,旨在将对象组合成树形结构以表示“部分-整体”的层次结构。它使客户端对单个对象和组合对象的使用具有一致性。 设计模式样例:https://gitee.com/lhdxhl/design-pattern-example.git 2、什么是组合模式 组合模式…

计算机基础 试题

建议做的时候复制粘贴,全部颜色改为黑色,做完了可以看博客对答案。 一、单项选择题(本大题共25小题,每小题2分,共50分〉 1.计算机内部采用二进制数表示信息,为了便于书写,常用十六进制数表示。一个二进制数0010011010110用十六进制数表示为 A.9A6 B.26B C.4D6 D.…

SAP ABAP-日期格式问题 SAP内部错误,反序列化JSON字符串时发生异常 值 20241215 不是根据 ABAP 的 XML 格式的有效日期

SAP ABAP-日期格式问题 SAP内部错误,反序列化JSON字符串时发生异常 值 20241215 不是根据 ABAP 的 XML 格式的有效日期 在SAP内部用 YYYYMMDD没有问题 外部传入参数

腾讯云云开发 Copilot 深度探索与实战分享

个人主页:♡喜欢做梦 欢迎 👍点赞 ➕关注 ❤️收藏 💬评论 目录 一、引言 二、产品介绍 三、产品体验过程 四、整体总结 五、给开发者的复用建议 六、对 AI 辅助开发的前景展望 一、引言 在当今数字化转型加速的时代,…

中间件 redis安装

redis官网地址:Redis - The Real-time Data Platform 环境 CentOS Linux release 7.9.2009 (Core) java version "17.0.12" 2024-07-16 LTS 1、通过压缩包安装redis 1,远程下载redis压缩包,或去官网下载:Downloads …

CVE-2021-44228 漏洞复现

漏洞描述 什么是 log4j 和 log4j2 log4j 是 Apache 的一个开源日志库,是一个基于 Java 的日志记录框架,Log4j2 是 log4j 的后继者,其中引入了大量丰富的特性,可以控制日志信息输送的目的地为控制台、文件、GUI 组建等&#xff0…

SpringBoot02

1. 学习目标(了解) 2. Mybatis整合&数据访问(操作) 使用SpringBoot开发企业项目时,持久层数据访问是前端页面数据展示的基础,SpringBoot支持市面上常见的关系库产品(Oracle,Mysql,SqlServer,DB2等)对应…

答:C++需要学到什么程度再开始学 qt 比较合理?

有网友问:C需要学到什么程度再开始学 qt 比较合理? 南老师回答如下。 在我看来,这确实是一个好问题,但我的回答,大概很难成为一个好回答。 但我还是想回答,所以诚恳谢妖! 如果有人问我&…

Elasticsearch8.17.0在mac上的安装

1、下载并安装 下载8.17版本es(目前最新版本):Download Elasticsearch | Elastic 也可以通过历史版本列表页下载:Past Releases of Elastic Stack Software | Elastic 当然也可以指定具体版本号进行下载:Elasticsearch 8.17.0 | Elastic …

爬取Q房二手房房源信息

文章目录 1. 实战概述2. 网站页面分析3. 编写代码爬取Q房二手房房源信息3.1 创建项目与程序3.2 运行程序,查看结果 4. 实战小结 1. 实战概述 本次实战项目旨在通过编写Python爬虫程序,抓取深圳Q房网上的二手房房源信息。我们将分析网页结构,…

易语言OCR银行卡文字识别

一.引言 文字识别,也称为光学字符识别(Optical Character Recognition, OCR),是一种将不同形式的文档(如扫描的纸质文档、PDF文件或数字相机拍摄的图片)中的文字转换成可编辑和可搜索的数据的技术。随着技…

6.3.1 MR实战:计算总分与平均分

在本次实战中,我们的目标是利用Apache Hadoop的MapReduce框架来处理和分析学生成绩数据。具体来说,我们将计算一个包含五名学生五门科目成绩的数据集的总分和平均分。这个过程包括在云主机上准备数据,将成绩数据存储为文本文件,并…

MongoDB、Mongoose使用教程

文章目录 一:MongoDB 简介1.1 什么是 MongoDB1.2 特点1.3 与关系数据库的区别:1.4 资源链接: 二:安装 MongoDB2.1 安装前的准备2.2 安装、启动 MongoDB2.3 创建用户 MongoDB 三、连接四:MongoDB 基础操作4.1 库操作&am…

【2024/12最新】CF罗技鼠标宏分享教程与源码

使用效果: 支持的功能 M4 7发一个点HK417 连点瞬狙炼狱加特林一个圈 下载链接 点击下载

vue2组件

文章目录 组件注册全局注册局部注册 组件中的props格式单向数据校验 组件中的事件使用传参声明事件校验 组件上的v-model使用携带参数多个v-model处理修饰符 透传 Attributes简单使用禁用透传多个继承 动态组件介绍使用KeepAlive包含缓存生命周期 插槽使用默认内容具名插槽条件…

【C++】用哈希表封装myunordered_map和myunordered_set

前言 本篇博客我们来用哈希表模拟实现一下STL库里的unordered_map与unordered_set 💓 个人主页:小张同学zkf ⏩ 文章专栏:C 若有问题 评论区见📝 🎉欢迎大家点赞👍收藏⭐文章 目录 1.源码及框架分析 2.模…

在linux系统的docker中安装GitLab

一、安装GitLab: 在安装了docker之后就是下载安装GitLab了,在linux系统中输入命令:docker search gitlab就可以看到很多项目,一般安装第一个,它是英文版的,如果英文不好可以安装twang2218/gitlab-ce-zh。 …

Restaurants WebAPI(一)—— clean architecture

文章目录 项目地址一、Restaurants.Domain 核心业务层1.1 Entities实体层1.2 Repositories 数据操作EF的接口二、Restaurants.Infrastructure 基础设施层2.1 Persistence 数据EF CORE配置2.2 Repositories 数据查询实现2.3 Extensions 服务注册三、Restaurants.Application用例…

全栈开发----Mysql基本配置与使用

本篇是在已下载Mysql的情况下进行的,若还未下载或未创建Mysql服务,请转到这篇: 2024 年 MySQL 8.0.40 安装配置、Workbench汉化教程最简易(保姆级)_mysql8.0.40下载安装教程-CSDN博客 本文对于mysql的操作均使用控制台sql原生代码…

AI可信论坛亮点:合合信息分享视觉内容安全技术前沿

前言 在当今科技迅猛发展的时代,人工智能(AI)技术正以前所未有的速度改变着我们的生活与工作方式。作为AI领域的重要盛会,CSIG青年科学家会议AI可信论坛汇聚了众多青年科学家与业界精英,共同探讨AI技术的最新进展、挑…