Amazon SageMaker简直就是机器学习平台的天花板

一、前言

最近参与了亚马逊云科技【云上探索实验】活动,通过Amazon SageMaker基于Stable Diffusion模型,非常简单快速搭建的第一个AIGC,一开始以为非常复杂,不懂动手操作,但实际上操作非常简单,没有想象中的恐怖,整体体验非常愉快,我先对Amazon SageMaker简单介绍,然后对基于Stable Diffusion模型,搭建AIGC应用简单总结下。

二、Amazon SageMaker简单介绍

Amazon SageMaker 是 Amazon Web Services(AWS)的一款全面的机器学习(ML)平台,旨在让数据科学家,开发人员和企业更轻松地构建、训练和部署机器学习模型。Amazon SageMaker 提供了一整套工具和框架,包括数据标注、模型训练、模型部署、自动化建模等功能,同时还支持多种常见数据科学框架,例如 TensorFlow、PyTorch 和 Apache MXNet。Amazon SageMaker 建立在 Amazon 二十年来开发现实世界机器学习应用程序的经验之上,这些应用程序包括产品推荐、个性化、智能购物、机器人技术和语音辅助设备。

官网地址地址

 

三、基于Stable Diffusion模型,搭建AIGC应用简单

1、我们需要先检查限额

我们会使用ml.g4dn.xlarge,首先需要确保 ml.g4dn.xlarge有额度,点击这里:请点击检查限额 ,搜索框中输入ml.g4dn.xlarge for endpoint usage 若您的限额如图所示,在ml.g4dn.xlarge for endpoint usage行第二列若为0,请继续以下步骤

选中其中的ml.g4dn.xlarge for endpoint usage,然后点击右上角橙色按钮“请求增加配额”一步一步的往下走。

 

2、我们需要创建Amazon SageMaker Notebook实例

1)、登录控制台

2)、在查找服务处搜索SageMaker,然后配置笔记本实例。

3)、配置一个IAM角色

 

3、我们需要在AWS Cloud9 创建前后端 Web 应用

1)、创建环境

这里我们需要进行创建AWS Cloud9和安装boto3这些环境等,具体操作可以看这里

2)、运行app.py和preview前端页面

3)、简单测试prompt

输入:a siamese cat wearing glasses,  working hard at the computer

 

4、总结

基于Stable Diffusion模型,搭建AIGC应用操作非常简单,就算我们不是很懂,也能操作成功,功能也非常强大,体验非常舒服,真心建议大家去使用。

四、Stable Diffusion 模型介绍和核心竞争力

1、模型结构图

2、模型原理

3、模型训练

训练目标:一步步对随机的高斯噪声降噪(denoise)

优势:Latent diffusion 之所以是 “latent”,是因为模型是在低维的潜空间(latent space)上进行扩散过程,而不是在实际的像素空间,从而降低了内存消耗和计算复杂度(比如输入shape是(3,512,512),下采样因子是8,潜空间中变成了(3,64,64),节省了8×8=64倍的内存)。训练完之后的模型就能把一张图表示成一个低维的潜特征。

4、模型推理

如图(假设batch size是1),用户输入的 prompt 被 CLIP Text encoder 编码为 77×768 的潜特征,随机噪声被表示成 64×64 的潜特征;然后 U-Net 以 prompt 的特征为条件,逐步迭代计算。U-Net 输出的噪声残差,会通过调度算法(scheduler algorithm),根据先前的噪声表示和预测的噪声残差,计算最终去噪的图像潜表示。Stable Diffusion 建议的调度算法有三种:

  • PNDM scheduler(Pseudo Numerical Methods for Diffusion Models on Manifolds,默认)
  • DDIM scheduler
  • K-LMS scheduler

得到图像潜表示后,就可以送到 VAE 的 decoder 解码成图像了。

 

5、Stable Diffusion 算法模型的核心竞争力

  • Stable Diffsuion能压缩率更高,清晰度超越JPEG等算法。
  • 与纯粹基于transformer的方法相比,本文方法更适合高维数据;还可以高效地应用于百万像素图像的高分辨率合成。
  • 显著降低计算成本,在多个任务(无条件图像合成、inpainting、超分辨率)和数据集上实现了具有竞争力的性能。与基于像素的扩散方法相比,显著降低了推理成本。
  • 与之前的工作(同时学习编码器/解码器架构和score-based的先验)相比,方法不需要对重构和生成能力进行精确的权衡。这确保了仅需非常少的潜空间正则化下,即可有较合理的重建效果。
  • 对于超分辨率、图像修复和语义合成等条件密集输入型的任务,模型能以卷积的方式应用,并输出高达1024分辨率的图像。
  • 基于交叉注意力的通用条件机制,实现了多模态训练。用它来训练类条件模型、文本到图像模型和布局到图像模型。
  • Stable Diffsuion制作图片速度非常快。

总之只需训练一次通用的自动编码阶段,就可以用于多次DM训练或探索可能完全不同的任务。

五、Amazon SageMaker产品强大的功能特性

1、模型训练功能

Amazon SageMaker 提供了完整的模型训练流程,支持多种常见的深度学习和机器学习算法,包括线性回归、逻辑回归、k-means聚类、随机森林等。用户可以在 SageMaker 中选择合适的算法,并通过简单易用的界面或 API 进行模型训练。此外,用户可以使用预训练模型或自己的模型文件进行训练。

当然,我们还可有使用亚马逊训练模特 SageMaker,下图说明了 Amazon 如何训练和部署模型 SageMaker:。

 

2、模型部署功能

Amazon SageMaker 提供了多种模型部署选项,包括实时端点、批量推理和容器化部署等。用户可以根据自己的需求选择合适的部署方式,并通过简单易用的界面或 API 进行部署。此外,用户还可以根据自己的需求进行部署优化,例如通过使用 GPU 实例加速推理速度,下图就是工作原理。

 我们可以在点击这里部署用于推理的模型具体深入了解。

3、数据标注功能

Amazon SageMaker 提供了一整套数据标注工具,包括文本分类、图像分类、目标检测等。用户可以选择合适的数据标注任务,并通过简单易用的界面或 API 进行标注。此外,用户还可以使用 Amazon Mechanical Turk 等服务来获取更多的标注数据。

4、自动化建模功能

Amazon SageMaker 提供了自动化建模功能,可以根据用户提供的数据自动生成模型。用户只需要上传数据集,SageMaker 就会自动生成最佳的模型架构和参数,并进行训练和优化。此功能可以大大简化模型构建的过程,提高模型的精度和效率。

5、建模能力、速度与易用性

Amazon SageMaker 提供了一整套优秀的建模能力,可以帮助用户快速构建高质量的模型。同时,SageMaker 的训练速度也非常快,可以大大缩短模型训练的时间。此外,SageMaker 的易用性也非常好,用户可以通过简单易用的界面或 API 进行操作,无需专业知识。

6、框架支持能力功能

Amazon SageMaker 支持多种常见的数据科学框架,包括 TensorFlow、PyTorch 和 Apache MXNet 等。用户可以选择合适的框架进行模型训练和部署,并享受到 SageMaker 提供的各种优秀功能。

7、其它特性

除了以上所述的功能特性,Amazon SageMaker 还提供了多种其他有用的功能,例如模型调优、模型监控、模型解释等。这些功能可以帮助用户更好地理解和管理自己的机器学习模型。

六、Amazon SageMaker技术原理

1、机器学习原理性能

Amazon SageMaker 基于 TensorFlow、PyTorch、MXNet 等常见的机器学习框架,使用高效的分布式计算、自动化调参、自动化特征工程等技术,提高了机器学习模型的训练速度和效率。同时,SageMaker 还提供了多种优秀的算法库,可以帮助用户更好地构建和优化自己的机器学习模型。

1)、监督学习

Amazon SageMaker 提供了多种内置的通用算法,可用于分类或回归问题。

  • AutoGluon-表格
  • CatBoost
  • 因子分解机算法
  • K 最近邻 (k-NN) 算法
  • LightGBM
  • 线性学习器算法
  • TabTransformer
  • XGBoost 算法
  • Object2Vec 算法
  • DeepAR 预测算法

2)、无监督学习

Amazon SageMaker 提供了多种内置算法,可用于各种无监督学习任务,例如聚类、降维、模式识别和异常检测。

  • 主成分分析 (PCA) 算法
  • K-Means 算法
  • IP 见解
  • 随机森林砍伐 (RCF) 算法

3 )、文本分析

SageMaker 提供专为分析自然语言处理、文档分类或摘要、主题建模或分类以及语言转录或翻译中使用的文本文档而量身定制的算法。

  • BlazingText 算法
  • 序列到序列算法
  • 潜在狄利克雷分配 (LDA) 算法
  • 神经主题模型 (NTM) 算法
  • 文本分类- TensorFlow

4)、图像处理

SageMaker 还提供用于图像分类、物体检测和计算机视觉的图像处理算法。

  • 图像分类-MXNet
  • 图像分类- TensorFlow
  • 语义分割算法
  • 物体检测-MXNet
  • 物体检测- TensorFlow

2、主要功能算法总结

Amazon SageMaker 提供了多种常见的机器学习和深度学习算法,包括线性回归、逻辑回归、k-means聚类、随机森林等。同时,SageMaker 还支持自定义算法,用户可以根据自己的需求进行扩展和优化。

七、Amazon SageMaker产品适用场景和体验

1、适用场景

Amazon SageMaker 适用于各种类型和规模的机器学习项目,包括计算机视觉、自然语言处理、推荐系统等。它可以帮助用户更轻松地构建、训练和部署机器学习模型,提高模型的精度和效率。

2、体验优势

1)、接入便捷

Amazon SageMaker 可以与其他 AWS 服务无缝集成,例如 Amazon S3、Amazon Redshift、AWS Lambda 等。这使得用户可以轻松地将自己的数据和应用程序与 SageMaker 集成,无需担心数据迁移和管理问题,点击这里入门。

2)、功能丰富

Amazon SageMaker 提供了一整套机器学习工具和框架,包括模型训练、模型部署、数据标注、自动化建模等功能。用户可以根据自己的需求选择合适的功能,并通过简单易用的界面或 API 进行操作。

3)、帮助文档丰富

Amazon SageMaker 提供了详尽的帮助文档和示例,可以帮助用户更好地理解和使用 SageMaker。此外,AWS 还提供了丰富的支持服务,用户可以随时联系 AWS 支持团队获取帮助。

常见问题都能得到解决

3、客户业务案例

Amazon SageMaker 已经被广泛应用于各种机器学习项目中,例如:

垃圾邮件过滤:使用 SageMaker 训练模型来识别垃圾邮件,提高邮件过滤的效率和准确率。

图像分类:使用 SageMaker 训练模型来识别不同类别的图像,例如车辆、人物、动物等。

语音识别:使用 SageMaker 训练模型来识别语音,例如语音搜索、语音识别等。

推荐系统:使用 SageMaker 训练模型来预测用户的购买行为,提高推荐系统的准确率和效率。

部分客户如下图

八、Amazon SageMaker产品总结

1、技术总结

Amazon SageMaker 基于 TensorFlow、PyTorch、MXNet 等常见的机器学习框架,使用高效的分布式计算、自动化调参、自动化特征工程等技术,提高了机器学习模型的训练速度和效率。同时,SageMaker 还提供了多种优秀的算法库和工具,可以帮助用户更好地构建和优化自己的机器学习模型。

2、性能总结

Amazon SageMaker 提供了高效的数据标注、模型训练和模型部署功能,可以帮助用户更轻松地构建、训练和部署机器学习模型。同时,SageMaker 还提供了多种优秀的算法库和工具,可以提高模型的精度和效率。

3、核心竞争力总结

Amazon SageMaker 提供了一整套优秀的机器学习工具和框架,包括模型训练、模型部署、数据标注、自动化建模等功能。用户可以根据自己的需求选择合适的功能,并通过简单易用的界面或 API 进行操作。此外,SageMaker 还提供了高效的分布式计算、自动化调参、自动化特征工程等技术,可以大大提高机器学习模型的训练速度和效率。

4、是否满足大众需求总结

Amazon SageMaker 已经被广泛应用于各种机器学习项目中,并得到了广泛的认可和好评。它提供了一整套优秀的机器学习工具和框架,可以帮助用户更轻松地构建、训练和部署机器学习模型,提高模型的精度和效率。

九、温馨提示

目前云上探索实验室正在进行中,欢迎大家参与。

活动介绍与活动链接,https://dev.amazoncloud.cn/experience
活动定位:通过云上探索实验室,开发者可以学习实践云上技术,同时将自己的技术心得分享给其他开发者小伙伴。一同创造分享,互助启发,玩转云上技术。云上探索实验室不仅是体验的空间,更是分享的平台”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/10197.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【嵌入式Linux】Jetson nano GPIO应用 | 驱动开发 | 官方gpiolib、设备树与chip_driver

GPIO子系统 0.暴露给应用层 应用 $ echo 79 > /sys/class/gpio/export //导出79号gpio 引脚,使得可在应用层访问 $ echo out > /sys/class/gpio/gpio79/direction //设置 为输出 $ echo 1 > /sys/class/gpio/gpio79/value //输出高电平 开灯 $ echo 0…

Spark对正常日志文件清洗并分析

目录 日志文件准备: 一.日志数据清洗: 第一步:数据清洗需求分析: 二.代码实现 2.1 代码和其详解 2.2创建jdbcUtils来连接Mysql数据库 2.3 运行后结果展示: 三、留存用户分析 3.1需求概览 3.2.代码实现 3…

T 级数据量迁移!知名云巨头如何从 Jira 切换至 ONES?

2021 年,Atlassian 旗下 Jira&Confluence 等系列产品 Server 版(本地私有化部署版)全面停售,并将在 2024 年停止维护,Server 版客户必须迁移至 Cloud(云)或 Data Center(数据中心…

全网最详细,Jmeter性能测试-性能基础详解,控制器不同选择(四)

目录:导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜)前言 逻辑控制器 提前说…

一篇文章让你搞懂TypeScript中的??和?:和?.和!.是什么意思

TypeScript中的??和?:和?.和!.是什么意思?知识回调(不懂就看这儿!)场景复现核心干货???:?.!.知识回调(不懂就看这儿!) 知识专栏专栏链接TypeScript知识专栏https://blog.csdn.net/xsl_…

Scrapy爬虫框架(概念)

Scrapy 入门教程 | 菜鸟教程 (runoob.com) Scrapy是一个快速功能强大的网络爬虫框架 Scrapy的安装 通过 pip 安装 Scrapy 框架: pip install Scrapy 安装后小测: 执行 scrapy ‐h Scrapy不是一个函数功能库,而是一个爬虫框架。 Scrapy架构图(绿线是…

CentOS7 虚拟机 双网卡绑定

一、网卡绑定模式 模式类型特点mode0round-robin(平衡轮询策略)基于per packet方式,轮询往每条链路发送报文。提供负载均衡和容错的能力,当有链路出问题,会把流量切换到正常的链路上。交换机端需要配置聚合口。mode1a…

【论文笔记】CRN: Camera Radar Net for Accurate, Robust, Efficient 3D Perception

原文链接:https://arxiv.org/abs/2304.00670 1. 引言 本文提出两阶段融合方法CRN,能使用相机和雷达生成语义丰富且位置精确的BEV特征。具体来说,首先将图像透视特征转换到BEV下,该步骤依赖雷达,称为雷达辅助的视图变换…

C#基础复习

语句 目录 语句 switch: 跳转语句 标签语句 标签: 标签语句的作用域 goto语句 using 语句 资源的包装使用 using 语句示例: 多个资源和嵌套 语句是描述某个类型或让程序执行某个动作的源代码指令 块在语法上算作一个单条嵌入语句。任何语…

电脑无法正常关机?点了关机又会自动重启

“真木马”相信不少朋友遇到过电脑关机自动重启现象,一点关机,但随后电脑有会进入重启状态,就是一直不会停,属实是很难崩。 目录 一、问题症状 二、问题原因 三、解决方案 方法一: 1.关闭系统发生错误时电脑自动…

企业数字化转型全是坑?这几篇数字化转型成功案例,减少70%损失

这篇给大家整理了200企业数字化转型案例合集,涵盖了制造、建筑、教育、零售、互联网等10行业的大中小型企业数字化转型思路,希望对大家有所帮助。 案例全部整合在这篇文章中,点击即可查看>>数字化干货资料合集! 01 首先&…

C++编程法则365条一天一条(359)认识各种初始化术语

文章目录Default initialization默认初始化Copy initialization拷贝初始化Aggregate initialization聚合初始化Direct initialization直接初始化list_initialization列表初始化value_initialization值初始化参考: https://en.cppreference.com/w/cpp/language/copy_…

项目打包发布流程

---》》》项目打包发布 1.编译并构建项目 2.部署 npm i npm run build scp2:需要写代码 ---》》》 后续有空更新:赋几个链接: Jenkins官网 nullhttps://www.jenkins.io/zh/一文详解Jenkins的安装与配置Jenkins是一个基于Java开发的开源…

ERROR:org.apache.hadoop.hbase.PleaseHoldException: Master is initializing错误

一、问题 重新安装hbase后,在hbase shell中查看所有命名空间时,出现了ERROR:org.apache.hadoop.hbase.PleaseHoldException: Master is initializing错误。 二、方法 1、root用户下,关闭hbase stop-hbase.sh 2、执行以下命令删除HDFS下的hb…

深度学习环境配置超详细教程【Anaconda+PyTorch(GPU版)+CUDA+cuDNN】

深度学习环境配置 入门深度学习,首先要做的事情就是要搭建深度学习的环境。不管你是Windows用户,Mac用户还是Ubuntu用户,只要电脑配置允许,都可以做深度学习,毕竟Windows、Mac和Ubuntu系统都可以进行深度学习环境的搭…

惊呆了,2小时我就学会了Charles抓包的详细教程

目录 一、什么是Charles 二、下载Charles 三、设置Charles代理 四、配置设备代理 五、抓包操作 六、常见问题及解决方法 抓包不到某些应用程序 Charles抓包后网站出现异常 七、总结 一、什么是Charles Charles是一个跨平台的HTTP代理服务工具,可以用来查看…

软件测试工作主要做什么

随着信息技术的发展和普及,人们对软件的使用越来越普及。但是在软件的使用过程中,软件的效果却不尽如人意。为了确保软件的质量,整个软件业界已经逐渐意识到测试的重要性,也有越来越多的小伙伴加入了软件测试这个行业中来。软件测…

从FPGA说起的深度学习(六)-任务并行性

这是新的系列教程,在本教程中,我们将介绍使用 FPGA 实现深度学习的技术,深度学习是近年来人工智能领域的热门话题。在本教程中,旨在加深对深度学习和 FPGA 的理解。用 C/C 编写深度学习推理代码高级综合 (HLS) 将 C/C 代码转换为硬…

ServletAPI详解(四)-HttpServletResponse

我们来看第三个方法,HttpServletResponse 在servlet运行原理中提到,servlet代码中的doXXX方法的目的就是根据请求计算响应,然后将响应数据设置到HttpServletResponse对象中,然后 Tomcat 就会把这个 HttpServletResponse 对象按照 HTTP 协议的格式, 转成一个字符串, 并通过 Soc…

Linux Shell 实现一键部署二进制Rabbitmq

rabbitmq 前言 RabbitMQ是实现了高级消息队列协议(AMQP)的开源消息代理软件(亦称面向消息的中间件)。RabbitMQ服务器是用Erlang语言编写的,而集群和故障转移是构建在开放电信平台框架上的。所有主要的编程语言均有与代…