【EdgeAI实战】(1)STM32 边缘 AI 生态系统

【EdgeAI实战】(1)STM32 边缘 AI 生态系统

【EdgeAI实战】(1)STM32 边缘 AI 生态系统

    • 1. STM32 边缘人工智能
      • 1.1 X-CUBE-AI 扩展包
      • 1.2 STM32 AI Model Zoo
      • 1.3 ST AIoT Craft
    • 2. STM32N6 AI 生态系统 (STM32N6-AI)
      • 2.1 STM32N6 AI 产品组合
      • 2.2 STM32N6 AI 开发工具
    • 3. STM32Cube.AI 参考资料
      • 3.1 ST 边缘AI 官方入口
      • 3.2 ST 边缘AI 套件(ST Edge AI Suite)
      • 3.3 STM32Cube.AI 参考文档
      • 3.4 STM32N6 资料和设计文件


1. STM32 边缘人工智能

从云AI到边缘AI

AI的应用越来越广泛,它影响着我们每天使用的服务,接触的设备和机器。

现阶段的AI技术很大程度上依赖于云计算,使用强大的远程数据中心,处理由本地设备收集的数据。边缘AI将AI算法和模型直接部署在物联网 (IoT) 设备和嵌入式工业和汽车系统等设备上。这种部署方式让我们得以在源头实时处理和分析数据,让真正自主的智能设备成为可能,使设备能够快速决策,以适应性的方式触发行动。

相对云部署,在边缘部署AI具有诸多优势。更快的速度和超低的延迟,大大降低了数据传输负荷,显著提高了安全性。在云端运行推理算法需要瓦特级的功率,而在边缘设备上仅需消耗毫瓦甚至微瓦级的功率,显著降低了运行功耗。此外,边缘AI还能更好地保护隐私。

边缘AI为所有市场的设备和服务创造者打开了新的大门,让我们可以用比云技术低得多的成本实现更多新应用。


1.1 X-CUBE-AI 扩展包

STM32 Cube.AI 扩展包 下载地址:STM32 x-cube-ai

X-CUBE-AI是STM32Cube.AI生态系统的STM32Cube扩展包部分,能够自动转换预训练人工智能算法(包括神经网络和经典机器学习模型),并将生成的优化库集成到用用户项目中,以此来扩展STM32CubeMX功能。

  • 为STM32平台优化NN和ML模型
  • 在STM32平台上对NN和ML模型进行性能分析
  • 在STM32平台上评估NN和ML模型
  • 以STM32CubeMX扩展包的形式提供

在这里插入图片描述
在这里插入图片描述


1. 为STM32平台优化NN和ML模型
将您自己的神经网络模型导入STM32CubeMX,选择优化选项,并生成与输入模型相对应的经优化C代码。
在这里插入图片描述

2. 在STM32平台上对NN和ML模型进行性能分析
X-CUBE-AI将分析NN模型并生成性能分析报告,从而详细说明整个网络及其各层的NN内存需求和推理时间。
在这里插入图片描述

3. 其它功能
从预训练神经网络和经典机器学习模型生成STM32优化库
原生支持各种深度学习框架,如Keras和TensorFlow™ Lite,并支持可导出为ONNX标准格式的所有框架,如PyTorch™、Microsoft® Cognitive Toolkit、MATLAB®等
支持各种内置scikit-learn模型,如孤立森林、支持向量机(SVM)、K-means等
支持8位量子化Keras网络以及TensorFlow™ Lite量子化网络
允许将权重存储在外部Flash存储器和外部RAM的激活缓冲区中,从而使用更大的网络
通过STM32Cube集成在不同的STM32微控制器系列之间实现轻松移植
借助TensorFlow™ Lite神经网络,使用STM32Cube.AI运行时或面向微控制器的TensorFlow™ Lite运行时来生成代码


1.2 STM32 AI Model Zoo

Model Zoo 提供一系列 针对 STM32 器件进行优化的 AI 模型,可以部署在 STM32 MCU 上运行。

  • 可从针对 STM32 器件进行了优化的一系列AI模型中选择
  • 使用脚本重新训练数据集中的任何模型
  • 使用脚本在应用上部署AI模型
  • 自带模型 (BYOM) 或自带数据 (BYOD)

下载地址:
Github: ST-stm32ai-modelzoo
Github: ST-MEMS-Machine Learning Core
Github: ST-MEMS-intelligent sensor processing unit

在这里插入图片描述


1.3 ST AIoT Craft

这是一款在线工具,可利用带有传感器内AI的 STM32 组件快速开发传感器到云解决方案。

借助ST AIoT Craft,可以尝试集成在 STM32 智能传感器中的先进边缘AI功能。

  • 首先学习如何对嵌入在许多MEMS惯性传感器和IMU中的机器学习核心(MLC)引擎进行编程:当微控制器处于睡眠模式时,可以对加速度(或振动)和旋转模式进行分类,从而节省能源。
  • ST AIoT Craft收集标记的传感器数据,并使用它来训练MLC发动机。结果可以通过ST评估板从门户网站(我们建议使用Chrome)或配套的移动应用程序进行验证。
  • ST AIoT Craft还建立了一个完整的物联网系统,其中传感器板连接到网关,网关与云应用程序通信。
  1. 利用意法半导体开发板创建传感器到云解决方案
    使用在线工具简化支持AI的物联网节点的开发流程。

在这里插入图片描述

  1. 对机器学习内核编程,以运行传感器内AI
    在MEMS传感器中快速创建在其嵌入的机器学习内核上运行的决策树算法。

在这里插入图片描述

  1. 探索端到端项目示例
    利用 STM32 参考设计探索概念验证。

在这里插入图片描述


2. STM32N6 AI 生态系统 (STM32N6-AI)

STM32N6-AI

STM32N6 AI生态系统 (STM32N6-AI) 是意法半导体推出的工具和资源集合,旨在支持在高性能STM32N6系列微控制器上开发和部署AI模型。

在这里插入图片描述


2.1 STM32N6 AI 产品组合

STM32N6微控制器 (MCU) 首次集成了意法半导体专有的Neural-ART加速器神经处理单元 (NPU),在AI/ML性能上实现了重大突破。

STM32N6 是ST首款集成自研硬件NPU神经网络硬件处理单元的通用微控制器,其算力可达0.6TOPS(每秒0.6万亿次运算)。STM32N6 还集成了新IP和视频外设,如MIPI CSI摄像机、机器视觉图像信号处理器(ISP)、H.264视频编码器和支持时间敏感网络(TSN)端点的千兆以太网控制器。

  • 神经网络硬件加速单元(NPU)
    处理能力达 600 GOPS,其神经网络加速处理能力是目前最高性能 STM32H7 的 600 倍。
    能效出色:能效达到 3TOPS/W,功耗极低,运行 AI 模型无需散热装置。

  • 基于 Cortex-M55 内核
    采用 Cortex-M55 内核,主频 800MHz,基于 ARM v8.1 架构,新增 150 个新指令,尤其是矢量指令集,可用于 NPU 运算数据的前处理和后处理(如 DSP 运算操作)。

  • 内置大容量 RAM
    拥有 4.2MB 连续地址空间的 SRAM,具备多种使用方式,比如存储 NPU 运算中的推理数据,或用作帧缓存以及 H264 压缩时的中间数据。

  • 机器视觉能力
    算力支持:提供 600GOPS 的 AI 处理算力,可开展众多机器视觉应用。
    接口与处理器:具备 MIPI CSI2 2 线的摄像头接口,还有特定的图像信号处理器 ISP,能实现摄像机 RAW 图到 RGB 格式的转换。

  • 扩展的多媒体功能
    图形加速:2.5D图形加速器。
    视频编码传输:集成 H264 编码器,便于在运行 AI 处理时,通过以太网口或 USB(UVC 协议)将摄像头获取的视频传输到外部,同时具备 JPEG 编码和解码的硬件。
    在这里插入图片描述

  • STM32Cube.AI (X-CUBE-AI):

    • 用于优化NN模型的桌面工具(STM32CubeMX插件)
    • 自动生成适用于STM32微控制器的C代码
  • ST Edge AI Developer Cloud (STEDGEAI-DC):

    • 在线基准测试平台,用于在Board Farm中在线托管的STM32开发板上对AI性能(推理时间、内存占用)进行基准测试。
    • 自动生成适用于STM32微控制器的C代码
    • 通过REST API实现流程自动化
  • ST Edge AI Core (STEdgeAI-Core):

    • 用于优化NN模型的命令行接口 (CLI)
    • 自动生成适用于STM32微控制器的C代码
  • STM32 Model Zoo:

    • 提供经过精心优化的AI模型集及相关性能、即用型应用示例,以及用于模型训练、评估、量化、基准测试和部署的脚本。
    • 通过REST API使用ST Edge AI Developer Cloud服务
  • 应用包:

    • 提供多个AI应用的优化源代码
    • 在用户的开发板上无缝实施
  • 入门代码示例:

    • 简单的AI代码示例和教程,介绍如何使用意法半导体Neural-ART加速器实现AI应用
    • 可选链接至STM32 Model Zoo资源
  • 提供丰富工具以满足用户的配置和目标。

  • Neural-ART加速器与AI软件生态系统的无缝集成,确保了AI应用性能的优化。

  • 用户可轻松获取模型选择、训练脚本及关键模型指标,可直接用于基准测试。

  • 基于Python™脚本 (REST API) 的ML自动化基准测试服务。

  • 丰富的使用案例和应用代码示例,快速在MCU上开启AI应用开发。

  • 原生支持多种深度学习框架,如 Keras 和 TensorFlow Lite,同时兼容所有可导出为ONNX标准格式的框架,包括PyTorch、MATLAB 等。


2.2 STM32N6 AI 开发工具

STM32N6 AI生态系统的所有工具和软件包均属于ST Edge AI Suite。该套件整合了多种软件工具,旨在简化嵌入式AI应用的开发和部署。该综合套件支持从数据收集到在硬件最终部署的整个机器学习算法和神经网络模型的优化和部署流程,简化了跨学科领域的专业人士的工作流程。

STM32N6-AI工具专为简化开发流程而设计,确保开发人员能够实现最理想的性能和效率。这些工具支持“自带数据”(BYOD) 和“自带模型”(BYOM) 两种开发方式,以满足用户的不同开发实践和偏好。
例如,STM32 Model Zoo(github.com/STMicroelectronics/stm32ai-modelzoo)、ST Edge AI Developer Cloud (STEDGEAI-DC)、STM32Cube.AI (X-CUBE-AI) 和ST Edge AI Core (STEdgeAI-Core) 等工具,充分发挥了STM32N6在AI和计算机视觉 (CV) 应用方面的潜力。

此外,STM32N6-AI还提供多种软件包,作为用户AI项目的示例和起点:

  • AI应用:包括简单的计算机视觉 (CV) 和音频应用(如人物检测或图像分类),以及更复杂和优化的应用(如姿势估计、实例分割、手部关键点检测和音频场景识别)。
  • 视频应用:展示完整的应用场景,包括H264编码和通过USB视频设备等级码流将数据输出到PC。

总体而言,STM32N6-AI提供了一个完整的软件和工具生态系统,帮助开发人员利用STM32N6在边缘构建下一代机器学习应用。STM32N6中嵌入的Neural-ART加速器NPU专为高效处理AI推理任务而设计,可显著加速NN模型的执行。这种整合使微控制器上的边缘AI应用变得更加实用和普及,为广泛的应用场景提供了强大、高效且可扩展的解决方案。


3. STM32Cube.AI 参考资料

3.1 ST 边缘AI 官方入口

ST Artificial intelligence at the edge
ST 边缘人工智能

在这里插入图片描述


3.2 ST 边缘AI 套件(ST Edge AI Suite)

ST Edge AI Suite
ST 边缘AI 套件

意法半导体边缘AI套件为您提供免费工具、案例研究和资源,以便在微控制器、微处理器和智能传感器上启用AI。
助您将边缘AI应用于MCU、MPU和智能传感器的得力工具。

在这里插入图片描述


3.3 STM32Cube.AI 参考文档

Wiki: STM32Cube.AI
STM32CubeAI Data brief
STM32CubeAI User manual
STM32CubeAI 扩展包入门指南

在这里插入图片描述

在这里插入图片描述


3.4 STM32N6 资料和设计文件

STM32N6 设计文件
STM32N6超全资料合集
【STM32N6570-DK评测】1.你好N6
【STM32N6570-DK评测】2.最简点灯
【STM32N6570-DK评测】3.从外部flash启动
【STM32N6570-DK评测】4.800MHz的点灯


版权声明:
youcans@qq.com 原创作品,转载必须标注原文链接:(https://blog.csdn.net/youcans/article/details/145256170)
Copyright@youcans 2025
Crated:2025-01

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/957698.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

DeepSeek-R1性能如何?如何使用DeepSeek-R1和o1 Pro模型

我们一起来看看DeepSeek-R1模型和OpenAI o1模型的能力如何?接下来,我们先看数据结果,然后再实际体验,我们今天就让他们写个python爬虫脚本来爬取所有有关孙颖莎和樊振东的相关报道和图片。 DeepSeek-R1 DeepSeek介绍自己说 &quo…

FunASR语言识别的环境安装、推理

目录 一、环境配置 1、创建虚拟环境 2、安装环境及pytorch 官网:pytorch下载地址 3、安装funasr之前,确保已经安装了下面依赖环境: python代码调用(推荐) 4、模型下载 5、启动funasr服务 二、 客户端连接 2.1 html连接 …

【Elasticsearch】 Ingest Pipeline `processors`属性详解

在Elasticsearch中,Ingest Pipeline 的 processors 属性是一个数组,包含一个或多个处理器(processors)。每个处理器定义了一个数据处理步骤,可以在数据索引之前对数据进行预处理或富化。以下是对 processors 属性中常见…

架构思考与实践:从通用到场景的转变

在当今复杂多变的商业环境中,企业架构的设计与优化成为了一个关键议题。本文通过一系列随笔,探讨了业务架构的价值、从通用架构到场景架构的转变、恰如其分的架构设计以及如何避免盲目低效等问题。通过对多个实际案例的分析,笔者揭示了架构设…

消息队列实战指南:三大MQ 与 Kafka 适用场景全解析

前言:在当今数字化时代,分布式系统和大数据处理变得愈发普遍,消息队列作为其中的关键组件,承担着系统解耦、异步通信、流量削峰等重要职责。ActiveMQ、RabbitMQ、RocketMQ 和 Kafka 作为市场上极具代表性的消息队列产品&#xff0…

win32汇编环境,怎么得到磁盘的盘符

;运行效果 ;win32汇编环境,怎么得到磁盘的盘符 ;以下代码主要为了展示一下原理,应用GetLogicalDrives、GetLogicalDriveStrings函数、屏蔽某些二进制位、按双字节复制内容等。以下代码最多查8个盘,即返回值中的1个字节的信息 ;直接抄进RadAsm可编译运行。…

微软预测 AI 2025,AI Agents 重塑工作形式

1月初,微软在官网发布了2025年6大AI预测,分别是:AI模型将变得更加强大和有用、AI Agents将彻底改变工作方式、AI伴侣将支持日常生活、AI资源的利用将更高效、测试与定制是开发AI的关键以及AI将加速科学研究突破。 值得一提的是,微…

网络编程套接字(二)

目录 TCP网络程序 服务端初始化 创建套接字 服务端绑定 服务端监听 服务端启动 服务端获取连接 服务端处理请求 客户端初始化 客户端启动 发起连接 发起请求 网络测试 多进程版TCP网络程序 捕捉SIGCHLD信号 孙子进程提供服务 多线程版TCP网络程序 线程池版TC…

网站HTTP改成HTTPS

您不仅需要知道如何将HTTP转换为HTTPS,还必须在不妨碍您的网站自成立以来建立的任何搜索排名权限的情况下进行切换。 为什么应该从HTTP转换为HTTPS? 与非安全HTTP于不同,安全域使用SSL(安全套接字层)服务器上的加密代…

渗透测试--攻击常见的Web应用

本文章咱主要讨论,常见Web应用的攻击手法,其中并不完全,因为Web应用是在太多无法囊括全部,但其中的手法思想却值得我们借鉴,所以俺在此做了记录,希望对大家有帮助!主要有以下内容: 1…

外包公司名单一览表(成都)

大家好,我是苍何。 之前写了一篇武汉的外包公司名单,评论区做了个简单统计,很多人说,在外包的日子很煎熬,不再想去了。 有小伙伴留言说有些外包会强制离职,不行就转岗,让人极度没有安全感。 这…

2025 最新flutter面试总结

目录 1.Dart是值传递还是引用传递? 2.Flutter 是单引擎还是双引擎 3. StatelessWidget 和 StatefulWidget 在 Flutter 中有什么区别? 4.简述Dart语音特性 5. Navigator 是什么?在 Flutter 中 Routes 是什么? 6、Dart 是不是…

Spring Boot安全加固:基于Spring Security的权限管理

引言 在当今数字化时代,随着企业信息化程度的不断提高,应用程序的安全性成为了一个至关重要的问题。Spring Boot 作为 Java 生态系统中广泛使用的开发框架,以其简洁、高效的特点深受开发者的喜爱。然而,仅仅依靠 Spring Boot 的默…

论文笔记(六十二)Diffusion Reward Learning Rewards via Conditional Video Diffusion

Diffusion Reward Learning Rewards via Conditional Video Diffusion 文章概括摘要1 引言2 相关工作3 前言4 方法4.1 基于扩散模型的专家视频建模4.2 条件熵作为奖励4.3 训练细节 5 实验5.1 实验设置5.2 主要结果5.3 零样本奖励泛化5.4 真实机器人评估5.5 消融研究 6 结论 文章…

工业缺陷检测实战——基于深度学习YOLOv10神经网络PCB缺陷检测系统

基于深度学习YOLOv10神经网络PCB缺陷检测系统,其能识别六种PCB缺陷:names {0:missing_hole, 1:mouse_bite, 2:open_circuit, 3:short, 4:spur, 5:spurious_copper} CH_names [缺失孔,鼠标咬伤,开路,短路,杂散,伪铜] 具体图片见如下: 第一步…

React+AntDesign实现类似Chatgpt交互界面

以下是一个基于React和Ant Design搭建的简单ChatGPT风格前端交互界面代码框架示例,该示例实现了基本的用户输入、发送请求以及展示回复的功能。假设后端有一个模拟接口来处理请求并返回回复。 1. 项目初始化: 确保你已经安装了Node.js和npm。通过以下命…

FANUC机器人系统镜像备份与恢复的具体步骤(图文)

FANUC机器人系统镜像备份与恢复的具体步骤(图文) 镜像备份: 如下图所示,进入文件—工具—切换设备,找到插入的U盘UT1, 如下图所示,进入U盘目录后,创建目录,这里目录名称为11, 如下图所示࿰

MongoDB 备份与恢复综述

目录 一、基本概述 二、逻辑备份 1、全量备份 2、增量备份 3、恢复 三、物理备份 1、cp/tar/fsync 2、WiredTiger 热备份 3、恢复 四、快照备份 一、基本概述 MongoDB 是一种流行的 NoSQL 数据库,它使用文档存储数据,支持丰富的查询语言和索引…

【Qt 常用控件】显示类控件——QLabel

目录 1.QLabel 1.1 textFormat 文本类型 普通文本和富文本 Markdown格式 1.2 alignment 文本对齐方式 1.3 wordWrap 自动换行 1.4 indent 文本缩进 1.5 margin 边距 1.6 buddy,qlabel伙伴 1.7 pixmap图片 和 scaledContents自动填充 1.QLabel 功能&#x…

npm install 报错:Command failed: git checkout 2.2.0-c

[TOC](npm install 报错:Command failed: git checkout 2.2.0-c) npm install 报错:Command failed: git checkout 2.2.0-c export NODE_HOME/usr/local/node-v14.14.0-linux-x64 npm config set registry https://registry.npmmirror.com 使用如上环…