【人工智能基础】人工神经网络

一、人工神经网络的三要素

人工神经元数理模型

MP模型是世界上第一个神经计算模型,为神经网络理论提供了基础 

mp神经元模型基本组成

MP模型功能

  • 对树突输入u的线性加权求和
  • 对净输入的非线性转换\

作用函数的功能作用函数的功能

MP神经元模型的作用函数是单位阶跃函数。当x≥0时f(x)=1,反之f(x)=0

作用函数的功能

  1. 控制输入对输出的激活作用
  2. 对输入、输出进行函数转换
  3. 将无限域的输入变换为有限范围内的输出

在神经元模型中,作用函数还有其他形式,包括:

  • 阈值型作用函数(单位阶跃函数,符号函数):采用阶跃作用函数的神经元,称为阈值逻辑单元
  • 连续非线性作用函数(双极性函数、双曲正切函数)
  • 分段线性作用函数

人工神经网络结构

根据网络拓扑结构形式分

层次型神经网络

  • 单纯型(前向神经网络):神经元分层排列,顺序连接,神经元间不存在反馈
  • 层内有互联型:任意两个神经元之间都有可能有相互连接
  • 有反馈型

互联型神经网络

根据神经网络内部信息传递方向分

  • 前馈型神经网络:没有反馈,结构简单,易于实现,适合解决一般的函数逼近和预测问题
  • 反馈型神经网络:有反馈,信息处理体现为状态变换。适合解决动态序列分析或联想记忆等问题

人工神经网络学习算法

神经网络的运行阶段

学习阶段:通过学习训练样本或其他方法调整权值矩阵

工作阶段:各连接权成熟,不再改变,用于求解实际问题

学习方式

有监督学习方式:根据实际输出和期望输出的偏差,按照一定准则调整权值

无监督学习方式:仅根据输入调整权值

学习规则

联想式学习(Hebb学习规则)

误差纠正式学习(Delta学习规则)

二、感知器

模拟人的视觉,接收环境信息,并由神经冲动进行信息传递的神经网络

感知器的连接权值可变,被赋予了学习的特性

单层感知器

  • 作用函数:阈值型函数
  • 网络结构:单层处理单元
  • 学习规则:感知器学习规则

训练步骤

  1. 设置权值的处置wj(0)(j=0,1……n)为较小的随机非0值,设置学习率η∈(0,1],t=0
  2. 给定输入/输出样本对:up/dp(p=1,2……L),当up∈A时dp=+1,up∈B,dp=-1
  3. 对全部要本逐一求感知器输出
  4. 若yp(t)≠dp,权值第t+1次调整
  5. 若误差为0,学习结束,反之t++,回到第三步

注意:判断输出误差时,要求所有样本误差为0,学习才结束

功能

n维输入的单节点感知器具有分类功能,其分类界面是n维空间的一个超平面,超平面法矢量是其连接权值向量,位置由神经元阈值确定

感知器的学习过程就是将分类知识存储于神经元的权值向量与阈值中

局限性

如果输入的两类模式是线性可分集合,则算法收敛。反之无法收敛

多层感知器(多层前馈神经网络)

在输入和输出层间增加一层或多层隐单元

三、误差反向传播网络(BP网络)

  • 单元特性:作用函数连续可微
  • 网络结构:多输入多输出的多层前馈网络
  • 学习规则:误差反向传播方法

基本思想

在外界输入样本的刺激下,不断改变网络的连接权值,使得网络的实际输出不断地接近期望的输出

基本步骤

  1. 设置初始权值W(0)为较小的随机非零值
  2. 给定输入/输出要本结婚{up,dp}
  3. 重复迭代下列过程,直到妈祖收敛条件
  4. 对任意样本p正向传播、计算每层输出,然后反向传播,计算灵敏度和梯度
  5. 利用负梯度修正权值

BP网络设计

网络层数:优先考虑一个隐层,最多两个;

输入层节点数:取决于输入向量的维数

隐层节点数:如果两个隐层,第一隐层包含较多节点,第二隐层较少

输出层节点数:根据实际问题的抽象模型确定

神经元的作用函数

  1. 回归问题:隐层一般采用Sigmoid,输出层采用线性作用函数
  2. 分类问题:隐层选择Sigmoid、tanh或者Relu,输出层可以使用Sigmoid。限制输出值在[0,1]或者[-1,1]之间

学习率:根据训练情况调整

优势

  • 非线性映射能力
  • 并行分布处理方式
  • 自学习和自适应能力
  • 在线学习和数据融合能力

局限性

  • 训练过程可能陷于局部最优
  • 参数选择缺乏有效方法
  • 网络学习的逼近和推广能力与训练样本有关
  • 网络具有不可重现性

四、深度学习概述

深度学习与浅层学习相比,强调了模型结构的深度,通常由5-10个活更多隐层。突出了特征学习的重要性,利用大数据来学习特征,能够刻画数据的丰富内在信息

深度前馈网络的逐层训练方式

  1. 采用自下而上的无监督学习,每次调整一层,每层采用wake-sleep算法调优
  2. 自顶向下的有监督学习,在学习获得各层参数基础上,在最顶层添加一个分类器,利用梯度下降法微调整个网络参数

优势

  • 通过深层非线性网络结构,实现复杂函数逼近,对输入数据进行分布式表示
  • 自动提取特征,对于各层学习到的特征由更好的解释性
  • 更充分利用无标签数据,不容易陷入局部最优
  • 结合大数据,不容易出现过拟合现象

五、卷积神经网络

基本结构

卷积层

每个隐层节点连接到图像某个足够小的局部上,局部卷积核参数共享,大大减少需要训练的权值参数

池化层

紧接在卷积层之后,简化从卷积层输出的信息,使用压缩方法,通过一个下采样的过程,减少图像规模,池化降低了每个特征映射的维度,但是保留了最重要的稀稀。池化有多种形式:最大、平均、求和等。最大池化效果最好

作用

  1. 减少网络中待计算的参数数量,抑制过拟合
  2. 增强网络对输入图像中小变形、扭曲、平移的鲁棒性

非线性激励层

一般位于卷积层和池化层之后,也可以位于两者之间,是深度网络非线性的主要来源

训练过程

  1. 用随机数初始化所有的卷积核参数和权重
  2. 将训练图片作为输入,执行前向步骤并计算每个类别对应输出概率
  3. 计算输出层总误差
  4. 反向传播,更新所有卷积核参数和权值,使输出误差最小化

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/571164.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

JTS:Java Topology Suit

接口文档:org.locationtech.jts:jts-core 1.19.0 API。 开发文档:JTS | Documentation。 概述 JTS提供了平面线性几何(planar and linear geometry)与相关的基础几何处理函数(a set of fundamental geometric functions.)。 JTS遵循OGC发布的简单几何规范(Simple Featu…

递归、搜索与回溯算法:综合练习

例题一 解法: 算法思路: ⾸先,我们在第⼀⾏放置第⼀个皇后,然后遍历棋盘的第⼆⾏,在可⾏的位置放置第⼆个皇后,然后再遍历第三⾏,在可⾏的位置放置第三个皇后,以此类推&#xff0c…

nodejs切换

1.卸载nodejs 2.下载nvm工具 3.检查nvm安装情况 nvm -v3.nvm 安装命令 nvm install 10.16.34.查询nodejs版本 nvm list5.切换nodejs版本 nvm use 10.16.3

⑤【Shiro】SpringBoot整合Shiro,实现登录认证

个人简介:Java领域新星创作者;阿里云技术博主、星级博主、专家博主;正在Java学习的路上摸爬滚打,记录学习的过程~ 个人主页:.29.的博客 学习社区:进去逛一逛~ ⑤【Shiro】SpringBoot整合Shiro,实…

精度论文Generative Prompt Model for Weakly Supervised Object Localization

Generative Prompt Model for Weakly Supervised Object Localization 中国科学院大学&&浙江大学CVPR20231.Abstract 当从图像类别标签中学习对象定位模型时,弱监督对象定位(WSOL)仍然具有挑战性, 传统的鉴别训练激活模型的方法忽略了具有代表性但鉴别性较差的对象…

弱光图像增强 | 基于TensorFlowLite+TensorRT加速的MIRNet弱光图像增强实现

项目应用场景 面向弱光图像增强场景,项目基于 MIRNet 弱光图像增强算法,采用 TensorRT TensorFlow-Lite 进行 GPU 算法加速推理。 项目效果 项目细节 > 具体参见项目 README.md (1) 具体参考项目内 jupyter,包括 MIRNet_TFLite.ipynb、M…

云南旅游攻略

丽江景点 Day1 ——丽江古城 丽江古城是一个充满文化和历史的地方,拥有丰富的景点和活动。 推荐游玩: 参观标志性建筑:大水车是丽江古城的标志性建筑,可以在这里拍照留念。 探索中心广场:四方街是古城的中心&#xf…

2024年火爆全网的三款ai智能直播系统,你知道哪一种?

2024年火爆全网的三款ai智能直播系统,你知道哪一种? 如今网络时代,信息运转的速度非常迅猛。 有句话说的好:“若水三千只取一瓢饮,”快速筛选有价值的信息,过滤掉对自己有害的垃圾信息。不要想着把所有钱都赚完&…

Lambda表达式特点

Lambda 表达式是 Java 8 引入的一项重要特性,它们提供了一种更简洁的方式来表达匿名函数。Lambda 表达式允许你将一段代码传递给方法,而不是显式创建一个实现了接口的匿名内部类。Lambda 表达式通常用于实现单个抽象方法的接口(即函数式接口&…

元宇宙虚拟空间的角色状态更新(七)

前言 该文章主要讲元宇宙虚拟空间的角色状态更新,基本核心技术点 角色状态更新 对角色设置一个位置判断(从中心点向下投射一射线确定角色的位置) character.feetRaycast(); feetRaycast的start获取碰撞体的位置,end射线结束的…

MKS 质量MFC流量控制器原理及应用课件PPT

MKS 质量MFC流量控制器原理及应用课件PPT

SpringBoot+Vue开发记录(四)

说明: 本篇文章的主要内容是软件架构以及项目的前端Vue创建 一、软件架构 我道听途说的,听说这个东西很关键很重要什么的。 软件架构(software architecture)是一个系统的草图,是一系列相关的抽象模式,用于指导大型软…

W801学习笔记十四:掌机系统——菜单——尝试打造自己的UI

未来将会有诸多应用,这些应用将通过菜单进行有序组织和管理。因此,我们需要率先打造好菜单。 LCD 驱动通常是直接写屏的,虽然速度较快,但用于界面制作则不太适宜。所以,最好能拥有一套 UI 框架。如前所述,…

4.26日学习记录

[湖湘杯 2021 final]Penetratable SUID提权 SUID是一种对二进制程序进行设置的特殊权限,可以让二进制程序的执行者临时拥有属主的权限 SUID具有一定的限制: 1.仅对于二进制有效; 2.执行者在程序中有可以执行的权限; 3.权限仅在程序…

使用Spring 完成转账业务添加日志功能

(完整的代码在文章附带文件中 , 文章里的代码仅作展示 , 可能有部分不完善 代码地址 :下载:https://javazhang.lanzn.com/i5oLI1vyiile 密码:1234 ) 任务目标 具体实现方法和心得 步骤1. 导入依赖项Spring依赖 , aop依赖,德鲁伊依赖,mybatis依赖 , mysql驱动 , mybatis-sprin…

深度学习框架pytorch:tensor.data和tensor.detach()的区别

本文重点 本文我们区别一下tensor.data和tensor.detach(),我们所讲解的都是pytorch的1.0版本的情况 官方解释 返回一个新的张量,它与当前图形分离。结果永远不需要梯度。返回的张量与原始张量共享相同的存储空间。将看到对其中任何一个的就地修改,并且可能在正确性检查中…

【神经网络结构可视化】PlotNeuralNet的安装、测试及创建自己的神经网络结构可视化图形

文章目录 前提准备1、下载MikTeX2、下载Git bash3、下载PlotNeuralNet 进行测试1、解压PlotNeuralNet-master.zip2、打开Git bash3、 在my_project中查看生成的pdf文件 创建自己的神经网络结构可视化图形 前提准备 1、下载MikTeX 下载链接: MikTeX ( https://mikt…

闲话 ASP.NET Core 数据校验(一):内置数据校验

前言 所谓输入的是垃圾,输出也必然是垃圾,有多少安全问题隐藏在请求的数据中,所以永远不能相信来自用户端的输入。 对请求数据的合法性进行校验,不仅有助于提升用户界面的友好性,而且有助于提高后台程序的安全性和稳…

区块链安全应用------压力测试

测试要求: 1. 对以下AccountManager智能合约进行压测(基础要求set函数测试,balanceOf涵为20分加分项)2. 在本地链进行测试,需要监控本地进程的资源使用情况。每个进程的multiOutput属性为Avg3. 需要将每一个更改的配置文件截图,和…

初入数据库

SQL:操作关系型数据库的编程语言,定义了一套操作关系型数据库的统一标准。 DDL(Data Definition Language)数据定义语言 数据库 show databases;create database db01;use db01;select database(); 显示当前使用的数据库drop d…