粗俗理解多层感知器

一、前言

参考资料和图片均来自以下链接:
https://www.youtube.com/watch?v=aircAruvnKk&list=PLZHQObOWTQDNU6R1_67000Dx_ZCJB-3pi
https://www.youtube.com/watch?v=bfmFfD2RIcg
https://www.youtube.com/watch?v=KuXjwB4LzSA
https://www.youtube.com/watch?v=Ilg3gGewQ5U
3Blue1Brown的个人空间-3Blue1Brown个人主页-哔哩哔哩视频
神经网络——最易懂最清晰的一篇文章-CSDN博客

二、几个问题

首先我想引入几个问题:
1.对于神经网络中的 "神经元" 是什么,如何工作的?
2.多层感知器是什么?他和常出现的CNN、RNN、GNN等有什么关系?
3.输入神经网络的信息只能是数字形式的吗?为什么是或者否?
 

三、多层感知器的组成部分和工作原理

    很多人(包括我自己)可能在起初接触神经网络时获取的大部分信息也许都是关于CNN、RNN等的,入门的门槛一下子就拉高了,也许从经典的多层感知器(MLP)入门神经网络会更加轻松,一级打boss比较难哈。

1.神经元:
    神经元是神经网络的基本单元,它接收输入,对其进行处理,并生成输出。
    神经元通常执行加权求和的操作,将输入乘以权重,加上一个偏置项,然后通过一个激活函数来产生输出。

 数学表达如下图:(注意每一个神经元都要进行这样的操作)

    每一层神经元接收上一层或下一层的输入,对应前向传播和反向传播,每一个神经元代表一个激活函数。不是只要激活值为正数就激活,所以要设置偏执项。对应以下视频10:59处,原话为:"但有时 即使加权和大于0时 你也不想把神经元点亮,可能只有当和大于例如10的时候才让它激发,此时你就需要加上一个偏置值 保证不能随便激发"。【官方双语】深度学习之神经网络的结构 Part 1 ver 2.0_哔哩哔哩_bilibili

2.层次结构:
    输入层:接收原始数据作为网络的输入。
    隐藏层:在输入和输出层之间,可以有一个或多个隐藏层构成了MLP的核心,它们负责处理输入数据,提取特征,并通过非线性变换学习输入数据的复杂模式和特征。
    输出层:产生网络的最终输出,例如分类或回归任务的预测值。

    神经网络的输入信息必须是数字形式的,因为神经网络的运算基于数学运算,如加法、乘法和激活函数等,这些都需要数值型数据才能进行。因此,任何非数字形式的数据,在输入到神经网络之前,都需要被转换成数字形式。这个转换过程通常称为特征工程或数据预处理。

3.连接和权重:
    节点之间全连接:每个节点与前一层的所有节点相连。
    每个连接都有一个权重,表示输入信号在该连接上传递时的强度或重要性。
    每个神经元还有一个偏置项,用于调整激活函数的输出。

4.激活函数:
    激活函数的作用是在神经元中引入非线性,这是MLP能够解决非线性问题的关键。
    常见的激活函数包括Sigmoid、tanh、ReLU(Rectified Linear Unit)等。

此外必须的还有(下面的不必一下子就理解):

5.前向传播:
    在前向传播过程中,信息从输入层开始,逐层向前传递,直到输出层。
    每一层的输出都是下一层的输入。

6.损失函数:
    损失函数衡量了神经网络的预测与实际值之间的差异。
    训练神经网络的目标是最小化这个损失函数。

7.反向传播和优化:
    通过反向传播算法,神经网络可以根据损失函数的梯度来更新权重和偏置。
    优化器,如SGD(随机梯度下降)、Adam等,用于指导如何调整权重和偏置来最小化损失函数。

四、其余神经网络

    其余的神经网络如CNN、RNN、GNN等都是在处理某一种任务是表现良好的,例如CNN专门针对图像数据设计、RNN能够处理时间序列和文本等有时间顺序的数据、GNN专为图数据设计等等,但他们都包含以上七部分。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/611625.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2024数维杯数学建模竞赛A题完整代码和思路论文解析

2024数维杯数学建模完整代码和成品论文已更新,获取↓↓↓↓↓ https://www.yuque.com/u42168770/qv6z0d/bgic2nbxs2h41pvt?singleDoc# 2024数维杯数学建模A题34页论文已完成,论文包括摘要、问题重述、问题分析、模型假设、符号说明、模型的建立和求解&…

linux下使用jexus部署aspnet站点

1.运行环境 Centos 7 安装dos2unix工具 yum install dos2unix 安装jexus curl https://jexus.org/release/x64/install.sh|sudo sh2.网站部署 2.1. 将windows下的网站发布包Msc_qingdao_admin.zip上传到linux中, 然后解压后放入/var/www(没有则创建)目录下 r…

ICode国际青少年编程竞赛- Python-4级训练场-绿色能量1

ICode国际青少年编程竞赛- Python-4级训练场-绿色能量1 1、 Dev.step(3) Dev.turnLeft() Dev.step(3) Spaceship.step(4) Spaceship.turnRight() Spaceship.step(4) Dev.step(3) while Item[1].y ! Dev.y:wait()2、 Dev.step(4) while Item[0].x ! Dev.x:wait() Dev.turnLe…

AScript纯本地离线文字识别插件

目的 AScript是一款可以模拟鼠标和键盘操作的自动化工具。它可以帮助用户自动完成一些重复的、繁琐的任务,节省大量人工操作的时间。但按键精灵是不包含图色功能,无法识别屏幕上的图像,根据图像的变化自动执行相应的操作。本篇文章主要讲解下…

15 华三华为链路聚合综述

1 链路聚合简介 以太网链路聚合通过将多条以太网物理链路捆绑在一起形成一条以太网逻辑链路,实现增加链路带宽的目的,同时这些捆绑在一起的链路通过相互动态备份,可以有效地提高链路的可靠性。 2 成员端口的状态 聚合组内的成员端口具有以下…

深入理解Docker容器镜像

深入理解Docker容器镜像 1 容器是什么:特殊的进程 容器其实是一种沙盒技术。顾名思义,沙盒就是能够像一个集装箱一样,把你的应用“装”起来的技术。这样,应用与应用之间,就因为有了边界而不至于相互干扰;而…

聊天室项目思路

发起群聊: 从好友表选取人发送到服务器,服务器随机生成不重复的群号,存储在数据库,同时建立中间表,处理用户与群聊的关系 申请入群: 输入群号,发消息给服务器,服务器查询是否存在…

如何使用openEuler 22.03 配置mail.rc给邮箱发送邮件

目录 需求环境总体步骤梳理详细步骤1. 安装mailx软件包(centos默认安装,openEuler不默认安装)2. 检查是否能ping得到smtp服务器3. 在qq邮箱开启smtp设置4. 修改/etc/mail.rc文件5. 测试 可能遇到的问题 需求 希望检查每日的备份和系统运行记…

[MRCTF2020]Ez_bypass1 and [网鼎杯 2020 青龙组]AreUSerialz1()php语言基础学习,以及序列化概念的基本了解

1.[MRCTF2020]Ez_bypass1 (1)打开环境后它是一串很长并且看起来非常混乱的代码,看不懂那咱就先不管,直接查看源码 (2)看了之后可以发现它涉及到很多东西 首先就是要进行一个仔细的代码审计,分…

代码随想录算法训练营第六十三天|84.柱状图中最大的矩形

代码随想录算法训练营第六十三天|84.柱状图中最大的矩形 84.柱状图中最大的矩形 给定 n 个非负整数,用来表示柱状图中各个柱子的高度。每个柱子彼此相邻,且宽度为 1 。 求在该柱状图中,能够勾勒出来的矩形的最大面积。 示例 1: 输入&…

调试代码问题汇总

1.最常见的就是数据库密码不对。根据调试视频将你的数据库密码设置正确,数据库密码是数字的优先直接连如果不成功可以加个双引号或者单引号。 提示:java.sql.SQLException: Access denied for user rootlocalhost (using password: YES) 2.原本配置好的…

我觉得POC应该贴近实际

今天我看到一位老师给我一份测试数据。 这是三个国产数据库。算是分布式的。其中有两个和我比较熟悉,但是这个数据看上去并不好。看上去第一个黄色的数据库数据是这里最好的了。但是即使如此,我相信大部分做数据库的人都知道。MySQL和PostgreSQL平时拿出…

【算法基础实验】排序-最小优先队列MinPQ

优先队列 理论知识 MinPQ(最小优先队列)是一种常见的数据结构,用于有效管理一组元素,其中最小元素可以快速被检索和删除。这种数据结构广泛应用于各种算法中,包括图算法(如 Dijkstra 的最短路径算法和 Pr…

RISCV 外部GCC 工具链安装@FreeBSD15

在交叉编译的时候,可以使用FreeBSD15默认的工具链:LLVM 也可以使用GCC工具链,GCC可以使用现成pkg包安装,也可以编译安装。 LLVM的特点是高移植性和高效,但学习成本高。GCC的特点是成熟稳定,但优化能力有限…

【系统架构师】-案例篇(五)企业应用系统集成与ESB

在航空业中,Ramp Coordination是指飞机从降落到起飞过程中所需要进行的各种业务活动的协调过程。通常每个航班都有一位员工负责Ramp Coordination,称之为RampCoordinator。由Ramp Coordinator协调的业务活动包括检查机位环境、卸货和装货等。 由于航班类…

2024C题生物质和煤共热解问题的研究 详细思路

背景 随着全球能源需求的不断增长和对可再生能源的追求,生物质和煤共热解作为一种潜在的能源转化技术备受关注。生物质是指可再生能源,源自植物和动物的有机物质,而煤则是一种化石燃料。** 在共热解过程中,生物质和煤在高温和缺氧…

数据库调优-SQL语句优化

2. SQL语句优化 sql 复制代码 # 请问这两条SQL语句有什么区别呢?你来猜一猜那条SQL语句执行查询效果更好! select id from sys_goods where goods_name华为 HUAWEI 麦芒7 魅海蓝 6G64G 全网通; ​ select id from sys_goods where goods_id14967325985…

【科研】常用的实验结果评价指标(1) —— R2(R-square)是什么?

常用的实验结果评价指标(1) —— R2(R-square),可能为负数吗?! 提示:先说概念,后续再陆续上代码 文章目录 常用的实验结果评价指标(1) —— R2(R-square),可能…

【电路笔记】-无源高通滤波器

无源高通滤波器 文章目录 无源高通滤波器1、概述2、一阶高通滤波器的频率响应3、高通滤波器示例4、二阶高通滤波器5、RC 差异化因素高通滤波器与低通滤波器电路完全相反,因为这两个组件已互换,滤波器输出信号现在从电阻器两端获取。 1、概述 由于低通滤波器只允许低于其截止…

Python中的多进程、多线程、协程

Python中的多线程、多进程、协程 一、概述 1. 多线程Thread (threading): 优点:同一个进程中可以启动多个线程,充分利用IO时,cpu进行等待的时间缺点:相对于进程,多线程只能并发执…