深度学习入门笔记（一）必备数学基础知识

深度学习入门笔记（一）必备数学基础知识

article2025/2/25 13:47:50/文章来源:https://blog.csdn.net/nonmarking/article/details/136001694

本节中，我们先来介绍一些深度学习中必备的数学知识，有些是大学课堂讲过的，还有些可能没有，对于第一次见到的知识，可以先不用深究，了解概念即可，再后面应用的时候可以翻过头再看。

1.1 线性代数

深度学习中有4种核心数据结构：标量、向量、矩阵和张量。都对应大学课堂中线性代数中的知识。

向量

向量的点乘（注意点乘结果是个标量）；对应项相乘；矩阵乘法；都可用python的numpy库完成。

范数

范数是一种距离的表示，或者说向量的长度。常见的范数有 L0 范数、L1 范数和 L2 范数，我们通过一个向量来看：
x =(x,x2,x3.… xn)

L0 范数：指这个向量中非 0 元素的个数。我们可以通过 L0 范数减少非 0 元素的个数，从而减少参与决策的特征，减少参数。这样一来，自然模型就运算得更快，模型的体积也更小了。

L1 范数：指的是向量中所有元素的绝对值之和，它是一种距离的表示（曼哈顿距离），也被称为稀疏规则算子，L0 范数和 L1 范数都能实现权值稀疏。但 L1 范数是 L0 范数的最优凸近似，它比 L0 范数有着更好的优化求解的特性，所以被更广泛地使用。

权值稀疏：模型中可能有大量特征，有一部分特征对于最后结果的贡献非常小，甚至近乎零。这些用处不大的特征，我们希望能够将其舍弃，以更方便模型做出决策

L2 范数：是向量中所有元素的平方和的平方根，L2范数对应欧氏距离，它的作用就是防止过拟合。因为L2 实际上就是让向量中所有元素的平方和再开方。那么，如果我们要避免模型过拟合，就要使 L2 最小，这意味着向量中的每一个元素的平方都要尽量小，且接近于 0。和 L0 和 L1 不一样，L2 不会让元素等于 0。

L1 和 L2 范数的区别：L1 会趋向于产生少量的特征，而其他的特征都是 0，用于特征选择和稀疏；L2 会选择更多的特征，但这些特征都会接近于 0，用于减少过拟合。

1.2 微积分

导数

实际上就是平时说的斜率。一个函数在某一点的导数描述了这个函数在这一点附近的变化率。

偏导数

它实际上是函数在不同方向（坐标轴）上的变化率。就好比爬山，任意一个位置，都会有东西方向和南北方向的坡度（斜率）。

梯度

函数的所有偏导数构成的向量就叫作梯度。梯度是一个向量。同时，梯度向量的方向即为函数值增长最快的方向。

1.3 信息论

KL 散度

也称为相对熵，它衡量了两个分布之间的差异。
在这里插入图片描述

因此该公式字面上的含义就是真实事件的信息熵，同理论拟合的事件的信息量与真实事件的概率的乘积的差的累加。

拆开来看，真实事件的信息熵就是 p(xi) log p(xi)，理论拟合的事件的信息量就是 log q(xi)，真实事件的概率就是 p(xi)。

在模型优化、数据分析和统计等场合下，我们就可以使用 KL 散度衡量我们选择的近似分布与数据原分布有多大差异。当拟合事件和真实事件一致的时候 KL 散度就成了 0，不一样的时候就大于 0。

交叉熵

衡量了两个分布之间的差异，但是与 KL 散度的区别在于，交叉熵代表用拟合分布来表示实际分布的困难程度
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/366489.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

github请求超时解决方法

github请求超时解决方法

github请求超时解决办法我使用windows执行如下git命令,提示超时 git clone xxxxx命令行提示如下： Failed to connect to github.com port 443: Timed out问题排查可我Chrome可以正常访问github甚至ChatGPT，但是为什么在命令行里面却无法访问&#…

阅读更多...

OpenAI 悄悄升级 ChatGPT；王腾：小米手机用户忠诚度安卓第一丨 RTE 开发者日报 Vol.140

OpenAI 悄悄升级 ChatGPT；王腾：小米手机用户忠诚度安卓第一丨 RTE 开发者日报 Vol.140

开发者朋友们大家好： 这里是「RTE 开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE （Real Time Engagement） 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「…

阅读更多...

Java中的常用API

Java中的常用API

常用API Object类浅克隆与深克隆 ObjectsObjects中的equals 包装类StringBuilder和StringBufferStringBuilder是可变字符串对象StringBuffer线程安全案例![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/87649c20e6464113a42aee5f16f1ee22.png) StringJoiner Object…

阅读更多...

鸿蒙harmony--自定义组件

鸿蒙harmony--自定义组件

今天是2月1日，星期四，二月的第一条祝福送给你，愿你目之所及皆是欢喜，心之所想皆能如愿，希望在新的一年里，我们都能越来越好。目录一，定义二，自定义组件的基本用法三，…

阅读更多...

生产问题排查系列——未知404状态接口请求

生产问题排查系列——未知404状态接口请求

引言我们的产品主打金融服务领域，以B端客户为我们的核心合作伙伴，然而，我们的服务最终将惠及C端消费者。在技术实现上，我们采用了公司自主研发的微服务框架，该框架基于SpringBoot，旨在提供高效、可靠的服…

阅读更多...

【FPGA VerilogModelsim】 8bitBCD码60计数器

【FPGA VerilogModelsim】 8bitBCD码60计数器

可私信获取整个项目文件 8bit 即有8位二进制 BCD码，全称Binary-Coded Decimal,简称BCD码或者二-十进制代码利用四位二进制（0000-1111）16个中选择10个作为十进制0-9；常见的BCD码是8421码本项目使用两组BCD码（每组4bit，共8bit，故称为8bitBCD）（高位0-5，低位0-9…

阅读更多...

【Java网络编程04】网络原理进阶（二）

【Java网络编程04】网络原理进阶（二）

1. 前言在网络原理进阶（一）部分我们详细介绍了UDP/TCP两大协议及其相关特性，本章我们会讨论网络层、数据链路层、物理层相关协议。但是需要注意的是，如果有小伙伴们未来是想成为Java后端开发工程师的，那么未来工作中…

阅读更多...

随着网络的快速发展，网络安全问题也日益凸显，遇到攻击该如何处理，如何抉择合适的防护方案

随着网络的快速发展，网络安全问题也日益凸显，遇到攻击该如何处理，如何抉择合适的防护方案

DexunCloud 经过研究发现当今世界，随着网络的快速发展，网络安全问题也日益凸显。其中，DDoS（分布式拒绝服务）攻击被认为是网络安全领域里最为严重的威胁之一。毫无疑问，DDoS攻击不仅可以导致网络服务中断&am…

阅读更多...

LCR 156. 序列化与反序列化二叉树

LCR 156. 序列化与反序列化二叉树

w 解题思路： 序列化反序列化 public class Codec {public String serialize(TreeNode root) {if(root null) return "[]";StringBuilder res new StringBuilder("[");Queue<TreeNode> queue new LinkedList<>() {{ add(root)…

阅读更多...

RK3326系统中集成思必驰音频适配文件

RK3326系统中集成思必驰音频适配文件

前言最近本人在RK3326 8.1系统上做定制化，需要对接思必驰平台音频相关接口，同时在系统中集成音频适配文件，踩了很多坑，写这篇文章记录一下。一、为什么要集成音频适配文件？ 当APP（集成…

阅读更多...

【C语言】通讯录实现（下）

【C语言】通讯录实现（下）

目录 1.进阶通讯录特点（下） 2.实现步骤 （1）保存增加的联系人数据到文件中 （2）加载保存的联系人数据 3.完整C语言通讯录代码 （1）contact.h (2)test.c (3)contact.c 4.结语 1.…

阅读更多...

【Qt加密播放器】登录窗口功能补充

【Qt加密播放器】登录窗口功能补充

输入框小设计目的：实现鼠标点击输入框时的聚焦效果。首先在LoginForm构造函数中为账号和密码输入框添加事件过滤器。关于事件过滤器的具体介绍可以参考这篇博文：Qt消息机制和事件 ui->nameEdit->installEventFilter(this); ui->pwdEdit->…

阅读更多...

文字超长显示省略号...坑（如果盒子本身是弹性盒子flex布局会不支持）

文字超长显示省略号...坑（如果盒子本身是弹性盒子flex布局会不支持）

如果盒子是弹性盒子样式会失效 #item-title{font-size: 28rpx;font-weight: 800;color: #2D3748;width: 100%;overflow: hidden;text-overflow: ellipsis;white-space: nowrap;}&:nth-child(2){width: calc(100% - 172rpx);margin-left: 40rpx;>view{&:not(:first-…

阅读更多...

人工智能基础-Numpy矩阵运算-聚合操作

人工智能基础-Numpy矩阵运算-聚合操作

加、减、乘、除、整除幂、取余、倒数、绝对值三角函数 e的x次方、3的x次方、logx、log2为底、log10为底矩阵运算加、减、乘（对应数相乘）、矩阵相乘运算、转至向量和矩阵的运算加法对应相加改变维度后相加乘法矩阵的逆聚合操作 …

阅读更多...

Java基础数据结构之Lambda表达式

Java基础数据结构之Lambda表达式

一.语法基本语法：(parameters)->expression或者(parameters)->{statements;} parameters：类似方法中的形参列表，这里的参数是函数式接口里面的参数。这里的参数可以明确说明，也可以不声明而由JVM隐含的推断。当只有一个推…

阅读更多...

Android View解析

Android View解析

一、什么是View？ 1.View是用户接口组件的基本构建块； 2.View在屏幕上占据一个矩形区域； 3.View通过绘制自己与事件处理两种方式与用户交互设计View，主要是为了让应用能够与用户交互，要想完成交互，这个…

阅读更多...

数据探索与可视化:可视化分析数据-下

数据探索与可视化:可视化分析数据-下

目录一、前言二、介绍 Ⅰ.时间序列数据 Ⅱ.文本数据 Ⅲ.社交网络数据三、结语一、前言那么本篇将互怼其他类型的数据分析的可视化方法进行介绍，它们分别是:时间序列，文本数据，社交网络数据。二、介绍 Ⅰ.时间序列数据 import pan…

阅读更多...

【python接口自动化】- 正则用例参数化

【python接口自动化】- 正则用例参数化

🔥 交流讨论：欢迎加入我们一起学习！ 🔥 资源分享：耗时200小时精选的「软件测试」资料包 🔥 教程推荐：火遍全网的《软件测试》教程 📢欢迎点赞 👍 收藏 ⭐留言 &#x1…

阅读更多...

鸿蒙开发有必要学吗？看完这篇再决定吧

鸿蒙开发有必要学吗？看完这篇再决定吧

在科技的潮流中，每一次新操作系统的诞生都是对旧秩序的挑战与新机遇的孕育。鸿蒙操作系统的出现，无疑是近年来科技界最引人注目的事件之一。自华为于2019年正式推出鸿蒙系统以来，这一我们自主研发的操作系统不仅在国内引起巨大反响&#xff0…

阅读更多...

在windows平台上mysql的安装教程

在windows平台上mysql的安装教程

1.下载 mysql下载网址：https://dev.mysql.com/downloads/installer/ 这里直接选择的是mysql的社区版。自己使用直接选择免费的就行直接选择下载 2.安装过程选择Server only 就行下一步下一步下一步，选择弱密码把，方便学习和自己使用设置…

阅读更多...

最新文章