吉洪诺夫正则化随笔

前言

前几天在回顾压缩感知中的特征选择与LASSO回归发现了这个Tikhonov regularization,查了一下叫个如题的名字。先来浅说一下正则化这玩意:正则化(Regularization)是一种用来防止模型过拟合(Overfitting)的技术。过拟合指的是模型在训练数据上表现得过于完美,但是当遇到新的、未见过的数据时,模型的表现却大幅下降,即模型的泛化能力较差。这通常发生在模型过于复杂,以至于它开始捕捉训练数据中的噪声和随机波动,而不是数据背后的真实规律。
正则化通过在损失函数(Loss Function)中添加一个惩罚项(Penalty Term)来实现,这个惩罚项与模型的复杂度相关。模型越复杂,惩罚项的值就越大,从而使得损失函数的总值也越大。在训练过程中,模型会尝试同时最小化原始损失函数(如均方误差、交叉熵等)和正则化项,以达到一个平衡点。这样,正则化就鼓励模型在拟合训练数据的同时,保持较低的复杂度,从而提高模型的泛化能力。
常见的正则化方法包括:
1、L1正则化(LASSO回归):通过在损失函数中添加模型权重的绝对值之和作为惩罚项,来鼓励模型产生稀疏的权重,即许多权重变为零。这有助于降低模型的复杂度,因为它实际上移除了对最终预测没有贡献的特征。
2、L2正则化(岭回归):通过在损失函数中添加模型权重的平方和作为惩罚项,来防止权重变得过大。这有助于减少模型的复杂度,因为它限制了权重的大小,使得模型在拟合数据时更加平滑,不易受到极端数据点的影响。
3、Dropout:在神经网络中,Dropout通过在训练过程中随机丢弃(即将输出设置为零)一部分神经元来工作。这可以被视为一种集成方法,因为它训练了多个网络(每个都丢弃了不同的神经元),然后在测试时使用这些网络的平均输出来做预测。Dropout有效地减少了神经网络对特定神经元或连接的依赖,从而提高了模型的泛化能力。
4、早停法(Early Stopping):虽然不是直接对模型参数进行正则化,但早停法通过监控模型在验证集上的性能,并在性能开始下降时停止训练,来防止过拟合。这可以看作是一种对训练过程的正则化。
5、弹性网络:前两种的结合。

吉洪诺夫正则化

接下来的内容就是别人的内容了,我先介绍完再做补充吧。吉洪诺夫正则化,说实话这篇文章是我搜集到的关于此内容写的比较详细的了,尤其是文中的公式推导方面。
下面说一下它的结果,还是借用他的图片说一下吧,或者明天我有时间再整理一遍
公式推导
正则化的部分就是加了吉洪诺夫矩阵乘以变量 w w w,如果没有这项的话,结果的导数就变成了: w = ( X T X ) − 1 X T y w=(X^{T}X)^{-1}X^{T}y w=(XTX)1XTy,也就是用 ( X T X + T T T ) − 1 (X^{T}X+T^{T}T)^{-1} (XTX+TTT)1代替了 ( X T X ) (X^{T}X) (XTX)
Tikhonov 正则化的本质是通过对非满秩的矩阵 X X X的协方差矩阵 X T X X^{T}X XTX加入吉洪诺夫矩阵的协方差矩阵,使得奇异的协方差矩阵 X T X X^{T}X XTX求逆变为非奇异矩阵 ( X T X + T T T ) − 1 (X^{T}X+T^{T}T)^{-1} (XTX+TTT)1的求逆,从而大大改善求解非满秩矩阵 y = X w y =Xw y=Xw的数值稳定性,增加的项对其施加一个惩罚,其得到的解比仅优化 X T X X^{T}X XTX更切合实际。
如果这个吉洪诺夫矩阵是单位矩阵的倍数,这样说不太恰当,就是等于 λ I \lambda I λI的时候,此时退化为二范数惩罚项。
对于图片中注释的矩阵求导部分,在B站上找到了相关讲解的视频:(在例题中提到)。
矩阵求导

总结

写的有些粗糙,明天再改吧哈哈哈,还有一些明天参考的文章也加上。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/775254.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【数据库了解与学习】

1.下载所需版本安装包 1.1将所需文件压缩包以及安装包放在你选择的任意一盘,新建一个没有文字和空格的文件夹 1.2双击打开安装包,选择Custom自定义模式然后点击右下方的Next 1.4三连点击1,再点击箭头出现3,选中3出现4,…

AJAX-day1:

注:文件布局: 一、AJAX的概念: AJAX是浏览器与服务器进行数据通信的技术 >把数据变活 二、AJAX的使用: 使用axios库,与服务器进行数据通信 基于XMLHttpRequest封装,代码简单 Vue,React项目使用 学习…

day04-matplotlib入门

matplotlib Matplotlib 提供了一个套面向绘图对象编程的 API接口 是一款用于数据可视化的 Python 软件包,支持跨平台运行 它能够根据 NumPyndarray 数组来绘制 2D(3D) 图像,它使用简单、代码清晰易懂,深受广大技术爱好 者喜爱。 实列&…

云计算渲染时代:选择Blender或KeyShot进行高效渲染

在云渲染技术日益成熟的背景下,挑选一款贴合项目需求的3D渲染软件显得尤为关键。当前,Blender与KeyShot作为业界领先的全能渲染解决方案,广受推崇。它们虽皆能创造出令人信服的逼真视觉效果,但在特色功能上各有所长。本篇文章旨在…

加装德国进口高精度主轴 智能手机壳「高质量高效率」钻孔铣槽

在当前高度智能化的社会背景下,智能手机早已成为人们生活、工作的必备品,智能手机壳作市场需求量巨大。智能手机壳的加工过程涉及多个环节,包括钻孔和铣槽等。钻孔要求精度高、孔位准确,而铣槽则需要保证槽位规整、深度适宜。这些…

利用C语言实现三子棋游戏

文章目录 1.游戏界面2.游戏内容2.1 棋盘类型2.2棋盘的初始化2.3 打印棋盘的界面展示 3.游戏操作3.1 玩家操作3.2 电脑操作3.3 胜负判定 4.代码整合 1.游戏界面 无论写任何程序,我们都需要先去了解它的大概框架,这里我们先把它的初始界面写出来。一个游戏…

自动化设备上位机设计 二

目录 一 设计原型 二 后台代码 一 设计原型 二 后台代码 namespace 自动化上位机设计 {public partial class Form1 : Form{public Form1(){InitializeComponent();timer1.Enabled true;timer1.Tick Timer1_Tick;}private void Timer1_Tick(object? sender, EventArgs e)…

「媒体邀约」天津媒体资源?媒体邀约宣传报道

传媒如春雨,润物细无声,大家好,我是51媒体网胡老师。 媒体宣传加速季,100万补贴享不停,一手媒体资源,全国100城线下落地执行。详情请联系胡老师。 天津拥有丰富的媒体资源,利用这些资源进行有效…

数智化配补调:零售品牌增长新引擎

随着科技的不断进步和消费者需求的日益个性化、多元化,传统服装行业正面临着前所未有的挑战与机遇。在这个快速变化的时代,如何精准把握市场脉搏,实现库存的高效管理,成为了服装品牌生存与发展的关键。数智化配补调策略应运而生&a…

Java后端每日面试题(day3)

目录 Spring中Bean的作用域有哪些?Spring中Bean的生命周期Bean 是线程安全的吗?了解Spring Boot中的日志组件吗? Spring中Bean的作用域有哪些? Bean的作用域: singleton:单例,Spring中的bean默…

重载一元运算符

自增运算符 #include<iostream> using namespace std; class CGirl { public:string name;int ranking;CGirl() { name "zhongge"; ranking 5; }void show() const{ cout << "name : "<<name << " , ranking : " <…

卫星轨道平面简单认识

目录 一、轨道平面 1.1 轨道根数 1.2 应用考虑 二、分类 2.1 根据运行高度 2.2 根据运行轨迹偏心率 2.3 根据倾角大小 三、卫星星座中的轨道平面 四、设计轨道平面的考虑因素 一、轨道平面 1.1 轨道根数 轨道平面是定义卫星或其他天体绕行另一天体运动的平面。这个平…

小白 | Linux安装python3

一、更新包列表 首先&#xff0c;确保你的包管理器是最新的&#xff1a; sudo apt update 二、安装 Python 3 安装 Python 3 以及常用的开发工具 sudo apt install python3 python3-pip python3-venv 三、验证安装 python3 --version

如何在 SwiftUI 中熟练使用 sensoryFeedback 修饰符

文章目录 前言背景介绍平台支持仅支持watchOS支持watchOS和iOS 基本用法预定义样式根据触发器值选择样式使用场景当值更改时触发使用条件闭包触发使用反馈闭包触发 可以运行 Demo总结 前言 SwiftUI 引入了新的 sensoryFeedback 视图修饰符&#xff0c;使我们能够在所有 Apple …

【数据结构】(6.2)堆的应用——Top-K问题(C语言)

系列文章目录 文章目录 系列文章目录问题引入一、TopK 问题 是什么&#xff1f;二、TopK 问题解决思路2.1 TopK 思路2.2 随机产生数字2.2 完整代码2.3 验证结果 问题引入 TopK 问题 (在一堆数据里面找到前 K 个最大 / 最小的数)。 一、TopK 问题 是什么&#xff1f; 生活中也…

Linux_fileio学习

参考韦东山老师教程&#xff1a;https://www.bilibili.com/video/BV1kk4y117Tu?p12 目录 1. 文件IO函数分类2. 函数原型2.1 系统调用接口2.2 标准IO接口 3. fileio内部机制3.1 系统调用接口内部流程3.1 dup函数使用3.2 dup2函数使用 4. open file4.1 open实例4.2 open函数分析…

【matlab】智能优化算法——基准测试函数

智能优化算法的基准测试函数是用于评估和优化算法性能的一组标准问题。这些测试函数模拟了真实世界优化问题的不同方面&#xff0c;包括局部最小值、全局最优解、高维度、非线性、不连续等复杂性。以下是对智能优化算法基准测试函数的详细归纳&#xff1a; 测试函数的分类&…

任天堂称未来第一方游戏不会使用生成式AI

虽然EA、育碧、暴雪、Embracer等西方游戏厂商都大力支持生成式AI技术&#xff0c;但日本老牌游戏公司任天堂并不会追随这一步伐。任天堂已经确认该公司未来的第一方游戏不会使用生成式AI技术。 在公司最近的投资人问答会上&#xff0c;任天堂描绘了公司未来游戏愿景。在谈到AI技…

秋招突击——7/5——设计模式知识点补充——适配器模式、代理模式和装饰器模式

文章目录 引言正文适配器模式学习篮球翻译适配器 面试题 代理模式学习面试题 装饰器模式学习装饰模式总结 面试题 总结 引言 为了一雪前耻&#xff0c;之前腾讯面试的极其差&#xff0c;设计模式一点都不会&#xff0c;这里找了一点设计模式的面试题&#xff0c;就针对几个常考…

图书馆数据仓库

目录 1.数据仓库的数据来源为业务数据库&#xff08;mysql&#xff09; 初始化脚本 init_book_result.sql 2.通过sqoop将mysql中的业务数据导入到大数据平台&#xff08;hive&#xff09; 导入mysql数据到hive中 3.通过hive进行数据计算和数据分析 形成数据报表 4.再通过sq…