【机器学习:三、常见的代价函数】

代价函数的选择与任务类型(回归、分类等)以及模型的具体目标密切相关。

回归任务中的代价函数

均方误差(Mean Squared Error, MSE)

  • 公式:
    J ( θ ) = 1 m ∑ i = 1 m ( y i − y ^ i ) 2 J(\theta)=\frac{1}{m}\sum_{i=1}^m(y_i-\hat{y}_i)^2 J(θ)=m1i=1m(yiy^i)2
    其中, y i y_{i} yi是真实值, y ^ i \hat{y}_i y^i是预测值,m是样本数量。
  • 特点:
    • 对误差平方,放大了较大的误差,适用于预测准确度要求高的场景。
    • 对异常值较为敏感。

平均绝对误差(Mean Absolute Error, MAE)

  • 公式:
    J ( θ ) = 1 m ∑ i = 1 m ∣ y i − y ^ i ∣ J(\theta)=\frac{1}{m}\sum_{i=1}^m|y_i-\hat{y}_i| J(θ)=m1i=1myiy^i
  • 特点:
    • 对异常值不敏感。
    • 相比MSE,优化时导数在零点处不连续,可能导致收敛较慢。

Huber损失

  • 公式:
    L ( y , y ^ ) = { 1 2 ( y − y ^ ) 2 , i f ∣ y − y ^ ∣ ≤ δ δ ⋅ ∣ y − y ^ ∣ − δ 2 2 , i f ∣ y − y ^ ∣ > δ L(y,\hat{y})=\begin{cases}\frac{1}{2}(y-\hat{y})^2,&\mathrm{if}|y-\hat{y}|\leq\delta\\\delta\cdot|y-\hat{y}|-\frac{\delta^2}{2},&\mathrm{if}|y-\hat{y}|>\delta&\end{cases} L(y,y^)={21(yy^)2,δyy^2δ2,ifyy^δifyy^>δ
  • 特点:
    • 结合了 MSE 和 MAE 的优点。
    • 对异常值具有一定鲁棒性。

分类任务中的代价函数

对数损失(Log Loss, 或称交叉熵损失)

  • 公式(用于二分类):
    J ( θ ) = − 1 m ∑ i = 1 m [ y i log ⁡ ( y ^ i ) + ( 1 − y i ) log ⁡ ( 1 − y ^ i ) ] J(\theta)=-\frac{1}{m}\sum_{i=1}^m\left[y_i\log(\hat{y}_i)+(1-y_i)\log(1-\hat{y}_i)\right] J(θ)=m1i=1m[yilog(y^i)+(1yi)log(1y^i)]
  • 特点:
    • 用于分类任务中,衡量模型预测的概率与真实类别标签的吻合程度。
    • 对错误分类的惩罚较高。

平方误差损失

  • 尽管平方误差通常用于回归任务,但也可以用于分类问题(主要用于标签数值化的场景)。
  • 缺点:相对于交叉熵损失,对分类问题不敏感,收敛速度较慢。

Hinge 损失(用于支持向量机, SVM)

  • 公式
    J ( θ ) = 1 m ∑ i = 1 m max ⁡ ( 0 , 1 − y i y ^ i ) J(\theta)=\frac{1}{m}\sum_{i=1}^m\max(0,1-y_i\hat{y}_i) J(θ)=m1i=1mmax(0,1yiy^i)
    其中, y i ∈ { − 1 , 1 } y_i\in\{-1,1\} yi{1,1} 是真实标签, y ^ i \hat{y}_i y^i 是预测值。
  • 特点:
    • 用于支持向量机分类。
    • 通过最大化分类边界间隔,提高分类的鲁棒性。

非监督学习中的代价函数

K-Means 损失函数

  • 公式
    J = ∑ i = 1 k ∑ x ∈ C i ∥ x − μ i ∥ 2 J=\sum_{i=1}^k\sum_{x\in C_i}\|x-\mu_i\|^2 J=i=1kxCixμi2
    其中, C i C_{i} Ci是第i个聚类簇, μ i \mu_{i} μi是该簇的中心。
  • 特点:
    • 用于聚类任务,目标是最小化样本到其所属簇中心的平方距离。

自编码器的重建误差

  • 公式:
    J ( θ ) = 1 n ∑ i = 1 n ∥ x i − x ^ i ∥ 2 J(\theta)=\frac{1}{n}\sum_{i=1}^n\left\|x_i-\hat{x}_i\right\|^2 J(θ)=n1i=1nxix^i2
    其中, x i x_{i} xi是原始输入, x ^ i \hat{x}_i x^i是重建输出。
  • 特点:
    • 用于衡量模型重建输入数据的能力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/948405.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

PHP如何删除数组中的特定值?

php 中删除数组特定值的方法有三种:unset():直接删除指定索引的值,但会保留数组索引结构和未删除元素,适合小数组。array_filter():根据自定义回调函数筛选数组元素,返回一个新数组,原数组不变&…

(九千七-星河襟)椭圆曲线加密(ECC, Elliptic Curve Cryptography)及其例题

椭圆曲线加密(ECC)是一种基于椭圆曲线数学的公钥加密技术。它提供了一种高效的加密方法,能够在较小的密钥长度下实现与传统加密算法(如RSA)相同的安全级别。以下是ECC的主要特点和工作原理的总结: 1. 基本…

大模型系列17-RAGFlow搭建本地知识库

大模型系列17-RAGFlow搭建本地知识库 安装ollama安装open-wehui安装并运行ragflowRAG(检索、增强、生成)RAG是什么RAG三过程RAG问答系统构建步骤向量库构建检索模块生成模块 RAG解决LLM的痛点 使用ragflow访问ragflow配置ollama模型添加Embedding模型添加…

5大常见高并发限流算法选型浅析

高并发场景下,如何确保系统稳定运行,成为了每一个开发工程师必须面对的挑战。**你是否曾因系统崩溃、请求超时或资源耗尽而头疼不已?**高并发限流算法或许能帮你解决这些难题。 在处理高并发请求时,应该如何选择合适的限流算法呢…

高等数学学习笔记 ☞ 无穷小比较与等价无穷小替换

1. 无穷小比较 1. 本质:就是函数的极限趋于0时的速度,谁快谁慢的问题。 2. 定义:若是在同一自变量的变化过程中的无穷小,且,则: ①:若,则称是比的高阶无穷小,记作&…

配置嵌入式服务器

一、如何定制和修改Servlet容器的相关配置 修改和server有关的配置(ServerProperties) server.port8081 server.context‐path/tx server.tomcat.uri-encodingUTF-8二、注册servlet三个组件【Servlet、Filter、Listener】 由于SpringBoot默认是以jar包…

大模型系列18-AI Agents

什么是AI Agents Al Agent智能体,是指一种能够模拟人类思考和行为来自动执行任务,以解决复杂问题的程序或系统 架构图 思考->行动->观测 思考依赖记忆以及规划决策,行动依赖工具,观测依赖感知 举例 长沙今天白天和晚上的…

springCloud 脚手架项目功能模块:Java分布式锁

文章目录 引言分布式锁产生的原因:集群常用的分布式锁分布式锁的三种实现方式I ZooKeeper 简介zookeeper本质上是一个分布式的小文件存储系zookeeper特性:全局数据一致性ZooKeeper的应用场景分布式锁(临时节点)II 基于ZooKeeper 实现一个排他锁创建锁获取锁释放锁Apache Zo…

Appium(二)--- ADB命令操作

一、ADB概述 什么是ADB?ADB全称Android Debug Bridge,起到调试桥的作用,是一个客户端-服务器端程序。其中客户端是用来操作的操作,服务端是Android设备。ADB也是Android SDK的一个工具,可以直接操作管理Android模拟器或者真实的…

基于SpringBoot在线竞拍平台系统功能实现十五

一、前言介绍: 1.1 项目摘要 随着网络技术的飞速发展和电子商务的普及,竞拍系统作为一种新型的在线交易方式,已经逐渐深入到人们的日常生活中。传统的拍卖活动需要耗费大量的人力、物力和时间,从组织拍卖、宣传、报名、竞拍到成…

Android GameActivity(NativeActivity)读写文件

最近研究native android相关内容,其中最棘手的就是文件读写问题,最主要的是相关的文档很少。这里写下我所知道的方法。 由于本人使用的是Android14[arm64-v8a]版本的设备,能访问的路径相当有限,如果想要访问更多的路径,就不得不申…

conda指定路径安装虚拟python环境

DataBall 助力快速掌握数据集的信息和使用方式,会员享有 百种数据集,持续增加中。 需要更多数据资源和技术解决方案,知识星球: “DataBall - X 数据球(free)” -------------------------------------------------------------…

计算机网络练习题

学习这么多啦,那就简单写几个选择题巩固一下吧! 1. 在IPv4分组各字段中,以下最适合携带隐藏信息的是(D) A、源IP地址 B、版本 C、TTL D、标识 2. OSI 参考模型中,数据链路层的主要功能是(…

【算法不挂科】算法期末考试【选择题专项练习】<多单元汇总>

前言 大家好吖,欢迎来到 YY 滴算法不挂科系列 ,热烈欢迎! 本章主要内容面向接触过C的老铁 主要内容含: 一.选择题 【1】算法绪论 1.算法与程序的区别是( ) A.输出 B.输入 C.确定性 D.有穷性 D 2.算法复杂度分析的两种基本方法…

MIPI_DPU 综合(DPU+MIPI+Demosaic+VDMA 通路)

目录 1. 简介 2. 创建 Platform 2.1 Block Design 2.1.1 DPU PFM Lite 2.1.2 DPU prj 2.1.3 DPU MIPI Platform 2.2 pin 约束 2.2.1 GPIO 约束 2.2.2 IIC 约束 2.1.3 DPHY 约束 3. 报错总结 3.1 AXI_M 必须顺序引用 3.2 DPU 地址分配错误 4. Design Example 4.…

李宏毅机器学习课程笔记01 | 1.Introduction of Machine/Deep Learning

笔记是在语雀上面做的,粘贴在CSND上可能存在格式错误 机器学习的本质就是借助机器寻找一个转换函数 根据函数的输出类型,可以将机器学习进行分类 regression 回归任务:函数输出时一个数值classification 分类任务:人类设定好选项…

《Rust权威指南》学习笔记(五)

高级特性 1.在Rust中,unsafe是一种允许绕过Rust的安全性保证的机制,用于执行一些Rust默认情况下不允许的操作。unsafe存在的原因是:unsafe 允许执行某些可能被 Rust 的安全性检查阻止的操作,从而可以进行性能优化,如手…

云备份项目--客户端编写

文章目录 10. 客户端工具类10.1 整体的类10.2 测试 11 客户端数据管理类11.1 整体的类11.2 测试 12. 客户端业务处理12.1 整体的类 完整的代码–gitee链接 10. 客户端工具类 10.1 整体的类 在windows平台下进行开发,Util.hpp实际上是客户端FileUtil.hpp和JsonUtil…

开发培训-慧集通(iPaaS)集成平台脚本开发Groovy基础培训视频

‌Groovy‌是一种基于Java虚拟机(JVM)的敏捷开发语言,结合了Python、Ruby和Smalltalk的许多强大特性。它旨在提高开发者的生产力,通过简洁、熟悉且易于学习的语法,Groovy能够与Java代码无缝集成,并提供强大…

蓝桥杯(Java)(ing)

Java前置知识 输入流: (在Java面向对象编程-CSDN博客里面有提过相关知识------IO流) // 快读快写 static BufferedReader in new BufferedReader(new InputStreamReader(System.in)); static BufferedWriter out new BufferedWriter(new…