logistic回归 目的、方程、损失函数

logistic回归多用于二分类问题。

目的:给出x,当x满足条件时,y=1的概率是多少。


y ^ = P ( y = 1 ∣ x ) , x ∈ R n x y ^ ∈ [ 0 , 1 ] \hat y=P(y=1|x),x \in R^{nx}\\ \hat y \in[0,1] y^=P(y=1∣x)xRnxy^[0,1]

方程: y ^ = σ ( ω T x + b ) \hat y =\sigma(\omega^Tx+b) y^=σ(ωTx+b)

参数: ω ∈ R n x 、 b ∈ R \omega\in R^{nx}、b\in R ωRnxbR

  1. 线性规划中输出为
    y ^ = ω T x + b \hat y =\omega^Tx+b y^=ωTx+b
    但是 y ^ \hat y y^可能为大于1的数或负数,这样的概率无意义。

  2. 因此在logistic回归中,输出变为
    y ^ = σ ( ω T x + b ) = σ ( z ) ω T x + b = z \hat y =\sigma(\omega^Tx+b)\\=\sigma(z)\\\omega^Tx+b=z y^=σ(ωTx+b)=σ(z)ωTx+b=z
    其中 σ ( ) \sigma() σ()即为sigmoid函数,如下所示。
    在这里插入图片描述

损失函数: J ( ω , b ) = 1 m ∑ i = 1 m L ( y ^ ( i ) , y ( i ) ) J(\omega,b)={1\over m}\sum_{i=1}^m L(\hat y^{(i)},y^{(i)}) J(ω,b)=m1i=1mL(y^(i),y(i))

L ( y ^ , y ) L(\hat y,y) L(y^,y)为单个样本的误差函数,越小越好。


我们常见的衡量误差的函数一般是误差平方,即
L ( y ^ , y ) = 1 2 ( y ^ − y ) 2 L(\hat y,y)={1\over 2}(\hat y-y)^2 L(y^,y)=21(y^y)2
但将其作为损失函数不便于用梯度下降法求最优解,因为为非凸函数。


因此,在logistic回归中,我们定义损失函数如下,起着与误差平方相似的作用
L ( y ^ , y ) = − ( y l o g y ^ + ( 1 − y ) l o g ( 1 − y ^ ) L(\hat y,y)=-(ylog\hat y+(1-y)log(1-\hat y) L(y^,y)=(ylogy^+1ylog(1y^)
当y=1时, L ( y ^ , y ) = − l o g y ^ L(\hat y,y)=-log\hat y L(y^,y)=logy^,想要让损失函数尽可能小,则需使 y ^ \hat y y^尽可能大,接近1

当y=0时, L ( y ^ , y ) = − l o g ( 1 − y ^ ) L(\hat y,y)=-log(1-\hat y) L(y^,y)=log(1y^),想要让损失函数尽可能小,则需使 y ^ \hat y y^尽可能小,接近0

总体的损失函数即为
J ( ω , b ) = 1 m ∑ i = 1 m L ( y ^ ( i ) , y ( i ) ) J(\omega,b)={1\over m}\sum_{i=1}^m L(\hat y^{(i)},y^{(i)}) J(ω,b)=m1i=1mL(y^(i),y(i))

logistic的训练过程,即通过不断的训练找到参数 ω 、 b \omega、b ωb,使得损失函数最小

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/132997.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

本地编译安装 Minkowski Engine 报错 Cuda 版本 与 Pytorch 版本不匹配

编译 Cuda 版本 C 插件 Cuda 版本 与 Pytorch 版本不匹配解决方案 报错详情环境报错分析 报错详情 RuntimeError: The detected CUDA version (12.2) mismatches the version that was used to compile PyTorch (11.8). Please make sure to use the same CUDA versions.环境 …

环境变量小节

这是写的第二篇环境变量博客,写了一年多了,第一次出现把自己博客删了的情况,不知道为什么明明发表了,然后就把草稿箱和回收站的删了,结果晚上发现没发表,回收站删除是无法找回的,以后还是要慎重…

git基础知识

1.git的必要配置 所有的配置文件,其实都保存在本地! 查看所有配置 git config -l 即把 系统配置(system)和当前用户(global)配置都 列出来 以直接编辑配置文件,通过命令设置后会响应到这里。 注意: 如果…

传统测试将被取代?AI测试现状及发展之思

近年来,我一直关注AI相关的测试,并积极参与多个全国性测试社区和社群。在这些社区中,我与不同公司和领域的测试专家交流探讨AI测试相关话题,包括业界顶尖公司的专家和国内知名测试学者。我也参加了多个大会,聆听了许多…

B087-人力资源项目-文件上传课程分类

目录 背景控制台操作开通OSS服务创建存储空间 项目工程准备概述新建文件管理模块把文件上传到OSS的三种方案 通过官方文档完成demo上传官方文档找JavaSDK文件上传思路代码 背景 为什么要交给第三方文件管理服务管理? 最传统的的文件管理方案是把文件存储到项目中本…

半小时拥有自己的ChatGPT4,高效低成本,无脑跟即可

文章目录 一、获取Key二、获取服务器三、设置端口三、安装Docker环境 一、获取Key 最简单的获取方法,去某宝搜 “open账号ai” 购入一个key,几块钱,有3.5、4.0,买3.5就行了,4.0太贵了。注意是购入key,不是…

Elasticsearch 和 Go 中使用向量搜索寻找地鼠

作者:CARLY RICHMOND,LAURENT SAINT-FLIX 就像动物和编程语言一样,搜索也经历了不同实践的演变,很难在其中做出选择。 加入我们的第二部分,通过 Elasticsearch 中的矢量搜索在 Go 中狩猎地鼠(gophers&…

Install Docker in Linux

Docker官网链接: https://docs.docker.com/ 1.确定Linux版本 新版本的Docker对Linux系统版本有一定的要求。如果Linux的发行版系统是centOS,安装最新版的docker需要centOS 7以上的系统。 在Docker安装帮助页面查看支持的系统版本。 Docker帮助页面:https://docs…

13 套接字Socket

1、Socket 编程 socket编程基于 TCP 和 UDP 协议的tcp和udp是区分客户端和服务端的,所以我们的socket编程也是区分的。 2、socket是端到端的通信 1.Socket 这个名字很有意思,可以作插口或者插槽讲 2.一头插在客户端,一头插在服务端&#x…

拉晶工艺设备——切片机

单晶炉拉出硅棒后,经硅棒切断、外园整形,便用切片机切成薄片,供后续工艺使用。切片机也用于玻璃、陶瓷、 大理石、花岗岩等硬脆材料的切割。 半导体行业使用的切片机按结构形式可分为立式切片机、卧式切片机,按刀片形式可分内圆切…

魔众文库系统 v5.5.0 批量快捷上传,文档图标优化,档转换逻辑优化

魔众文库系统基于文档系统知识,建立平台与领域,打造流量、用户、付费和变现的闭环,帮助您更好的搭建文库系统。 魔众文库系统发布v5.5.0版本,新功能和Bug修复累计14项,批量快捷上传,文档图标优化&#xff…

酷柚易汛ERP - 套餐管理操作指南

1、应用场景 套餐管理应用于商品打包销售,如临期食品,促销商品等 2、主要操作 2.1 新增套餐 打开【资料】-【套餐管理】点击新增 套餐是一个组合新商品出现,价格需要重新设定,也可以设定不同等级客户对应价格

SAP ABAP基础语法-Excel上传(十)

EXCEL BDS模板上传及赋值 上传模板事务代码:OAER l 功能代码:向EXCEL模板中写入数据示例代码如下 REPORT ZEXCEL_DOI. “doi type pools TYPE-POOLS: soi. *SAP Desktop Office Integration Interfaces DATA: container TYPE REF TO cl_gui_custom_c…

arduino 简易智能花盆

编辑器:arduino IDE 主板:arduino uno 传感器: 0.96寸的OLED屏(四脚) 声音模块 土壤温湿度模块 DS18B20温度模块(这里用到防水的) 光敏电阻模块(买成三脚的了只能显示高低&#x…

软件测试的终点是“测试开发”吗?

前言 在一线大厂,没有测试这个岗位,只有测开这个岗位,即使是做业务测试,那么你的title也是测开。 所以想聊一聊测开的看法,但不代表这是正确的看法,仅供参考。 没来阿里之前我对测开的看法 一直以为专职做自…

软件测试金融项目,在测试的时候一定要避开的一些雷区

软件测试金融项目需要格外谨慎和专注,因为这些项目通常涉及大量的交易、用户隐私和其他敏感信息。以下是一些软件测试金融项目时需要关注的方面: 1. 数据保护 在测试金融项目时,必须确保用户数据和投资信息得到保护。测试人员必须确保测试环…

我干了8年测试,告诉你现在软件测试还能不能找到工作!

观点:如果你还是以前的思维来学习测试,那你肯定是找不到工作! 我做测试工作有将近8年的时间,蚂蚁金服做过2年,因为加班太多离职了。目前在一家国企上市公司,一年能拿三四十个左右,对比头部互联…

信息系统“好用”的标准探讨

数字化转型建设的关键不在建设信息系统。这是为了避免走信息化建设的老路——业务和信息化两张皮,寄希望信息系统解决业务问题。在数字化转型建设中,信息系统仍然是重要抓手和显性成果,是企业业务和数据的承载平台,也是IT厂商向客…

李峋同款的C语言动态爱心代码来了,彩色闪动,附源码

1.前言 最近一部电视剧《点燃我,温暖你》可火啦,大家纷纷在搞男主阿瑟的同款爱心代码,但是虽然网上有它的源码,但都不是 C 语言的,看不懂。我看了一下这个视频,大致分析了一下它的运行过程。用语言描述一下…

【C++】C++11常用特性梳理

C11特性梳理 1. 列表初始化2. auto & decltype3. 右值引用3.1. 左右值引用比较3.2. 右值引用的意义3.3. 万能引用与完美转发3.4. 移动构造与移动赋值 4. default & delete5. 可变参数模板6. push_back 与 emplace_back7. lambda表达式7.1. 捕捉列表 8. function包装器8…