机器学习6:逻辑回归

 

 

假设我们有一个二元分类问题,有两个特征(x1, x2)和对应的类别标签(y)。给定

以下训练数据集:

我们定义逻辑回归模型的假设函数和损失函数。假设函数使用 sigmoid 函

数来将线性函数的输出转换为概率值,使用对数损失函数(log loss)来衡量模

型的预测结果与实际类别标签之间的差异,请使用逻辑回归模型对新的测试样本

(2.2, 2.3) 进行分类预测。

import numpy as np

# 定义sigmoid函数
def sigmoid(z):
    return 1 / (1 + np.exp(-z))

# 训练数据集
X_train = np.array([[1.0, 2.0],
                    [1.5, 1.8],
                    [2.0, 2.5],
                    [3.0, 3.2]])

y_train = np.array([0, 0, 1, 1])

# 添加偏置项,将特征向量X_train扩展为(X0=1, X1, X2)
X_train = np.column_stack((np.ones(X_train.shape[0]), X_train))
print("添加偏置项后的训练数据集:")
print(X_train)

# 初始化模型参数
w = np.zeros(X_train.shape[1])
print("初始化模型参数 w:")
print(w)

# 定义损失函数(对数损失函数)
def loss_function(X, y, w):
    z = np.dot(X, w)
    h = sigmoid(z)
    loss = -y * np.log(h) - (1 - y) * np.log(1 - h)
    return np.mean(loss)

# 定义梯度下降函数
def gradient_descent(X, y, w, learning_rate, num_iter):
    m = X.shape[0]
    for i in range(num_iter):
        z = np.dot(X, w)
        h = sigmoid(z)
        gradient = np.dot(X.T, (h - y)) / m
        w -= learning_rate * gradient
        loss = loss_function(X, y, w)
        print("迭代次数:{},模型参数 w:{},损失函数值:{}".format(i+1, w, loss))
    return w

# 训练模型
learning_rate = 0.1
num_iter = 1000
w = gradient_descent(X_train, y_train, w, learning_rate, num_iter)
print("经过梯度下降算法训练后的模型参数 w:")
print(w)

# 测试样本
X_test = np.array([[1, 2.2], [2.2, 2.3]])

# 添加偏置项,将测试样本扩展为(X0=1, X1, X2)
X_test = np.column_stack((np.ones(X_test.shape[0]), X_test))
print("添加偏置项后的测试样本:")
print(X_test)

# 使用训练好的模型进行分类预测
z_test = np.dot(X_test, w)
h_test = sigmoid(z_test)

# 判断类别标签
predictions = np.round(h_test).astype(int)

# 打印预测结果
# 打印预测结果和属于正类的概率值
for i in range(X_test.shape[0]):
    print("预测样本{}属于{},属于正类的概率值为{}".format(i+1, "正类" if predictions[i]==1 else "负类", h_test[i]))
    print("预测样本{}的类别标签:{}".format(i + 1, predictions[i]))

# for i in range(X_test.shape[0]):
#     if predictions[i] == 1:
#         print("预测样本{}属于正类".format(i + 1))
#     else:
#         print("预测样本{}属于负类".format(i + 1))


# for i in range(X_test.shape[0]):
#     print("预测样本{}的类别标签:{}".format(i + 1, predictions[i]))

 

对于测试样本 (1,2.2), (2.2, 2.3),我们可以使用经过训练得到的 logistic 回归模型对其进行分类预测,并计算其属于正类的概率值。

具体地,我们可以先将测试样本添加偏置项,然后将该样本的特征向量带入经过训练得到的模型参数 w 中,计算出 sigmoid 函数的输出值(即该样本属于正类的概率值),最后根据概率值来判断该样本属于哪个类别。

 

 sigmoid 函数的计算 1/(1+exp(−z))

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/144910.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Java之SpringCloud Alibaba【九】【Spring Cloud微服务Skywalking】

Java之SpringCloud Alibaba【一】【Nacos一篇文章精通系列】跳转Java之SpringCloud Alibaba【二】【微服务调用组件Feign】跳转Java之SpringCloud Alibaba【三】【微服务Nacos-config配置中心】跳转Java之SpringCloud Alibaba【四】【微服务 Sentinel服务熔断】跳转Java之Sprin…

【2014年数据结构真题】

41. (13分)二叉树的带权路径长度(WPL)是二叉树中所有叶结点的带权路径长度之和。 给定一棵二叉树T,采用二叉链表存储,结点结构如下: 其中叶结点的weight域保存该结点的非负权值。 设root为指向T的根结点的指针, 请设计求T 的WPL…

抖音电商的野心,中小商家的风口

文丨新熔财经 作者丨寒蝉鸣 反向消费的大浪潮,不会辜负任何一个抓住风口的平台。过去是拼多多,如今是唯品会。 靠着响应新时代消费者对“质价比”的需求,消失在大众视线许久的唯品会,不仅守住了电商老前辈的行业地位&#xff0…

Express基本接口开发-入门学习

前提推荐 任何一个新的知识都是从文档看起,因此express官方文档示例有必要去学习一遍。 推荐看: 推荐入门指南-路由指南-中间件 看完这几个内容之后心里大概知道express有些什么东西了,然后现在就可以去练习了 注意:更多示例-代…

Quarkus 替代 SpringBoot

1 概述2 SpringBoot3 Quarkus4 比较5 调查结果6 从 Spring 转换到 Quarkus7 我是 Spring 开发者,为什么要选Quarkus?8 Spring 开发者可以活用哪些现有知识?9 对Spring开发者有额外的好处吗?10 Spring开发者如何开始学习Quarkus&am…

libgdx实现雪花、下雪效果(二十三)

libgdx实现雪花、下雪效果(二十三) 转自:https://lingkang.top/archives/libgdx-shi-xian-xue-hua package effect;import com.badlogic.gdx.ApplicationAdapter; import com.badlogic.gdx.Gdx; import com.badlogic.gdx.backends.lwjgl3.…

使用CXF调用WSDL(二)

简介 本篇文章主要解决了上篇文章中遗留的对象嵌套问题,要想全面解析无限极的对象嵌套需要使用递归去解决 上文链接: 使用CXF调用WSDL(一) 上文回顾 上文使用了单方法“ call() ”解决了List和基本类型(含String&…

基于逐次变分模态分解(SVMD)联合小波阈值去噪

代码原理 逐次变分模态分解 (Iterative Variational Mode Decomposition, IVMD) 是一种信号分解方法,它可以将一个时域信号分解为若干个本征模态函数(Intrinsic Mode Functions, IMF)。它通过迭代寻找信号的本征模态函数和残差部分&#xff…

Kalman滤波

文章目录 一、公式推导二、扩展卡尔曼滤波 卡尔曼滤波是一种最优化递归数据处理算法。(Optimal Recursive Data Processing Algorithm) Kalman滤波是时域滤波,采用状态空间描述系统,运用递推形式是计算简单,数据存储量…

TSINGSEE视频汇聚管理与AI算法视频质量检测方案

一、建设背景 随着互联网视频技术的发展,视频监管在辅助安全生产、管理等方面发挥了不可替代的作用。但是,在监管场景中,仍然存在视频掉线、视频人为遮挡、视频录像存储时长不足等问题,对企业的日常管理和运转存在较大的安全隐患…

A. Weird Sum

题目链接 : Problem - 1648A - Codeforces 题面 : 题意 : 输入 n m (1≤n*m≤1e5) 和 n 行 m 列的矩阵 a,元素范围 [1,1e5]。 对于矩阵中的所有相同元素对,即满足 a[x1][y1] a[x2][y2] 的元素对 (a[x1][y1], a[x2][y2]),把 abs(x1-x2)…

P3371 【模板】单源最短路径(弱化版)

【模板】单源最短路径(弱化版) 题目背景 本题测试数据为随机数据,在考试中可能会出现构造数据让SPFA不通过,如有需要请移步 P4779。 题目描述 如题,给出一个有向图,请输出从某一点出发到所有点的最短路…

代码随想录Day45 动态规划13 LeetCode T1143最长公共子序列 T1135 不相交的线 T53最大子数组和

LeetCode T1143 最长公共子序列 题目链接:1143. 最长公共子序列 - 力扣(LeetCode) 题目思路: 动规五部曲分析 1.确定dp数组的含义 这里dp数组的含义是结尾分别为i-1,j-1的text1和text2的最长公共子序列长度 至于为什么是i-1,j-1我之前已经说过了,这里再…

ABZ正交编码 - 异步电机常用的位置信息确定方式

什么是正交编码? ab正交编码器(又名双通道增量式编码器),用于将线性移位转换为脉冲信号。通过监控脉冲的数目和两个信号的相对相位,用户可以跟踪旋转位置、旋转方向和速度。另外,第三个通道称为索引信号&am…

μC/OS-II---计时器管理2(os_tmr.c)

目录 获取计时器的名字获取计时器到期前剩余的时间查看计时器的状态 计时器是倒计时器,当计数器达到零时执行某个动作。用户通过回调函数提供这个动作。回调函数是用户声明的函数,在计时器到期时被调用。在回调函数中绝对不能进行阻塞调用(例…

软件测试基础1:认识软件及测试

功能测试能力:具备对所有软件的功能进行质量验证。 1什么是软件 分类 应用软件系统软件 软件:控制计算机硬件工作的工具。 2软件基本组成 3软件产生过程 4什么是软件测试 软件测试:使用技术手段验证软件是否满足使用需求。 5软件测试目的 减少软件…

使用matlab制作声音采样率转换、播放以及显示的界面

利用matlab做一个声音采样率转换、播放以及显示的界面 大抵流程: 图形界面创建:使用figure函数创建名为“声音采样率转换”的图形界面,并设置了其位置和大小。 按钮和文本框:使用uicontrol函数创建了选择音频文件的按钮、显示当前…

工业数据的“最后一公里”怎么走?

随着工业互联网的迅猛发展,工业数据已经成为推动制造业转型升级的重要动力。然而,面对海量的工业数据,如何高效、准确地走过数据的“最后一公里”,成为制约企业发展的关键问题。本文将探讨工业数据“最后一公里”所面临的挑战&…

魔兽服务器学习-笔记(服务器部署、地图管理、DB、日志模块、任务模块、战斗模块)

文章目录 一、环境准备1)依赖安装2)源码下载和编译 二、生成数据信息1)地图数据信息(客户端信息)2)数据库信息 三、启动服务器四、日志模块五、数据库模块六、场景模块1)地图管理2)A…

如何在微信内置浏览器内抓包

文章目录 使用环境&工具使用步骤1、手机USB连接上电脑,打开USB调试2、解压adb工具的压缩包,使用该工具连接上手机3、开启微信抓包4、电脑上打开chrome内核的浏览器或edge浏览器 使用环境&工具 windows电脑 安卓手机 adb工具 USB数据线 使用步骤…