深度学习J3周:RNN-心脏病预测

  • 🍨 本文为🔗365天深度学习训练营中的学习记录博客
  • 🍖 原作者:K同学啊

要求

1.本地读取并加载数据

2.了解循环神经网络(RNN)的构建过程

3.测试集accuracy到达87%

拔高:

测试机accuracy到达89%

一、基础知识

RNN(Recurrent Neural Network)

用于处理序列数据。

传统神经网络的结果简单:输入层--隐藏层--输出层

RNN与传统神经网络的最大区别:每次都会将前一次的输出结果,带到下一次隐藏层中,一起训练。

代码流程图:

二、代码复现

1.前期准备

1.1 设置GPU

import numpy as np
import pandas as pd
import torch
from torch import nn
import torch.nn.functional as F
import seaborn as sns

#设置GPU训练,也可使用cpu
device=torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(device)

输出结果:

1.2导入数据

df = pd.read_csv("heart.csv")
print(df)

输出结果:

数据介绍:

1.age:年龄

2.sex:性别

3.cp:胸痛类型(4 values)

4.trestbps:静息血压

5.chol:血清胆甾醇(mg/dl)

6.fbs:空腹血糖>120mg/dl

7.restecg:静息心电图结果(值0,1,2)

8.thalach:达到的最大心率

9.exang:运动诱发的心绞痛

10.oldpeak:相对于静止状态,运动引起的ST段压低

11.slope:运动峰值ST段的斜率

12.ca:荧光透视着色的主要血管数量(0-3)

13.thal:0=正常;1=固定缺陷;2=可逆转的缺陷

14.target:0=心脏病发作的几率较小;1=心脏病发作的几率更大

2.构建数据集

2.1标准化

from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split

x = df.iloc[:,:-1]
y = df.iloc[:,:-1]

#将每一列特征标准化为标准正太分布,注意:标准化是针对每一列而言
sc = StandardScaler()
x = sc.fit_transform(x)

2.2划分数据集

x = torch.tensor(np.array(x), dtype=torch.float32)
y = torch.tensor(np.array(y), dtype=torch.int64)
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.1,random_state=1)

print(x_train.shape,y_train.shape)

输出结果:

2.3构建数据加载器

from torch.utils.data import TensorDataset, DataLoader

train_dl = DataLoader(TensorDataset(x_train,y_train),
                      batch_size=64,
                      shuffle=False)
test_dl = DataLoader(TensorDataset(x_test,y_test),
                      batch_size=64,
                      shuffle=False)

测试集与验证集的关系:

1.验证集没有参与训练过程的梯度下降过程,狭义上讲是没有参与模型的参数训练更新

2.广义上,验证集存在意义--参与了一个“人工调参”的过程,根据每一个epoch训练后模型在验证集上的表现决定是否需要训练进行提前结束,或者根据这个过程的模型性能来调整模型的超参数,如学习率。

3.验证集也参与了训练,但没有使模型去overfit验证集。

3.模型训练

3.1构建模型

class model_rnn(nn.Module):
    def __init__(self):
        super(model_rnn, self).__init__()
        self.rnn0 = nn.RNN(input_size=13, hidden_size=200,
                           num_layers=1, batch_first=True)

        self.fc0 = nn.Linear(200,50)
        self.fc1 = nn.Linear(50, 2)

    def forward(self, x):

        out, hidden1 = self.rnn0(x)
        out = self.fc0(out)
        out = self.fc1(out)
        return out

model = model_rnn().to(device)
print(model)

输出结果:

看一下模型的输出数据集格式是什么

#模型的输出数据集格式是什么
print(model(torch.rand(30,13).to(device)).shape)

输出结果:

 

3.2定义训练函数

# 训练循环
def train(dataloader, model, loss_fn, optimizer):
    size = len(dataloader.dataset)  # 训练集的大小
    num_batches = len(dataloader)  # 批次数目, (size/batch_size,向上取整)

    train_loss, train_acc = 0, 0  # 初始化训练损失和正确率

    for x, y in dataloader:  # 获取图片及其标签
        x, y =x.to(device), y.to(device)

        # 计算预测误差
        pred = model(x)  # 网络输出
        loss = loss_fn(pred, y)  # 计算网络输出和真实值之间的差距,targets为真实值,计算二者差值即为损失

        # 反向传播
        optimizer.zero_grad()  # grad属性归零
        loss.backward()  # 反向传播
        optimizer.step()  # 每一步自动更新

        # 记录acc与loss
        train_acc += (pred.argmax(1) == y).type(torch.float).sum().item()
        train_loss += loss.item()

    train_acc /= size
    train_loss /= num_batches

    return train_acc, train_loss

3.3定义测试函数

def test(dataloader, model, loss_fn):
    size = len(dataloader.dataset)  # 测试集的大小
    num_batches = len(dataloader)  # 批次数目
    test_loss, test_acc = 0, 0

    # 当不进行训练时,停止梯度更新,节省计算内存消耗
    with torch.no_grad():
        for imgs, target in dataloader:
            imgs, target = imgs.to(device), target.to(device)

            # 计算loss
            target_pred = model(imgs)
            loss = loss_fn(target_pred, target)

            test_loss += loss.item()
            test_acc += (target_pred.argmax(1) == target).type(torch.float).sum().item()

    test_acc /= size
    test_loss /= num_batches

    return test_acc, test_loss

 3.4正式训练模型

loss_fn = nn.CrossEntropyLoss()  # 创建损失函数
learn_rate = 1e-4
opt = torch.optim.Adam(model.parameters(), lr=learn_rate)
epochs = 50

train_loss = []
train_acc = []
test_loss = []
test_acc = []

for epoch in range(epochs):
    model.train()
    epoch_train_acc, epoch_train_loss = train(train_dl, model, loss_fn, opt)

    model.eval()
    epoch_test_acc, epoch_test_loss = test(test_dl, model, loss_fn)

    train_acc.append(epoch_train_acc)
    train_loss.append(epoch_train_loss)
    test_acc.append(epoch_test_acc)
    test_loss.append(epoch_test_loss)

    # 获取当前的学习率
    lr = opt.state_dict()['param_groups'][0]['lr']

    template = ('Epoch:{:2d}, Train_acc:{:.1f}%, Train_loss:{:.3f}, Test_acc:{:.1f}%, Test_loss:{:.3f}, Lr:{:.2E}')
    print(template.format(epoch + 1, epoch_train_acc * 100, epoch_train_loss,
                          epoch_test_acc * 100, epoch_test_loss, lr))

print("="*20, 'Done', "="*20)

4.模型评估

4.1Loss与Accuracy图

import matplotlib.pyplot as plt
from datetime import datetime
# 隐藏警告
import warnings
warnings.filterwarnings("ignore")  # 忽略警告信息
current_time = datatime.now()#获取当前时间

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号
plt.rcParams['figure.dpi'] = 200  # 分辨率

epochs_range = range(epochs)

plt.figure(figsize=(12, 3))
plt.subplot(1, 2, 1)

plt.plot(epochs_range, train_acc, label='Training Accuracy')
plt.plot(epochs_range, test_acc, label='Test Accuracy')
plt.legend(loc='lower right')
plt.title('Training and Validation Accuracy')
plt.xlabel(current_time)

plt.subplot(1, 2, 2)
plt.plot(epochs_range, train_loss, label='Training Loss')
plt.plot(epochs_range, test_loss, label='Test Loss')
plt.legend(loc='upper right')
plt.title('Training and Validation Loss')
plt.show()

三、总结

1.遇到的问题一:

解决方法:没有安装seaborn库-----pip install seaborn
2.遇到问题二:

解决方法:pip install scikit-learn

3.遇到问题三:

解决方法:

模型没有实例化,model = model_rnn().to(device)写成了model = model_rnn.to(device)

4.遇到问题四:

解决方法:

 在使用pytorch的empty函数时传递的参数有误。

输入代码时细节敲错

5.遇到问题五:

还没有解决,

个人总结:RNN的重要特点---每一步的参数共享。但代码能力还是太弱,代码对了好几遍,都没有问题,但还是无法运行。关于pytorch的讲解不多,遇到的问题会多一些。能大概找到问题可能出在“正式训练模型”,但改了好多遍都没有改对。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/957070.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux C\C++方式下的文件I/O编程

【图书推荐】《Linux C与C一线开发实践(第2版)》_linux c与c一线开发实践pdf-CSDN博客 《Linux C与C一线开发实践(第2版)(Linux技术丛书)》(朱文伟,李建英)【摘要 书评 试读】- 京东图书 Lin…

FPGA:Quartus软件与操作系统版本对照表

文章目录 1.软件概述2.软件版本3.设计流程4.支持的设备5.新特性6.版本对照 1.软件概述 Quartus软件是由英特尔(Intel)公司开发的一款功能强大的FPGA(现场可编程逻辑门阵列)设计工具,广泛应用于数字电路设计、仿真、综…

ui设计公司分享:浅色 UI 设计

在数字化产品琳琅满目的今天,用户对于界面的要求早已不止于功能的实现,更追求一种舒适、无压的交互体验。而浅色UI设计,凭借其独特的魅力,正逐渐成为众多设计师营造优质体验的首选。 一、浅色UI设计的视觉优势 (一&a…

Unity中实现伤害跳字效果(简单好抄)

第一步骤安装并导入Dotween插件(也可以不用导入之后直接下载我的安装包) 官网DOTween - 下载 第二步: 制作跳字预制体 建议把最佳适应打开,这样就不怕数字太大显示不全了。 第三步:创建一个空对象并编写脚本JumpNumbe…

为什么相关性不是因果关系?人工智能中的因果推理探秘

目录 一、背景 (一)聚焦当下人工智能 (二)基于关联框架的人工智能 (三)基于因果框架的人工智能 二、因果推理的基本理论 (一)因果推理基本范式:因果模型&#xff0…

VMamba 安装教程(无需更改base环境中的cuda版本)

导航 安装教程导航 Mamba 及 Vim 安装问题参看本人博客:Mamba 环境安装踩坑问题汇总及解决方法(初版)Linux 下Mamba 及 Vim 安装问题参看本人博客:Mamba 环境安装踩坑问题汇总及解决方法(重置版)Windows …

FRP内网穿透0.61.1新版教程

在上一篇zerotier讲述了如何实现虚拟局域网搭建,这篇会讲述FRP内网穿透的使用教程 那么frp与zerotier的区别是什么呢?(说人话) FRP 主要用于内网服务向外网的单向暴露。 ZeroTier 用于构建一个虚拟的私有网络,实现多点…

如何使用MaskerLogger防止敏感数据发生泄露

关于MaskerLogger MaskerLogger是一款功能强大的记录工具,该工具可以有效防止敏感数据泄露的发生。 MaskerLogger旨在保护目标系统的日子安全,此格式化程序可确保你的日志安全并防止敏感数据泄露。例如使用此格式化程序,打印下列数据&#x…

React进阶之react.js、jsx模板语法及babel编译

React React介绍React官网初识React学习MVCMVVM JSX外部的元素props和内部的状态statepropsstate 生命周期constructorgetDerivedStateFromPropsrendercomponentDidMount()shouldComponentUpdategetSnapshotBeforeUpdate(prevProps, prevState) 创建项目CRA:create-…

【Python】JSON

文章目录 定义Json格式数据转化 定义 JSON是一种轻量级的数据交互格式,可以按照JSON指定的格式去组织和封装数据 JSON本质上是一个带有特定格式的字符串 JSON可以直接和Python的字典或列表进行无缝转换 【主要功能】 JSON就是一个在各个编程语言中流通的数据格…

.Net Core微服务入门全纪录(五)——Ocelot-API网关(下)

系列文章目录 1、.Net Core微服务入门系列(一)——项目搭建 2、.Net Core微服务入门全纪录(二)——Consul-服务注册与发现(上) 3、.Net Core微服务入门全纪录(三)——Consul-服务注…

【18】Word:明华中学-儿童医保❗

目录 题目​ NO2 NO3 NO4 NO5 NO6 NO7 NO8 NO9 题目 NO2 布局→页面设置对话框→纸张方向:横向→纸张大小:A3 ;页面设置对话框:直接输入纸张大小的宽度和高度即可→页面设置对话框:上下左右边距→版式&…

数据结构漫游记:动态实现栈(stack)

嘿,各位技术潮人!好久不见甚是想念。生活就像一场奇妙冒险,而编程就是那把超酷的万能钥匙。此刻,阳光洒在键盘上,灵感在指尖跳跃,让我们抛开一切束缚,给平淡日子加点料,注入满满的pa…

SpringBoot 搭建 SSE

参考链接 https://www.51cto.com/article/798001.html 了解一下SseEmitter&#xff08;一&#xff09;-CSDN博客 依赖 有默认的 springboot-web 依赖即可 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-start…

python_在钉钉群@人员发送消息

python_在钉钉群人员发送消息 1、第一种 企业内部机器人群聊实现人接入指南&#xff0c;适用于群机器人接收消息&#xff0c;处理完一系列的动作之后&#xff0c;将消息返回给发消息的人员&#xff0c;同时该人员。 需要在企微后台新建一个自建应用&#xff0c;在自建应用里…

macOS安装Gradle环境

文章目录 说明安装JDK安装Gradle 说明 gradle8.5最高支持jdk21&#xff0c;如果使用jdk22建议使用gradle8.8以上版本 安装JDK mac系统安装最新&#xff08;截止2024.9.13&#xff09;Oracle JDK操作记录 安装Gradle 下载Gradle&#xff0c;解压将其存放到资源java/env目录…

HTML之拜年/跨年APP(改进版)

目录&#xff1a; 一&#xff1a;目录 二&#xff1a;效果 三&#xff1a;页面分析/开发逻辑 1.页面详细分析&#xff1a; 2.开发逻辑&#xff1a; 四&#xff1a;完整代码&#xff08;不多废话&#xff09; index.html部分 app.json部分 二&#xff1a;效果 三&#xff1a;页面…

PostgreSQL的学习心得和知识总结(一百六十六)|深入理解PostgreSQL数据库之\watch元命令的实现原理

目录结构 注&#xff1a;提前言明 本文借鉴了以下博主、书籍或网站的内容&#xff0c;其列表如下&#xff1a; 1、参考书籍&#xff1a;《PostgreSQL数据库内核分析》 2、参考书籍&#xff1a;《数据库事务处理的艺术&#xff1a;事务管理与并发控制》 3、PostgreSQL数据库仓库…

使用 Parcel 和 NPM 脚本进行打包

使用 Parcel 和 NPM 脚本进行打包 Parcel Parcel 是一个零配置的网页应用程序打包工具&#xff0c;主要用于快速构建现代 JavaScript 应用。 我们可以使用npm直接安装它 npm install --save-dev parcel //这将把 Parcel 添加到 devDependencies 中&#xff0c;表明它是一个…

项目实战--网页五子棋(游戏大厅)(3)

我们的游戏大厅界面主要需要包含两个功能&#xff0c;一是显示用户信息&#xff0c;二是匹配游戏按钮 1. 页面实现 hall.html <!DOCTYPE html> <html lang"ch"> <head><meta charset"UTF-8"><meta name"viewport"…