b站小土堆pytorch学习记录—— P27-P29 完整的模型训练套路

文章目录

  • 一、定义模型(放在model.py文件中)
  • 二、训练
  • 三、测试
  • 四、完整的训练和测试代码

一、定义模型(放在model.py文件中)

import torch
from torch import nn

class Guodong(nn.Module):
    def __init__(self):
        super(Guodong,self).__init__()
        self.module = nn.Sequential(
            nn.Conv2d(3, 32, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 32, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 64, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Flatten(),
            nn.Linear(64*4*4, 64),
            nn.Linear(64, 10)
        )

    def forward(self, x):
        x = self.module(x)
        return x

if __name__ == '__main__':
    guodong = Guodong()
    input = torch.ones((64, 3, 32, 32))
    output = guodong(input)
    print(output.shape)

二、训练

import torch
import torchvision
from torch import nn
from torch.utils.data import DataLoader
from model import *

dataset_train = torchvision.datasets.CIFAR10("dataset1", train=True, transform=torchvision.transforms.ToTensor(), download=True)
dataset_test = torchvision.datasets.CIFAR10("dataset1", train=False, transform=torchvision.transforms.ToTensor(),download=False)

dataset_train_size = len(dataset_train)
dataset_test_size = len(dataset_test)
print("训练集的数据长度为{}".format(dataset_train_size))
print("测试集的数据长度为{}".format(dataset_test_size))

train_dataloader = DataLoader(dataset_train, batch_size=64)
test_dataloader = DataLoader(dataset_test, batch_size=64)

# 创建网络模型
guodong = Guodong()

# 损失函数
loss_fn = nn.CrossEntropyLoss()

# 优化器
learning_rate = 1e-2
optimizer = torch.optim.SGD(guodong.parameters(), learning_rate)

# 设置训练网络的一些参数
total_train_step =0
total_test_step = 0
epoch = 10

for i in range(10):
    print("------第{}次训练开始------".format(i+1))

    # 训练开始
    for data in train_dataloader:
        imgs, target = data
        output = guodong(imgs)
        loss = loss_fn(output, target)

        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step = total_train_step+1
        if total_train_step % 100 == 0:
            print("训练次数:{},Loss:{}".format(total_train_step, loss.item()))

运行结果:(部分)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
可以看到,随着训练次数的增加,loss整体上在不断变小

三、测试

import torch
import torchvision
from torch import nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

from model import *

writer = SummaryWriter("train_logs")

dataset_train = torchvision.datasets.CIFAR10("dataset1", train=True, transform=torchvision.transforms.ToTensor(), download=True)
dataset_test = torchvision.datasets.CIFAR10("dataset1", train=False, transform=torchvision.transforms.ToTensor(),download=False)

dataset_train_size = len(dataset_train)
dataset_test_size = len(dataset_test)
print("训练集的数据长度为{}".format(dataset_train_size))
print("测试集的数据长度为{}".format(dataset_test_size))

train_dataloader = DataLoader(dataset_train, batch_size=64)
test_dataloader = DataLoader(dataset_test, batch_size=64)

# 创建网络模型
guodong = Guodong()

# 损失函数
loss_fn = nn.CrossEntropyLoss()

# 优化器
learning_rate = 1e-2
optimizer = torch.optim.SGD(guodong.parameters(), learning_rate)

# 设置训练网络的一些参数
total_train_step =0
total_test_step = 0
epoch = 10

for i in range(10):
    print("------第{}次训练开始------".format(i+1))

    # 训练开始
    for data in train_dataloader:
        imgs, targets = data
        outputs = guodong(imgs)
        loss = loss_fn(outputs, targets)

        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step = total_train_step+1
        if total_train_step % 100 == 0:
            # print("训练次数:{},Loss:{}".format(total_train_step, loss.item()))
            writer.add_scalar("train_loss", loss.item(), total_train_step)

    total_test_loss = 0
    with torch.no_grad():
        for data in test_dataloader:
            imgs, targets = data
            outputs = guodong(imgs)
            loss = loss_fn(outputs, targets)
            total_test_loss = total_test_loss + loss.item()
    print("整体测试集上的Loss:{}".format(total_test_loss))
    writer.add_scalar("test_loss", total_test_loss, total_test_step)

writer.close()

运行结果:

在这里插入图片描述
打开tensorboard后,结果如下:

在这里插入图片描述

四、完整的训练和测试代码

主要功能:
加载和准备CIFAR-10数据集,以便训练和测试深度学习模型。
创建一个自定义的深度学习模型(Guodong),并定义损失函数和优化器。
执行训练循环和测试循环,通过反向传播优化模型参数,并评估模型在测试集上的性能。
使用TensorBoard记录训练过程中的损失和准确率等信息,以便后续分析和可视化。
保存训练后的模型参数到文件中,以便后续部署和使用。

此外

在深度学习中,通常使用**.train().eval()**这两个方法来设置模型的训练模式和评估模式。这两个方法通常用于 PyTorch 或 TensorFlow 等深度学习框架。

.train(): 这个方法将模型设置为训练模式。在训练模式下,模型会启用训练相关的功能,比如启用 dropout 或 batch normalization 层的运算,以及计算梯度用于参数更新。当调用该方法后,模型会处于可以接受输入数据并进行前向传播、反向传播的状态。

.eval(): 这个方法将模型设置为评估模式。在评估模式下,模型会关闭一些训练过程中的特殊操作,如 dropout 或 batch normalization 的自适应性,以确保在推理阶段的一致性。评估模式通常用于模型在验证集或测试集上的性能评估,以保证评估结果的稳定性和一致性。

通过在训练和评估阶段分别调用.train()和.eval()方法,可以确保模型在不同阶段有正确的行为表现,从而提高训练和评估的效果和可靠性。

import torch
import torchvision
from torch import nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

from model import Guodong  # 导入自定义的模型类

# 创建TensorBoard的SummaryWriter,用于记录训练过程中的损失和准确率等信息
writer = SummaryWriter("train_logs")

# 加载CIFAR-10数据集
dataset_train = torchvision.datasets.CIFAR10("dataset1", train=True, transform=torchvision.transforms.ToTensor(), download=True)
dataset_test = torchvision.datasets.CIFAR10("dataset1", train=False, transform=torchvision.transforms.ToTensor(), download=False)

dataset_train_size = len(dataset_train)
dataset_test_size = len(dataset_test)
print("训练集的数据长度为{}".format(dataset_train_size))
print("测试集的数据长度为{}".format(dataset_test_size))

# 创建训练和测试数据加载器
train_dataloader = DataLoader(dataset_train, batch_size=64)
test_dataloader = DataLoader(dataset_test, batch_size=64)

# 创建网络模型实例
guodong = Guodong()

# 定义损失函数和优化器
loss_fn = nn.CrossEntropyLoss()
learning_rate = 1e-2
optimizer = torch.optim.SGD(guodong.parameters(), learning_rate)

# 设置训练网络的一些参数
total_train_step = 0
total_test_step = 0
epoch = 10

for i in range(10):
    print("------第{}次训练开始------".format(i + 1))

    guodong.train()

    # 训练开始
    for data in train_dataloader:
        imgs, targets = data
        outputs = guodong(imgs)
        loss = loss_fn(outputs, targets)

        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step += 1
        if total_train_step % 100 == 0:
            writer.add_scalar("train_loss", loss.item(), total_train_step)

    # 测试开始
    guodong.eval()
    total_test_loss = 0
    total_accuracy = 0
    with torch.no_grad():
        for data in test_dataloader:
            imgs, targets = data
            outputs = guodong(imgs)
            loss = loss_fn(outputs, targets)
            total_test_loss += loss.item()
            accuracy = (outputs.argmax(1) == targets).sum()
            total_accuracy += accuracy

    print("整体测试集上的Loss:{}".format(total_test_loss))
    print("整体测试集上的正确率:{}".format(total_accuracy / dataset_test_size))
    writer.add_scalar("test_loss", total_test_loss, total_test_step)
    writer.add_scalar("test_accuracy", total_accuracy / dataset_test_size, total_test_step)

    # 保存模型
    torch.save(guodong.state_dict(), "guodong_{}.pth".format(i))
    print("模型已保存")

    total_test_step += 1

writer.close()

代码运行结果:

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/440740.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

在vue2中使用tailwindcss(完整教程)

如果你看过好多教程之后,还是报错,无法使用tailwindcss,我希望本教程可以让你成功上岸。 环境要求 node:>v14.17.0 安装tailwindcss 由于最新的tailwind css使用post css 8版本,vue2框架暂时还不支持&#xff0…

Springboot + Vue用户管理系统

Springboot Vue用户管理系统 主要实现了管理员的登录,用户管理,用户的增删改查等操作, 技术实现,前端采用Vue 后端采用Springboot ,前后端分离系统,数据库使用mysql 还用到了redis,mybatis-plus。。。。。。。。。…

10大主流压力/负载/性能测试工具推荐

在移动应用和Web服务正式发布之前,除了进行必要的功能测试和安全测试,为了保证互联网产品的服务交付质量,往往还需要做压力/负载/性能测试。然而很多传统企业在试水互联网的过程中,往往由于资源或产品迭代速度等原因忽视了这一块工…

【Python】科研代码学习:三 PreTrainedModel, PretrainedConfig, PreTrainedTokenizer

【Python】科研代码学习:三 PreTrainedModel, PretrainedConfig, PreTrainedTokenizer 前言Models : PreTrainedModelPreTrainedModel 中重要的方法 tensorflow & pytorch 简单对比Configuration : PretrainedConfigPretrainedConfig 中重要的方法 Tokenizer : …

influxdb2.0插入数据字段类型出现冲突问题解决

一、问题出现 一个学校换热站自控系统,会定时从换热站获取测点数据,并插入到influxdb数据库中。influxdb插入数据时,报错提示: com.influxdb.exceptions.UnprocessableEntityException: failure writing points to database: par…

组合逻辑电路(二)(译码器和编码器)

目录 译码器 简单逻辑门译码器 二进制译码器 2线-4线译码器 3线-8线译码器 二-十进制译码器 4线-10线译码器 七段显示译码器 编码器 二进制普通编码器 二-十进制普通编码器(8421BCD码编码器) 优先编码器(Priority Encoder) 译…

《解密云计算:企业之选》

前言 在当今数字化时代,企业面临着巨大的数据处理压力和信息化需求,传统的IT架构已经无法满足日益增长的业务需求。在这样的背景下,越来越多的企业开始转向云计算,以实现灵活、高效和可扩展的IT资源管理和利用。 云计算 云计算是…

【QT中如何生成导出.exe可执行文件并打包给其他人使用】

1、将QT的部署设置改成Release编译模式。 2、运行项目生成release文件夹,其中包含.exe文件。 3、新建空文件夹,将release文件夹中的.exe文件复制到里面去。(此处新建了hellofile空文件夹来存放hello.exe文件) 4、在QT终端里&#…

SpringBoot学习之自定义注解和AOP 切面统一保存操作日志(二十九)

一、定义一个注解 这个注解是用来控制是否需要保存操作日志的自定义注解(这个类似标记或者开关) package com.xu.demo.common.anotation;import java.lang.annotation.ElementType; import java.lang.annotation.Retention; import java.lang.annotation.RetentionPolicy; i…

Filter过滤器+JWT令牌实现登陆验证

一、背景 我们需要在客户端访问服务器的时候给定用户一定的操作权限,比如没有登陆时就不能进行其他操作。如果他需要进行其他操作,而在这之前他没有登陆过,服务端则需要将该请求拦截下来,这就需要用到过滤器,过滤器可以…

【YOLO v5 v7 v8 v9小目标改进】AFPN 渐进式特征金字塔网络:解决多尺度特征融合中,信息在传递过程丢失

AFPN 渐进式特征金字塔网络:解决多尺度特征融合中,信息在传递过程丢失 提出背景AFPN 多尺度特征金字塔 非邻近层次的直接特征融合 自适应空间融合操作 小目标涨点YOLO v5 魔改YOLO v7 魔改YOLO v8 魔改YOLO v9 魔改 提出背景 论文:https:…

复试人工智能前沿概念总结

1.大模型相关概念(了解即可) 1.1 GPT GPT,全称为Generative Pre-training Transformer,是OpenAI开发的一种基于Transformer的大规模自然语言生成模型。GPT模型采用了自监督学习的方式,首先在大量的无标签文本数据上进…

力扣hot100题解(python版55-59题)

55、全排列 给定一个不含重复数字的数组 nums ,返回其 所有可能的全排列 。你可以 按任意顺序 返回答案。 示例 1: 输入:nums [1,2,3] 输出:[[1,2,3],[1,3,2],[2,1,3],[2,3,1],[3,1,2],[3,2,1]]示例 2: 输入&…

论文研读笔记1:

1.Improving Domain-Adapted Sentiment Classification by Deep Adversarial Mutual Learning: 1.1本篇论文提出了一种名为深度对抗性互学习(Deep Adversarial Mutual Learning, DAML)的新方法,用于改进领域适应性情感分类。 对…

使用 Cypress 进行可视化回归测试:一种务实的方法

每次组件库 Picasso 发布新版本时,都会更新所有的前端应用程序,让绝大部分新功能能与整个平台的设计保持一致。上个月,推出了 Toptal Talent Portal 的 Picasso 更新,这是我们的用户用来找工作和与客户互动的平台。 已知了这个版本…

C++指针(四)万字图文详解!

个人主页:PingdiGuo_guo 收录专栏:C干货专栏 前言 相关文章:C指针(一)、C指针(二)、C指针(三) 本篇博客是介绍函数指针、函数指针数组、回调函数、指针函数的。 点赞破六…

结构体和malloc学习笔记

结构体学习: 为什么会出现结构体: 为了表示一些复杂的数据,而普通的基本类型变量无法满足要求; 定义: 结构体是用户根据实际需要自己定义的符合数类型; 如何使用结构体: //定义结构体 struc…

【工具】Raycast – Mac提效工具

引入 以前看到同事们锁屏的时候,不知按了什么键,直接调出这个框,然后输入lock屏幕就锁了。 跟我习惯的按Mac开机键不大一样。个人觉得还是蛮炫酷的~ 调研 但是由于之前比较繁忙,这件事其实都忘的差不多了&#xff0…

C++ · 代码笔记4 ·继承与派生

目录 前言010继承与派生简单例程020多级继承030使用using关键词更改访问权限040隐藏050派生类与基类成员函数同名时不构成重载060使用多级继承展示成员变量在内存中的分布情况071派生类在函数头调用基类构造函数072构造函数调用顺序080构造函数与析构函数的调用顺序091多重继承…

【常见集合】Java 常见集合重点解析

Java 常见集合重点解析 1. 什么是算法时间复杂度? 时间复杂度表示了算法的 执行时间 和 数据规模 之间的增长关系; 什么是算法的空间复杂度? 表示了算法占用的额外 存储空间 与 数据规模 之间的增长关系; 常见的复杂度&#x…