Tensorflow入门实战 P01-实现手写数字识别mnist

目录

1、背景:MNIST手写数字识别

2、完整代码(Tensorflow):

3、运行过程及结果:

4、小结(还是很清晰的)

5、 展望


  • 🍨 本文为🔗365天深度学习训练营 中的学习记录博客
  • 🍖 原作者:K同学啊 | 接辅导、项目定制

1、背景:MNIST手写数字识别

MINIST手写数字数据集来源于美国国家标准与技术研究所,是著名的公开数据集。

数据集获取的网址:http://yann.lecun.com/exdb/mnist/(下载后需要解压)。

但是,我们一般会采用一行简单的代码来直接调用,无需去直接下载。

(train_images, train_labels),(test_images, test_labels) = datasets.mnist.load_data()

其中,MNIST手写数字集中包含了70000张图片,70000 = 60000(训练数据) + 10000(测试数据)。且图片都是28*28大小的。

如果我们把每一张图片中的像素转换为向量,则得到长度为28*28=784 的向量。因此我们可以把训练集看成是一个[60000, 784] 的张量,第一个维度表示图片的索引,第二个维度表示每张图片中的像素点。而图片里的每个像素点的值介于0-1之间。

2、完整代码(Tensorflow):

# 前期工作
# 1、设置GPU
import tensorflow as tf
gpus = tf.config.list_physical_devices("GPU")

if gpus:
    gpu0 = gpus[0]  # 如果有多个GPU,仅使用第0个GPU
    tf.config.experimental.set_memory_growth(gpu0, True)  # 设置GPU显存用量按需使用,这样Tensorflow不会一开始就占用全部显存
    tf.config.set_visible_devices([gpu0], "GPU")  # 设置Tensorflow可见的GPU设备列表。


# 2、导入mnist 数据
from keras import datasets, layers, models
import matplotlib.pyplot as plt

# 导入mnist数据,依次分别为 训练集图片、训练集标签、测试集图片、测试集标签
(train_images, train_labels), (test_images, test_labels) = datasets.mnist.load_data()

# 将像素的值标准化至0到1的区间内。(对于灰度图片来说,每个像素最大值是255,每个像素最小值是0,也就是直接除以255就可以完成归一化。)
train_images, test_images = train_images / 255.0, test_images / 255.0


# 3、可视化图片
# 将数据集前20个图片数据可视化显示,并进行图像大小为20宽、10长的绘图(单位为英寸inch)
plt.figure(figsize=(20,10))
# 遍历MNIST数据集下标数值0~49
for i in range(20):
    plt.subplot(2,10,i+1)   # 将整个figure分成5行10列,绘制第i+1个子图。
    plt.xticks([])  # 设置不显示x轴刻度
    plt.yticks([]) # 设置不显示y轴刻度
    plt.grid(False) # 设置不显示子图网格线
    plt.imshow(train_images[i], cmap=plt.cm.binary)  # 图像展示,cmap为颜色图谱,"plt.cm.binary"为matplotlib.cm中的色表
    plt.xlabel(train_labels[i])  # 设置x轴标签显示为图片对应的数字
plt.show() # 显示图片


# 4、调整图片格式(调整数据到我们需要的格式)
train_images = train_images.reshape((60000, 28, 28, 1))
test_images = test_images.reshape((10000, 28, 28, 1))
print(train_images.shape, test_images.shape, train_labels.shape, test_labels.shape)
#       (60000, 28, 28, 1)  (10000, 28, 28, 1)  (60000,)            (10000,)


# 5、搭建卷积神经网络
'''
    创建并设置卷积神经网络
    ① 卷积层:通过卷积操作对输入图像进行降维和特征抽取
    ② 池化层:是一种非线性形式的下采样。主要用于特征降维,压缩数据和参数的数量,减小过拟合,同时提高模型的鲁棒性。
    ③ 全连接层:在经过几个卷积和池化层之后,神经网络中的高级推理通过全连接层来完成。
'''

model = models.Sequential([
    # 设置二维卷积层1,设置32个3*3卷积核,activation参数将激活函数设置为ReLu函数,input_shape参数将图层的输入形状设置为(28, 28, 1)
    # ReLu函数作为激活励函数可以增强判定函数和整个神经网络的非线性特性,而本身并不会改变卷积层
    # 相比其它函数来说,ReLU函数更受青睐,这是因为它可以将神经网络的训练速度提升数倍,而并不会对模型的泛化准确度造成显著影响。
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    # 池化层1,2*2采样
    layers.MaxPooling2D((2, 2)),
    # 设置二维卷积层2,设置64个3*3卷积核,activation参数将激活函数设置为ReLu函数
    layers.Conv2D(64, (3, 3), activation='relu'),
    # 池化层2,2*2采样
    layers.MaxPooling2D((2, 2)),

    layers.Flatten(),  # Flatten层,连接卷积层与全连接层
    layers.Dense(64, activation='relu'),  # 全连接层,特征进一步提取,64为输出空间的维数,activation参数将激活函数设置为ReLu函数
    layers.Dense(10)  # 输出层,输出预期结果,10为输出空间的维数
])
# 打印网络结构
# model.summary()

# 6、编译模型

"""
    这里设置优化器、损失函数以及metrics
    这三者具体介绍可参考我的博客:
    https://blog.csdn.net/qq_38251616/category_10258234.html
"""
# model.compile()方法用于在配置训练方法时,告知训练时用的优化器、损失函数和准确率评测标准
model.compile(
    optimizer='adam',  # 设置优化器为Adam优化器
    # 设置损失函数为交叉熵损失函数(tf.keras.losses.SparseCategoricalCrossentropy())
    # from_logits为True时,会将y_pred转化为概率(用softmax),否则不进行转换,通常情况下用True结果更稳定
    loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
    # 设置性能指标列表,将在模型训练时监控列表中的指标
    metrics=['accuracy'])

# 训练模型

"""
这里设置输入训练数据集(图片及标签)、验证数据集(图片及标签)以及迭代次数epochs
关于model.fit()函数的具体介绍可参考我的博客:
https://blog.csdn.net/qq_38251616/category_10258234.html
"""
history = model.fit(
    train_images,  # 输入训练集图片
    train_labels,  # 输入训练集标签
    epochs=10,  # 设置10个epoch,每一个epoch都将会把所有的数据输入模型完成一次训练。
    validation_data=(test_images, test_labels))  # 设置验证集

# 预测模型
plt.imshow(test_images[1])  # 将数据变换成图像
plt.show()  # 将图像显示出来!!!

pre = model.predict(test_images) # 对所有测试图片进行预测
print(pre[1])  # 输出第一张图片的预测结果

3、运行过程及结果:

4、小结(还是很清晰的)

        学习过程总是坎坷的,每次都会遇到各种问题,但是这就需要我们有很好的解决能力。现在科技这么发达,很多AI,还有网上很多的博客、大神之类的,这些都是帮助我们前进的助力。

先说说我吧:

我之前一直写的是pytorch,只听说过tensorflow,但是没有实际使用过,这周是第一次暗转tensorflow,刚开始页式各种的问题,下面我细细列举几个:

① tensorflow需要3.8版本的python。我的python是3.10的,安装失败了,看到提示才知道需要python3.8版本,于是就果断的`conda create -n tensorflow -n python=3.8`

② 环境安装好了,开始安装tensorflow: pip install tensorflow 

③ 安装好tensorflow,pip list 检查已经安装好。开始写代码

④ 刚写没几行,报错。

⑤ 点进去tensorflow 里面根本没有keras ,去网上搜了下,发现是需要这样的。

于是,再次去查看了pip list,查看先关的包,发现tensorflow和keras 都存在,而且不是父子关系。于是就把报错那块的tensorflow.keras 换成 keras 就可以了!!!!

⑥ plt.imshow(test_images[1])  代码里面的这快,是要显示测试数据集里面的第一个图片,但是运行代码,一直不显示。于是,我又去网上搜索了,看了下 plt.imshow() 和plt.show()的区别。

好好好,这样写就好了。

⑦ 后续在没有任何报错了。very good!!!!

⑧ 推荐一个学习tensorflow学习的网站(可以当个词典):TensorFlow官方文档_w3cschool

5、 展望

加油,今年争取发个论文。最近一直在看相关论文,跑实验!!!!

Good luck to me !!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/637975.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

智慧水务可视化大屏,一屏纵览水务信息。

智慧水务可视化大屏通常需要展现以下几类信息: 01.实时监测数据: 包括水源水质、水压、水位、水流速等实时监测数据,通过图表、曲线等形式展示,帮助监测人员了解当前水务系统的运行状态。 02.设备运行状态: 展示水泵…

监控上网的软件有哪些?含泪推荐的电脑监控软件

监控上网的软件有很多,企业选择的时候应该遵循什么样的原则呢?鄙人愚见,认为以下四项原则是选择监控软件时首要考虑的。 1、功能需求: 监控软件不应该只是起到控制上网的作用,因为一些泄密行为可能是通过USB接口、打印…

AI大模型的口语练习APP

开发一个使用第三方大模型的口语练习APP涉及多个步骤,从需求分析到部署上线。以下是详细的开发流程和关键步骤,通过系统化的流程和合适的技术选型,可以有效地开发出一个功能丰富、用户体验良好的口语练习APP。北京木奇移动技术有限公司&#…

Ipad air6买什么电容笔?5款超值精品平替电容笔推荐!

电容笔作为ipad的最佳拍档,为学生党和打工人带来了极大的便利,二者搭配效率真的大大提升,但是,如何选购一支适合自己的电容笔呢?作为一个对数码设备非常感兴趣并且有一定了解的人,我根据自己多年的使用经验…

DeepDriving | CUDA编程-03:线程层级

本文来源公众号“DeepDriving”,仅用于学术分享,侵权删,干货满满。 原文链接:CUDA编程-03:线程层级 DeepDriving | CUDA编程-01: 搭建CUDA编程环境-CSDN博客 DeepDriving | CUDA编程-02: 初识CUDA编程-C…

【搜索】BFS

#include <iostream> #include <cstring> #include <queue>using namespace std;const int N 110;typedef pair<int, int> PII;int n, m; int g[N][N], d[N][N];//存放地图//存每一个点到起点的距离int bfs() {queue< PII > q;q.push({0, 0});m…

变量命名的艺术:让你的代码更具可读性

新书上架~&#x1f447;全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我&#x1f446;&#xff0c;收藏下次不迷路┗|&#xff40;O′|┛ 嗷~~ 目录 一、引言&#xff1a;为何变量命名如此重要&#xff1f; 二、变量命名的基本规则 1. 避免数…

Threejs路径规划_基于A*算法案例完整版

上节利用了A*实现了基础的路径规划&#xff0c;这节把整个功能完善好&#xff0c;A*算法一方面是基于当前点找到可以到达的点&#xff0c;计算从出发点到此点&#xff0c;以及此点到目的地的总成本&#xff0c;比较出最小的那个&#xff0c;再用最小成本的点继续找到它可以到达…

无线领夹麦克风哪个品牌音质最好,揭秘无线领夹麦哪个牌子好用

​随着社交媒体和内容创作的兴起&#xff0c;清晰可靠的音频捕捉已成为打造高品质作品的关键要素。无线领夹麦克风因其轻巧设计和用户友好的接口而受到青睐&#xff0c;它能够确保你的声音在任何环境下都能被完美捕捉。经过精心测试和对比&#xff0c;以下几款无线领夹麦克风是…

用手机打印需要下载什么软件

在快节奏的现代生活中&#xff0c;打印需求无处不在&#xff0c;无论是工作文件、学习资料还是生活小贴士&#xff0c;都可能需要一纸呈现。然而&#xff0c;传统的打印方式往往受限于时间和地点&#xff0c;让人倍感不便。今天&#xff0c;就为大家推荐一款便捷又省钱的手机打…

解锁合同管理的新路径:低代码与定制开发的完美结合

引言 合同管理在企业中扮演着至关重要的角色。无论是与供应商、客户还是合作伙伴之间的合作&#xff0c;合同都是约束双方责任和权利的关键文档。然而&#xff0c;随着业务的不断增长和全球化的发展&#xff0c;合同管理变得越来越复杂。传统的合同管理方法往往面临着诸多挑战&…

影响程序员发展,首个关于“软件供应链安全”国家标准发布,你该知道的10个问题!【附标准全文】

近日&#xff0c;GB/T 43698-2024《网络安全技术 软件供应链安全要求》作为国内首个软件供应链安全的国标&#xff0c;对于程序员的影响深远。该标准的实施&#xff0c;不仅为程序员提供了明确的软件安全开发指导&#xff0c;还强化了他们在软件开发过程中对安全性的重视。程序…

第十三节:带你梳理Vue2 : watch侦听器

官方解释:> 观察 Vue 实例变化的一个表达式或计算属性函数。回调函数得到的参数为新值和旧值。表达式只接受监督的键路径。对于更复杂的表达式&#xff0c;用一个函数取代<br/>## 1. 侦听器的基本使用侦听器可以监听data对象属性或者计算属性的变化watch是观察属性的…

哈夫曼树的介绍

引入 概述 基本概念 示例 算法实现 存储结构 具体步骤 示例 初始化 合并 示例 代码整合&#xff1a; //哈夫曼树的建立 //定义类型:权值双亲结点左右孩子结点 typedef struct {int weight;int parent;int lchild,rchild; }Hnode,*huffmantree; //建立 1.判断有结点&#xf…

入门四认识HTML

一、HTML介绍 1、Web前端三大核心技术 HTML&#xff1a;负责网页的架构 CSS&#xff1a;负责网页的样式、美化 JS&#xff1a;负责网页的行动 2、什么是HTML HTML是用来描述网页的一种语言。 3、Html标签 单标签<html> 双标签<h>内容</h> 4、标…

如何零基础快速制作商业画册?这篇攻略帮你搞定

随着社会经济的发展&#xff0c;商业画册作为企业形象和产品介绍的重要载体&#xff0c;越来越受到重视。然而&#xff0c;很多企业和个人由于没有设计背景&#xff0c;在面对制作商业画册时往往感到困惑。本文将为你介绍零基础快速制作商业画册的攻略&#xff0c;让你轻松搞定…

Live800:提升客服服务质量,企业应从这几个方面下功夫

客户服务质量&#xff0c;是企业为客户提供优质服务的一个重要衡量指标。通常来说&#xff0c;一个企业的客服部门在其经营活动中发挥着重要作用&#xff0c;是客户与企业之间沟通的桥梁。良好的客服服务&#xff0c;不仅能够提高客户满意度&#xff0c;还能增强企业品牌的美誉…

Java中String类常用方法

写笔记记录自己的学习记录以及巩固细节 目录 1.String类的常用方法 1.1 字符串构造 1.2 String对象的比较 1.2.1 比较两个字符串是否相等 1.2.2 比较两个字符串的大小 1.3 字符串查找 1.4 字符串的转化 1.4.1 字符串转整数 1.4.2 字符串转数字 1.4.3 大小写的转换 1…

Mysql注入详细讲解

特殊字符 0x3a:0x7e~0x23# 注入基础 联合查询注入(union) :::tips 页面将SQL查询内容显示出来&#xff0c;即为有回显&#xff0c;可以尝试联合查询注入 利用关键字union &#xff0c;union all 拼接恶意SQL语句 ::: 注入流程 有报错&#xff0c;可以利用报错。如&#xff…

day 38 435.无重叠区间 763.划分字母区间 56. 合并区间 738.单调递增的数字 968.监控二叉树

435.无重叠区间 思路 为了使区间尽可能的重叠所以排序来使区间尽量的重叠&#xff0c;使用左边界排序来统计重叠区间的个数与452. 用最少数量的箭引爆气球恰好相反。 代码 class Solution {public int eraseOverlapIntervals(int[][] intervals) {Arrays.sort(intervals,(a,…