吴恩达2022机器学习专项课程C2(高级学习算法)W1(神经网络):Lab02 TensorFlow构建神经网络

这里写目录标题

  • 实验目的
  • 导入训练集并绘制散点图
  • 特征缩放处理数据集
  • 扩展数据集
  • TensorFlow构建神经网络模型
    • 1.设置模型的层
    • 2.获取模型信息
    • 2.优化模型
    • 3.设置模型参数
    • 3.开始预测
    • 4.转换预测结果
  • 检测神经元的功能
    • 1.目的
    • 2.准备工作
    • 3.第一层的预测与真实数据的对比
    • 2.第二层
    • 3.神经网络的整体情况

实验目的

构建一个神经网络,通过神经网络可以预测给入的样本[温度,持续时间],能否烘焙出好的咖啡豆。

导入训练集并绘制散点图

200个训练样本,每个训练样本的特征是[持续时间,温度],我们假设,如果一个样本的温度在175-260且持续时间在12-15分钟,那么就认为根据这个样本烘焙的咖啡会得到好咖啡,对应图里红叉。相反,输入特征不在这个范围内的,都是坏咖啡的样本,对应图里蓝色圈。
在这里插入图片描述

特征缩放处理数据集

使用 z 标准化处理训练样本的特征,减小每个训练样本的温度差异和持续时间差异(咖啡烘焙)。具体做法是创建一个规范化层,并使用 adapt 方法计算数据的均值和方差,然后对输入数据 X 进行 z 标准化处理,得到新的样本 Xn。

  • 原训练样本的温度差异:284.99,151.32。
  • 原训练样本的持续时间差异:15.45,11.51。
  • z标准化后的温度差异:1.66,-1.69。
  • z标准化后的持续时间差异:1.79,-1.70。
    在这里插入图片描述

扩展数据集

扩展训练集数据,可以减少训练周期数(详见优化模型中的时代和批次)。
在这里插入图片描述

TensorFlow构建神经网络模型

1.设置模型的层

  • 设置2个层,第1个层3个神经元。第2个层1个神经元。
  • set_seed每次运行代码,模型的结构和参数初始化保持一致。
  • tf.keras.Input(shape=(2,)),可以理解成模型的输入层为2个特征的单样本。
    在这里插入图片描述

2.获取模型信息

  • model.summary(),返回模型的相关信息。
    在这里插入图片描述
  • Param参数的计算
    • L1有3个神经元,每个神经元输入的样本包含2个特征,因此每个神经元w有2个,b有1。因此3个神经元一共包含2*3+3=9个参数。
    • L2输入L1的3个激活值,可以理解成L2输入的样本包含3个特征,L2只有1个神经元,因此3*1+1。
      在这里插入图片描述
  • 获取每一层的参数,在神经层接收输入的时候,w,b参数就已经被自动初始化了。查看层的参数,也可以可视化的查看summary返回的param都是什么。
    在这里插入图片描述

2.优化模型

  • model.compile 语句定义了一个损失函数并指定了一个编译优化。model.fit 语句运行梯度下降并将权重拟合到数据中。简单来说就是优化模型的过程,并且让模型里被自动初始化的参数w,b达到局部最优解。
    在这里插入图片描述

  • 时代和批次

    • epochs=10表示训练时代(周期)数,每个时代包含多次梯度下降的迭代。
    • Tensorflow 默认批次大小为32,示例中的数据集样本为200000,因此每个时代的梯度下降迭代次数为200000/32=6250,也就是每个时代执行6250次梯度下降迭代。
    • 如果数据集样本数量少,为了保证每个执行足够多的梯度下降迭代次数,就要设置更大的epochs,可能会导致过拟合,所以我们在一开始要扩展数据集样本数量。
  • 查看模型优化后的w,b参数。在这里插入图片描述

3.设置模型参数

重新设置w,b,如果后续没有显式的设置修改w,b,那么就会一直使用这个w,b。这样做是确保模型的稳健性,即使TensorFlow库随时间的更新可能会带来变化,也可以确保模型在重新运行时的结果与之前一致。在这里插入图片描述

3.开始预测

  • 模型的输出是一个概率,即烘烤好的概率。为了做出决策,必须将概率应用到一个阈值上。在这种情况下,我们将使用 0.5。
  • 构建用于测试的训练样本,为了保证结果的准确,测试样本也要z标准化处理。
  • 结果分别是0.963和0.0000000303。
  • 备注:之前讲述的内容,并没有详细讲述给神经网络传入一个矩阵,矩阵是如何在神经网络中计算的,后面课程会详细讲,这里只需先掌握TensorFlow的使用过程就好。
    在这里插入图片描述

4.转换预测结果

  • 预测的是一个概率,我们需要设置阈值0.5,来让概率变成确定的1或0,根据结果0.963和0.0000000303,因此是1和0。这也就是说,200度13.9分钟,能烘焙出好的咖啡豆。而200度17分钟,无法烘焙出好的咖啡豆,烤过头了!
    在这里插入图片描述
  • 更简化的写法。
    在这里插入图片描述

检测神经元的功能

1.目的

给入神经元与真实数据集范围相同的特征,对比神经元和神经网络的预测效果与真实数据。

2.准备工作

  • 图中的散点是根据实际的X,Y绘制,散点图已经呈现出好样本的温度和持续时间是多少,坏样本的温度和持续时间是多少。
  • 用于计算神经元或神经网络预测的x,是随机构建的1600个输入样本,它们的特征范围和实际的X的特征范围一致。
  • 备注:实际代码中是不一致的,1600个输入样本温度特征在150到285,持续时间特征在11.5到15.5,而实际的范围是温度特征在175-260且持续时间在12-15,这里猜测是为了让两个图形在视觉上更加贴近,以便更好地比较模型的预测结果和实际数据分布。

3.第一层的预测与真实数据的对比

  • Unit 0:当输入样本中的温度过低时,这个单元的激活值会较大,颜色就会越深(阴影),此时的输入样本中的温度特征,属于真实数据集中温度低的范围,表示神经元对温度低的训练样本更敏感。

  • Unit 1:当输入样本中的持续时间较短时,这个单元的激活值会较大,颜色就会越深(阴影),此时的输入样本中的持续时间特征,属于真实数据集中持续时间短的范围,表示神经元对持续时间短的样本更敏感。

  • Unit 2:当输入样本中的持续时间过久且温度过高,这个单元的激活值会增大,表示神经元对持续时间过久以及烘焙温度过高的训练样本更敏感。

  • 高激活值表示神经元对输入或某些特征的响应强烈,因此我们观察高激活值的分布情况。

这些神经元之所以能根据样本筛选出样本不同的问题,并不是人为设计的功能,而是神经网络通过梯度下降自主学习得到的(也就是不同神经元获得了不同的w,b,这里是吴恩达直接给出了合适的W1,B1),这些学习到的功能与人类可能会选择用于做出相同决策的函数非常相似,表明神经网络能够模拟人类的决策过程。
在这里插入图片描述

2.第二层

  • 最终层的输入来源于第一层的输出。已知第一层使用了sigmoid激活函数,这意味着其输出值范围被限定在0到1之间。

  • 为了更好地理解最终层的行为,可以通过创建一个三维图来展示所有可能的3个输入组合下模型的输出结果。

  • 上图中,如果神经元的激活值较高,则表示对应的样本不是好样本,相反,如果神经元的激活值较小,则对应了好的样本。因此下图中,最终层的高激活值(深蓝色)对应3个输入变量取较小值的区域,而较小的3个输入变量,都是上一层神经元好样本计算出的激活值,因此这些区域对应于“good roast”,即良好的烘焙结果。
    在这里插入图片描述

3.神经网络的整体情况

  • 左侧图表显示的是神经网络最后一层预测输出(1600个训练样本),神经网络模型的预测是准确的。阴影部分对应高激活值,而高激活值对应的输入样本里的特征范围,与真实数据集好咖啡的特征范围一致。因此可以说,这个神经网络根据训练样本预测出好咖啡是敏感的。
  • 而右侧图中的散点,并不是真实数据集里的Y,而是神经网络预测并通过阈值转换的Y,能够看到它跟左侧的数据点Y分布一样,给入神经网络X,预测Y和真实Y时一致的,证明了神经网络预测的准确性。在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/620117.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【.net core】微信支付基础功能(开发及使用)

注意 微信开发前期准备工作参照:【微信开发】微信支付前期准备工作(申请及配置)-CSDN博客 本文仅提供微信支付下单,付款,回调,退款等基础功能内容,更多微信支付功能请参照微信支付官网:微信支…

GT2712-STBD 三菱触摸屏12.1寸型

GT2712-STBD 三菱触摸屏12.1寸型 GT2712-STBD参数说明:12.1型, SVGA, TFT彩色液晶屏 65536色, 黑色边框, 电源DC24V。 一、三菱触摸屏GT2712-STBD性能规格: [显示部*1*2] . 显示软元件:TFT彩色液晶屏 . GT2712-STBD画面尺寸:12.1寸 . GT2712-STBD…

这三大场景是未来电瓶车充电桩布局的重中之重

电瓶车充电桩主板作为电瓶车充电系统中的核心组成部分,在实际应用场景中发挥着关键作用。 电瓶车充电桩主板作为电瓶车充电系统的核心组成部分,在各种应用场景中发挥着关键作用。下面我们将一起探讨电瓶车充电桩主板未来重点布局的场景。 01、老旧小区—…

PVFS: A Parallel File System for Linux Clusters——论文泛读

ALS 2000 Paper 分布式元数据论文阅读笔记整理 问题 Linux集群作为低成本、高性能并行计算平台,但缺乏并行文件系统的支持,它对于此类集群上的高性能I/O至关重要。 本文方法 本文为Linux集群开发了一个并行文件系统,称为并行虚拟文件系统…

云原生技术发展概述:投身云计算,从拥抱云原生开始

一、云原生的起源 云计算领域正在进行着一场革命,主机虚拟化实现了主机资源的池化,可以看作是云计算的上半场。以容器为基础的云原生真正实现了应用层的弹性,可以看作是云计算的下半场。 图来源:CNCF公开资料 有人说&#xff0c…

AI+文旅|当智慧遇见风景,感受文旅新体验

今年的五一假期,公众出游热度持续升温,全国多地景区再现“人山人海”,在这样的背景下,促使文旅行业不断通过数字化手段,提升旅游体验质量、探索新的服务方式,AI技术的加入为旅游业带来了革命性的变化。智能导游、智能推…

nuxt3.0+scrollreveal动画插件实现页面滚动加载动画效果

项目安装 npm install scrollreveal --save 在src下创建plugins文件夹,写入名为scrollreveal.client.ts的文件。 import { defineNuxtPlugin } from "#app"; import scrollReveal from scrollrevealexport default defineNuxtPlugin((nuxtApp) > {l…

最新微信智能电子名片源码 全开源可二开 智能名片系统开发

在数字化日益深入人心的今天,名片已不再是简单的纸质交换工具,而是成为了一个展示个人或企业形象、促进商务交流的重要窗口。分享一款全新的微信智能电子名片系统,源码开源、可二次开发的灵活性,更在功能上进行了全面升级和优化&a…

docker搭建mysql集群实现主从复制

前言 随着业务的增长,一台数据服务器已经满足不了需求了,负载过重。这个时候就需要减压了,实现负载均衡和读写分离,一主一丛或一主多从。 主服务器只负责写,而从服务器只负责读,从而提高了效率减轻压力。 …

微服务核心01-Maven【项目管理工具】基础

一、Maven 简介 1.1 传统项目管理: 1.2 Maven 的作用 项目构建:提供标准的、跨平台的自动化项目构建方式。依赖管理:管理项目依赖的资源(jar 包),避免资源间的版本冲突问题统一开发结构:提供标…

夜莺监控(Nightingale)上线内置指标功能

Prometheus 生态里如果要查询数据,需要编写 promql,对于普通用户来说,门槛有点高。通常有两种解法,一个是通过 AI 的手段做翻译,你用大白话跟 AI 提出你的诉求,让 AI 帮你写 promql,另一种是平台…

智慧油田三维电子沙盘系统

深圳易图讯科技(www.3dgis.top)智慧油田三维电子沙盘系统采用三维GIS、大数据、云计算、虚拟现实、物联网、AI等前沿技术,支持无人机航拍、高清卫星影像、DEM高程数据、矢量数据、无人机倾斜摄像、BIM模型、点云、城市白模、等高线、标高点等数据融合和切换&#xf…

如何查看MySQL binlog日志

1、查看MySQL是否开启binlog日志 SQL:show variables like ‘%log_bin%’; log_bin:on 是开启状态 若是OFF,则需要开启binlog日志。 开启方式:打开mysql配置文件my.cnf,在[mysqlId]下面增加 log-binmysql-bin 查看binlog日志 …

每日OJ题_贪心算法四⑥_力扣1262. 可被三整除的最大和

目录 力扣1262. 可被三整除的最大和 解析代码 力扣1262. 可被三整除的最大和 1262. 可被三整除的最大和 难度 中等 给你一个整数数组 nums,请你找出并返回能被三整除的元素最大和。 示例 1: 输入:nums [3,6,5,1,8] 输出:1…

Section I:Introduction

想学习的私信,免费学习路线 原文 Section I:Introduction 1.1 Your First Java Program The classic first program when introducing any new language is Hello World, or a program that prints to the console. In Java, Hello World can be writ…

AI地名故事:笔岗村

笔岗村,实际上是由笔村和宏岗村两个古老的村落合并而成的。南宋度宗元年,也就是公元1265年,笔村开始建立。随着时间的推移,到了宋代后期,宏岗村也相继建立。这两个村落各自承载着丰富的历史和文化,最终在历…

浅析安全用电监控系统在工厂的研究与应用论述

摘 要:随着社会时代的发展,人们的安全意识越来越强烈,在人们生活和工作中离不开各种用电设备,用电设备的安全使用是保障人们生命安全的重要内容。工厂因自身厂内工作环境的特殊性,用电设备的种类多且复杂,如…

云仓酒庄携手中视中州国际传媒 开启央视广告战略合作新征程

近日,云仓酒庄与中视中州(央视代理机构)隆重举行2024-2025年度央视广告战略签约仪式,云仓酒庄副总裁周玄代表云仓酒庄签约。此次合作标志着云仓酒庄在品牌传播和市场营销方面迈出了坚实的一步,将借助央视及多家卫视的强…

星戈瑞SH-PEG3-OH一种多功能生物相容性PEG小分子

SH-PEG3-OH是一种含有硫基(-SH)、三个乙二醇单元和羟基(-OH)的小分子化合物。其分子结构中的硫基赋予了其独特的化学反应性,能够与其他含有不饱和键的化合物发生点击化学反应,如迈克尔加成反应等。同时&…

iOS 面试题总结(可能是最全的!!!)

如有错误 请及时在评论中指出 文章将不定期更新 1. objc_msgForward是干什么的,如果直接调用会发生什么? 作用:这个函数是IMP类型(方法实现的内存地址也就是函数指针),用于消息转发,当向一个对…