sheng的学习笔记-【中】【吴恩达课后测验】Course 3 - 结构化机器学习项目 - 第一周测验

课程3_第1周_测验题

目录:目录

要解决的问题

① 这个例子来源于实际项目,但是为了保护机密性,我们会对细节进行保护。

② 现在你是和平之城的著名研究员,和平之城的人有一个共同的特点:他们害怕鸟类。

③ 为了保护他们,你必须设计一个算法,以检测飞越和平之城的任何鸟类,同时警告人们有鸟类飞过。市议会为你提供了10,000,000张图片的数据集,这些都是从城市的安全摄像头拍摄到的。它们被命名为:

  1. y = 0:图片中没有鸟类
  2. y = 1:图片中有鸟类

④ 你的目标是设计一个算法,能够对和平之城安全摄像头拍摄的新图像进行分类。

⑤ 有很多决定要做:

  1. 评估指标是什么?
  2. 你如何将你的数据分割为训练/验证/测试集?

⑥ 市议会告诉你,他们想要一个算法:

  1. 拥有较高的准确度
  2. 快速运行,只需要很短的时间来分类一个新的图像。
  3. 可以适应小内存的设备,这样它就可以运行在一个小的处理器上,它将用于城市的安全摄像头上。
    在这里插入图片描述

第一题

1.有三个评估指标使您很难在两种不同的算法之间进行快速选择,并且会降低您的团队迭代的速度。

A. 【  】对

B. 【  】不对

答案:

A.【 √ 】对

第二题

① 经过进一步讨论,市议会缩小了它的标准:

  1. “我们需要一种算法,可以让我们尽可能精确的知道一只鸟正飞过和平之城。”
  2. “我们希望经过训练的模型对新图像进行分类不会超过10秒。”
  3. “我们的模型要适应10MB的内存的设备。”

2.如果你有以下三个模型,你会选择哪一个?

A. 【  】测试准确度:97%;运行时间:1 sec;内存大小:3MB

B. 【  】测试准确度:99%;运行时间:13 sec;内存大小:9MB

C. 【  】测试准确度:97%;运行时间:3 sec;内存大小:2MB

D. 【  】测试准确度:98%;运行时间:9 sec;内存大小:9MB

答案:

D.【 √ 】测试准确度:98%;运行时间:9 sec;内存大小:9MB

第三题

3.根据城市的要求,您认为以下哪一项是正确的?

A. 【  】准确度是一个优化指标;运行时间和内存大小是满意指标。

B. 【  】准确度是一个满意指标;运行时间和内存大小是一个优化指标。

C. 【  】准确性、运行时间和内存大小都是优化指标,因为您希望在所有这三方面都做得很好。

D. 【  】准确性、运行时间和内存大小都是满意指标,因为您必须在三项方面做得足够好才能使系统可以被接受。

答案:

A.【 √ 】准确度是一个优化指标;运行时间和内存大小是满意指标。

第四题

4.在实现你的算法之前,你需要将你的数据分割成训练/验证/测试集,你认为哪一个是最好的选择?

A. 【  】训练集:3,333,334;验证集:3,333,333;测试集:3,333,333

B. 【  】训练集:9,500,000;验证集:250,000;测试集:250,000

C. 【  】训练集:6,000,000;验证集:3,000,000;测试集:1,000,000

D. 【  】训练集:6,000,000;验证集:1,000,000;测试集:3,000,000

答案:

B.【 √ 】训练集:9,500,000;验证集:250,000;测试集:250,000

第五题

5.在设置了训练/开发/测试集之后,市议会再次给你了1,000,000张图片,称为“公民数据”。 显然,和平之城的公民非常害怕鸟类,他们自愿为天空拍照并贴上标签,从而为这些额外的1,000,000张图像贡献力量。 这些图像与市议会最初给您的图像分布不同,但您认为它可以帮助您的算法。

① 你不应该将公民数据添加到训练集中,因为这会导致训练/验证/测试集分布变得不同,从而损害验证集和测试集性能

A. 【  】对

B. 【  】不对

答案:

B.【 √ 】不对

第六题

6.市议会的一名成员对机器学习知之甚少,他认为应该将1,000,000个公民的数据图像添加到测试集中,你反对的原因是:

A. 【  】这会导致验证集和测试集分布变得不同。这是一个很糟糕的主意,因为这会达不到你想要的效果

B. 【  】公民的数据图像与其他数据没有一致的x->y映射(类似于纽约/底特律的住房价格例子)

C. 【  】一个更大的测试集将减慢迭代速度,因为测试集上评估模型会有计算开销

D. 【  】测试集不再反映您最关心的数据(安全摄像头)的分布

答案:

A.【 √ 】这会导致验证集和测试集分布变得不同。这是一个很糟糕的主意,因为这会达不到你想要的效果

D.【 √ 】测试集不再反映您最关心的数据(安全摄像头)的分布

第七题

7.你训练了一个系统,其误差度如下(误差度 = 100% - 准确度):

  1. 训练集误差:4.0%
  2. 验证集误差:4.5%

① 这表明,提高性能的一个很好的途径是训练一个更大的网络,以降低4%的训练误差。你同意吗?

A. 【  】是的,因为有4%的训练误差表明你有很高的偏差。

B. 【  】是的,因为这表明你的模型的偏差高于方差。

C. 【  】不同意,因为方差高于偏差。

D. 【  】不同意,因为没有足够的信息,这什么也说明不了。

答案:

D.【 √ 】不同意,因为没有足够的信息,这什么也说明不了。

第八题

8.你让一些人对数据集进行标记,以便找出人们对它的识别度。你发现了准确度如下:

  1. 鸟类专家1 错误率:0.3%
  2. 鸟类专家2 错误率:0.5%
  3. 普通人1 (不是专家) 错误率:1.0%
  4. 普通人2 (不是专家) 错误率:1.2%

① 如果您的目标是将“人类表现”作为贝叶斯错误的基准线(或估计),那么您如何定义“人类表现”?

A. 【  】0.0% (因为不可能做得比这更好)

B. 【  】0.3% (专家1的错误率)

C. 【  】0.4% (0.3 到 0.5 之间)

D. 【  】0.75% (以上所有四个数字的平均值)

答案:

B.【 √ 】0.3% (专家1的错误率)

第九题

9.您同意以下哪项陈述?

A. 【  】学习算法的性能可以优于人类表现,但它永远不会优于贝叶斯错误的基准线。

B. 【  】学习算法的性能不可能优于人类表现,但它可以优于贝叶斯错误的基准线。

C. 【  】学习算法的性能不可能优于人类表现,也不可能优于贝叶斯错误的基准线。

D. 【  】学习算法的性能可以优于人类表现,也可以优于贝叶斯错误的基准线。

答案:

A.【 √ 】学习算法的性能可以优于人类表现,但它永远不会优于贝叶斯错误的基准线。

第十题

10.你发现一组鸟类学家辩论和讨论图像,可以得到一个更好的0.1%的性能,所以你将其定义为“人类表现”。在对算法进行深入研究之后,最终得出以下结论:

  1. 人类表现 0.1%
  2. 训练集误差 2.0%
  3. 验证集误差 2.1%

① 根据你的资料,以下四个选项中哪两个尝试起来是最有希望的?(两个选项)

A. 【  】尝试增加正则化。

B. 【  】获得更大的训练集以减少差异。

C. 【  】尝试减少正则化。

D. 【  】训练一个更大的模型,试图在训练集上做得更好。

答案:

C.【 √ 】尝试减少正则化。

D.【 √ 】训练一个更大的模型,试图在训练集上做得更好。

第十一题

11.你在测试集上评估你的模型,并找到以下内容:

  1. 人类表现 0.1%
  2. 训练集误差 2.0%
  3. 验证集误差 2.1%
  4. 测试集误差 7.0%

① 这意味着什么?(两个最佳选项)

A. 【  】你没有拟合验证集

B. 【  】你应该尝试获得更大的开发集

C. 【  】你应该得到一个更大的测试集

D. 【  】你对验证集过拟合了

答案:

B.【 √ 】你应该尝试获得更大的开发集

D.【 √ 】你对验证集过拟合了

第十二题

12.在一年后,你完成了这个项目,你终于实现了:

  1. 人类表现 0.10%
  2. 训练集误差 0.05%
  3. 验证集误差 0.05%

① 你能得出什么结论? (检查所有选项。)

A. 【  】现在很难衡量可避免偏差,因此今后的进展将会放缓。

B. 【  】统计异常(统计噪声的结果),因为它不可能超过人类表现。

C. 【  】有0.09%的进步空间,你应该很快就能够将剩余的差距缩小到0%

D. 【  】如果测试集足够大,使得这0.05%的误差估计是准确的,这意味着贝叶斯误差是小于等于0.05的。

答案:

A.【 √ 】现在很难衡量可避免偏差,因此今后的进展将会放缓。

D.【 √ 】如果测试集足够大,使得这0.05%的误差估计是准确的,这意味着贝叶斯误差是小于等于0.05的。

第十三题

13.事实证明,和平之城也雇佣了你的竞争对手来设计一个系统。您的系统和竞争对手都被提供了相同的运行时间和内存大小的系统,您的系统有更高的准确性。然而,当你和你的竞争对手的系统进行测试时,和平之城实际上更喜欢竞争对手的系统,因为即使你的整体准确率更高,你也会有更多的假阴性结果(当鸟在空中时没有发出警报)。你该怎么办?

A. 【  】查看开发过程中开发的所有模型,找出错误率最低的模型。

B. 【  】要求你的团队在开发过程中同时考虑准确性和假阴性率。

C. 【  】重新思考此任务的指标,并要求您的团队调整到新指标。

D. 【  】选择假阴性率作为新指标,并使用这个新指标来进一步发展。

答案:

C.【 √ 】重新思考此任务的指标,并要求您的团队调整到新指标。

第十四题

14.你轻易击败了你的竞争对手,你的系统现在被部署在和平之城中,并且保护公民免受鸟类攻击! 但在过去几个月中,一种新的鸟类已经慢慢迁移到该地区,因此你的系统的性能会逐渐下降,因为您的系统正在测试一种新类型的数据。

① 你只有1000张新鸟类的图像,在未来的3个月里,城市希望你能更新为更好的系统。你应该先做哪一个?

A. 【  】使用所拥有的数据来定义新的评估指标(使用新的验证/测试集),同时考虑到新物种,并以此来推动团队的进一步发展。

B. 【  】把1000张图片放进训练集,以便让系统更好地对这些鸟类进行训练。

C. 【  】尝试数据增强/数据合成,以获得更多的新鸟的图像。

D. 【  】将1,000幅图像添加到您的数据集中,并重新组合成一个新的训练/验证/测试集

答案:

A.【 √ 】使用所拥有的数据来定义新的评估指标(使用新的验证/测试集),同时考虑到新物种,并以此来推动团队的进一步发展。

第十五题

15.市议会认为在城市里养更多的猫会有助于吓跑鸟类,他们对你在鸟类探测器上的工作感到非常满意,他们也雇佣你来设计一个猫探测器。由于有多年的猫探测器的工作经验,你有一个巨大的数据集,你有100,000,000猫的图像,训练这个数据需要大约两个星期。你同意哪些说法?(选出所有正确项)

A. 【  】需要两周的时间来训练将会限制你迭代的速度。

B. 【  】购买速度更快的计算机可以加速团队的迭代速度,从而提高团队的生产力。

C. 【  】如果10,000,000个样本就足以建立一个足够好的猫探测器,你最好用10,000,00个样本训练,从而使您可以快速运行实验的速度提高约10倍,即使每个模型表现差一点因为它的训练数据较少。

D. 【  】建立了一个效果比较好的鸟类检测器后,您应该能够采用相同的模型和超参数,并将其应用于猫数据集,因此无需迭代。

答案:

A.【 √ 】需要两周的时间来训练将会限制你迭代的速度。

B.【 √ 】购买速度更快的计算机可以加速团队的迭代速度,从而提高团队的生产力。

C.【 √ 】如果10,000,000个样本就足以建立一个足够好的猫探测器,你最好用10,000,00个样本训练,从而使您可以快速运行实验的速度提高约10倍,即使每个模型表现差一点因为它的训练数据较少。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/104157.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

超级强大!送你几款Linux 下终极SSH客户端

更多IT技术,请关注微信公众号:“运维之美” 超级强大!送你几款Linux 下终极SSH客户端 1.MobaXterm2.Xshell3.SecureCRT4.PuTTY5.FinalShell6.Termius7.WindTerm 安全外壳协议(Secure Shell,简称 SSH)是一种网络连接协议…

线性代数1:线性方程和系统

Digital Collection (staedelmuseum.de) 图片来自施泰德博物馆 一、前言 通过这些文章,我希望巩固我对这些基本概念的理解,同时如果可能的话,通过我希望成为一种基于直觉的数学学习方法为其他人提供额外的清晰度。如果有任何错误或机会需要我…

【Overload游戏引擎细节分析】standard材质Shader

提示:Shader属于GPU编程,难写难调试,阅读本文需有一定的OpenGL基础,可以写简单的Shader,不适合不会OpenGL的朋友 一、Blinn-Phong光照模型 Blinn-Phong光照模型,又称为Blinn-phong反射模型(Bli…

苹果将于8月31日举行今秋的第二场发布会

在今日凌晨,苹果宣布,将于北京时间10月31日早上8点举行今秋的第二场发布会,主题为“来势迅猛”。据多方猜测苹果本次活动的核心产品大概率是搭载全新M3芯片的Mac系列产品。 据了解,在苹果的产品线中,搭载M3芯片的Mac系…

Stable Diffusion WebUI扩展canvas-zoom详细讲解

canvas-zoom这是什么? 这是一个针对画布做一些操作的工具,比如缩放等。 下面来详细说一下这些操作的热键。 重要的热键: 缩放(Alt+滚轮)、移动画布 (F)、全屏 (S) 和重置缩放 (R) (1)Shift + wheel - 缩放画布 按住Shift + 滚轮之后,一点反应都没有,之后按…

vue3检测是手机还是pc端,监测视图窗口变化

1.超小屏幕&#xff08;手机&#xff09; 768px以下 2.小屏设备&#xff08;平板&#xff09; 768px-992px 3.中等屏幕&#xff08;旧式电脑&#xff09; 992px-1200px 4.大屏设备&#xff08;现代电脑&#xff09; 1200px以上 <script setup name"welcome"> i…

Games104现代游戏引擎笔记 网络游戏架构基础

挑战1:网络同步 挑战2:是网络的可靠性&#xff0c;包括应对网络的延迟&#xff0c;丢包和掉线 挑战3: 反作弊和安全系统&#xff0c;因为网络游戏的本质是经济系统 挑战4:多样性(不同设备&#xff0c;不同服务器)&#xff0c;在不停服的情况下热更新 挑战5:大量人数时对高并发…

为什么POST请求经常发送两次?

大多数初级前端程序员&#xff0c;在通过浏览器F12的调试工具调试网络请求时&#xff0c;可能都会有一个发现&#xff0c;在进行POST请求时&#xff0c;明明代码里只请求了一次&#xff0c;为什么network里发送了两次呢&#xff0c;难道我代码出bug了&#xff1f;带着疑问点开第…

javascript原生态xhr上传多个图片,可预览和修改上传图片为固定尺寸比例,防恶意代码,加后端php处理图片

//前端上传文件 <!DOCTYPE html> <html xmlns"http://www.w3.org/1999/xhtml" lang"UTF-8"></html> <html><head><meta http-equiv"Content-Type" content"text/html;charsetUTF-8;"/><title…

npm改变npm缓存路径和改变环境变量

在安装nodejs时&#xff0c;系统会自动安装在系统盘C&#xff0c; 时间久了经常会遇到C盘爆满&#xff0c;有时候出现红色&#xff0c;此时才发现很多时候是因为npm 缓存保存在C盘导致的&#xff0c;下面就介绍下如何改变npm缓存路径。 1、首先找到安装nodejs的路径&#xff0c…

【微信小程序】实现投票功能(附源码)

一、Vant Weapp介绍 Vant Weapp 是一个基于微信小程序的组件库&#xff0c;它提供了丰富的 UI 组件和交互功能&#xff0c;能够帮助开发者快速构建出现代化的小程序应用。Vant Weapp 的设计理念注重简洁、易用和高效&#xff0c;同时提供灵活的定制化选项&#xff0c;以满足开发…

【Redis】redis 十大数据类型 概述

个人简介&#xff1a;Java领域新星创作者&#xff1b;阿里云技术博主、星级博主、专家博主&#xff1b;正在Java学习的路上摸爬滚打&#xff0c;记录学习的过程~ 个人主页&#xff1a;.29.的博客 学习社区&#xff1a;进去逛一逛~ redis十大数据类型 一、redis字符串&#xff0…

jenkins配置gitlab凭据

下载Credentials Binding插件&#xff08;默认是已经安装了&#xff09; 在凭据配置里添加凭据类型 点击保存 Username with password&#xff1a; 用户名和密码 SSH Username with private 在凭据管理里面添加gitlab账号和密码 点击全局 点击添加凭据&#xff08;版本不同…

Spring实例化源码解析之Bean的实例化(十二)

前言 本章开始分析finishBeanFactoryInitialization(beanFactory)方法&#xff0c;直译过来就是完成Bean工厂的初始化&#xff0c;这中间就是非lazy单例Bean的实例化流程。ConversionService在第十章已经提前分析了。重点就是最后一句&#xff0c;我们的bean实例化分析就从这里…

数据结构——栈与队列

目录 1. 中缀表达式转换为后缀表达式 2. 括号匹配问题 3. 栈实现队列 4. 约瑟夫环 1. 中缀表达式转换为后缀表达式 【问题描述】 输入一个中缀表达式&#xff0c;表达式中有、-、*、/四种运算以及&#xff08;、&#xff09;&#xff0c;表达式中的其他符号为大写的字母。实…

互联网Java工程师面试题·Spring篇·第五弹

目录 1、什么是 spring? 2、使用 Spring 框架的好处是什么&#xff1f; 3、Spring 由哪些模块组成? 4、核心容器&#xff08;应用上下文) 模块。 5、BeanFactory – BeanFactory 实现举例。 6、XMLBeanFactory 7、解释 AOP 模块 8、解释 JDBC 抽象和 DAO 模块。 9、…

javaEE -7(网络原理初识 --- 7000字)

一&#xff1a;网络初识 计算机的独立模式是指多台计算机在网络中相互独立运行&#xff0c;彼此之间不共享资源或信息。在早期&#xff0c;计算机主要采用独立模式&#xff0c;每台计算机都拥有自己的操作系统、应用程序和数据&#xff0c;它们之间没有直接的连接或通信。 在…

【Spring Boot 源码学习】HttpEncodingAutoConfiguration 详解

Spring Boot 源码学习系列 HttpEncodingAutoConfiguration 详解 引言往期内容主要内容1. CharacterEncodingFilter2. HttpEncodingAutoConfiguration2.1 加载自动配置组件2.2 过滤自动配置组件2.2.1 涉及注解2.2.2 characterEncodingFilter 方法2.2.3 localeCharsetMappingsCus…

【开源框架】Glide的图片加载流程

引入依赖 以下的所有分析都是基于此版本的Glide分析 //引入第三方库glide implementation com.github.bumptech.glide:glide:4.11.0 annotationProcessor com.github.bumptech.glide:compiler:4.11.0分析 Glide的使用就是短短的一行代码 Glide.with(this).load("xxx&q…

01.MySQL(SQL分类及使用)

注意&#xff1a;DML只是进行增删改&#xff0c;DQL才有查询 分类全称说明DDLData Definition Language数据定义语言&#xff0c;用来定义数据库对象&#xff08;数据库&#xff0c;表&#xff0c;字段&#xff09;DMLData Manipulation Language数据操作语言&#xff0c;用来…