【class】人工智能初步(了解深度学习)

任务二:对电脑图像的智能识别和自动分类之前

在实现对电脑图像的智能识别和自动分类之前,本节课我们先学习两个知识点:
1. 计算机如何看世界?
揭秘计算机眼中的图像
2. 计算机如何理解世界?
揭秘图像识别、深度学习

计算机眼中的图像

在计算机的眼睛里,这个精彩的世界只是一堆死板的数字。如果将一幅图像放大 🔍 ,我们可以看到它是由一个个小方格组成的,每个小方格是一个色块。这个小方格我们叫它--像素。

像素

定义

像素(缩写为px)是图像中的最小单位,由一个个小方格组成。这些小方格都有一个固定的位置和颜色,共同决定了图像所呈现出来的样子。(每个像素都有一个固定的位置和颜色,共同决定了图像所呈现出来的样子。

这些小方格的行数与列数又被叫做分辨率
我们常说的某幅图像的分辨率是1280(长)×720(宽),指的就是这张图中的每一行都有1280个像素,每一列都有720个像素。

图像分辨率

定义

图像分辨率指图像中存储的信息量,是每英寸图像内有多少个像素点。因此,图像分辨率和图像的像素有直接的关系。

         

图像分辨率的表达方式为: 水平像素数×垂直像素数长宽比通常是4:3,用于确定组成一幅图像的像素数目。例如,一张分辨率为640×480的图像,就达到了约30万像素;同样的,一张分辨率为1600×1200的图像,将达到约200万像素。

图像分辨率决定图像的质量。对于同样尺寸的一幅图,如果图像分辨率越高,则组成该图的图像像素数目越多,像素点也越小,图像越清晰、逼真,印刷的质量也就越好。当然,这也会增加文件占用的存储空间

            

总结:

如果我们用不同的数字来表示不同的颜色,图像就可以表示为一个数字表,这就是计算机所看到的。该如何让计算机理解庞大的视觉信息,学会看懂这个世界呢?不妨来看看,人类是如何做到的。

我们生活在读图时代,身边充斥着各种视觉信息。我们的眼睛好比相机镜头负责采集图像,而进行识别和理解图像的则是大脑。例如,我们能轻易地分辨出生活中常见的事物。

但其实分辨对人类来说也并非易事。古有《史记》中记载,有奸臣赵高指鹿为马,混淆是非,成为笑谈。面对陌生的事物,我们也很难认清。识别陌生的事物要比识别出猫 🐱 或者飞机 这些常见的事物困难多了。
我们的视觉能力究竟是如何形成的?

人类拥有今天的视觉能力其实是大自然长期训练的结果。但对计算机来说,所有的事物都是陌生的。如何像人类一样,拥有识别和理解图像的视觉能力?这就是图像识别的任务。

图像识别

定义

图像识别是利用计算机对图像进行处理、分析和理解,从而识别出各种不同物体的技术。图像识别通常以图像的主要特征为基础。

隐喻

正如在生活中,我们能识别出飞机、人、汽车、交通标志等等,并且还能把收集到的信息做更多的处理。

在图像识别的原理上,计算机和人类并没有本质的区别
当人类在识别某种物品的时候,也不单单是凭借这个物品存储在脑海中的记忆来识别的。
一般都是依靠事物本身所具有的特征,先将它进行分类。

总结:

计算机如何实现图像识别?
我们不妨来想象一下这个过程:
1. 给计算机看一些特定的图像,比如猫;
2. 用编程的语言告诉计算机这样一句话:
🐱 有着圆脸,胖身子,两个尖尖的耳朵和一条长尾巴。

倘若到这里,计算机已经记住了🐱 的特征并且能够根据这个特征识别出猫了。
接下来,如果遇到这样的猫呢?
可能会识别失败。因为图中猫的侧面遮挡严重,缺少圆脸、两个尖尖的耳朵这些特征,计算机无法根据猫的特征作出判断。

同样的,如果遇到这些猫也可能会识别失败。
因为它们不能同时满足圆脸,胖身子,两个尖尖的耳朵和一条长尾巴这些特征一旦特征不匹配,识别的效果就会大打折扣。可见,这个过程非常依赖人为对图像特征的提取。

例子:

比较  猫咪  小鸟  飞机  汽车

灵感缪斯

直到一个有趣的事实引起了大家的注意:人类幼崽大约2岁就能识别各类物体了,他是如何做到的?
我们的眼球转动一次的平均时间是200毫秒,如果把这每一次转动比作按下一次相机快门的话,一个2岁左右的孩子,已经看过上亿张现实世界的图片了。
显然,上亿张图片是一个海量的数据集。

从这个角度来看,能发现什么 🤔
或许不是我们的研究方法不行 🙅 ,而是实验数据出了问题,数据量太少了,导致实验效果不好?
带着这个疑惑,李飞飞教授和实验室成员在2007年开始了一项伟大的工作--建立ImageNet数据集

ImageNet约包含1500张图片和2.2个类别,是目前世界上图像识别最大的数据库。
它的出现改变了数据集的地位,人们开始意识到:
在人工智能领域,数据和方法一样重要。
数据就像燃料,推动着人工智能这枚火箭不断前进。

那计算机能自动学习特征吗?
答案是肯定的。
深度学习的出现解决了这个问题。
人类终于找到了处理“抽象概念”这个亘古难题的方法。

深度学习

定义

深度学习是一种在表达能力上灵活多变,同时又允许计算机不断尝试,直到最终逼近目标的机器学习方法。
它能学习样本数据的内在规律和表示层次,能自动从图像中学习有效的特征。

隐喻

就像我们在做题过程中,能不断地通过刷题获得解题方法和技巧一样。

深度学习来源于人工神经网络,之所以叫深度”是因为它自身由许多不同的层组成。第一层一般以图像为输入,通过特定的运算从图像中提取特征。

接下来,每一层以前一层提取出的特征为输入,对其进行特定形式的变换,便可以得到更复杂一些的特征。

经过很多层的变换之后,这种结构就可以组合原始图像中的低层特征形成更加抽象的高层特征。
这种由简单到复杂、由低级到高级的抽象过程,可以通过生活中的例子来体会。
例如,人脸识别。

这种层次化的特征提取过程可以累加,赋予深度学习强大的特征提取能力。因此,深度学习更有能力发现大数据中隐含的复杂结构。

深度学习能发现大数据集中更复杂的数据关系

深度学习的深度是指网络结构的层数有很多

深度学习的最终目标是让机器能够像人一样具有分析学习能力

  1. 深度学习是机器学习的一个特定分支。
    B. 传统的机器学习才依赖于人工提取特征。
    D. 机器学习能解决的问题更多,对于一些简单分析和处理,机器学习更高效。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/623309.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

图像质量评价指标:了解图像质量的度量方式

图像质量评价指标:了解图像质量的度量方式 在图像处理和计算机视觉领域,评价图像质量的准确性对于许多应用至关重要。通过合适的评价指标,我们可以量化图像的质量,从而更好地了解图像处理算法的效果和改进空间。本文将介绍图像质…

单链表经典算法OJ题---力扣21

1.链接:. - 力扣(LeetCode)【点击即可跳转】 思路:创建新的空链表,遍历原链表。将节点值小的节点拿到新链表中进行尾插操作 遍历的结果只有两种情况:n1为空 或 n2为空 注意:链表为空的情况 代…

程序员的神奇应用:从代码创造到问题解决的魔法世界之持续集成/持续部署

文章目录 持续集成/持续部署 在软件开发的海洋中,程序员的实用神器如同航海中的指南针,帮助他们导航、加速开发、优化代码质量,并最终抵达成功的彼岸。这些工具覆盖了从代码编写、版本控制到测试和部署的各个环节。 在当今数字化的世界里&…

GEE获取年均LAI(叶面积指数)和FPAR(光合有效辐射分量)

MODIS/061/MOD15A2H 组合了叶面积指数 (LAI) 和光合有效辐射分数 (FPAR) 产品是分辨率为 500m 的 8 天复合数据集。该算法从Terra传感器8天内的所有采集数据中选择了“最佳”像元。 var table ee.FeatureCollection("users/yipeizhao736/HefeiProvince"); var coll…

【C++初阶】第十一站:list的介绍及使用

目录 list的介绍及使用 1.list的含义 2.list的介绍 3.list的使用 1.list的构造 2.list iterator的使用 3.list capacity 4.list element access 5 list modifiers 尾插尾删 和 头插头删 insert 和 erase resize swap clear 6.list sort and reverse 7.list copy vector copy li…

设计一个游戏的基本博弈框架

设计一个游戏的基本博弈框架,玩家通过操作改变某个数值,这个数值的变动会引发一系列实时变化,并且当这些数值累计到特定阈值时,会导致游戏中出现其他变化,可以分为以下几个步骤: 1. 确定游戏类型和主题 首…

GH263-045、GH263-035比例阀用电磁铁驱动放大器

GH263-045、GH263-035比例阀用电磁铁用于比例变量泵和油马达的控制,通过改变比例阀芯位置,可实现对比例变量泵的输出流量或油马达 转矩和转速的无级调节和远程控制,驱动电流分为GH263-035(0.68A)/GH263-045&#xff08…

未授权访问:Docker未授权访问漏洞

目录 1、漏洞原理 2、环境搭建 3、未授权访问 4、通过crontab反弹宿主机shell 防御手段 今天继续学习各种未授权访问的知识和相关的实操实验,一共有好多篇,内容主要是参考先知社区的一位大佬的关于未授权访问的好文章,还有其他大佬总结好…

五、Linux二进制安装MariaDB 六、MariaDB主从复制

目录 五、Linux二进制安装MariaDB1 卸载mariadb1.1 卸载相关的服务(mysql和mariadb都查询一下)1.2 查找MySQL和mariadb相关的文件目录 2 安装mariadb2.1 mariadb下载地址2.2 将安装包放入到服务器中并解压 (我放到opt下)2.3 将解压后的目录移动到安装目录下2.4 创建数据目录(根…

miniconda环境管理器安装及jupyter下载

1.miniconda简介 Miniconda是一款小巧的python环境管理工具,安装包大约只有50M多点,其安装程序中包含conda软件包管理器和Python。一旦安装了Miniconda,就可以使用conda命令安装任何其他软件工具包并创建环境等。 2.下载miniconda 查看需要的…

虚拟数字人及AI相关应用分享

一、虚拟数字人 1、简介 虚拟数字人可分为基础类和仿真智能类。可用于直播的,一般是仿真智能类;基础类动作缓慢,体验差,很容易被直播平台封号。 目前各大短视频平台上介绍的数字人,出于营销目的,有夸大宣传…

基于单片机的直流电机测速装置研究与设计

摘要: 基于单片机的直流电机测速装置采用了对直流电机的中枢供电回路串联取样电阻的方式实现对电机转速的精确实时测量。系统由滤波电路、信号放大电路、单片机控制电路以及稳压电源等功能模块电路构成。工作过程中高频磁环作为载体,利用电磁感应的基本原理对直流电…

Redis-持久化操作-RDB

Redis持久化 由于Redis的数据都存放在内存中,如果没有配置持久化,Redis重启后数据就全丢失了,于是需要开启 Redis的持久化功能,将数据保存到磁盘上,当Redis重启后,可以从磁盘中恢复数据。 Redis提供了两个…

利用一段代码轻松绕过PHP授权系统

第一步&#xff1a;首先你需要改名全局文件 比如说全局文件 common.php&#xff0c;那么 你将他改为core.php 第二步&#xff1a;创建文件 创建一个文件&#xff0c;和改名前的全局文件名称一样&#xff0c;然后把以下代码复制进去就OK了 代码如下&#xff1a; <?php…

免费分享一套SpringBoot+Vue教务管理(课程管理)系统,帅呆了~~

大家好&#xff0c;我是java1234_小锋老师&#xff0c;看到一个不错的SpringBootVue教务管理(课程管理)系统&#xff0c;分享下哈。 项目视频演示 【免费】SpringBootVue教务管理(课程管理)系统 Java毕业设计_哔哩哔哩_bilibili【免费】SpringBootVue教务管理(课程管理)系统 …

html5的一些新特性

最近总是碰到html5特性这种问题,虽然简单,但是也是自己平时不关注的东西,趁今天时间充裕,那就来总结一下吧 HTML5新特性包括新增了部分标签、表单元素增强、支持视频和音频、支持canvas绘图、提供web存储、提供地理定位功能、提供web workers机制、提供web socket协议、提供CS…

Django 安全性与防御性编程:如何保护 Django Web 应用

title: Django 安全性与防御性编程&#xff1a;如何保护 Django Web 应用 date: 2024/5/13 20:26:58 updated: 2024/5/13 20:26:58 categories: 后端开发 tags: CSRFXSSSQLUploadHTTPOnlyPasswordSession 跨站请求伪造&#xff08;CSRF&#xff09; 跨站请求伪造&#xff0…

【HarmonyOS】笔记八-图片处理

概念 开发者经常需要在应用中显示一些图片&#xff0c;例如&#xff1a;按钮中的icon、网络图片、本地图片等。在应用中显示图片需要使用Image组件实现&#xff0c;Image支持多种图片格式&#xff0c;包括png、jpg、bmp、svg和gif&#xff0c;该接口通过图片数据源获取图片&am…

垃圾回收器

首先先来回答一下上篇文章中最后留给大家的问题&#xff1a; 为什么分代GC算法要把堆分为年轻代和老年代&#xff1f; 系统中的大部分对象&#xff0c;都是创建出来之后很快就不再使用可以被回收&#xff0c;比如用户获取订单数据&#xff0c;订单数据返回给用户之后就可以释放…

【软考高项】四十五、项目管理科学计算之工程经济学

一、资金的时间价值与等值计算的概念 1、资金的时间价值是指不同时间发生的等额资金在价值上的差别。 2、把资金存入银行,经过一段时间后也会产生增值,这就是利息。 例如,在年利率为5.22%条件下&#xff0c;当年的100元与下一年的105.22元是等值的,即100 &#xff08;15.22%&a…