【总第49篇】2.3深度学习开发任务实例(2)机器学习和深度学习的对比【大厂AI课学习笔记】

机器学习和深度学习都是用于图片分类任务的强大工具,但它们采用的方法和原理有所不同。下面我将分别解释这两种技术是如何应用于图片分类的,并着重讨论深度学习中的卷积概念。

机器学习在图片分类中的应用

传统的机器学习方法在进行图片分类时,通常依赖于手动提取的特征。这些特征可能是图像的颜色、纹理、形状等低级特征,或者是通过更复杂的方法(如SIFT、SURF、HOG等)提取的特征。提取特征后,使用分类器(如支持向量机SVM、决策树、随机森林等)对这些特征进行学习和分类。

然而,这种方法的一个主要缺点是它依赖于特征工程,即需要专家知识来设计和选择好的特征。此外,手动设计的特征可能无法捕捉到图像中的高级抽象概念,从而限制了分类器的性能。

你看到的图片,和机器看到的图片,是不同的概念。

 

要训练出一个分类器,特征点过多,如果是640*320的PRG图片,有640*320*3≈61万个特征。

 

手动提取特征,上图的+号,代表是汽车的像素,上图的-,代表不是,手工进行特征提取和分类标注。 

深度学习在图片分类中的应用

深度学习,特别是卷积神经网络(Convolutional Neural Networks,CNN),在图片分类任务中取得了显著的突破。与传统的机器学习不同,深度学习能够自动从原始图像中学习层次化的特征表示。

卷积的概念

卷积是深度学习中一个核心概念,特别是在处理图像数据时。在卷积神经网络中,卷积层负责执行卷积操作,以捕捉图像中的局部特征。

  1. 局部感知:在全连接网络中,每个神经元与前一层中的所有神经元相连。然而,在图像中,像素之间的相关性往往是局部的。因此,卷积神经网络采用局部感知的策略,即每个神经元只与输入图像的一个局部区域相连。这种连接模式通过卷积核(或滤波器)实现,卷积核在图像上滑动并计算局部区域的加权和。
  2. 权值共享:在卷积层中,同一卷积核会应用于整个图像,这意味着图像的不同位置共享相同的权值。这种权值共享的策略大大减少了网络中的参数数量,降低了过拟合的风险,并使得网络能够学习到与位置无关的特征。
  3. 特征映射:当卷积核应用于输入图像时,它会生成一个新的二维特征映射(或称为激活映射),该映射突出了图像中与卷积核匹配的特定特征。通过堆叠多个卷积层,网络能够学习到更加复杂和抽象的特征表示。

在卷积神经网络中,除了卷积层外,通常还包括池化层(用于降低特征映射的维度和增加空间不变性)、全连接层(用于分类)以及其他正则化技术(如Dropout、批量归一化等)。这些组件共同工作,使得CNN能够在图像分类任务中达到很高的性能。

深度学习和机器学习不同,是端到端的输入输出。

在线性系统里,卷积用来描述输入信息,脉冲响应和输入信息的关系。

 

卷积用图来表示,就非常清晰了。

 

移动窗口,矩阵运算“卷积和”,5*5,转换为3*3。

3*3是卷积层(卷积和)来扫描这张图,小数字是卷积和的权重。

局部像素都被同一个卷积和扫描,每个像素权重是一样的,权重共享。

权重共享:

权重共享是指在深度学习模型中多个位置或层次上使用相同的参数或权重。这意味着不同的权重共享单元将使用相同的参数来计算其输出。通过共享参数,模型可以在不同的位置共享信息,并减少整体模型的参数数量。

权重共享的原理基于一种假设,即在某些任务中,不同位置或层级的特征具有一定的相似性。例如,在图像分类任务中,对象的局部特征可以通过共享权重来识别。由于对象的不变性和相似性,许多图像区域可能具有共享参数所需的相同特征提取能力。因此,通过共享权重,模型可以更好地捕捉到这些共享特征,并以更简洁的方式表示数据。

权重共享在深度学习中有多种应用,其中最常见的是卷积神经网络(CNNs)。在CNN中,卷积层采用权重共享的方式,通过滑动窗口在图像上提取特征。通过共享滤波器参数,卷积层可以在整个输入图像上共享特征提取能力,从而大大减少了参数数量和计算复杂度。这使得CNN成为处理图像和视觉任务的强大工具。

权重共享的好处不仅仅体现在减少计算和存储需求上。它还有助于防止模型过拟合,因为共享参数可以限制模型的复杂性。此外,权重共享还可以加快模型的收敛速度,因为参数共享可以使梯度信息更好地在模型中传播。

然而,权重共享也存在一些局限性。在某些情况下,不同位置或层级的特征可能具有较大的差异性,此时强制共享权重可能会导致模型性能下降。因此,在实际应用中需要根据具体任务和数据特性来选择合适的权重共享策略。

除了CNN,权重共享还可以应用于其他类型的神经网络模型,如循环神经网络(RNN)等。此外,在自编码器、生成对抗网络(GANs)等模型中也可以通过权重共享来提取和生成数据,加强训练和生成过程。

总之,权重共享是一种有效的深度学习技术,可以在减少模型参数数量的同时提高模型的性能和效率。在实际应用中,需要根据具体任务和数据特性来选择合适的权重共享策略,并结合其他优化技术来进一步提高模型的性能。

 生成一个新的特征图。就是后面的3*3的小图。

机器学习,就是利用算法使计算机能够像人一样从数据中挖掘信息。

而深度学习,则是端到端。相比其他方法参数更多、模型更复杂,使得数据对模型理解更深、更智能。

 

总的来说,深度学习通过自动学习层次化的特征表示,避免了传统机器学习方法中繁琐的特征工程过程。而卷积神经网络作为深度学习的一种重要架构,在图像分类等视觉任务中表现出了卓越的性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/412543.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

干洗行业上门预约解决方案,干洗店洗鞋店小程序开发;

互联网干洗店洗鞋店小程序,企业干洗方案,干洗行业小程序,上门取衣小程序,预约干洗小程序,校园干洗店小程序,工厂干洗店小程序,干洗店小程序开发; 一、干洗店洗鞋店小程序核心功能介绍: 1.(支持上门取送、送货到店、寄存网点、智能衣柜四种下单方式) 用户下单-上门取…

大数据职业技术培训包含哪些

技能提升认证考试,旨在通过优化整合涵盖学历教育、职业资格、技术水平和高新技术培训等各种教育培训资源,通过大数据行业政府引导,推进教育培训的社会化,开辟教育培训新途径,围绕大数据技术人才创新能力建设&#xff0…

赛劲SEJINIGB减速机丨非标摆线减速机定制化解决方案

减速机是机械设备传动系统的核心部件,是一种能够改变转速和输出力矩的机械必备装置,在现代化工业生产中,减速机已经成为不可或缺的重要设备之一。 赛劲SEJINIGB公司自1993年成立以来,一直致力于研发、生产和销售各类高精密减速机…

将本地项目上传到svn服务端和git

一、SVN 1.创建svn库,下面生成了三个文件夹,branches指分支,trunk下可以放项目 2.在本地checkout,填入svn库的地址,因为是新建的,所以checkout的是空文件夹 把自己的项目复制到trunk下,在项目上 右键-TortoiseSVN-add add完之后 右键-svn commit 3.idea打开这个项目,将项目跟…

合并spark structured streaming处理流式数据产生的小文件

备注: By 远方时光原创,可转载,不能复制到其他平台 背景:做流批一体,湖仓一体的大数据架构,常见的做法就是 数据源->spark Streaming->ODS(数据湖)->spark streaming->…

STM32--低功耗模式详解

一、PWR简介 正常模式与睡眠模式耗电是mA级,停机模式与待机模式是uA级。 二、电源框图 供电区域有三处,分别是模拟部分供电(VDDA),数字部分供电,包括VDD供电区域和1.8V供电区域,后备供电&…

Java 学习和实践笔记(22):package(包机制)、JDK常见的包、类的导入

前面学的类,每创建一个类,在电脑上就是创建了一个对应的类文件。而package 相当于文件夹对文件的管理作用。主要用于管理类、用于解决类的重名问题。这个含义很简单。因为实际的程序,类可能有成千上万个,这样就需要把不同功能的类…

视频和音频使用ffmpeg进行合并和分离(MP4)

1.下载ffmpeg 官网地址:https://ffmpeg.org/download.html 2.配置环境变量 此电脑右键点击 属性 - 高级系统配置 -高级 -环境变量 - 系统变量 path 新增 文件的bin路径 3.验证配置成功 ffmpeg -version 返回版本信息说明配置成功4.执行合并 ffmpeg -i 武家坡20…

dpdk协议栈之udp架构优化

dpdk优势 传统网络架构与 DPDK(Data Plane Development Kit)网络架构之间存在许多区别,而 DPDK 的优势主要体现在以下几个方面: 数据包处理性能:传统网络架构中,网络数据包的处理通常由操作系统的网络协议…

测试环境搭建整套大数据系统(七:集群搭建kafka(2.13)+flink(1.14)+dinky+hudi)

一:搭建kafka。 1. 三台机器执行以下命令。 cd /opt wget wget https://dlcdn.apache.org/kafka/3.6.1/kafka_2.13-3.6.1.tgz tar zxvf kafka_2.13-3.6.1.tgz cd kafka_2.13-3.6.1/config vim server.properties修改以下俩内容 1.三台机器分别给予各自的broker_id…

网络安全与IP安全网络安全

网络安全与IP安全网络安全 网络安全 是指网络系统的硬件,软件以及系统中的数据收到的保护。 保护的基本属性为:机密性,身份认证,完整性和可用性; 基本特征:相对性,时效性,相关性…

vue3 + vite + ts 中使用less文件全局变量

文章目录 安装依赖新建css变量文件全局引入css变量文件使用css变量 一、安装依赖 npm install less less-loader --save-dev 二、新建CSS变量文件 (1) :在根目录下的src文件中 src-> asset -> css ->glibal.less // glibal.less :root{--public_background_font_Col…

Leetcoder Day23| 回溯part03:组合+分割

语言:Java/Go 39. 组合总和 给你一个 无重复元素 的整数数组 candidates 和一个目标整数 target ,找出 candidates 中可以使数字和为目标数 target 的所有不同组合 ,并以列表形式返回。你可以按任意顺序返回这些组合。 candidates 中的同一个…

LDR6020双盲插音频随便插充电听歌随便插

随着智能手机的普及和功能的日益丰富,手机已经成为我们日常生活中不可或缺的一部分。音乐、电影、游戏等娱乐内容更是丰富了手机的使用体验。而在这其中,音频转接器的作用愈发凸显,特别是在边听边充的场景下,一款高效且便捷的手机…

【底层解读】ArrayList源码学习

成员变量 学习源码前,我们还是先看一下ArrayList中成员变量有哪些 构造函数 ArrayList一共有三个构造函数。 第一个:带有指定初始容量的构造函数 第二个:空参构造 第三个:包含指定集合的构造函数 OK,看完构造函数&a…

Gemma谷歌(google)开源大模型微调实战(fintune gemma-2b)

Gemma-SFT Gemma-SFT(谷歌, Google), gemma-2b/gemma-7b微调(transformers)/LORA(peft)/推理 项目地址 https://github.com/yongzhuo/gemma-sft全部weights要用fp32/tf32, 使用fp16微调十几或几十的步数后大概率lossnan;(即便layer-norm是fp32也不行, LLaMA就没有这个问题, …

Open CASCADE学习|视图

目录 Mainwin.h Mainwin.cpp Mainwin.h ​#pragma once#include <QtWidgets/QMainWindow>#include "Displaywin.h"#include "OCC.h"class Mainwin : public QMainWindow{ Q_OBJECTpublic: Mainwin(QWidget* parent nullptr); ~Mainwin();​pri…

Python中高效的爬虫框架,你用过几个?

在信息时代&#xff0c;数据是无价之宝。许多开发者和数据分析师需要从互联网上采集大量的数据&#xff0c;用于各种用途&#xff0c;如分析、建模、可视化等。Python作为一门强大的编程语言&#xff0c;提供了多种高效的爬虫框架&#xff0c;使数据采集变得更加容易和高效。本…

IT资讯——全速推进“AI+鸿蒙”战略布局!

文章目录 每日一句正能量前言坚持长期研发投入全速推进“AI鸿蒙”战略 人才战略新章落地持续加码核心技术生态建设 后记 每日一句正能量 人总要咽下一些委屈&#xff0c;然后一字不提的擦干眼泪往前走&#xff0c;没有人能像白纸一样没有故事&#xff0c;成长的代价就是失去原来…

HashMap的put()方法执行流程

HashMap的数据结构在jdk1.8之前是数组链表&#xff0c;为了解决数据量过大、链表过长是查询效率会降低的问题变成了数组链表红黑树的结构&#xff0c;利用的是红黑树自平衡的特点。 链表的平均查找时间复杂度是O(n)&#xff0c;红黑树是O(log(n))。 HashMap中的put方法执行过…