【大厂AI课学习笔记】【1.6 人工智能基础知识】(2)机器学习

 

目录

必须理解的知识点:

举一个草莓的例子:

机器学习的三个类别:

监督学习:

无监督学习:

强化学习:

更多知识背景:

机器学习的诞生需求

监督学习的关键技术与实现步骤

无监督学习的关键技术与实现步骤

区别:

联系:

其他关键知识点:


(声明:以下学习笔记内容来自于腾讯云人工智能课程,本系列学习笔记,图片均来自于课件,仅做学习使用,如有异议,请联系本人删除。)

必须理解的知识点:

机器学习是对能通过经验自动改进计算机算法的研究。

机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。

人类基于经验,机器基于训练模型。

举一个草莓的例子:

机器学习就是找到草莓的不同特征维度(尺寸、颜色、成熟度)与草莓标签(酸、甜)之间的映射关系。

机器学习就是找到特征与标签之间的关系,利用算法从一类训练数据或信息中自动分析并获得该类数据或信息的规律,并利用获得的规律进行预测。

上述寻找关系和规律的过程,成为训练。结果是得到一个机器学习模型。

 

 

注意这里的标签,实际就相当于答案。这是监督学习常用的一种方法。

机器学习的三个类别:

监督学习:

是在有指导的前提下让机器进行学习,这种指导的关键是给训练数据标注好“标签“。

监督学习的目标在观察完一些事先标注过的训练数据(输入和预期输出)后,这个模型对任何可能出现的输入去预测其输出。要达到此目的,学习者必须以“合理”(归纳规律)的方式从现有的数据中一般化到未观察到的情况。在人类和动物感知中,则通常被称为概念学习。

无监督学习:

无指导的学习的过程,待训练的数据没有标签。

聚类:机器学习算法寻找共同特征,并聚合到一起。

自由的探索,所学的内容要包括理解数据本身,而不是将这种理解用于特定的任务。通往通用智能的道路,必须有无监督学习。

重点就是归纳,并不是要实现某个特定的任务和目的,因为没有人给与指导,也没有所谓的答案。所有大部分的模型,设计就是在聚类,创建数据子集。

强化学习:

强化学习(Reinforcement Learning, RL)是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。常见模型是标准的马尔可夫决策过程(Markov Decision Process, MDP)。强化学习可以分为基于模式的强化学习(model-based RL)和无模式强化学习(model-free RL),以及主动强化学习(active RL)和被动强化学习(passive RL)。求解强化学习问题所使用的算法可分为策略搜索算法和值函数(value function)算法两类。深度学习模型可以在强化学习中得到使用,形成深度强化学习。

强化学习从动物学习、参数扰动自适应控制等理论发展而来,其理论受到行为主义心理学启发,侧重在线学习并试图在探索-利用(exploration-exploitation)间保持平衡。不同于监督学习和非监督学习,强化学习不要求预先给定任何数据,而是通过接收环境对动作的奖励(反馈)获得学习信息并更新模型参数。

强化学习的诞生主要源于以下几个原因:

  1. 试错学习:强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。这种方法模拟了生物体在自然环境中的学习过程,通过不断地尝试和错误来找到最佳的行为策略。
  2. 心理学启发:强化学习理论受到行为主义心理学的启发,它强调智能体在与环境的交互过程中通过接收奖励或惩罚来学习正确的行为。这种学习方式与人类和动物的学习过程有一定的相似性。
  3. 解决复杂问题:强化学习旨在解决一些复杂的问题,如自动控制、机器人交互系统、游戏AI等。这些问题需要智能体能够根据当前环境状态选择最佳的动作,并在长期内最大化累积奖励。强化学习提供了一种有效的框架来解决这类问题。
  4. 多学科融合:强化学习涉及概率论、统计学、逼近论、凸分析、计算复杂性理论、运筹学等多学科知识。这种多学科融合使得强化学习能够充分利用各种数学工具和算法来优化学习过程和提高性能。

总的来说,强化学习的诞生是为了解决复杂问题,模拟生物体的学习过程,并通过试错和多学科融合的方法来实现智能体的自主学习和决策能力。如今,强化学习已经在许多领域取得了显著的成果,如围棋、电子游戏、机器人控制等。随着深度学习技术的发展,深度强化学习也逐渐成为研究热点,为解决更复杂的问题提供了新的思路和方法。

更多知识背景:

机器学习的诞生需求

机器学习的诞生源于对自动化和智能化的需求。随着数据量的爆炸性增长和计算能力的不断提升,传统的基于规则或手动编程的方法已无法有效处理和分析这些数据。因此,需要一种能够自动从数据中学习并改进性能的方法,这就是机器学习的核心需求。

监督学习的关键技术与实现步骤

监督学习是机器学习的一种常见范式,它通过学习输入到已知标签的映射来进行训练。关键技术包括:

  1. 特征工程:选择和构造与任务相关的特征,以便机器学习模型能够更好地理解数据。
  2. 模型选择:根据任务和数据特点选择合适的监督学习模型,如线性回归、决策树、支持向量机等。
  3. 参数调优:通过交叉验证、网格搜索等方法优化模型的超参数,以提高模型性能。
  4. 评估与选择:使用准确率、召回率、F1分数等指标评估模型的性能,并选择最佳模型。

实现步骤通常包括:

  1. 数据收集与预处理:收集相关数据并进行清洗、归一化等预处理操作。
  2. 特征提取与选择:从原始数据中提取有用的特征,并可能进行特征选择以降低维度。
  3. 模型训练:使用训练数据集对选定的监督学习模型进行训练。
  4. 模型评估与优化:使用验证数据集对模型进行评估,并根据评估结果进行模型优化。
  5. 预测与应用:使用测试数据集对模型进行最终评估,并将模型应用于实际任务中。

无监督学习的关键技术与实现步骤

无监督学习是另一种机器学习范式,它旨在从无标签的数据中学习数据的内在结构和关系。关键技术包括:

  1. 聚类分析:将数据点分组为具有相似性的簇,如K-means、层次聚类等。
  2. 降维技术:通过主成分分析(PCA)、t-SNE等方法将数据从高维空间映射到低维空间,以便可视化和处理。
  3. 关联规则学习:挖掘数据集中项集之间的有趣关系,如Apriori、FP-Growth等算法。
  4. 生成模型:学习数据的概率分布并生成新的样本,如自编码器、生成对抗网络(GAN)等。

实现步骤通常包括:

  1. 数据收集与预处理:与监督学习类似,收集相关数据并进行预处理。
  2. 特征提取与选择(可选):在某些情况下,可能需要进行特征提取或选择以改善性能。
  3. 模型选择与训练:根据任务和数据特点选择合适的无监督学习模型,并使用训练数据集进行训练。
  4. 结果解释与评估:对模型的结果进行解释和评估,以理解数据的内在结构和关系。
  5. 应用与优化:将模型应用于实际任务中,并根据需要进行优化和改进。

区别:

  1. 数据标签:监督学习需要带有标签的数据进行训练;而无监督学习则不需要标签,它试图从数据中直接学习结构和关系。
  2. 学习目标:监督学习的目标是学习输入到已知标签的映射;而无监督学习的目标是发现数据中的内在结构和关系或生成新的数据样本。
  3. 应用场景:监督学习常用于分类、回归等任务;而无监督学习常用于聚类、降维、关联规则挖掘等任务。

联系:

  1. 数据预处理:在数据预处理阶段,两者都需要对数据进行清洗、归一化等操作以提高模型性能。
  2. 特征工程:尽管在无监督学习中特征工程的重要性相对较低,但在某些情况下仍然需要进行特征提取或选择以改善性能。因此,特征工程在两者中都有一定的应用。
  3. 模型评估与优化:无论是监督学习还是无监督学习,都需要对模型进行评估和优化以提高性能。评估指标和方法可能因任务而异,但优化的目标是相似的。
  4. 同时使用:在某些复杂任务中,可能会同时使用监督学习和无监督学习。例如,可以先使用无监督学习对数据进行聚类或降维处理,然后再使用监督学习对处理后的数据进行分类或回归任务。这种结合可以充分利用两者的优势并提高整体性能。

其他关键知识点:

  1. 深度学习:深度学习是机器学习的一个子领域,它利用深度神经网络来模拟人类的学习过程。深度学习在计算机视觉、自然语言处理等领域取得了显著的成果,是当前人工智能研究的重要方向之一。了解深度学习的基本原理、常见模型(如CNN、RNN、GAN等)以及应用场景是非常必要的。

  2. 强化学习:强化学习是机器学习的另一个重要范式,它旨在让智能体在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标。强化学习在游戏AI、自动控制等领域有广泛的应用前景。了解强化学习的基本原理、常见算法(如Q-learning、Policy Gradient等)以及应用场景也是非常重要的。

  3. 数据科学与大数据处理技术:随着大数据时代的到来,数据处理和分析技术变得越来越重要。了解数据科学的基本概念、数据清洗与预处理技术、数据挖掘与分析方法以及大数据处理平台(如Hadoop、Spark等)是非常有帮助的。这将有助于更好地理解和应用机器学习算法,并解决实际问题中的数据挑战。

  4. 可解释性与透明性:随着机器学习模型在许多领域的应用越来越广泛,模型的可解释性和透明性也变得越来越重要。了解如何解释机器学习模型的预测结果、评估模型的可靠性以及识别潜在的偏见和错误是非常关键的。这将有助于建立更加可信和负责任的人工智能系统。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/383606.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【教学类-48-03】202402011“闰年”(每4年一次 2月有29日)世纪年必须整除400才是闰年)

2000-2099年之间的闰年有25次, 背景需求: 已经制作了对称年月的数字提取,和年月日相等的年份提取 【教学类-48-01】20240205对称的“年”和“月日”(如2030 0302)-CSDN博客文章浏览阅读84次。【教学类-48-01】202402…

可达鸭二月月赛——入门赛第四场T4题解

name 王胤皓 AC 记录 Problem Ideas 用一个字符串进行输入,第二个字符串赋值为第一个字符串,然后把第二个字符串进行翻转,第一个字符串称为 s s s,第二个字符串称为 s 2 s2 s2。 再用另外一个存储字典序最小的字符串&#xf…

中科大计网学习记录笔记(九):DNS

前言: 学习视频:中科大郑烇、杨坚全套《计算机网络(自顶向下方法 第7版,James F.Kurose,Keith W.Ross)》课程 该视频是B站非常著名的计网学习视频,但相信很多朋友和我一样在听完前面的部分发现信…

opencv图像像素的读写操作

void QuickDemo::pixel_visit_demo(Mat & image) {int w image.cols;//宽度int h image.rows;//高度int dims image.channels();//通道数 图像为灰度dims等于一 图像为彩色时dims等于三 for (int row 0; row < h; row) {for (int col 0; col < w; col) {if…

EMC学习笔记(二十四)降低EMI的PCB设计指南(四)

降低EMI的PCB设计指南&#xff08;四&#xff09; 1.电路板分区2.信号走线2.1 电容和电感串扰2.2 天线2.3 端接和传输线2.4输入端的阻抗匹配 tips&#xff1a;资料主要来自网络&#xff0c;仅供学习使用。 1.电路板分区 电路板分区与电路板平面规划具有相同的基本含义&#x…

【深度学习每日小知识】全景分割

全景分割 全景分割是一项计算机视觉任务&#xff0c;涉及将图像或视频分割成不同的对象及其各自的部分&#xff0c;并用相应的类别标记每个像素。与传统的语义分割相比&#xff0c;它是一种更全面的图像分割方法&#xff0c;传统的语义分割仅将图像划分为类别&#xff0c;而不…

集群及LVS简介、LVSNAT模式原理、LVSNAT模式配置、LVSDR模式原理、LVSDR模式配置、LVS错误排查

目录 集群 LVS 配置LVS NAT模式步骤 LVS DR模式 配置LVS DR模式 集群 将很多机器组织到一起&#xff0c;作为一个整体对外提供服务 集群在扩展性、性能方面都可以做到很灵活 集群分类&#xff1a; 负载均衡集群&#xff1a;Load Balance高可用集群&#xff1a;High Avai…

flask+python高校学生综合测评管理系统 phl8b

系统包括管理员、教师和学生三个角色&#xff1b; 。通过研究&#xff0c;以MySQL为后端数据库&#xff0c;以python为前端技术&#xff0c;以pycharm为开发平台&#xff0c;采用vue架构&#xff0c;建立一个提供个人中心、学生管理、教师管理、课程类型管理、课程信息管理、学…

CSS基础---新手入门级详解

CSS:层叠样式表 CSS&#xff08;Cascading Style Sheets,层叠样式表&#xff09;&#xff0c;是一种用来为结构化文档添加样式&#xff08;字体、间距和颜色&#xff09;的计算机语言&#xff0c;css扩展名为.css。 实例: <!DOCTYPE html><html> <head><…

ubuntu中尝试安装ros2

首先&#xff0c;ubuntu打开后有个机器人栏目&#xff0c;打开后&#xff0c;有好多可选的&#xff0c;看了半天 ,好像是博客&#xff0c;算了&#xff0c;没啥关系&#xff0c;再看看其他菜单 这些都不是下载链接。先不管&#xff0c;考虑了一下&#xff0c;问了ai&#xff…

板块一 Servlet编程:第二节 Servlet的实现与生命周期 来自【汤米尼克的JAVAEE全套教程专栏】

板块一 Servlet编程&#xff1a;第二节 Servlet的实现与生命周期 一、Servlet相关概念Serlvet的本质 二、中Web项目中实现Servlet规范&#xff08;1&#xff09;在普通的Java类中继承HttpServlet类&#xff08;2&#xff09;重写service方法编辑项目对外访问路径 二、Servlet工…

LeetCode.144. 二叉树的前序遍历

题目 144. 二叉树的前序遍历 分析 这道题目是比较基础的题目&#xff0c;我们首先要知道二叉树的前序遍历是什么&#xff1f; 就是【根 左 右】 的顺序&#xff0c;然后利用递归的思想&#xff0c;就可以得到这道题的答案&#xff0c;任何的递归都可以采用 栈 的结构来实现…

[C++] opencv + qt 创建带滚动条的图像显示窗口代替imshow

在OpenCV中&#xff0c;imshow函数默认情况下是不支持滚动条的。如果想要显示滚动条&#xff0c;可以考虑使用其他库或方法来进行实现。 一种方法是使用Qt库&#xff0c;使用该库可以创建一个带有滚动条的窗口&#xff0c;并在其中显示图像。具体步骤如下&#xff1a; 1&…

使用PyOD进行异常值检测

异常值检测各个领域的关键任务之一。PyOD是Python Outlier Detection的缩写&#xff0c;可以简化多变量数据集中识别异常值的过程。在本文中&#xff0c;我们将介绍PyOD包&#xff0c;并通过实际给出详细的代码示例 PyOD简介 PyOD为异常值检测提供了广泛的算法集合&#xff0c…

【Rust】使用Rust实现一个简单的shell

一、Rust Rust是一门系统编程语言&#xff0c;由Mozilla开发并开源&#xff0c;专注于安全、速度和并发性。它的主要目标是解决传统系统编程语言&#xff08;如C和C&#xff09;中常见的内存安全和并发问题&#xff0c;同时保持高性能和底层控制能力。 Rust的特点包括&#x…

C++构造和折构函数详解,超详细!

个人主页&#xff1a;PingdiGuo_guo 收录专栏&#xff1a;C干货专栏 大家龙年好呀&#xff0c;今天我们来学习一下C构造函数和折构函数。 文章目录 1.构造函数 1.1构造函数的概念 1.2构造函数的思想 1.3构造函数的特点 1.4构造函数的作用 1.5构造函数的操作 1.6构造函数…

洗地机哪个品牌最耐用质量好?耐用的洗地机型号

相较于传统的打扫方式&#xff0c;洗地机的出现可以称得上是懒人福音。一台洗地机就能包办吸、扫、拖所有清洁步骤&#xff0c;节省了大量的打扫时间。不过最近几年洗地机行业涌入的品牌属实有些鱼龙混杂了&#xff0c;至于型号就更是乱七八糟&#xff0c;稍不留神就会白白花了…

深度学习之线性模型

深度学习之线性模型 y w * x模型思路 y w * x b模型思路 y w * x模型 思路 这里求权重w , 求最适合的权重&#xff0c;就是求损失值最小的时候 这里用穷举法:在一个范围内&#xff0c;列出w的所有值&#xff0c;并且计算出每组数据的平均损失值,以w 为横坐标, 损失值为纵坐…

【射影几何15】python双曲几何工具geometry_tools

目录 一、说明二、​环境问题&#xff1a;如何安装三、实现一个简单的例子四、绘制双曲组五、使用有限状态自动机加快速度六、资源和代码 一、说明 Geometry_tools 是一个 Python 包&#xff0c;旨在帮助您处理和可视化双曲空间和射影空间上的群动作。 该包主要构建在 numpy、…

C语言求解猴子分桃子

问题&#xff1a;海滩上有一堆桃子&#xff0c;五只猴子来分。第一只猴子把这堆桃子平均分为五份&#xff0c;多了一个&#xff0c;这只 猴子把多的一个扔入海中&#xff0c;拿走了一份。第二只猴子把剩下的桃子又平均分成五份&#xff0c;又多了 一个&#xff0c;它同样把多的…