生命在于学习——Python人工智能原理(2.1)

在这里插入图片描述

二、机器学习

1、机器学习的定义

机器学习是指从有限的观测数据中学习出具有一般性的规律,并利用这些规律对未知数据进行预测的方法,通俗的讲,机器学习就是让计算机从数据中进行自动学习,得到某种知识。
传统的机器学习主要关注如何学习一个预测模型,一般需要首先将数据表示为一组特征,特征的表示形式可以是连续的数值、离散的符号或其他形式,然后将这些特征输入到预测模型,并输出预测结果。

2、机器学习的步骤

当我们用机器学习来解决实际任务时,会面对多种多样的数据形式,比如声音、图像、文本等,不同数据的特征构造方式差异很大,对于图像这类数据,我们可以很自然的将其表示为一个连续的向量,而对于文本数据,因为其一般由离散符号组成,并且每个符号在计算机内部都表示为无异议的编码,所以通常很难找到合适的表示方式,所以在实际任务中使用机器学习模型一般会包含以下几个步骤:
在这里插入图片描述

(1)原始数据-数据预处理

经过数据的预处理,如去除噪声。

(2)特征提取

从原始数据中提取一些有效的特征,比如在图像分类中,提取边缘、尺度不变特征变换特征等。

(3)特征转换

对特征进行一定的加工,比如降维和升维,降维包括特证抽取和特征选择两种途径,常用的特征转换方法有主成分分析、现行判别分析等。

(4)预测-结果

机器学习的核心部分,学习一个函数并进行预测。

3、机器学习的特点

在这里插入图片描述

在一些复杂任务中,传统机器学习方法需要将一个任务的输入和输出之间人为的切割成很多子模块,每个子模块分开学习,比如一个自然语言理解人物,一般需要分词、词性标注、句法分析、语义分析、语义推理等步骤。
这种学习方式有两个问题,一是每个模块都需要单独优化,并且其优化目标和任务总体目标并不能保证一致。二是错误传播,即前一步的错误会对后续的模型造成很大的影响,这样就增加了机器学习方法在实际应用中的难度。
机器学习的每步特征处理以及预测一般都是分开进行的,传统的机器学习模型主要关注最后一步,即构建预测函数,但是实际操作过程中,不同预测模型的性能差不多,而前三步中的特征处理对最终系统的准确性有着十分关键的作用。
特征处理一般都需要人工干预完成利用人类的经验来选取好的特征,并最终提高机器学习系统的性能,因此,很多的机器学习问题变成了特征工程问题。

4、机器学习的相关名词

在这里插入图片描述

如果选取一些苹果。

(1)特征

包括颜色、大小、形状、产地、品牌。

(2)标签

标签可以是连续值,比如苹果的甜度、水分和成熟地。
标签也可以是炼制,比如好坏。

(3)样本

将标记好特征以及标签的苹果看作一个样本,也可以称为示例

(4)数据集

一组样本构成的集合称为数据集,一般将数据集分为两部分:训练集测试集。训练集中的样本是用来训练模型的,也叫训练样本,测试集中的样本是用来检验模型好坏的,也叫测试样本

(5)特征向量

我们通常使用一个D维向量x=[x1,x2,x3,…,xD]表示一个苹果所有特征构成的向量,称为特征向量,其中每一维表示一个特征,而苹果的标签通常用向量y表示。
假设训练集D由N个样本组成,其中每个样本都是独立同分布的,即独立的从相同的数据分布中抽取的,记为:
D={(x(1),y(1)),(x(2),y(2)),…,(x(n),y(n))}
给定训练集D,我们希望让计算机从一个函数集合F={f1(x)f2(x),…}中自动寻找一个最优的函数f*(x)来近似每个样本的特征向量x和标签y之间的真实映射关系。
如何寻找这个最优的函数f*(x)是机器学习的关键,一般需要通过学习算法来完成,这个寻找过程通常称为学习或训练过程。

5、机器学习的算法分类

在这里插入图片描述

按照训练样本提供的信息以及反馈方式的不同,将机器学习算法分为以下几类:

(1)监督学习

如果机器学习的目标是建模样本的特征x和标签y之间的关系,并且训练集中每个样本都有标签,你们这类机器学习称为监督学习,根据标签类型的不同,监督学习又可以分为回归问题、分类问题和结构化学习问题

a、回归

这类问题中的标签u是连续值,实数或连续整数,输出也是连续值。

b、分类

这类问题中的标签y是离散的类别,在分类问题中,学习到的模型也称为分类器。分类问题根据其类别数量又可以分为二分类和多分类问题。

c、结构化学习

此类问题是一种特殊的分类问题,在结构化学习中,标签y通常是结构化的对象,比如序列、数或图,由于结构化学习的输出空间比较大,因此我们一般定义一个联合特征空间,将x、y映射为该空间中的联合特征向量。

(2)无监督学习

是指从不包含目标标签的训练样本中自动学习到一些有价值的信息,典型的无监督学习问题有聚类、密度估计、特征学习、降维等。

(3)强化学习

是一类通过交互来学习的机器学习算法,在强化学习中,智能体根据环境的状态做出一个动作,并得到即时或延时的奖励。智能体在和环境的交互中不断学习并调整策略,以取得最大化的期望总回报。
监督学习需要每个样本都有标签,而无监督学习则不需要标签,一般而言,监督学习通常需要大量的有标签数据集,这些数据集一般都需要由人工进行标注,成本很高,所以也出现了很多弱监督学习和半监督学习的方法,希望从大规模的无标注数据中充分挖掘有用的信息,降低对标注样本数量的要求。
强化学习和监督学习的不同在于,强化学习不需要显式的以“输入/输出对”的方式给出训练样本,是一种在线的学习机制。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/654168.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

应用一键跳转,Xinstall助力提升用户体验

在移动互联网时代,App已成为人们日常生活中不可或缺的一部分。然而,随着App数量的激增,如何让用户更便捷地访问和使用App,成为了开发者们面临的一大挑战。在这一背景下,Xinstall作为国内专业的App全渠道统计服务商&…

滚珠花键在工业自动化领域中有什么优势?

滚珠花键是工业自动化设备中重要的传动系统之一,不仅在工业自动化系统中有着广泛的运用,还在机械制造领域、航空航天领域、工业汽车领域、工业机器人、高速铁路、新能源领域 等都得到广泛应用。由于具有高精度、高承载、耐磨损、传递扭矩大等特点&#x…

大连瓦房店市科工局副局长乔宽一行调研蓝卓

日前,瓦房店市科技和工业信息化局副局长乔宽、副局长国海军、轴承协会秘书长高钧一行莅临蓝卓调研,学习浙江数字经济发展路径,考察蓝卓数字化服务能力。蓝卓副总经理陈挺、装备汽配军团总监陈伟亮、数字化咨询总监周立斌、大连区域方案经理龚…

昆仑通态触摸屏组态软件MCGS 嵌入版V7.7.1.7老版触摸屏安装程序

1.MCGS7.7嵌入版用于昆仑通态老版本触摸屏组态开发,具体支持哪些型号组态,可以在软件的工程设置里面查看。新出的触摸屏一般用MCGS Pro版本组态开发,老版本触摸屏必须用MCGS 7.7嵌入版组态开发。 2.MCGS7.7嵌入版支持当下常用的Win7、Win10、…

AWS联网和内容分发之Transit Gateway

将Amazon VPC、AWS账户和本地网络连接到一个网关中。AWS Transit Gateway通过中央枢纽连接Amazon虚拟私有云(VPC)和本地网络。此连接简化了您的网络,并且结束了复杂的对等关系。Transit Gateway充当高度可扩展的云路由器,每个新的…

开发远程遥控情趣玩具软件,提供现成程序源码应具备哪些基础功能

以“东莞梦情智能”为参考,其提供的现成情趣玩具遥控软件程序源码,所具备哪些基础功能,看看它们如何让情趣玩具变得更加丰富多彩。 一、设备连接 设备连接是情趣玩具遥控软件的基础功能之一。“东莞梦情智能”的现成源码支持多种连接方式&am…

10、SpringBoot 源码分析 - 自动配置深度分析三

SpringBoot 源码分析 - 自动配置深度分析三 refresh和自动配置大致流程AutoConfigurationImportSelector的getAutoConfigurationEntry获取自动配置实体(重点)AutoConfigurationImportSelector的getCandidateConfigurations获取EnableAutoConfiguration类型的名字集合AutoConfig…

【ARM+Codesys案例】T3/RK3568/树莓派+Codesys锂电叠片机方案:结合CODESYS实现高效生产

锂电叠片机解决方案 乘风破浪,促进新能源行业发展 锂电池是依靠锂离子在正极与负极之间移动来达到充放电目的的一种可充电电池,具有高能量密度、高电压、寿命长、无记忆效应等优点。锂电池属于国家政策扶持的高速发展行业,近年发展快速&…

反射、类加载、代理模式

一、 反射 反射是在程序运行状态下,动态获取类的结构(属性,构造器,方法,注解),动态的创建类对象然后调用类中的属性方法。反射的起源Class,Class中包含类反射要使用的API 获取Class的…

java项目——图书管理系统

文章目录 前言图书管理系统整体框架:book包user包Main包:iooperation包总结: 前言 针对这些天所学的javaSE的知识,用一个小项目来实践一下。 图书管理系统 整体框架: 采取面向对象的思想实现此项目,首先…

RedHat9 | DNS剖析-DNS服务器综合部署

一、配置需求及网络拓扑 1、配置拓扑 2、配置需求 使用【主DNS服务器】管理meaauf.cn域和gz.meaauf.cn域;并将bj.meaauf.cn域委派给【子域DNS服务器】进行管理。在【主DNS服务器】上添加相应的A记录、别名记录、MX记录和PTR记录:【辅助DNS服务器】作为…

nginx 安全配置

1、前言 前后端分离后,nginx 作为跨域转发工具在日常应用中越来越广泛,它的安全性不能不能忽略。 2、nginx 安装相关说明 2.1 直接下载安装包 在nginx官网下载编译好的安装包,链接地址为nginx: download。如果是linux系统,直接使…

价格预言机领导者 Pyth 与 Eclipse 平台集成,为高频 DeFi 应用提供支持

本篇文章将对这一战略合作伙伴关系,以及 Pyth 网络在 Eclipse 生态系统中扮演的关键角色进行深入探讨。 目前,Pyth 价格数据已正式上线于 Eclipse 测试网。Eclipse 是首个结合了以太坊安全性、Solana 性能和 Celestia DA 的 Solana虚拟机(SVM) Layer2 方…

鸿蒙ArkUI-X跨语言调用说明:【平台桥接(@arkui-x.bridge)】

平台桥接(arkui-x.bridge) 简介 平台桥接用于客户端(ArkUI)和平台(Android或iOS)之间传递消息,即用于ArkUI与平台双向数据传递、ArkUI侧调用平台的方法、平台调用ArkUI侧的方法。 以Android平台为例,Ark…

小动物单通道麻醉机、多通道麻醉机

ZL-04A-5多通道小动物麻醉机采用英国进口的挥发罐体,国内组装而成,产品输出气体稳定。多通道小动物麻醉机无需氧气瓶,自带空气输出机,小动物麻醉机对氧气浓度有要求可以选配氧气输出机。 详情介绍: 产品特点&#xf…

模拟量4~20mA电流传感器接线方式

一、模拟量4~20mA电流传感器接线方式 无源双线制是常见的电流型传感器接线方式,它具有简单、经济的特点。其接线方式如下: 传感器的“”接到数据采集器的电源“”上, 传感器的“-”端子连接到数据采集器的“AI”端子上, 数据采集器…

VUE3+TS+elementplus+Django+MySQL实现从数据库读取数据,显示在前端界面上

一、前言 前面通过VUE3和elementplus创建了一个table,VUE3TSelementplus创建table,纯前端的table,以及使用VUE3TSelementplus创建一个增加按钮,使用前端的静态数据,显示在表格中。今天通过从后端获取数据来显示在表格…

简单介绍两个方法 学会怎样操作伦敦金

近期伦敦金价格大涨又大跌,不光吸引了多头的关注,空头也考虑入场对伦敦金进行做空操作。然而,这样去操作伦敦金的交易,是需要比较高的操作技巧的。对普通投资者来说,怎么练就这样的操作伦敦金的技巧呢? 复制…

山东大学软件学院项目实训-创新实训-基于大模型的旅游平台(二十二)- 微服务(2)

目录 4. Ribbon负载均衡 4.1 负载均衡流程 4.2 负载均衡策略 4.3 Ribbon饥饿加载 5. Nacos注册中心 5.1 服务注册到nacos 5.2 nacos服务分级存储模型 5.3 根据权重负载均衡 5.4 环境隔离--namespace 4. Ribbon负载均衡 4.1 负载均衡流程 4.2 负载均衡策略 默认实现是…

看潮成长日程表用户手册(上)

看潮成长日程表用户手册(上) 一、特色功能1、以每周日程表为主要形式2、全时管控的时间管理3、持续的日程管理4、分期间时间表5、按日排程,按周输出6、夏季作息时间处理7、年度假日处理8、休息日处理9、弹性日程10、完成记录11、多种输出形式…