1. 人工智能中的相关术语的概述

1.1 机器学习的概念:机器学习是指从有限的观测数据中学习出具有一般性的规律,并利用这些规律对未知数据进行预测的方法。机器学习可以分为监督学习,无监督学习和强化学习。

        传统的机器学习主要关注于如何学习一个预测模型。一般需要首先将数据表示为一组特征(feature),然后将这些特征输入到预测模型,并输出预测结果。这类机器学习可以看作是浅层学习,其特征主要依靠人工经验或特征转换的方法来抽取。在实际任务中使用机器学习模型的步骤如下图所示:

图1.机器学习模型的使用流程 

        其中,1.数据预处理:去噪声,标准化;2.特征提取:从原始数据中提取有效特征,例如图像边缘和尺度不变特征变换等; 3.特征转换:特征加工,升维和降维等; 4. 预测:核心部分,学习一个函数进行预测。

        在机器学习的过程中,特征工程问题十分重要,它很大程度上决定了任务的性能上限。一般来说在实际任务中,不同模型的性能的相差不多,而是前三步的处理对准确性起着关键的作用。

1.2 表示学习的概念: 将输入信息转换为有效的特征,或者更一般性的称为表示。如果有一种算法可以自动地学习出有效的特征,并提高最终机器学习模型的性能,那么这种学习就可以叫做表示学习(Representation Learning)。

        语义鸿沟问题是指输入数据的底层特征和高层语义信息之间的不一致性和差异性,比如给出几张“猫”的照片,这些照片在像素级别上的差异性会非常大,我们理解这些照片为猫是在高层语义概念上的,如果一个预测模型直接建立在底层特征之上,则对模型的预测能力要求过高。如果可以有一个好的表示在一定程度上可以反映出数据的高层语义特征,那就可以比较容易建立出较好的机器学习模型。

        在机器学习中,特征有两种常用表示方式:局部表示和分布式表示。一个比较常见的局部表示方法就是one-hot向量。这种表示方法的优势是具有较好的解释性,有利于人工归纳和总结并进行特征组合,计算效率较高。但缺点是不同特征之间的相似度为0,且特征维度扩展的成本很高。

         我们可以使用神经网络来将高维的局部表示空间映射到一个非常低维的分布式表示空间。在这个低维空间中,每个特征不再是坐标轴上的点,而是分散在整个低维空间,这个过程称为嵌入。在低维的嵌入空间中,每个特征不在坐标轴上,特征之间可以计算相似度。

1.3 深度学习的概念: 为了学习一种好的表示,需要构建具有一定深度的模型,并通过学习算法来让模型自动学习出好的特征表示(从底层特征,到中层特征,再到高层特征),从而提高模型的预测准确率。所谓的“深度”就是指原始数据进行非线性特征转换的次数。深度学习是机器学习的一个子问题,主要目的是从数据中自动学习到有效的特征表示。

        深度学习通过多层特征变换,将原始数据变成更高层次,更抽象的表示,这些学习到的特征可以替代人工设计的特征,避免“特征工程”。深度学习需要解决的关键问题是贡献度分配问题,即一个系统中的不同参数或者组件对其最终输出结果的影响。深度学习可以看作是一种强化学习,每个组件并不能直接得到监督信息,需要通过整个模型的最终监督信息得到。

        深度学习中的误差反向传播算法可以很好的解决贡献度分配问题。超过一层的神经网络都可以看作是深度学习模型,随着模型深度的不断增加,其特征表示的能力也逐渐加强,使得后续的预测变得更加容易。

1.4 端到端学习的概念:是指在学习过程中不进行分模块或者分阶段训练,直接优化任务的总体目标,在端到端学习中,一般不需要明确地给出不同模块或阶段的功能,中间过程不需要人为干预,训练数据为“输入-输出”对的形式,此外无需提供其它额外信息。

1.5 神经网络的概念:一种模仿人脑神经系统的数学模型。在机器学习领域,神经网络是指由很多人工神经元构成的网络结构模型,这些人工神经元之间的连接强度是可学习的参数。

        一个人的智力不完全由遗传决定,大部分来自于生活经验,也就是说人脑神经网络是一个具有学习能力的系统。在人脑神经网络中,每个神经元本身并不重要,重要的是神经元如何组成网络。不同神经元之间的突触有强有弱,其强度可以通过学习(训练)来不断改变,具有一定的可塑性。人脑的记忆分为两种,长期记忆和短期记忆,其中长期记忆的突触强度非常强。人脑神经元的结构如下:

         人工神经网络从结构、实现机理和功能上模拟人脑神经网络,它和生物神经元类似,由多个节点(人工神经元)相互连接而成,可以用来对数据之间的复杂关系进行建模。不同节点之间的连接被赋予了不同的权重,每个权重代表了一个节点对另一个节点的影响大小。

        感知器是最早的具有机器学习思想的神经网络,但其学习方法无法扩展倒多层的神经网络上。直到1980年,反向传播算法(BackPropagation, BP)才解决了多层神经网络的学习问题,称为最为流行的神经网络学习算法。

        人工神经网络可以看作是一个通用的函数逼近器,理论上只要有足够的训练数据和神经元数量,人工神经网络可以逼近任意的函数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/712024.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【教程】学会用PS做海报(教你如何套模板+模板资源),以研电赛展架为例

网上的视频都是好几十个小时,看起来很耗费时间,其实做海报,展架只用到其中的一部分功能,本文会进行讲解 这里写目录标题 去年研电赛做的展架1.首先打开比赛给的展板照片,按照研电赛要求设置大小2.调出ps的几个窗口&am…

苹果发布云AI系统;谷歌警告0day漏洞被利用;微软紧急推迟 AI 召回功能;劫持活动瞄准 K8s 集群 | 网安周报0614

苹果发布私有云计算,开创 AI 处理新时代,隐私保护再升级! 苹果宣布推出一个名为“私有云计算”(PCC)的“开创性云智能系统”,该系统专为在云中以保护隐私的方式处理人工智能(AI)任务…

【数学竞赛】阿里巴巴全球数学竞赛(附2019-2024年试题+答案)

阿里巴巴全球数学竞赛对所有年龄、背景和职业的个人开放。迄今为止,最年长的参赛者超过80岁,最年轻的仅8岁。 2024年共计801名选手参加比赛,涟水这中专的姜萍获得了全球12名的出众成绩,港中大也抛出了橄榄枝。 初赛注重享受数学之…

【Linux内核】伙伴系统算法和slab分配器(1)

【Linux内核】伙伴系统算法和slab分配器(1) 目录 【Linux内核】伙伴系统算法和slab分配器(1)伙伴系统(buddy)算法伙伴系统算法基本原理内存申请内存回收 接口函数源码分析内存分配接口物理内存释放接口规范…

【TypeScript】类型兼容(协变、逆变和双向协变)

跟着小满zs 学习 ts,原文:学习TypeScript进阶类型兼容_typescript进阶阶段类型兼容 小满-CSDN博客 类型兼容,就是用于确定一个类型是否能赋值给其他的类型。如果A要兼容B 那么A至少具有B相同的属性。 // 主类型 interface A {name: string,a…

【游戏】一款纯web集前后端为一体的沙盒游戏框架介绍

1.biomes-game是什么? 一款基于MIT协议开源沙盒 MMORPG。游戏中可建造、采集、玩迷你游戏等等,所有操作均可通过浏览器完成。它主要使用React框架,前后端用 Typescript 和 WebAssembly 编写。 2.如何本地体验? 配置:…

计算机网络 —— 一文搞懂TCP/UDP

传输层:TCP/UDP 1. TCP1.1 TCP连接管理1.2 TCP首部格式 2. UDPUDP首部格式 3. 其他传输层协议3.1 SCTP3.2 DCCP 传输层实现源端主机和目标端主机上对等实体间会话,TCP/IP中两个代表性的传输层协议分别是TCP和UDP,两者均使用端口来标识传输数据…

数据防泄漏的六个步骤|数据防泄漏软件有哪些

在当前复杂多变的网络安全环境下,数据防泄漏软件成为了企业信息安全架构中不可或缺的一环。下面以安企神软件为例,告诉你怎么防止数据泄露,以及好用的防泄露软件。 1. 安企神软件 安企神软件是当前市场上备受推崇的企业级数据防泄漏解决方案…

为什么微信输入法是比搜狗输入法更好的选择?

微信输入法官网:https://z.weixin.qq.com/ 最近使用搜狗输入法时,频繁弹出广告,实在令人烦恼,于是我干脆卸载了它。然而,电脑上没有输入法是不行的。经过在网上对比了许多输入法软件后,我发现了微信输入法。…

算法:分治(快排)题目练习

目录 题目一:颜色分类 题目二:排序数组 题目三:数组中的第k个最大元素 题目四:库存管理III 题目一:颜色分类 给定一个包含红色、白色和蓝色、共 n 个元素的数组 nums ,原地对它们进行排序,…

红队攻防渗透技术实战流程:中间件安全:JettyJenkinsWeblogicWPS

红队攻防渗透实战 1. 中间件安全1.1 中间件-Jetty-CVE&信息泄漏1.2 中间件-Jenkins-CVE&RCE执行1.2.1 cve_2017_1000353 JDK-1.8.0_291 其他版本失效1.2.2 CVE-2018-10008611.2.3 cve_2019_100300 需要用户帐号密码1.3 中间件-Weblogic-CVE&反序列化&RCE1.4 应…

驱动开发(四):Linux内核中断

驱动开发系列文章: 驱动开发(一):驱动代码的基本框架 驱动开发(二):创建字符设备驱动 驱动开发(三):内核层控制硬件层 驱动开发(四&#xf…

2024FIC决赛

容器密码:2024Fic~Competition~Finals杭州&Powered~By~HL! 案件背景: 2023年3月15日凌晨,受害人短视频平台上看到一段近期火爆的交通事故视频,留言后有人通过私信联系,称有一个赚大钱的机会,该人自称李某,提议让…

如何通过抖音自动评论精准获客实现业务增长?这些方法值得一试!

在当今竞争激烈的商业环境中,企业若想脱颖而出,就必须掌握精准获客的艺术。精准获客,即通过精确的市场定位和营销策略,吸引并保留最有可能成为客户的目标群体。它不仅能提高转化率,还能有效降低营销成本,是…

实况:老菜鸟自力更生从零开始重学spring目标是画出一张唬人大图(二、源码下载编译)

前情提要:调试前的基础知识梳理 速览 “Spring”包含哪些东西源码下载源码编译1、编译工具选择:gradle2、使用gradle编译spring并导入idea预编译spring-oxm导入IDEA确认合适的jdk版本排除spring-aspects模块 开始调试 “Spring”包含哪些东西 可以明确的…

LVS负载均衡:理解IPVS和IPVSADM的内部工作原理

LVS 负载均衡工作模式 LVS(Linux Virtual Server) 共有三种工作模式:DR、Tunnel、NAT。 DR(Direct Routing): 技术原理:DR模式下,LVS调度器接收到请求后,直接通过MAC地址…

Kali中安装和使用docker的学习笔记

一、常见命令 ctrl 、shift、 : 窗口变大; ctrl 、- :窗口变小; ctrl L: 清屏 ; sudo su : 切换root 用户; ip addr / ifconfig: 获取IP地址; systemctl start ssh…

探索Python的多媒体解决方案:ffmpy库

文章目录 探索Python的多媒体解决方案:ffmpy库一、背景:数字化时代的多媒体处理二、ffmpy:Python与ffmpeg的桥梁三、安装ffmpy:轻松几步四、ffmpy的五项基本功能1. 转换视频格式2. 调整视频质量3. 音频转换4. 视频截图5. 视频合并…

Mybatis框架中结果映射resultMap标签方法属性收录

Mybatis框架中结果映射resultMap标签收录 在MyBatis框架中,resultMap 是一种强大的机制,用于将数据库结果集映射到Java对象上。它允许你定义如何将查询结果中的列映射到Java对象的属性上,尤其是当数据库表的字段名与Java对象的属性名不一致时…

【太原理工大学】软件系统安全—分析题

OK了,又是毫无准备的一场仗,我真是ありがとうございます 凸^o^凸 根据前几年传下来的信息,所谓“分析”,就是让你根据情节自行设计,例如如何设计表单等,这类多从实验中出,王老师强调好好做实验一…