人工智能 机器学习 深度学习:概念,关系,及区别说明

如果过去几年,您读过科技主题的文章,您可能会遇到一些新词汇,如人工智能(Artificial Intelligence)、机器学习(Machine Learning)和深度学习(Deep Learning)等。这三个词的使用频率很高,几乎无处不在,但是他们具体都是什么?有什么不同之处?他们之间的关系是什么?

本文将详细解释人工智能,机器学习和深度学习的概念,并说明他们之间的关系。此外,本文还将介绍一些构建这些技术的最佳实践,以及在公司中实施这些技术的注意事项。

人工智能、机器学习和深度学习

谈论AI、ML和深度学习之间区别的最佳切入点是,将这三者视为一个梯度,每一个都是前一项的一部分。人工智能(AI)属于概括性术语,包含机器学习在内,而深度学习又是机器学习的一种类型。

现在,您已经基本了解三者的关系。接下来,让我们进行深入探讨。

人工智能(Artificial Intelligence)

人工智能(Artificial Intelligence)是一个概括性术语,包含多种技术。简单地说,AI是指一种能够模仿或体现人类智能特征的机器。几十年来,AI一直是一个热门理论,也是电影和科幻小说中的部分情节。

而今,AI已经被使用在我们身边。各行各业都在使用AI来自动化、预测、优化一些原本由人类完成的任务。这不仅能为企业节省金钱和时间,还可以将员工从重复枯燥的任务中解放出来,提高员工幸福感。

AI分为三大类型:

  • 狭义人工智能(又称弱人工智能,Artificial Narrow Intelligence,简称ANI)
  • 通用人工智能(又称强人工智能,Artificial General Intelligence,简称AGI)
  • 超级人工智能(又称超人工智能,Artificial Super Intelligence,简称ASI)

第一种形式的人工智能,即狭义人工智能,通常被称为“弱”AI,而另两种则被称为“强”AI。弱AI或侠义人工智能仅可完成某项特定的任务。但是,通用人工智能和超级人工智能,即强AI,可完成多项任务。

狭义人工智能(又称弱人工智能,Artificial Narrow Intelligence ,ANI)

狭义人工智能(ANI)是一种弱AI,只能完成一项任务。虽然弱AI擅长完成某类任务,但在其他领域或任务中,弱AI就比不上人类了。

弱AI的一个示例是深蓝(Deep Blue),这是一台于1996年击败国际象棋冠军加里·卡斯帕罗夫的计算机。除了每秒可以评估2亿个国际象棋位置之外,深蓝(Deep Blue)无法胜任其他任务,是一种弱AI。

ANI广泛应用于科学、商业和医疗保健领域,以创建擅长某项特定任务的AI解决方案。弱AI程序常见的应用有:阅读医学图像,检测制造异常,以及发现商业数据中的规律。

通用人工智能(又称强人工智能,Artificial General Intelligence ,AGI)

通用人工智能(AGI)是两种强人工智能之一。AGI能够完成多项任务,这超越了机器在能力上变得更像人类的界限。在没有人类输入的情况下,AGI可以自主做出决定。AGI既有逻辑,也有情感。

目前还没有纯粹的AGI模型,但我们已经在朝着这个目标努力前进。聊天机器人和数字虚拟助理的沟通技巧越来越熟练,并且能对直接刺激做出情绪反应。一些研究人员也已开始训练机器人阅读人类情绪的能力。虽然这令人兴奋,但有情感的AI并非只是能读懂情绪并做出反应那么简单,我们还需要很多努力才能创建出通用人工智能。

超级人工智能(又称超人工智能,Artificial Super Intelligence ,ASI)

科幻小说中讨论的AI是一种超级人工智能(ASI),是强AI的第二种类型。ASI模型是比人类更聪明、更有智慧和更具创造力的机器。这类AI尚未现世,只存在于科幻书中。甚至,科学家从未梦想过可以创造出这类强AI。

虽然目前尚未创造出这类强AI,但科学家已在一些不同的领域取得了进展,最终将有利于实现强AI。这些领域包括:

  • 机器人学:建立自给自足机器人,比如Roomba扫地机器人。
  • 机器推理:训练AI模型基于数据库或库的演绎和归纳能力,以做出决定并得出结论。
  • 机器学习:指机器用来完成某项特定任务的算法和计算机模型。

虽然现在大多数AI还只是弱AI,或者说是狭义AI,只能完成某一项任务,但对世界各地的企业和个人来说,这些AI仍具有革命性的意义。AI技术会继续向前发展,在自身迭代过程中不断超越已有的智能水平。

机器学习(Machine Learning)

AI的智能源自哪里?答案是机器学习(Machine Learning, ML)。机器学习是更大的AI领域中的一个子领域。ML的重点是教会计算机如何学习,而不是通过编程来完成特定任务。或者可以说,机器学习是教授和训练AI完成特定任务的算法和模型。

机器学习有如下三个关键特征:

  • 数据集:数据集即数据点或样本的集合。每一个数据可以是一个数字、图像、单词、音频文件或视频。数据集常用于训练机器学习模型。
  • 特征:特征是指任务解决方案的单体数据,并教授机器学习模型所寻求的内容。
  • 算法:指机器学习模型用来分析数据并得出结论的过程或一组规则。

究其根本,机器学习模型使用一种算法来读取数千个或数百万个数据,然后得出结论或预测。为了正确读取数据,机器学习模型需要算法来指导其工作流程。机器学习模型必须要经过训练,才能分析数据和得出结论。我们可以利用数据集和特征来训练机器学习模型,使模型可以根据现实世界的数据,利用算法来得出结论。

计算机视觉(Computer Vision, CV)是机器学习的最佳应用之一。很多不同的用例都有应用计算机视觉(CV),但最令人激动的用例是自动驾驶汽车。

机器学习分为四类:监督学习、非监督学习、半监督学习和强化学习。

监督学习(Supervised Learning)

监督学习模型是指在一位老师的指导下,使用具有标注训练数据的数据集训练模型。训练数据在机器学习模型中运行后,再通过新的数据来测试模型。由研究人员负责审核模型结果的准确性。在准确率达到所设定阈值前,需要持续训练和再训练机器学习模型。

那些用于垃圾邮件过滤、语言检测、分类和计算机视觉的机器学习模型,经常会采用监督学习方法。

非监督学习(Unsupervised Learning)

采用非监督学习方法来训练的机器学习模型,没有任何给定特征或目标。通过给定数据,训练机器学习模型搜索模式。非监督机器学习模型适合用来将数据聚类或分类,以及分析数据和提供见解。

非监督机器学习模型通常用于数据分割、异常检测、推荐引擎和风险管理。

半监督学习(Semi-Supervised Learning)

半监督学习是将监督和非监督机器学习模型相结合。机器学习模型接收部分标注和部分未标注的数据集。虽然程序员可以预测机器学习模型会在数据中找到什么模式,但模型必须在没有任何训练的情况下找到数据中的结构。

强化学习(Reinforcement Learning)

采用强化学习方法来学习的机器学习模型,其学习方式与人类最为相似。强化学习是一种试错法。机器学习模型从正强化或负强化中学习。

强化学习是机器学习模型中最令人兴奋的形式之一。在强化学习模式下,程序员可以不用跟踪模型,让模型进入自主学习状态,并在不完善的环境中进行动态学习。

强化学习应用于游戏、机器人、自动驾驶汽车和资源管理,以及2023年最令人瞩目的大语言模型。在LLM的训练中,以人类反馈为基础的强化学习是非常重要的微调方式,为大模型的反馈质量提供重要保证。

深度学习(Deep Learning)

深度学习(Deep Learning, DL)是机器学习的一个子领域。深度学习和其他类型机器学习的区别是算法的学习方式和算法使用的数据量。虽然深度学习需要大量数据集,但只需要极少的人工干预。

深度学习旨在模仿拥有复杂多层神经网络的人脑结构。数据通过连接通道在神经网络之间传输。深度机器学习模型可以使用标注数据集来学习,但这些数据集并不是必需品。深度学习模型可以通过监督或非监督学习模式来学习。

人工智能深度学习最令人兴奋的一个方面是,它可以使用非结构化或未标注的数据进行学习。未来的AI时代,模型能够在非监督模式下学习。

人工智能、机器学习和深度学习的关键区别

经过前面的介绍,我们了解到AI、机器学习和深度学习是同一主题下的分支,他们的关系如下:

  • 人工智能AI是算法的总称,这些算法用于检验数据,找出模式和解决方案。人工智能是一种类似于人类解决问题的能力。大多数AI项目均使用机器学习或深度学习。
  • 机器学习使用数据和算法来解决某个或多个问题,是人工智能的一种类型。
  • 深度学习使用神经网络来学习,以及通过非结构化数据来预测,是一种高级的机器学习类型。

人工智能、机器学习和深度学习的不同切入角度

当涉及AI、机器学习和深度学习时,您可以采取不同的方法设计项目。设计和部署AI项目有两种最常见的方法,即以模型为中心和以数据为中心。

以模型为中心

以模型为中心的AI项目会将大量时间花费在开发正确的AI或机器学习模型上。当您将大量时间花费在模型构建上时,您就不会在第一时间就关注数据。虽然您也会收集所需的数据,但您的重点是构建一个能够处理数据噪音的绝佳模型。在整个项目过程中,您要不断改进、调整模型和代码,以提高模型性能。

以数据为中心

与以模型为中心的方法相比,不同的是,您会拥有一个以数据为中心的模型。这类型模型主要关注数据,而不是模型本身。澳鹏坚信,数据是AI项目中最重要的部分。

无论您设计哪种类型的AI、ML或深度学习项目,您都需要高质量数据来启动项目。数据就是AI的“食粮”。数据收集、清理和标注是AI项目开发过程中的重要组成部分。即使AI项目已经启动,您也需要持续标注和改善数据质量,以获得更佳结果。

机器学习和AI专家Andrew Ng建议,数据准备应占用您80%的时间和资源,而实际的模型训练应仅占用20%。训练一直是大多数正在启动AI项目的企业的主要关注点,但如今这种观点已开始发生变化。相关研究和数据表明,高质量数据会带来高质量的AI结果。

如何利用数据提升机器学习模型

虽然花费大量时间收集、清理和标注数据与训练机器学习模型似乎是对立的,但关注数据确实可以改善项目的投资回报率和结果。下文我们将说明以数据为中心的方法会如何改进机器学习模型。

一致标注

当涉及到数据时,一致性是关键。您必须一致地标注数据,即使是不同批次的数据和不同数据标注者所标注的数据。至关重要的是,在数据标注过程中,您对质量保证要有高的期望和强有力的政策,以确保正确标注数据。

使用噪音标注

在建立以数据为中心的机器学习模型时,另一个反直觉的建议是故意在标注过程中引入一些噪音,或不一致的情况。

一致性是小型数据集的关键。这有助于训练模型并获得高质量的结果。但是,当您开始处理大型数据集时,一点噪音实际上是有益的。当数据过于完美时,机器学习模型会无法在现实世界中发挥作用,因为现实世界中没有十全十美的事情。实际上,在数据中添加一些噪音可以提高机器学习模型的准确性和能力。我们可以为您准备合适程度的噪音数据,提高机器学习模型的性能。

针对质量保证创建系统化的解决方案

成功部署以数据为中心的机器学习模型的关键步骤之一是质量保证。在模型和数据的整个生命周期中,您需要定期进行检查。

在数据标注过程中,要确保所有数据标注者以相同的方式标注数据点,这对质量保证来说至关重要。如果在质量保证过程中发现有差异,您可以重新培训标注人员,以纠正错误标注的数据点。不断地检查模型及其偏移情况也很重要。

现在,机器学习辅助的质检工具也已经开始流行,在预标注、人工校对、人工质检之外,机器学习辅助的质检工具可以更高效地帮助进行质量检查,保证数据质量符合要求,并提高标注效率。

机器学习模型并不只是训练和完成。您必须定期检查、更新和重新训练模型,确保模型持续产生准确的结果。将系统范围的质量保证政策落实到位,有助于确保机器学习模型保持准确性。

总结

人工智能、机器学习和深度学习经常被提到,他们是一个整体中的不同分支。深度学习是机器学习的一种类型,而机器学习又是AI的一个子领域。

而且,就像其他新技术一样,社会上对于如何最好地实施和使用这项技术有着不同的意见。有些人认为,AI和机器学习模型中最重要的部分是模型本身。其他人,包括我们自己,知道数据是促进模型发挥作用并实现最高投资回报的关键部分。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/274878.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

关于使用Selenium获取网页控制台的数据

背景: 需要获取网页的控制台的数据,如下图 在此文章将使用到 Pycharm 和 Selenium4 Pycharm安装 Selenium安装 from selenium import webdriver from selenium.webdriver.common.by import By import time# 创建浏览器对象 browser webdriver.Chro…

普中STM32-PZ6806L开发板(使用过程中的问题收集)

Keil使用ST-Link 报错 Internal command error 描述: 在某一次使用过程中,前面都是正常使用, Keil在烧录时报错Internal command error, 试了网上的诸多方式, 例如 升级固件;ST-Link Utility 清除;Keil升级到最新版本;甚至笔者板子的Micro头也换了,因为坏…

docker学习笔记02-安装mysql

1.安装mysql8 下载MySQL镜像 docker pull mysql:8.0创建并启动容器 docker run -itd --name mysqltest -p 9999:3306 -e MYSQL_ROOT_PASSWORD123456 mysql其中-it是交互界面 -d是后台执行 -name 指定容器名称 -p指定映射端口 -e设置环境变量 最后mysql是镜像名或者用镜像id如…

消防数据监测可视化大屏:守护城市安全的智慧之眼

在数字化时代,数据已经成为决策的关键。特别是在消防领域,快速、准确的数据分析对于及时应对火情、挽救生命财产具有不可估量的价值。为此,消防数据监测可视化大屏应运而生,成为城市安全的守护者。 一、什么是消防数据监测可视化大…

Qt 中使用 MySQL 数据库保姆级教程(下)

作者:billy 版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处 前言 上篇中我们安装好了 MySQL 数据库和 Navicat 软件,下面在 Qt 中尝试使用数据库 1. 在 Qt 中连接 MySQL 数据库&#…

VuePress、VuePress-theme-hope 搭建个人博客 1【快速上手】 —— 防止踩坑篇

vuePress官网地址 👉 首页 | VuePress 手动安装 这一章节会帮助你从头搭建一个简单的 VuePress 文档网站。如果你想在一个现有项目中使用 VuePress 管理文档,从步骤 3 开始。 步骤 1: 创建并进入一个新目录 mkdir vuepress-starter cd vuepress-star…

Unity 代码控制Text自适应文本高度

在使用代码给Text赋值时,且文本有多段,并需要根据实际文本高度适配Text组件的高度时,可以使用以下方法: //Text文本 public TextMeshProUGUI text;void Start() {//代码赋值文本text.text "好!\n很好!\n非常好!";//获…

加强->servlet->tomcat

0什么是servlet jsp也是servlet 细细体会 Servlet 是 JavaEE 的规范之一,通俗的来说就是 Java 接口,将来我们可以定义 Java 类来实现这个接口,并由 Web 服务器运行 Servlet ,所以 TomCat 又被称作 Servlet 容器。 Servlet 提供了…

ebay如何发货到国外?ebay发货规则是什么?——站斧浏览器

​ebay如何发货到国外? 对于卖家来说,在eBay上向海外买家发货可能会面临一些额外的挑战。以下是一些建议,帮助卖家顺利地将商品发货给海外买家: 1、选择合适的物流服务:eBay合作的物流服务通常提供可靠和经济实惠的国…

【ARMv8M Cortex-M33 系列 2.1 -- Cortex-M33 使用 .hex 文件介绍】

文章目录 HEX 文件介绍英特尔十六进制文件格式记录类型hex 示例Cortex-M 系列hex 文件的使用 HEX 文件介绍 .hex 文件通常用于微控制器编程,包括 ARM Cortex-M 系列微控制器。这种文件格式是一种文本记录,用于在编程时传递二进制信息。.hex 文件格式最常…

【Java EE初阶三 】线程的状态与安全(上)

1. join方法与多线程 1.1 初识多线程 为了提高cpu得利用率,因此就引入了多个线程的概念;即每个线程负责完成整个程序的一部分工作即可。 写一个代码,让主线程,创建一个新的线程,由新线程负责完成运算(12。…

人工智能时代,如何借助新技术实现突破?| 圆桌对话

继上篇介绍完干货满满的议题分享后,更精彩的圆桌论坛衔尾相随。本次圆桌对话以“人工智能时代,如何借助新技术实现突破?”为主题,由华锐技术机构市场团队负责人-高媛主持,邀请了AMD中国区数据中心事业部资深架构师-梁朝…

轻松实现不同类型文件,统一重命名与隐藏编号!

你是否经常需要处理大量的文件,却为如何进行高效的文件管理而苦恼?现在,我们为你提供了一种全新的解决方案——轻松实现文件统一重命名与隐藏编号! 第一步,首先我们要进入文件批量改名高手主页面,并在板块栏…

优思学院|掌握TPM的全貌:8大支柱及其优势

TPM(全面生产维护)是一种旨在通过组织内人员的参与,持续改进生产设备或制造过程的有效性的方法。它的目标是实现“零机器故障”或“零停机”。 TPM的八大支柱 自主保养(JISHU HOZEN) 操作员执行日常的CLIT活动&#…

【c++、数据结构课设】拓扑序列的应用

再贡献一篇课设,希望能帮助到正在做课设的小伙伴。 屏幕录制2023-12-27 22.28.48 课设要求 题目描述 大学的每个专业都要制定教学计划。假设任何专业都有固定的学习年限,每学年含两学期,每学期的时间长度和学分上限值均相等。每个专业开设的…

使用pandas处理数据的一些总结

1、替换换行符等特殊符号 df df.replace({None: "", np.nan: "", "\t": "", "\n": "", "\x08": ""}, regexTrue) 2、清除DataFrame中所有数据的左右空格,字符串中间空格不会清…

庙算兵棋推演AI开发初探(2-编写策略(上))

开始研读step()函数的编写方法。 这个是图灵网提供了一些基础的ai代码下载(浏览需要注册,下载需要审批)。 AI开发中心-人机对抗智能 (ia.ac.cn)http://turingai.ia.ac.cn/ai_center/show 一、代码研读(BaseAgent类) 1.step函数 这段代码定…

git的常用命令以及在可视化工具中的使用方法

一.引言 想当初在刚进公司的时候,对于git的使用非常不熟悉,特别是分支的概念,导致开发效率变低,故通过此文章,总结git的使用经验 二.Git 常用命令详解 2.1 git clone [url]: 克隆远程仓库到本地 刚开始时&#xff0c…

机器学习深度学习面试笔记

机器学习&深度学习面试笔记 机器学习Q. 在线性回归中,如果自变量之间存在多重共线性,会导致什么问题?如何检测和处理多重共线性?Q. 什么是岭回归(Ridge Regression)和Lasso回归(Lasso Regression)?它们与普通线性回…

Three.js基础入门介绍——Three.js学习三【借助控制器操作相机】

在Three.js基础入门介绍——Three.js学习二【极简入门】中介绍了如何搭建Three.js开发环境并实现一个包含旋转立方体的场景示例,以此为前提,本篇将引进一个控制器的概念并使用”轨道控制器”(OrbitControls)来达到从不同方向展示场…