什么是机器学习,机器学习与人工智能的区别是什么(一)?

image.png

人工智能和计算机游戏领域的先驱阿瑟·塞缪尔(Arthur Samuel)创造了 "机器学习"一词。他将机器学习定义为 “一个让计算机无需明确编程即可学习的研究领域” 。通俗地说,机器学习(ML)可以解释为根据计算机的经验自动化和改进计算机的学习过程,而无需实际编程,即无需任何人工帮助。该过程首先提供高质量的数据,然后通过使用数据和不同算法构建机器学习模型来训练我们的机器(计算机)。算法的选择取决于我们拥有什么类型的数据以及我们想要自动化的任务类型。

什么是机器学习?

机器学习人工智能的一个分支,它通过学习数据集的隐藏模式来开发算法,并使用它来对新的相似类型数据进行预测,而无需为每个任务进行显式编程。

传统机器学习将数据与统计工具相结合来预测可用于形成可行见解的输出。

机器学习用于许多不同的应用,从图像和语音识别到自然语言处理、推荐系统、欺诈检测、投资组合优化、自动化任务等等。机器学习模型还用于为自动驾驶汽车、无人机和机器人提供动力,使它们更加智能并能够适应不断变化的环境。

强化学习是另一种类型的机器学习,可用于改进基于推荐的系统。在强化学习中,代理学习根据其环境的反馈做出决策,并且该反馈可用于改进向用户提供的建议。例如,系统可以跟踪用户观看推荐电影的频率,并使用此反馈来调整未来的推荐。

基于机器学习的个性化推荐在许多行业中越来越受欢迎,包括电子商务、社交媒体和在线广告,因为它们可以提供更好的用户体验并增加对平台或服务的参与度。

这一突破源于这样一种想法:机器可以从数据(即示例)中单独学习以产生准确的结果。

机器学习-Geeksforgeeks

机器学习与传统编程的区别

机器学习与传统编程的区别如下:

机器学习传统编程人工智能
机器学习是人工智能 (AI) 的一个子集,专注于从数据中学习以开发可用于进行预测的算法。在传统编程中,基于规则的代码是由开发人员根据问题陈述编写的。人工智能涉及使机器变得尽可能强大,以便它能够执行通常需要人类智能的任务。
机器学习使用数据驱动的方法,通常根据历史数据进行训练,然后用于对新数据进行预测。传统编程通常是基于规则的和确定性的。它没有机器学习和人工智能等自学习功能。人工智能可以涉及许多不同的技术,包括机器学习和深度学习,以及传统的基于规则的编程。
机器学习可以在大型数据集中找到人类可能难以发现的模式和见解。传统的编程完全依赖于开发人员的智慧。因此,它的能力非常有限。有时,人工智能会结合使用数据和预定义规则,这使其在以高精度解决复杂任务方面具有巨大优势,而这对于人类来说似乎是不可能的。
机器学习是人工智能的子集。现在它被用于各种基于人工智能的任务,如聊天机器人问答、自动驾驶汽车等。传统编程通常用于构建具有特定功能的应用程序和软件系统。人工智能是一个广泛的领域,包括许多不同的应用,包括自然语言处理、计算机视觉和机器人技术。

机器学习算法如何工作

机器学习以以下方式工作。

  • 前向传递: 在前向传递中,机器学习算法接收输入数据并产生输出。根据模型算法计算预测。
  • 损失函数: 损失函数也称为误差或成本函数,用于评估模型预测的准确性。该函数将模型的预测输出与实际输出进行比较,并计算它们之间的差异。这种差异称为错误或损失。模型的目标是通过调整其内部参数来最小化误差或损失函数。
  • 模型优化过程: 模型优化过程是调整模型内部参数以最小化误差或损失函数的迭代过程。这是使用优化算法(例如梯度下降) 来完成的。优化算法计算误差函数相对于模型参数的梯度,并使用该信息来调整参数以减少误差。该算法重复此过程,直到误差最小化到令人满意的水平。

一旦模型在训练数据上进行了训练和优化,它就可以用于对新的、看不见的数据进行预测。模型预测的准确性可以使用各种性能指标进行评估,例如准确度、精确度、召回率和 F1 分数。

机器学习生命周期:

机器学习项目的生命周期涉及一系列步骤,其中包括:

  1. 研究问题: 第一步是研究问题。此步骤涉及理解业务问题并定义模型的目标。

  2. 数据收集: 当问题明确后,我们就可以收集模型所需的相关数据。数据可能来自各种来源,例如数据库、API 或网络抓取。

  3. 数据准备

    收集与问题相关的数据时。那么最好正确检查数据并将其设置为所需的格式,以便模型可以使用它来查找隐藏的模式。这可以通过以下步骤完成:

    • 数据清洗
    • 数据转换
    • 解释性数据分析和特征工程
    • 拆分数据集以进行训练和测试。
  4. 模型选择: 下一步是选择适合我们问题的机器学习算法。此步骤需要了解不同算法的优点和缺点。有时我们使用多个模型并比较它们的结果并根据我们的要求选择最佳模型。

  5. 模型构建和训练

    选择算法后,我们必须构建模型。

    1. 在传统机器学习的情况下,构建模式很容易,只需进行一些超参数调整即可。
    2. 在深度学习的情况下,我们必须定义分层架构以及输入和输出大小、每层的节点数、损失函数、梯度下降优化器等。
    3. 使用预处理的数据集训练该模型之后。
  6. 模型评估: 模型训练完成后,可以使用分类报告、F1 分数、精度、召回率、ROC 曲线、均方误差、绝对误差等不同技术在测试数据集上对其进行评估,以确定其准确性和性能。

  7. 模型调优: 根据评估结果,可能需要对模型进行调优或优化以提高其性能。这涉及调整模型的超参数。

  8. 部署: 模型经过训练和调整后,可以将其部署在生产环境中以对新数据进行预测。此步骤需要将模型集成到现有的软件系统中或为模型创建一个新系统。

  9. 监控和维护: 最后,监控模型在生产环境中的性能并根据需要执行维护任务至关重要。这包括监控数据漂移、根据需要重新训练模型以及在新数据可用时更新模型。

机器学习的类型

  • 监督机器学习
  • 无监督机器学习
  • 强化机器学习

1.监督机器学习:

监督学习是机器学习的一种,其中算法在标记数据集上进行训练。它学习根据标记的训练数据将输入特征映射到目标。在监督学习中,算法提供输入特征和相应的输出标签,并学习从这些数据中进行泛化,以对新的、未见过的数据进行预测。

监督学习主要有两种类型:

  • 回归:回归是一种监督学习,算法学习根据输入特征预测连续值。回归中的输出标签是连续值,例如股票价格、房价。机器学习中不同的回归算法有:线性回归、多项式回归、岭回归、决策树回归、随机森林回归、支持向量回归等
  • 分类:分类是一种监督学习,算法学习根据输入特征将输入数据分配到特定类别或类别。分类中的输出标签是离散值。分类算法可以是二元的,其中输出是两个可能的类别之一,也可以是多类别的,其中输出可以是多个类别之一。机器学习中不同的分类算法有:逻辑回归、朴素贝叶斯、决策树、支持向量机(SVM)、K-最近邻(KNN)等.

2.无监督机器学习:

无监督学习是机器学习的一种类型,其中算法无需使用标记示例进行显式训练即可学习识别数据中的模式。无监督学习的目标是发现数据的底层结构或分布。

无监督学习主要有两种类型:

  • 聚类:聚类算法根据相似的数据点的特征将其分组在一起。目标是识别彼此相似但与其他组不同的数据点组或集群。一些流行的聚类算法包括 K-means、层次聚类和 DBSCAN。
  • 降维: 降维算法减少数据集中输入变量的数量,同时保留尽可能多的原始信息。这对于降低数据集的复杂性并使其更易于可视化和分析非常有用。一些流行的降维算法包括主成分分析 (PCA)、t-SNE 和自动编码器。

3. 强化机器学习

强化学习是一种机器学习,其中代理通过执行操作并根据其操作接收奖励或惩罚来学习与环境交互。强化学习的目标是学习一种策略,它是从状态到行动的映射,随着时间的推移最大化预期累积奖励。

强化学习主要有两种类型:

  • 基于模型的强化学习: 在基于模型的强化学习中,代理学习环境模型,包括状态之间的转换概率以及与每个状态-动作对相关的奖励。然后,代理使用该模型来规划其行动,以最大化其预期奖励。一些流行的基于模型的强化学习算法包括值迭代和策略迭代。
  • 无模型强化学习:在无模型强化学习中,智能体直接从经验中学习策略,而无需显式构建环境模型。代理与环境交互并根据收到的奖励更新其策略。一些流行的无模型强化学习算法包括 Q-Learning、SARSA 和深度强化学习。

机器学习的需求:

机器学习很重要,因为它允许计算机从数据中学习并提高其在特定任务上的性能,而无需显式编程。这种从数据中学习并适应新情况的能力使得机器学习对于涉及大量数据、复杂决策和动态环境的任务特别有用。

以下是使用机器学习的一些特定领域:

  • 预测建模: 机器学习可用于构建预测模型,帮助企业做出更好的决策。例如,机器学习可用于预测哪些客户最有可能购买特定产品,或者哪些患者最有可能患上某种疾病。
  • 自然语言处理: 机器学习用于构建能够理解和解释人类语言的系统。这对于语音识别、聊天机器人和语言翻译等应用非常重要。
  • 计算机视觉: 机器学习用于构建可以识别和解释图像和视频的系统。这对于自动驾驶汽车、监控系统和医学成像等应用非常重要。
  • 欺诈检测: 机器学习可用于检测金融交易、在线广告和其他领域的欺诈行为。
  • 推荐系统:机器学习可用于构建推荐系统,根据用户过去的行为和偏好向他们推荐产品、服务或内容。

总体而言,机器学习已成为许多企业和行业的重要工具,因为它使他们能够更好地利用数据,改进决策流程,并为客户提供更加个性化的体验。

机器学习的各种应用

  • 自动化:机器学习,在任何领域完全自主地工作,无需任何人工干预。例如,机器人在制造工厂中执行基本的流程步骤。
  • 金融行业:机器学习在金融行业越来越受欢迎。银行主要使用机器学习来查找数据内部的模式,同时也防止欺诈。
  • 政府组织:政府利用机器学习来管理公共安全和公用事业。以拥有大规模人脸识别的中国为例。政府使用人工智能来防止乱穿马路。
  • 医疗保健行业:医疗保健是最早使用机器学习和图像检测的行业之一。
  • 营销: 由于数据的丰富性,人工智能在营销中得到了广泛的应用。在海量数据时代之前,研究人员开发了贝叶斯分析等先进的数学工具来估计客户的价值。随着数据的蓬勃发展,营销部门依靠人工智能来优化客户关系和营销活动。
  • 零售行业:零售行业使用机器学习来分析客户行为、预测需求和管理库存。它还可以根据每位顾客过去的购买情况和偏好推荐产品,帮助零售商为每位顾客提供个性化的购物体验。
  • 交通运输:机器学习在交通运输行业中用于优化路线、减少燃料消耗并提高交通系统的整体效率。它还在自动驾驶汽车中发挥着作用,其中机器学习算法用于做出有关导航和安全的决策。

机器学习的挑战和局限性

机器学习的局限性:

  1. 机器学习的主要挑战是缺乏数据或数据集的多样性。
  2. 如果没有可用数据,机器就无法学习。此外,缺乏多样性的数据集会给机器带来困难。
  3. 机器需要具有异质性才能学习有意义的洞察力。
  4. 当没有变化或变化很少时,算法很少能提取信息。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

资源分享

图片

大模型AGI学习包

图片

图片

资料目录

  1. 成长路线图&学习规划
  2. 配套视频教程
  3. 实战LLM
  4. 人工智能比赛资料
  5. AI人工智能必读书单
  6. 面试题合集

人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取

1.成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

对于从来没有接触过网络安全的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。

图片

2.视频教程

很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,其中一共有21个章节,每个章节都是当前板块的精华浓缩

图片

3.LLM

大家最喜欢也是最关心的LLM(大语言模型)

图片

人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/756577.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

从零开始搭建spring boot多模块项目

一、搭建父级模块 1、打开idea,选择file–new–project 2、选择Spring Initializr,选择相关java版本,点击“Next” 3、填写父级模块信息 选择/填写group、artifact、type、language、packaging(后面需要修改)、java version(后面需要修改成和第2步中版本一致)。点击“…

llamafactory-llama3微调中文数据集

一、定义 https://github.com/SmartFlowAI/Llama3-Tutorial/tree/main 基准模型测试opencompass 离线测评数据准备微调训练合并测试人工审核对比 二、实现 基准模型测试 基准模型 llama3-8b https://zhuanlan.zhihu.com/p/694818596? https://github.com/SmartFlowAI/Llam…

计算机网络知识整理笔记

目录 1.对网络协议的分层? 2.TCP/IP和UDP之间的区别? 3.建立TCP连接的三次握手? 4.断开TCP连接的四次挥手? 5.TCP协议如何保证可靠性传输? 6.什么是TCP的拥塞控制? 7.什么是HTTP协议? 8…

QGroundControl@Jetson Orin Nano - 从代码编译安装

QGroundControlJetson Orin Nano - Build from Source 1. 源由2. 步骤2.1 QT 编译2.1.1 下载2.1.2 版本2.1.3 初始化2.1.4 配置2.1.5 编译2.1.6 安装 2.2 QGC 编译2.2.1 下载2.2.2 版本2.2.3 初始化2.2.4 配置2.2.5 编译2.2.6 安装2.2.7 QT5命令备注 3. 可行方案4. 总结5. 补充…

CICD之Git版本管理及基本应用

CICD:持续集成,持续交付--让对应的资料,对应的项目流程更加规范--提高效率 CICD 有很多的工具 GIT就是其中之一 1.版本控制概念与环境搭建 GIT的概念: Git是一款分布式源代码管理工具(版本控制工具) ,一个协同的工具。 Git得其数据更像是一系列微型文件系统的快照。使用Git&am…

D : 合适的顺序

Description 给定 8 个数,如果将它们排成一列,每个数的权值是它与相邻的数之积,求一个排列方式,所有数的权值之和最大,输出该权值和. 例如 13242315 的权值和为 1∗33∗1∗22∗3∗44∗2∗22∗4∗33∗2∗11∗3∗55∗1…

libctk shared library的设计及编码实践记录

一、引言 1.1 <libctk>的由来 1.2 <libctk>的设计理论依据 1.3 <libctk>的设计理念 二、<libctk>的依赖库 三、<libctk>的目录说明 四、<libctk>的功能模块及使用实例说明 4.1 日志模块 4.2 mysql client模块 4.3 ftp client模块 4…

AVL树模拟

1.概念 虽然二叉搜索树可以缩短查找的效率&#xff0c;但如果数据有序或者接近有序时二叉搜索树树将退化为单支树&#xff0c;查找元素相当于在顺序表中搜索元素&#xff0c;效率低下。AVL 树是具有一下性质的二叉搜索树&#xff1a; 1.它的左右子树都是AVL树 2.左右子…

C++特殊类设计单例模式...

文章目录 请设计一个类&#xff0c;不能被拷贝请设计一个类&#xff0c;只能在堆上创建对象请设计一个类&#xff0c;只能在栈上创建对象请设计一个类&#xff0c;不能被继承请设计一个类&#xff0c;只能创建一个对象(单例模式)单例模式&#xff1a;饿汉模式&#xff1a;懒汉模…

steam社区载入失败、加载不出来、打不开?

随着steam夏季大促的到来&#xff0c;最近steam在线用户越来越多了&#xff0c;很多玩家在自己喜欢的游戏社区里看最新的玩法、攻略和玩家的游戏心得。不过有不少玩家表示有时候会打不开游戏社区或是社区加载失败等问题。根据大家遇到的问题&#xff0c;这里总结了几种解决方法…

Mongodb安装与配置

Mongodb的下载 这里下载的是MongoDB 7.0.11版本的 首先进入官网&#xff1a;https://www.mongodb.com/ 点击完上面两步后&#xff0c;加载来到该页面&#xff0c;选择自己的版本、系统&#xff0c;是压缩包(zip)还是安装包(msi)。 下载好之后能&#xff0c;来到安装包哪里&a…

程序员福利-一种高效的治疗颈椎病的方法

我从18年开始出现颈椎病&#xff0c;只要在电脑前低头工作两个小时&#xff0c;颈部就会不舒服&#xff0c;脖子的肌肉酸痛无力、僵硬麻木&#xff0c;影响血液循环系统&#xff0c;大脑供血不足&#xff0c;导致心烦意乱&#xff0c;注意力无法集中&#xff0c;还会影响消化系…

在HBuilder X中ElementUI框架的搭建

前言 本文将详解基于Vue-cli脚手架搭建的项目如何使用ElementUI &#xff1f;所以在学习本篇文章内容之前建议先学习vue-cli脚手架项目的搭建和学习 使用HbuilderX快速搭建vue-cil项目https://mp.csdn.net/mp_blog/creation/editor/140043776 ElementUI框架: Element&#xff…

【C++】类、静态、枚举、重载、多态、继承、重写、虚函数

五、类 面向对象编程是一个巨大的编程范式。C中的类class就是基于对象的程序设计。 我们可以用类来定义一个新的类型&#xff0c;这些新类型就可以像内置类型一样使用。 内置类型颗粒度太太小&#xff0c;现实需求又非常复杂&#xff0c;这就需要我们把内置类型适度的进行拼搭…

微软推出集成GPT-4o的文本转语音虚拟数字人服务

微软近日宣布&#xff0c;其全新的文本转语音虚拟数字人服务正式上线&#xff0c;并集成了GPT-4o技术。这一服务为用户提供了创建实时互动数字人的可能。通过先进的自然语言处理技术&#xff0c;数字人能够将文本转化为自然流畅的语音&#xff0c;并配以生动的虚拟形象&#xf…

C++【函数重载】【附有C语言为何不能实现函数重载的讲解】

P. S.&#xff1a;以下代码均在VS2019环境下测试&#xff0c;不代表所有编译器均可通过。 P. S.&#xff1a;测试代码均未展示头文件stdio.h的声明&#xff0c;使用时请自行添加。 博主主页&#xff1a;LiUEEEEE                        …

【硬件视界2】什么是CPU和GPU?有什么区别?

名人说&#xff1a;莫听穿林打叶声&#xff0c;何妨吟啸且徐行。—— 苏轼《定风波莫听穿林打叶声》 本篇笔记整理&#xff1a;Code_流苏(CSDN)&#xff08;一个喜欢古诗词和编程的Coder&#x1f60a;&#xff09; 目录 1、CPU (中央处理器)①主要作用②特点 2、 GPU (图形处理…

支持纳管达梦数据库,命令存储支持对接Elasticsearch 8,JumpServer堡垒机v3.10.11 LTS版本发布

2024年6月24日&#xff0c;JumpServer开源堡垒机正式发布v3.10.11 LTS版本。JumpServer开源项目组将对v3.10 LTS版本提供长期的支持和优化&#xff0c;并定期迭代发布小版本。欢迎广大社区用户升级至v3.10 LTS最新版本&#xff0c;以获得更佳的使用体验。 在JumpServer v3.10.…

50-2 内网信息收集 - 内网工作环境(域相关知识)

一、工作组 工作组(Work Group)是局域网中最基本的资源管理模式,适用于小规模网络环境。 工作组的定义: 工作组是将不同功能或部门的计算机分组管理的方式。它提供了层次化的网络资源管理,使得组织内的计算机可以按照功能或部门分类。每个工作组有一个自定义的主机名称,…

短视频矩阵系统搭建APP源码开发

前言 短视频矩阵系统不仅有助于提升品牌影响力和营销效率&#xff0c;还能帮助企业更精准地触达目标受众&#xff0c;增强用户互动&#xff0c;并利用数据分析来持续优化营销策略。 一、短视频矩阵系统是什么&#xff1f; 短视频矩阵系统是一种通过多个短视频平台进行内容创作…