【Python机器学习】1.1. 机器学习(Machine Learning)介绍

喜欢的话别忘了点赞、收藏加关注哦,对接下来的教程有兴趣的可以关注专栏。谢谢喵!(=・ω・=)

1.1.1. 什么是机器学习?

举个例子:

小明1月工资1000,每月增长10%,第10月是多少?

月份 x工资 y
11,000
21,100
31,210
41,331
51,464
61,611
71,772
81,949
92,144
10???

那么你很轻松就能列出函数:y = 1000 × 1.1^x

这正是传统算法的写法:你告诉计算机起始工资y0(1000元),再告诉它每一个月工资的函数关系y = 1000 × 1.1^x,让计算机计算出第10个月的工资
请添加图片描述

机器学习则会直接告诉计算机月份与工资的数据,让计算机自己推导其中的函数关系,并由此得出第10个月的工资。
请添加图片描述

一句话总结:机器学习是一种使计算机能够从数据中自动学习模式并进行预测或决策的算法和技术。

1.1.2. Transformer大行其道,还有必要学ML和DL吗?

有很多同学都会有这个疑问:现在Transformer模型非常火爆,我干嘛还要去学机器学习(ML)和深度学习(DL)的内容呢?

我们来看看作为Transformer模型最杰出的产物ChatGPT对此的回答:

Q:请你用一段话回答这个问题:现在Transformer大行其道,还有必要学习Machine Learning 和 Deep Learning吗?

A:当然有必要!Transformer虽然在自然语言处理、计算机视觉等领域取得了巨大成功,但Machine Learning(机器学习)和Deep Learning(深度学习)仍然是整个AI领域的基础。Transformer本质上是深度学习的一种架构,理解其原理需要扎实的深度学习知识,如神经网络、梯度下降、优化方法等。此外,机器学习中的传统方法(如决策树、SVM、聚类等)在小数据集、可解释性、低计算资源需求等场景下仍然具有优势。因此,系统学习机器学习和深度学习,不仅能帮助更好地理解和优化Transformer,还能在更广泛的应用场景中找到合适的解决方案。

我想GPT的回答已经很清晰了——机器学习(ML)和深度学习(DL)是基础,了解这两者才能为学习Transformer打好基础。

1.1.3. 机器学习的基本框架

请添加图片描述

机器学习(ML)和深度学习(DL)的核心是数据,尤其是训练数据。在图中,左侧的矩阵展示了训练数据的基本结构,其中包含多个样本,每个样本由一组输入特征(x1, x2, …, xn)和相应的输出标签(y1, y2, …, yn)组成。这些数据用于指导模型学习输入与输出之间的映射关系,为后续的预测和决策提供依据。

在ML和DL中,模型的目标是找到一个映射函数 f(x),使得对于新的输入 x,能够预测出合理的输出 y。这一过程涉及训练(Training),即让计算机根据提供的数据自动学习数据之间的关系,并不断优化模型参数,使其能够更准确地映射输入到输出。ML 可能依赖手工特征工程,而 DL 通过神经网络自动学习特征。

训练完成后,模型可以用于解决实际问题。对于新的数据输入 x,模型会利用已经学习到的f(x)进行预测,输出相应的结果。这一过程即为推理(Inference)

ML和DL的一个关键特性是“自动求解数据关系”。在传统编程方法中,程序员需要手动编写规则来处理数据,而在 ML 和 DL 中,计算机通过训练数据自动学习这些规则。ML 适用于结构化数据,DL 适用于更复杂的数据类型,如图像、语音和文本。这种方式大大提高了模型的适应能力,使其能够应对复杂的现实问题。

1.2.机器学习的类别

监督学习 (Supervised Learning)

监督学习是指模型在训练时使用的数据包含正确的结果(标签-label)。在训练过程中,模型通过输入数据和对应的正确标签进行学习,目的是找到输入与输出之间的映射关系,以便对新数据进行准确预测。

无监督学习 (Unsupervised Learning)

无监督学习的训练数据不包含正确的结果,模型需要自己从数据中学习其内在结构或模式。通常用于聚类(clustering)降维(dimensionality reduction) 任务。

半监督学习 (Semi-supervised Learning)

半监督学习介于监督学习和无监督学习之间,训练数据包含少量正确的结果,但大部分数据是未标注的。该方法结合了两者的优点,可以在标注数据有限的情况下提升模型性能。

强化学习 (Reinforcement Learning)

强化学习是一种通过与环境交互来学习最优策略的机器学习方法。智能体(Agent)在环境(Environment)中执行动作(Action),并根据奖励(Reward) 来调整策略,以最大化长期收益。与监督学习不同,强化学习没有固定的正确答案,而是通过探索和试错来优化决策。

1.3. 课程内容

之后的系列文章中我们会讲到这些部分:

1. 监督学习

  • 线性回归 - ML
  • 逻辑回归 - ML
  • 决策树 - ML
  • 神经网络(NN)、卷积神经网络(CNN)、循环神经网络(RNN) - DL

2. 无监督学习

  • 聚类算法 - ML

3. 混合学习

  • 监督学习 + 无监督学习 - ML

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/980311.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

协议-Airkiss

是什么? 设备 A 与外界没有建立任何实质性连接,可以称之为信息孤岛。设备 B 通过路由 或者直接 将 Wifi 的 ssid 与密码 UDP广播 传递给 A 为什么? 解决将无线网络的 ssid 与密码传输到设备难题 怎么做? 芯片自带AT指令开启Air…

python第十一课:并发编程 | 多任务交响乐团

🎯 本节目标 理解多线程/多进程/协程的应用场景掌握threading与multiprocessing核心用法学会使用asyncio进行异步编程开发实战项目:高并发爬虫引擎破解GIL锁的性能迷思 1️⃣ 并发编程三剑客 🎻 生活化比喻: 多线程 → 餐厅多个…

linux中断调用流程(arm)

文章目录 ARM架构下Linux中断处理全流程解析:从硬件触发到驱动调用 ⚡**一、中断触发与硬件层响应** 🔌**1. 设备触发中断** 📡 **二、CPU阶段:异常入口与上下文处理** 🖥️**1. 异常模式切换** 🔄**2. 跳转…

Deepseek 模型蒸馏

赋范课堂: https://www.bilibili.com/video/BV1qUN8enE4c/

商城系统单商户开源版源码

环境配置 1.软件安装 宝塔安装系统软件:Nginx、MySQL5.6、PHP( PHP用7.1-7.4版本)、phpMyAdmin(Web端MySQL管理工具)。 2.配置mysql 设置mysql,在已安装的软件里面找到 mysql点击进行设置 3.修改sql-mode 选择左侧配置修改,找到里面的sql-mode&…

登录日志管理:通用分页和排序封装、 查询登录日志列表、删除登录日志、清空登录日志、解锁用户登录状态(解锁密码错误次数超限)

文章目录 引言I 登录日志管理接口列表II 通用分页和排序封装Java 分页和排序封装vue前端排序页面III 工具类字段名转换 : 驼峰转下划线命名引言 I 登录日志管理 接口列表 import request from @/utils/request// 查询登录日志列表 export function list(query) {return

Java内存管理与性能优化实践

Java内存管理与性能优化实践 Java作为一种广泛使用的编程语言,其内存管理和性能优化是开发者在日常工作中需要深入了解的重要内容。Java的内存管理机制借助于垃圾回收(GC)来自动处理内存的分配和释放,但要实现高效的内存管理和优…

Flutter_学习记录_实现列表上拉加载更多的功能

可以用ScrollController组件来实现这样列表上拉加载更多的功能: 1. 定义变量 在StatefulWidget 的组件内,添加三个属性: // 滚动视图的控制器final ScrollController _scrollController ScrollController();// 是否已显示了上拉加载中bool _isShowM…

使用DeepSeek+KIMI生成高质量PPT

一、使用DeepSeek DeepSeek官网:DeepSeek 点击“开始对话”,进入交互页面。 在上图中,输入问题,即可获取AI生成的结果。 基础模型(V3):通用模型(2024.12),高…

TCP和UDP比较

以下是 TCP(传输控制协议) 和 UDP(用户数据报协议) 的详细对比,涵盖核心特性、应用场景及技术差异: 1. 核心特性对比 特性TCPUDP连接方式面向连接(需三次握手建立连接)无连接&#…

Spring Boot 3.x 基于 Redis 实现邮箱验证码认证

文章目录 依赖配置开启 QQ 邮箱 SMTP 服务配置文件代码实现验证码服务邮件服务接口实现执行流程 依赖配置 <dependencies> <!-- Spring Boot Starter Web --> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spr…

(七)消息队列-Kafka 序列化avro(传递)

&#xff08;七&#xff09;消息队列-Kafka 序列化avro&#xff08;传递&#xff09; 客从远方来&#xff0c;遗我双鲤鱼。呼儿烹鲤鱼&#xff0c;中有尺素书。 ——佚名《饮马长城窟行》 本文已同步CSDN、掘金平台、知乎等多个平台&#xff0c;图片依然保持最初发布的水印&…

Docker 学习(一)

一、Docker 核心概念 Docker 是一个开源的容器化平台&#xff0c;允许开发者将应用及其所有依赖&#xff08;代码、运行时、系统工具、库等&#xff09;打包成一个轻量级、可移植的“容器”&#xff0c;实现 “一次构建&#xff0c;随处运行”。 1、容器&#xff08;Container…

使用mermaid查看cursor程序生成的流程图

一、得到cursor生成的流程图文本 cursor写的程序正常运行后&#xff0c;在对话框输入框中输入诸如“请生成扫雷的代码流程图”&#xff0c;然后cursor就把流程图给生成了&#xff0c;但是看到的还是文本的样子&#xff0c;保留这部分内容待用 二、注册一个Mermaid绘图账号 …

蜂鸣器使用

1、蜂鸣器原理 无源蜂鸣器模块根据输入的 不同方波信号&#xff08;作为震荡源&#xff09;可以发出不同的声音。驱动电路中三极管电阻一般为1K-4K都行&#xff0c;能够让三极管导通即可。&#xff08;三极管即带箭头的部分&#xff0c;基极和发射机&#xff08;PNP&#xff09…

15. LangChain实战项目2——易速鲜花海报文案生成

你已经制作好了一批鲜花的推广海报&#xff0c;想为每一个海报的内容&#xff0c;写一两句话&#xff0c;然后 post 到社交平台上&#xff0c;以期图文并茂。 下载 Salesforce/blip-image-captioning-large 图生文模型 通过以下几个命令下载该模型 pip install -U huggingfa…

支持IPD项目管理的9大系统,哪款工具能有效提高项目控制能力

本文介绍了以下9大系统: 1.Worktile&#xff1b; 2. 腾讯敏捷开发平台&#xff08;TAPD&#xff09;&#xff1b; 3. 简道云&#xff08;Jiandaoyun&#xff09;&#xff1b; 4. 蓝鲸智云&#xff08;BlueWhale&#xff09;&#xff1b; 5. 轻流&#xff08;Qingflow&#xff0…

创建一个MCP服务器,并在Cline中使用,增强自定义功能。

MCP介绍 MCP 是一个开放协议&#xff0c;它标准化了应用程序如何向LLMs提供上下文。可以将 MCP 视为 AI 应用程序的 USB-C 端口。正如 USB-C 提供了一种标准化的方法来将您的设备连接到各种外围设备和配件一样&#xff0c;MCP 提供了一种标准化的方法来将 AI 模型连接到不同的…

Linux之yum详解

—— 小 峰 编 程 目录 1、Linux软件的安装方式 2、什么是yum 3、配置网络yum源 4、yum命令 【语法】 【yum常用命令】 1、Linux软件的安装方式 在CentOS系统中&#xff0c;软件管理方式通常有三种方式&#xff1a; rpm安装 、 yum安装 以及 编译安装 。 2、什么是yum…

2025国家护网HVV高频面试题总结来了01(题目+回答)

网络安全领域各种资源&#xff0c;学习文档&#xff0c;以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具&#xff0c;欢迎关注。 目录 0x1 高频面试题第一套 0x2 高频面试题第二套 0x3 高频面试题第三套 0x4 高频面试题第四套 0x5 高频面…