机器学习的魔法(一)从零开始理解吴恩达的精炼笔记


一、机器学习是什么?


1、机器学习的概念

机器学习是一种人工智能领域的技术和方法,旨在使计算机系统能够从经验数据中自动学习和改进,而无需显式地进行编程。它涉及开发算法和模型,使计算机能够自动分析和理解数据,并根据经验数据中的模式和规律做出预测或做出决策。

2、机器学习的核心思想

机器学习的核心思想是利用数据来训练计算机系统,使其能够从数据中学习,并根据学习到的知识进行推理和决策。机器学习算法可以自动发现数据中的模式和规律,并使用这些模式和规律来做出预测或做出决策,而无需显式地进行编程。


3、机器学习主要类型

机器学习可以分为监督学习(参数/非参数算法,支持向量机,核函数,神经网络)、无监督学习(聚类,降维,推荐系统,学习推荐)和强化学习三种主要类型。

  • 监督学习

    简单说就是我们教计算机如何完成任务 ,算法通过输入数据和相应的标签进行训练,以学习输入和输出之间的映射关系。

  • 无监督学习

    简单说就是我们打算让计算机自己进行学习, 算法只有输入数据而没有标签,它通过发现数据中的模式和结构来进行学习。

  • 在强化学习

    算法通过与环境进行交互,根据反馈信号来学习如何采取行动以最大化某种形式的奖励。

4、机器学习应用领域

机器学习在许多领域都有广泛的应用,包括图像和语音识别、自然语言处理、推荐系统、金融预测、医疗诊断等。


二、监督学习

监督学习是一种机器学习的方法,其中模型通过标记的训练数据集进行学习,这些数据集包含了输入数据及其对应的正确输出。通过此种方式,模型可以学习到输入与输出之间的关系,并可以应用于新的、未见过的数据。


下面是一些监督学习的例子:

1、房价预测

在这个案例中,模型可能会通过房屋的各种特性(如面积,房间数量,位置等)和历史销售价格数据进行训练学习。然后模型可以预测市场上新出售的房屋的价格。

当我们使用机器学习来预测房屋价格时,通常会涉及以下步骤:

  • 数据收集:首先,我们需要收集历史销售价格数据和房屋特性数据。这些特性可以包括房屋的面积、房间数量、位置(例如城市、街区)等。这些数据将成为我们模型的训练集。

  • 特征工程:在这一步中,我们会对数据进行处理,提取有用的特征。例如,我们可以计算每平方米的价格、房间数量与总面积的比例等。

  • 模型选择:选择适合房屋价格预测的机器学习模型。常见的模型包括线性回归、决策树、随机森林、神经网络等。

  • 模型训练:使用历史数据来训练模型。模型会学习数据中的模式,以便能够预测未来市场上新出售房屋的价格。

  • 模型评估:使用测试数据集来评估模型的性能。我们可以使用指标如均方误差、R² 等来衡量模型的预测能力。

  • 预测房屋价格:一旦模型训练完成,我们就可以使用它来预测市场上新出售房屋的价格。输入新房屋的特性(例如面积、房间数量、位置等),模型会给出相应的价格预测结果。


在这里插入图片描述


2、天气预测

通过历史天气数据(温度、湿度、风速等)和相应的天气结果(晴、雨、风暴等),模型可以预测未来的天气情况。


当我们使用机器学习来预测未来的天气情况时,通常会涉及以下步骤:

(1)、数据收集:首先,我们需要收集历史天气数据,包括温度、湿度、风速等。这些数据将成为我们模型的训练集。

(2)、特征工程:在这一步中,我们会对数据进行处理,提取有用的特征。例如,我们可以计算每日平均温度、最大风速等。

(3)、模型选择:选择适合天气预测的机器学习模型。常见的模型包括线性回归、决策树、随机森林、神经网络等。

(4)、模型训练:使用历史数据来训练模型。模型会学习数据中的模式,以便能够预测未来的天气情况。

(5)、模型评估:使用测试数据集来评估模型的性能。我们可以使用指标如均方误差、准确率等来衡量模型的预测能力。

(6)、预测未来天气:一旦模型训练完成,我们就可以使用它来预测未来的天气情况。输入新的特征(例如明天的温度、湿度等),模型会给出相应的天气预测结果。


在这里插入图片描述


在这里插入图片描述


三、无监督学习

无监督学习与监督学习相对应。在监督学习中,我们有明确的目标和标签,而在无监督学习中,我们没有明确的目标,也不需要给数据打标签。以下是无监督学习的几个特点:

  • 无明确目的:无监督学习没有预先定义的目标。我们试图从未标记的数据中发现潜在的结构。
  • 无需标签:与监督学习不同,无监督学习不需要给数据打标签。
  • 难以量化效果:由于缺乏明确目标,无监督学习的效果很难量化。

无监督学习在许多实际场景中都有广泛的应用。以下是一些例子:

  • 用户细分:广告平台可以使用无监督学习对用户进行细分。除了基本的性别、年龄、地理位置等维度外,还可以根据用户行为进行更精细的分类。

    以下是一些常见的用户细分维度和模型:

    (1)、RFM模型:这是一种常用于用户价值分析的模型,基于以下三个指标对用户进行分类:

    • 最近一次消费时间(Recently):用户最近一次购买的时间距离现在有多久。

    • 消费频次(Frequency):用户在一段时间内购买的次数。

    • 消费金额(Money):用户在一段时间内的累计消费金额。

    (2)、行为模式:根据用户的行为和互动模式进行分类,例如:

    • 活跃度:用户在网站或应用上的活跃程度,包括登录频率、页面浏览次数等。

    • 购买行为:用户的购买频率、购买金额、购买类别等。

    • 社交互动:用户在社交媒体上的互动、分享、评论等。

    (3)、兴趣和偏好:根据用户对不同内容、产品或服务的兴趣进行分类,例如:

    • 浏览历史:用户在网站上浏览的页面、产品或文章。

    • 点击行为:用户点击的广告、推荐内容或链接。

    (4)、用户生命周期阶段:将用户分为不同的生命周期阶段,例如:

    • 新用户:刚刚注册或开始使用产品的用户。

    • 活跃用户:经常使用产品的用户。

    • 流失用户:曾经活跃但现在不再使用产品的用户。

    (5)、个性化标签:根据用户的特定属性或行为添加标签,例如:

    • VIP用户:高价值、高忠诚度的用户。

    • 优惠敏感用户:对折扣和促销活动敏感的用户。


  • 推荐系统:无监督学习可以用于推荐系统。例如,根据用户的购买行为和浏览行为,推荐类似用户喜欢的商品。

在这里插入图片描述


以下是一些常见的无监督学习算法:

  • 聚类算法Clustering):将不带标签的数据分组成簇。这些算法可以帮助我们发现数据中的相似性。

    一些常见的聚类算法包括:

    • K-Means:将数据划分为k个组。

    • K-Medoids:类似于K-Means,但选择簇中的中心点而不是平均值。

    • DBSCAN:基于密度的聚类算法,可以发现不规则形状的簇。

    • OPTICS:另一种基于密度的聚类算法。

    • CLIQUE:用于发现高维数据中的簇。


  • 关联规则学习(Association Rule Learning:用于发现变量之间的有趣关系。例如,我们可以使用这些算法来发现购物篮中的商品之间的关联。一些常见的关联规则学习算法包括:

    • Apriori:用于挖掘频繁项集和关联规则。
    • FP-Growth/FPtree:另一种频繁项集挖掘算法。
    • Eclat:用于发现频繁项集。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/439478.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

MES组件车间解决方案:提高生产管理效率和质量的关键

市场环境的变化得越来越恶劣,现代生产管理理念不断更新,制造型企业是否进入管理的良性循环,关键在于“计划”与“执行”的密切配合,企业和车间管理人员必须在最短的时间内掌握生产现场的变化,并做出准确的判断和应对措…

龙芯第四代3A6000主板与龙芯3A500龙架构兼容,具备丰富的接口和扩展性

龙芯 3A6000 处理器完全自主设计、性能优异,代表了我国自主桌面 CPU 设计领域的最新里程碑成果。龙芯 3A6000 处理器的推出,说明国产 CPU 在自主可控程度和产品性能上已双双达到新高度,也证明了国内有能力在自研 CPU 架构上做出一流的产品。 …

洗车行业小程序源码系统 带完整的安装代码包以及搭建教程

大家好!今天来给大家分享一款洗车行业小程序源码系统,通过小程序,用户可以方便地预约洗车服务、查看服务进度,洗车店也可以实时管理订单、安排人员,从而提高服务效率。同时,小程序界面简洁明了,…

蓝牙耳机什么牌子好?全价位段盘点,真人实测带你避开雷区!

​无线耳机已经成为现代生活中的必备数码产品,尤其在感受到无线带来的自由后,很难再适应有线耳机的束缚。因此,耳机市场竞争激烈,各种类型和外观的耳机层出不穷。在此,我为大家总结了五款使用体验很不错的蓝牙耳机&…

VsCode搭建Spring Boot项目环境

VsCode搭建Spring Boot项目环境 1、前提条件:配置Java环境 下载安装JDK配置环境变量 2、VsCode配置SpringBoot环境 安装扩展 配置Maven 找到Maven配置文件,进行打开settings.json,添加如下代码: "workbench.iconThem…

工具 | 解决IDEA每次git拉取远程代码 default changelist 都会出现 .idea文件修改记录

问题描述: 每次我在拉取远程代码的时候,git都会默认将 .idea当中的文件(例如:compiler.xml or workspace.xml)都会莫名其妙的自动修改。 这里吐槽一下很离谱的一个现象,仔细看下修改的内容,最离…

邮件营销新手必读指南?怎样做好邮件营销?

邮件营销的全流程及步骤?做好邮件营销有哪些注意点? 邮件营销作为一种传统却依然高效的推广手段,被众多企业所青睐。对于新手来说,如何开展邮件营销,却是一个值得探讨的话题。AokSend将为你提供一份邮件营销新手必读指…

盘点热门的5个AI视频工具(上):附保姆级教程,居然还有免费的?(建议收藏)

一条完全使用 AI 做出的短视频,点赞上万,转发上万! 你敢信,这是我在前几天刷视频的时候,看到的一个 AI 视频案例。 这种 AI 视频为什么会火? AI 虽然不是什么新的领域,但 2023 年&#xff0c…

mini-spring|把AOP动态代理,融入到Bean的生命周期

本文完成 AOP 核心功能与 Spring 框架的整合,最终能通过在 Spring 配置的方式完成切面的操作。 解决问题: 怎么借着 BeanPostProcessor 把动态代理融入到 Bean 的生命周期中,以及如何组装各项切点、拦截、前置的功能和适配对应的代理器。 …

c++ 中const

对于基础类型直接赋值 void test01(){const int data10;cout<<"data"<<data<<endl;int * p (int*)&data;*p 1000;cout<<"*p"<<*p<<endl;cout<<"after data"<<data; } c中&#xff0c;对于…

Github 2024-03-02 开源项目日报Top9

根据Github Trendings的统计&#xff0c;今日(2024-03-02统计)共有9个项目上榜。根据开发语言中项目的数量&#xff0c;汇总情况如下&#xff1a; 开发语言项目数量非开发语言项目2Rust项目1JavaScript项目1Shell项目1C项目1TypeScript项目1C#项目1Python项目1 任天堂Switch模…

47. 【Linux教程】逻辑卷的简单使用

本小节介绍创建 LVM 的步骤&#xff0c;并介绍如何简单的使用 LVM&#xff0c;主要分为&#xff1a;定义物理卷、创建卷组、创建逻辑卷、创建文件系统、修改 LVM。 1.LVM 中的几个概念 PV(physical volume)&#xff0c;物理卷在逻辑卷管理系统最底层&#xff0c;可为整个物理硬…

那些像白牌的品牌正在霸榜TikTok美区!国货之光闪耀海外!

北京时间 3 月 6 日&#xff0c;据路透社报道&#xff0c;美国两党国会议员在周二提出了一项法案&#xff0c;要求字节跳动公司剥离对旗下短视频应用 TikTok 的控制权&#xff0c;否则就禁止应用商店上架分发 TikTok。 TikTok 对此回应称&#xff1a;“无论提案人如何掩饰&…

在线免费预览查看 Axure rp 原型

Axure RP 不仅可以绘制详细的产品概念&#xff0c;还可以在浏览器中生成 html 页面进行参考&#xff0c;但需要安装插件才能打开。安装 Axure rpchrome 插件之后&#xff0c;还需要在扩展程序中选择 “允许访问文件网站”&#xff0c;否则无法在 Axure 中成功。 在线查看原型。…

基于深度学习的驾驶员分心驾驶行为(疲劳+危险行为)预警系统使用YOLOv5+Deepsort实现驾驶员的危险驾驶行为的预警监测

人物专注性检测 项目快速预览 主要不同地方为&#xff1a; 1、疲劳检测中去掉了点头行为的检测&#xff0c;仅保留闭眼检测和打哈欠检测。 2、Yolov5的权重进行了重新训练&#xff0c;增加了训练轮次。 3、前端UI进行了修改&#xff0c;精简了部分功能。 项目介绍 该项目…

0基础学习VR全景平台篇第143篇:限定访问功能

大家好&#xff0c;欢迎观看蛙色VR官方——后台使用系列课程&#xff01;这期&#xff0c;我们将为大家介绍如何使用限定访问功能。 一.什么是限定访问功能&#xff1f; 限定访问&#xff0c;就是可以在编辑后台设置可以访问作品的用户的类型&#xff0c;还有可以访问作品的IP…

某准网招聘接口逆向之WebPack扣取

​​​​​逆向网址 aHR0cHM6Ly93d3cua2Fuemh1bi5jb20v 逆向链接 aHR0cHM6Ly93d3cua2Fuemh1bi5jb20vc2VhcmNoP3BhZ2VOdW09MSZxdWVyeT1weXRob24mdHlwZT01 逆向接口 aHR0cHM6Ly93d3cua2Fuemh1bi5jb20vYXBpX3RvL3NlYXJjaC9qb2IuanNvbg 逆向过程 请求方式&#xff1a;GET 参数构成…

434G数据失窃!亚信安全发布《勒索家族和勒索事件监控报告》

最新态势快速感知 最新一周全球共监测到勒索事件90起&#xff0c;与上周相比数量有所增加。 lockbit3.0仍然是影响最严重的勒索家族&#xff1b;alphv和cactus恶意家族也是两个活动频繁的恶意家族&#xff0c;需要注意防范。 Change Healthcare - Optum - UnitedHealth遭受了…

vue实现文字手工动态打出效果

vue实现文字手工动态打出效果 问题背景 本文实现vue中&#xff0c;动态生成文字手动打出效果。 问题分析 话不多说&#xff0c;直接上代码&#xff1a; <template><main><button click"makeText"><p class"text">点击生成内容…

【吊打面试官系列】Java虚拟机JVM篇 - 三道最简单最常问的JVM面试题

大家好&#xff0c;我是锋哥。今天分享三道最简单最常问的JVM面试题&#xff0c;希望对大家有帮助&#xff1b; 一&#xff0c;请问JDK与JVM有什么区别&#xff1f; 简单来说&#xff1a; 1. JVMJava 运行器&#xff1b; 2. JREJVM Java 基础&核心类库&#xff1b; 3. JD…