【分享】我想上手机器学习

目录

前言

一、理解机器学习

1.1 机器学习的目的

1.2 机器学习的模型

1.3 机器学习的数据

二、学习机器学习要学什么

2.1 学习机器学习的核心内容

2.2 怎么选择模型

2.3 怎么获取训练数据

2.4 怎么训练模型

三、机器学习的门槛

3.1 机器学习的第一道门槛

3.2 机器学习的第二道门槛

3.3 机器学习的第三道门槛


前言

对于新人来说,开始学习机器学习可能会感到有些困难。例如一般会给出海一样阔的学习清单,然后还需要掌握基础数学知识、学习Python编程语言、学习机器学习基础理论、实践项目、参与社区和持续学习等方面的努力等等等等等等等等等等等一大堆的“刚性要求”及“说与不说都一样的建议”。

与其说这些是学习建议或者学习指引,还不如说是“机器学习劝退书”。如果不抓住主干,而是繁枝杂叶,那么养猪都要买上十本书,看完隔壁家猪都下崽了。

下面结合实际的经验,和一些真正上手人的经历,今天我来分享一下机器学习上手要怎么搞。

一、理解机器学习

1.1 机器学习的目的

机器学习的目的就是通过X来预测Y,

1.2 机器学习的模型

但X与Y的关系往往不知,所以需要假设X与Y符合某个模型。而模型并非完全是死的,它预留了一些参数,例如线性模型y = wx,就预留了w作为参数,模型是固定的(它必然是线性的),但模型不是死的,可以通过参数w来调整线性关系的斜率。

1.3 机器学习的数据

模型中预留的参数如何确定?这时候就依靠历史数据了,求解一个参数,使得模型在历史数据中预测最准确,以此来确定模型的参数。

二、学习机器学习要学什么

2.1 学习机器学习的核心内容

由上而知,机器学习就是选择一个模型,然后再用数据训练模型,以达到我们的目的---用X预测Y。因此,重心就只有两个:

(1)怎么选择模型

(2)怎么获取训练数据

(3)怎么训练

2.2 怎么选择模型

要知道怎么选择模型,就必须了解模型,了解更多的模型。只有桔子梨子桃子李子都吃过了,才能知道现在想吃什么。所以这是一个很简单的问题, 多学几个模型,玩几个模型,多玩玩,就知道了。但是不是所有模型都要知道呢?当然不是,也是不可能的!就像梨子桃子桔子李子柚子柿子椰子梨子橙子车厘子都未必样样吃齐,一般先学着五六个常用模型,就算入门了。

机器学习基本的模型,包括线性回归、逻辑回归、支持向量机(SVM)、决策树、随机森林、聚类分析、降维等。这些模型可用于分类和回归问题,如房价预测、股票走势或测试成绩等连续变化的案例。其中,线性回归和逻辑回归是处理回归任务最常用的算法之一,而SVM、决策树和随机森林则是处理分类任务常用的算法。

在机器学习入门阶段,建议先学习一些基础模型,如线性回归和逻辑回归,以及一些基本的聚类方法和降维方法。然后,可以根据实际问题和数据集的特点,选择适合的模型进行学习和应用。同时,还需要了解各种模型的应用场景、优缺点、参数设置等,以便更好地应用它们解决实际问题。

2.3 怎么获取训练数据

这里的获取训练数据,并非指获取最原始的数据,而是指怎么获取喂给模型的数据。这就涉及到数据清洗了,这里不铺开讲述,只要学习了模型,再看一两个案例,就自然知道要把数据处理成什么样来喂给模型了。因为不同的模型,所要求的数据也有个别的出入,实践一两下就自然知道要求了。实践出真知!

知道模型要求什么数据,接下来就是数据的处理了,这就是实打实打编程苦力工,对于有编程基础的同学来说,完全是肝的问题,而不是懂不懂的问题,不学自通。而对于没有编程基础的,也可以根据这些数据处理要求,作为编程的练习题,既可以学习数据清洗,又可以学习编程,一举两得,何乐而不为!

2.4 怎么训练模型

训练模型是最简单不过的事情,根据机器学习包(例如python中的sklearn)的API说明,依样画葫芦就行,根本不需要学习。属于动手试试就知的那种,完全不会成为门槛。

API说明在哪里找?官网、百度、CSDN、知乎,满大街都是,随便搜一下拿来就用。

三、机器学习的门槛

3.1 机器学习的第一道门槛

机器学习的第一道门槛,在模型(算法)的学习上,但基本学过就行。这就是个吃梨子桃子桔子李子柚子柿子椰子梨子橙子车厘子的过程,吃过就知道味道了。

这个中可能会涉及到一些数学知识,其实不必介怀,一知半解也是没关系的,不是人人都是美食家,也不是人人都是水果专家,一吃就知道这桃子是哪个品种,有没有施药,雨水有没有充足,吃过就行了,大概知道个味道,也不影响我下次去买水果时选择哪个水果。

3.2 机器学习的第二道门槛

机器学习的第二道门槛在于实践,做一个模型,肯定是希望有效果的,如果总是训练效果不好,这不免会打击信心,这时候就需要耐心与信心加持了。相信数据,相信会有效果,耐心去分析问题,这里必须说明,很多时候都是出现在数据问题上,所以需要很仔细的去了解数据,分析数据,清洗数据。

3.3 机器学习的第三道门槛

相信有许多迈过了第一道,第二道,已经入门的同学,却没有继续在机器学习上走下去。为什么?因为没有实践的机会!对!第三道门槛就是实践的机会! 一份工作也好,一份自己的项目也好,“被需要”是很重要的! 在获得实践机会后,将机器学习融入生活,才算真正开启了机器学习之路!

其实也没写几个字,却敲到手累了,有机会再细说。

最后,列出一些可以参考与学习的网站:

《1》人工智能学习路线图2023版-黑马程序员人工智能技术路线

《2》老饼|机器学习

《3》机器学习相关电子书_天赋好书(cnToFu.com)

《4》1. 监督学习 - sklearn中文教程 | 编程字典


如果觉得本文有帮助,点个赞吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/229003.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

文件上传和下载

文件上传 1.文件上传的原理: 要实现Web开发中的文件上传功能,通常需完成两步操作:一是在Web项目的页面中添加上传输入项,二是在Servlet中读取上传文件的数据,并保存到目标路径中。 由于大多数文件的上传都是通过表单的形式提交…

北邮22级信通院数电:Verilog-FPGA(12)第十二周实验(2)彩虹呼吸灯(bug已解决 更新至3.0)

北邮22信通一枚~ 跟随课程进度更新北邮信通院数字系统设计的笔记、代码和文章 持续关注作者 迎接数电实验学习~ 获取更多文章,请访问专栏: 北邮22级信通院数电实验_青山如墨雨如画的博客-CSDN博客 目录 一.代码部分 1.1一些更新和讲解 1.2改正后的…

【网络编程】-- 02 端口、通信协议

网络编程 3 端口 端口表示计算机上的一个程序的进程 不同的进程有不同的端口号!用来区分不同的软件进程 被规定总共0~65535 TCP,UDP:65535 * 2 在同一协议下,端口号不可以冲突占用 端口分类: 公有端口:0~1023 HT…

Linux环境下用yum安装postgres15

1. 下载PostgreSQL 15 安装包 在官网选择对应版本的安装包 https://www.postgresql.org/download/ Linux | CentOS 7 | PostgreSQL 15 2. 安装PostgreSQL 15 sudo yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-la…

chrome安装jsonview

写在前面 通过jsonview可以实现,当http响应时application/json时直接在浏览器格式化显示,增加可读性。本文看下如何安装该插件到chrome中。 1:安装 首先在这里 下载插件包,然后解压备用。接着在chrome按照如下步骤操作&#xf…

小程序一键生成工具哪个好?

在这个数字化时代,小程序已经成为商家吸引客户、提升业务的重要工具。但是,传统的小程序开发方式既费时又费力,让许多商家望而却步。 现在,有了乔拓云小程序模板开发平台,一切都变了。 乔拓云提供了大量精心设计的模板…

销售技巧培训之如何提高手机销售技巧

销售技巧培训之如何提高手机销售技巧 随着科技的迅速发展,手机已成为我们日常生活中不可或缺的一部分。作为一名手机销售员,了解手机销售技巧是必不可少的。本文将通过案例分析与实践,为你揭示手机销售的奥秘。 一、了解客户需求 在销售过程…

自动化运维工具-ansible部署

首先我们来谈一下,为什么要引入自动化运维呢? 引入自动化运维的目的是为了提高运维效率、降低人工操作的错误率、减少重复性的工作、提高系统的可靠性和稳定性。传统的手动运维方式存在以下问题: 出现了大量的人工干预,运维人员需…

Web端在线云剪辑方案

视频内容已经成为企业传播信息、展示品牌形象的重要手段。然而,视频制作并非易事,需要专业的技术和设备支持。为了帮助企业解决这个问题,美摄科技推出了Web端在线云剪辑方案,提供广播级专业技术赋能,帮助企业快速搭建视…

最新V2board面板支付设置(四)

顺哥博客 支付方式一(推荐): USDT收款: 特点:自己的USDT钱包收款,没有中间商,无手续费,实时到账项目开源地址:【点击进入】把文件usdtwebhook.php放到网站此目录下&…

使用命令行移除VSAN中故障磁盘

原创作者:运维工程师 谢晋 使用命令行移除VSAN中故障磁盘 前提故障盘移除 前提 客户有套VSAN环境内有一台服务器的磁盘组出现了一块故障的数据盘,但该盘已经处于完全掉线状态,无法进行正常移除。如下图: 如果遇到这种情况&am…

QT作业2

使用手动连接,将登录框中的取消按钮使用qt4版本的连接到自定义的槽函数中,在自定义的槽函数中调用关闭函数 将登录按钮使用qt5版本的连接到自定义的槽函数中,在槽函数中判断ui界面上输入的账号是否为"admin",密码是否为…

为什么Java程序员需要掌握多线程?揭秘并发编程的奥秘

为什么Java程序员需要掌握多线程?揭秘并发编程的奥秘 个人简介前言多线程对于Java的意义📌1.提高程序性能:📌2 提高用户体验:📌3支持并发处理:📌4 资源共享和同步:&#…

el-tree数据量过大,造成浏览器卡死、崩溃

el-tree数据量过大,造成浏览器卡死、崩溃 场景:树形结构展示,数据超级多,超过万条,每次打开都会崩溃 我这里采用的是引入新的插件虚拟树,它是参照element-plus 中TreeV2改造vue2.x版本虚拟化树形控件&…

Navicat 技术指引 | 适用于 GaussDB 分布式的数据迁移工具

Navicat Premium(16.3.3 Windows 版或以上)正式支持 GaussDB 分布式数据库。GaussDB 分布式模式更适合对系统可用性和数据处理能力要求较高的场景。Navicat 工具不仅提供可视化数据查看和编辑功能,还提供强大的高阶功能(如模型、结…

选自《洛谷深入浅出进阶篇》——欧拉函数+欧拉定理+扩展欧拉定理

欧拉函数: 欧拉函数定义: 1~n中与n互质的数的个数。 比如 欧拉函数是积性函数:(也就是)当 n与m互质的时候: 由算术基本定理,我们可以设n,那么我们只要计算出的取值就能求出的取…

snakeyaml编辑yaml文件并覆盖注释

文章目录 前言技术积累实战演示1、引入maven依赖2、覆盖注释工具类3、snakeyaml工具类4、测试用例5、测试效果展示 写在最后 前言 最近在做一个动态整合框架的项目,需要根据需求动态组装各个功能模块。其中就涉及到了在application.yaml中加入其他模块的配置&#…

Windows版Minio使用教程(启动,登录,修改密码)

1 、下载安装包 进入官网下载安装包: MinIO | 高性能、支持原生 Kubernetes的对象存储 信任程序安装,就可以啦 2、启动MinIO 第一步,找到minio.exe所在的目录,在地址栏输入cmd进入cmd窗口。 第二步,输入.\minio.exe…

项目状态报告

《项目状态报告》 第1章 当前阶段的工作完成情况 1.1 概述 1.2 各子系统详细进度 第2章 偏差及偏差原因 第3章 偏差纠正措施 第4章 拟进行的变更 第5章 存在的风险及应对计划 第6章 下一阶段主要工作

delphi android打开外部文件,报错android.os.FileUriExposedException解决方法

Android 7.0强制启用了被称作 StrictMode的策略,带来的影响就是你的App对外无法暴露file://类型的URI了。 如果你使用Intent携带这样的URI去打开外部App(比如:打开系统相机拍照),那么会抛出FileUriExposedException异常。 Delphi 为Android…