我的机器学习起步如何Getting Started

学习技巧和原则

  • 先通过经典书籍进行科普
  • 知名机器学习网站
  • 根据书籍或网站的目录,先泛读、再选择有兴趣的部分重点精读、后至于反复读
  • 知行合一

起步Getting Started

  • 周志华版《机器学习》,又名西瓜书

可以作为科普书籍,需要主动略过对于理论推导过程,和数学公式的求真

介绍的非常全面,可作为参考书籍

书籍的前几章基本上概括了机器学习现在的框架,有助于对具体的机器学习算法或工具进行把握

  • 吴军博士《数学之美》

更侧重对于自然语言处理、语音识别、搜索等方面的人工智能上层应用,做了专向的科普和技术原理概要介绍。

文风轻松、叙事流畅,读起来相当轻松

区别于常见回归分类的基础应用,对于更上层的人工智能技术应用进行了介绍,并阐述了背后的数学原理并不复杂

更侧重于基于大数据的概率统计、马尔可夫过程、条件概率等技术手段进行人工智能应用

  • scikit-learn.org官网起步资料
    • getting_started
      知识成图

介绍了粗略结构

    • user_guide目录结构

仅关注目录结构,把握机器学习的大脉络

每个章节仅读取头部几个章节的简单的内容

数据清洗,对于这一部分目录的了解,让你几乎可以作为一名初级的数据工程师

    • 简明扼要介绍机器学习要解决的问题
      • 有监督学习:分类问题、回归问题
      • 无监督学习: 聚类、概率分布、降维等
    • Faqs

英文比较好的同学,可以深入研究其它官网例子

  • 信息论主要观点
    • 信息消除不确定性
    • 信息量、信息熵

代码例子学习网站

  • scikit-learn

相当全面的机器学习工具库,着力解决中小数据规模的机器学习问题,但大部分也够用了

基于深度学习的神经网络,确实在既适应线性问题、又适应非线性问题方面比较突出
可视化例子

  • OpenCV

对于图片或视频进行处理,可以进行一些SVMKNN的机器学习,甚至包括一些预处理。例如,常用的图片灰度化手段,其实从机器学习来看,就是专家赋能后进行降维处理,但是,对于学习任务信息量又没有丢失太多,以致于学习不到什么东西。

彩蛋

  • 回归问题和分类问题的桥梁

对数几率回归;两者的差别没有想想的那么大

  • CNN卷积神经网络

在图片特征抽取上面找到了工程上可接受的调参技术手段,关键在于最终步骤采样特征向量形成

相比较于常见较为容易处理特征向量,深度学习对于容易获取的图片数据、但难以描述其典型特征的的粗材料数据,提供了形成特征向量的方法

  • 对于关系数据库中的表记录作为特征向量的思考

关系数据库中的唯一索引对于机器学习并不友好,可以考虑提前去除

非唯一索引等非独立属性可以作为聚类分析的关注对象
其它列数据基本上可以做到相互独立,或依赖比较弱

  • 算力的忧虑

一般人很难拥有强大算力,需要注意如何自举

结束语

机器学习对于其成熟的应用领域,确实达到了工具化的程度,如果了解了,就会能够使用,并成为倍增器!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/286228.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

无监督关键词提取算法:TF-IDF、TextRank、RAKE、YAKE、 keyBERT

TF-IDF TF-IDF是一种经典的基于统计的方法,TF(Term frequency)是指一个单词在一个文档中出现的次数,通常一个单词在一个文档中出现的次数越多说明该词越重要。IDF(Inverse document frequency)是所有文档数比上出现某单词的个数,通常一个单词…

IEEE 802.15.4和ZigBee基础

该文章不知道从哪里抄的,忘记出处了,放在电脑中很久了。里面略有改动。若有侵权,请告诉我删除。IEEE 802.15.4网络是指在一个POS(10米左右范围)内使用相同的无线信道,并通过IEEE 802.15.4标准相互通信的一组…

【MySQL】orderby/groupby出现Using filesort根因分析及优化

序 在日常的数据库运维中,我们可能会遇到一些看似难以理解的现象。比如两个SQL查询语句,仅仅在ORDER BY子句上略有不同,却造成了性能的天壤之别——一个飞速完成,一个则让数据库崩溃。今天就让我们围绕这个问题,深入剖…

我这个小白坚持写作一整年,赚了多少?

今天是 2023 年的最后一天,和大家一起来一个年终复盘,主题就是:2023年,我到底赚了多少? 今年除了工作之外,我的重点都放在了写文章上。 截止到今天,已经在公众号上发布了 100 篇原创文章&…

selenium3自动化测试(这一篇就够了)——自学篇

📢专注于分享软件测试干货内容,欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正!📢交流讨论:欢迎加入我们一起学习!📢资源分享:耗时200小时精选的「软件测试」资…

瑞吉外卖项目详细总结

文章目录 瑞吉外卖1.技术栈2.项目文件架构3.业务功能模块(例子)3.1管理员登录接口层(Controller)3.2管理员登录实现层(ServiceImpl)3.3管理员登录服务层(Service)3.4管理员登录Mapper层 4.公共模块4.1 BaseContext(保存…

Cuk、Zeta和Sepic开关电源拓扑结构

Cuk、Zeta和Sepic变换器,三种拓扑结构大致类似。不同点在于电感和二极管,MOS管的位置关系的变化。 Cuk电源是一种非隔离的直流电源转换器,其基本结构包括输入滤波电容、开关管、输入电感、输出电感和输出电容等元件。Cuk电路可以看作是Boost和Buck电路的…

day5--java基础编程:异常,内部类

6 异常 6.1 异常概述 出现背景: 在使用计算机语言进行项目开发的过程中,即使程序员把代码写得尽善尽美,在系统的运行过程中仍然会遇到一些问题,因为很多问题不是靠代码能够避免的,比如:客户输入数据的格式&#xff0c…

磁盘管理与文件系统

步骤: 1.建立分区(必须分区) 在文件中的格式开头为b ,块设备 2.文件系统 因公安是个硬件设备,是一类软件的总称,管理文件的功能,下载文件占硬盘的空间 3.挂载 将硬盘与系统内的文件夹做关…

图论及其应用(匈牙利算法)---期末胡乱复习版

目录 题目知识点解题步骤小结题目 T1:从下图中给定的 M = {x1y4,x2y2,x3y1,x4y5},用 Hungariam算法【匈牙利算法】 求出图中的完美匹配,并写出步骤。 知识点 关于匈牙利算法: 需要注意的是,匈牙利算法仅适用于二分图,并且能够找到完美匹配。什么是交替路?从一个未匹…

Linux/Unix/国产化操作系统常用命令(二)

目录 后CentOS时代国产化操作系统国产化操作系统有哪些常用Linux命令关于Linux的LOGO 后CentOS时代 在CentOS 8发布后,就有了一些变化和趋势,可以说是进入了"后CentOS时代"。这个时代主要表现在以下几个方面: CentOS Stream的引入…

刚来实习就跑路,可行么?

最近 编程导航 的一位鱼友问了个让我血压升高的问题: 鱼友提问 鱼皮你好,我投了两周简历,然后昨天面了一个小厂的远程实习并且拿到了 offer,我要不要试试呢? 我在顾虑比如我如果在远程实习期间找到一个中厂或者大厂…

vite项目中动态引入src失败的问题解决:require is not defined

问题复现 静态引入路径(无问题) <el-menu-item v-for"(item,index) in menuList" :index"item.name" :key"index"><img class"menuItemImg" src"../svg/router/homePage.svg" alt"">{{ item.meta.c…

浙大链协2023年终总结

2 0 2 4 元旦 快乐 龙腾虎跃 01 引言 俗话说&#xff1a;"币圈一天&#xff0c;人间十年"&#xff0c;数字货币一天的涨跌可能抵上其他资产价格一年的波动幅度。而经历过漫长的熊市后&#xff0c;铭文的火爆十分生动地表述了这一口号...... 2023年&#xff0c;浙大链…

odoo17后台启动过程3——三种server

文件位置&#xff1a;odoo\service\server.py 1、三种server&#xff1a; 1.1、Threaded 这是Odoo默认的选项&#xff0c;线程模式&#xff0c;我们知道python的多线程并不是真正的多线程&#xff0c;所以&#xff0c;这种模式下&#xff0c;并发性能较低&#xff0c;也无法利…

使用拉普拉斯算子的图像锐化的python代码实现——数字图像处理

原理 拉普拉斯算子是一个二阶导数算子&#xff0c;用于图像处理中的边缘检测。它通过计算图像亮度的二阶空间导数来工作&#xff0c;能够突出显示图像中的快速变化区域&#xff0c;如边缘。 图像锐化的原理&#xff1a; 图像锐化是指增强图像中的边缘和细节&#xff0c;使图像…

Python基础知识:整理1 使用函数实现银行ATM操作

定义一个全局变量&#xff1a; money, 用来记录银行卡余额&#xff08;默认为5000000&#xff09; 定义一个全局变量&#xff1a; name, 用来记录客户姓名&#xff08;启动程序时输入&#xff09; 定义如下函数&#xff1a; 查询余额的函数&#xff1b; 存款函数&#xff1b; 取…

blender mix节点和它的混合模式

Mix 节点是一种用于混合两个颜色或者两个图像的节点&#xff0c;它有以下几个输入和输出&#xff1a; Color1&#xff1a;用于接收第一个颜色或者图像&#xff0c;也就是基色。Color2&#xff1a;用于接收第二个颜色或者图像&#xff0c;也就是混合色。Fac&#xff1a;用于控制…

第六节、项目支付功能实战-保证金支付、支付回调

摘要 上一节中,我们申请了商户的证书、APIv3密钥,以及编写了微信平台证书的下载的相关代码,并以微信平台证书下载和微信下单接口为例分析了sdkapi的使用、sdk是如何封装加签和验签的流程的。这一节我们将结合实际保证金支付业务来实现整个支付的功能。 功能实现 1、实现小…

RDS快速入门

目录 实例创建 设置白名单 RDS&#xff08;Relational Database Service&#xff09;是一种托管式的关系型数据库服务&#xff0c;它为用户提供了一种简单、可靠、安全的方式来部署、操作和扩展数据库。具有安全可靠、解决运维烦恼、有效降低成本和自研增加等四大特性&#x…