机器学习入门介绍

各位大佬好 ,这里是阿川的博客 , 祝您变得更强

在这里插入图片描述 个人主页:在线OJ的阿川

大佬的支持和鼓励,将是我成长路上最大的动力 在这里插入图片描述

阿川水平有限,如有错误,欢迎大佬指正 在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

目录

  • 三大方向
  • 机器学习产生的原因
  • 机器如何学习
  • 模型评价
  • 应用层
  • 适用条件
  • 学习要弄清楚
    • 数据什么样
    • 研究哪些问题
    • 如何分门别类
    • 常见误区与局限
  • 工具栏
    • 四大必备工具
      • Anaconda
      • [Jupyter notebook](https://jupyter.org/)
      • Numpy(重点)
      • Matplotlib

机器学习

  • 计算机 从数据中学习规律并改善自身进行预测的过程

三大方向

在这里插入图片描述
其中深度学习为重点

机器学习产生的原因

  • 人与计算机理解方式不同
  • 规律系统不够用
  • 逻辑判断专家参与耗时耗力

机器如何学习

在这里插入图片描述
注意:我们期望机器在没有见过的数据集表现良好,所以在训练中会采用28原则

  • 80%的历史数据用来训练
  • 20%的数据用来测试

在这里插入图片描述

模型评价

模型要进行模型评价

在这里插入图片描述

应用层

  • 商品画像
  • 用户画像
  • 商品推荐
  • 搜索算法
  • 以画搜画
  • 商品排序
  • 人脸检测
  • 活体检测
  • 人脸识别

适用条件

  • 问题存在某种模式
    • 一般是人能够解决的,若人解决不了的,作为强人工智能领域
  • 难以人工总结定义
  • 足够样本数据
    • 小数据下会失效

学习要弄清楚

学习机器学习要弄清楚

在这里插入图片描述

数据什么样

  • 常用的公开数据集
  • 典型实例
  • 如何使用数据
  • 高维特征空间
  • 结构化与非结构化数据

研究哪些问题

  • 任务地图

在这里插入图片描述

  • 分类任务(重点)

    • 特征

      • 已知样本特征
      • 判断样本类别
      • 二分类,多分类,多标签分类
    • 二分类

    • 多分类

    • 多标签分类

      • 标签间不互斥
      • 概率和不为1
    • 更多实例

  • 回归任务(重点)

    • 特征

      • 用于预测
    • 线性回归

    • 多项式回归

      • 一个因变量
      • 一个或多个自变量
      • 任何函数都可以用多项式逼近
    • 逻辑回归

      • 实际上是分类
      • 细节很多,求法不同,导致在回归类

不管是分类还是回归,都属于监督学习

  • 类别标记
  • 直接反馈

无监督学习

  • 无标准答案,去探索某种规律或结构

强化学习

  • 研究环境与行动之间的互动,以获取最大化结果

如何分门别类

划分依据

  • 监督学习

    • 训练数据有标记
    • 基础而重要
  • 无监督学习

    • 训练数据未有标记
    • 聚类
    • 降维
      • 主成分分析
        • K均值算法
        • 密度聚类
        • 最大期望算法
      • 核方法
  • 半监督学习

    • 少量标记,大量无标记
  • 强化学习

    • 观测环境
    • 估计状态
    • 执行操作
    • 获得回报或惩罚
  • 批量学习

    • 先训练再使用
    • 需要大量的时间和计算资源
    • 通常都是高线完成
  • 在线学习

    • 循序渐进
    • 边学边用
  • 基于实例的学习

  • 基于模型的学习

常见误区与局限

  • 数据越多越好吗

    • 数据质量是关键
    • 多不意味着准确
    • 传统方法依然有用
  • 模型真的可信吗

    • 可解释性难题
    • 深度学习是个黑盒子
    • 深层学习有具优势
  • 随机和确定性哪个更好

    • 机器学习本质上是统计
    • 确定性依然十分重要
    • 随机与确定性间的平衡
  • 小样本集怎么办

    • 机器学习适合大数据
    • 很多问题是天然小数据
    • 小样本学习是机器学习的挑战
  • 推理而不只是判断

    • 机器学习尚在判断阶段
    • 抽象思维和逻辑思维推理远未实现
    • 数学依旧是汪洋大海
  • 机器学习是机会

    • 深度学习局限性凸显
    • 本质上是几何空间变换
    • 具体问题应具体分析

工具栏

四大必备工具

在这里插入图片描述

Anaconda

在这里插入图片描述

Jupyter notebook

  • 基础使用
    • 基础操作
      • 快捷键
      • markdown
  • 高级使用
    • %%writefile
    • %pycat
    • %run
    • %timeit
    • %time
    • %%timeit
    • %%time
    • %whos
    • %lsmagic
    • %magic

Numpy(重点)

  • 基础知识

    • 性能对比
  • 数组创建

    • 常用属性
      • ndim\shape\size
  • 创建数组

    • np.array()
    • ones/ones_alike
    • zeros/zeros_like
    • full/full_like 指定数值
    • empty/empty_like 实数组
    • arange/linspace 等量数组
    • random/rand/randint/randn/nomal/uniform/seed 随机数组
    • reshape 改变形状
    • help/? 查看文档
  • 基础索引

  • 数据合并与拆分

    • 合并
      • concatnade/vstack/hstack
    • 拆分
      • split/vsplit/hsplit
  • 矩阵运算

    • 一元运算
      • abs/sqrt/square/exp/log/ceil/floot/round/sincostan
    • 二元运算
      • dot/加速乘除/取余/幂运算
    • 矩阵运算
      • 加速乘除/dot/转查/逆矩阵/行列式
  • 统计运算

    • min/max
    • sum/mean/median/std/var
    • ptp/percentile/cumsum/diff/prod
  • arg运算

    • argmin/argmax/argsort/argpartition
  • 补齐索引和布尔索引

Matplotlib

  • 数据可视化基础
    • 拆线
    • 散点
    • 绘制设置

好的,到此为止啦,祝您变得更强

在这里插入图片描述

道阻且长 行则将至

个人主页:在线OJ的阿川大佬的支持和鼓励,将是我成长路上最大的动力 在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/630015.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2024年第十届中西部外语翻译大赛

2024年第十届中西部外语翻译大赛 竞赛信息 “由中西部翻译协会共同体指导发起,各省市译协共建学术指导委员会,2024年第十届中西部外语翻译大赛由中西部翻译协会共同体秘书处(武汉公仪网络科技有限公司)承办。” - 获奖证书样图 -…

springSecurity快速入门

1. 介绍 springsecurity是安全框架,准确来说是安全管理框架。相比与另外一个安全框架Shiro,springsecurity提供了更丰富的功能,社区资源也比Shiro丰富 springsecurity框架用于Web应用的需要进行认证和授权 认证:验证当前访问系统…

红蓝对抗 网络安全 网络安全红蓝对抗演练

什么是红蓝对抗 在军事领域,演习是专指军队进行大规模的实兵演习,演习中通常分为红军、蓝军,演习多以红军守、蓝军进攻为主。类似于军事领域的红蓝军对抗,网络安全中,红蓝军对抗则是一方扮演黑客(蓝军&…

分享四款AI论文工具和降重技术

在科研领域,AI写作工具如同新一代的科研利器,它们能够极大提高文献查阅、思路整理和表达优化的效率,本质上促进了科研工作的进步。AI写作工具不仅快速获取并整理海量信息,还帮助我们精确提炼中心思想,显著提升论文写作…

如何隐藏计算机IP地址,保证隐私安全?

隐藏计算机的IP地址在互联网在线活动种可以保护个人隐私,这是在线活动的一种常见做法,包括隐私问题、安全性和访问限制内容等场景。那么如何做到呢?有很5种方法分享。每种方法都有自己的优点和缺点。 1. 虚拟网络 当您连接到虚拟服务器时,您…

数据结构——希尔排序

懒猫老师-数据结构-(62)希尔排序_哔哩哔哩_bilibili 对直接插人的改进 基本思想 将整个待排序记录分为若干子序列,在子序列内分别进行直接插入排序,待整个序列中的记录基本有序时,对全体记录进行直接插入排序。 分割排序的目的 1、减少待…

DeepSpeed

文章目录 一、关于 DeepSpeed1、DeepSpeed 是什么2、深度学习训练和推理的极致速度和规模3、DeepSpeed 的四大创新支柱1)DeepSpeed 训练2)DeepSpeed 推理3)DeepSpeed 压缩4)DeepSpeed4Science 4、DeepSpeed 软件套件DeepSpeed 库推…

公共命名空间和RHP

概述 RHP的全称是:the little Robot that Helped me Program,帮我编程序的小机器人。 RHP必然存在,C语言的宏、C的模板,都是RHP;更复杂的例子,是lex和yacc,它们是制作程序的程序,也…

UE5C++ FString做为参数取值时报错error:C4840

问题描述 用来取FString类型的变量时报错: 问题解决 点击错误位置,跳转到代码: void AMyDelegateActor::TwoParamDelegateFunc(int32 param1, FString param2) {UE_LOG(LogTemp, Warning, TEXT("Two Param1:%d Param2:%s"), param…

Linux基本工具的使用

什么是工具? 在Linux中,工具的本质也是指令,只是因为这些指令与我们的开发的关系不是很大,所以就被称为工具 1 软件包管理器yum 在我们的Windows上如果想要安装软件,第一件事就是要先下载软件安装包,然后…

VUE之旅—day2

文章目录 Vue生命周期和生命周期的四个阶段created应用—新闻列表渲染mounted应用—进入页面搜索框就获得焦点账单统计(Echarts可视化图表渲染) Vue生命周期和生命周期的四个阶段 思考: 什么时候可以发送初始化渲染请求?&#xff…

Spring 各版本发布时间与区别

版本版本特性Spring Framework 1.01. 所有代码都在一个项目中 2. 支持核心功能IoC、AOP 3. 内置支持Hibernate、iBatis等第三方框架 4. 对第三方技术简单封装。如:JDBC、Mail、事务等 5. 只支持XML配置方式。6.主要通过 XML 配置文件来管理对象和依赖关系&#xff0…

首次曝光!我喂了半年主食冻干,喵状态真滴顶~

科学养猫理念的推广,使得主食冻干喂养越来越受到养猫者的欢迎。主食冻干不仅符合猫咪的自然饮食习惯,还能提供丰富的营养,有助于保持猫咪的口腔和消化系统健康。我家喂了半年主食冻干,猫咪的状态是真的不一样了! 然而…

P9748 [CSP-J 2023] 小苹果 / P7071 [CSP-J2020] 优秀的拆分:做题笔记

目录 P9748 [CSP-J 2023] 小苹果 思路 代码 P7071 [CSP-J2020] 优秀的拆分 思路 代码 P9748 [CSP-J 2023] 小苹果 P9748 [CSP-J 2023] 小苹果 思路 先写几个看看规律 题意我们能看出来是三个三个一组的,然后每次取走的都是三个里面的第一个。我们应该很容易…

23.HashMap的put方法流程

一、put方法的流程图 二、put方法的执行步骤 首先,根据key值计算哈希值。然后判断table数组是否为空或者数组长度是否为0,是的话则要扩容,resize()。接着,根据哈希值计算数组下标。如果这个下标位置为空&a…

Linux平台和Windows平台互传文件

rz和sz的出发对象都是从Linux出发的,例如sz发送(Send)从Linux->发送到Windows。 rz 从Windows文件发送到Linux中 先创立一个新文本文件 之后将hello Windows输入到该文本文件中 在显示器上显示里面是否有hello Windows内容 sz发送Lin…

【SpringBoot】SpringBoot整合jasypt进行重要数据加密

📝个人主页:哈__ 期待您的关注 目录 📕jasypt简介 🔥SpringBoot使用jasypt 📂创建我需要的数据库文件 📕引入依赖 🔓配置数据库文件(先不进行加密) 🌙创…

暴利 选品大课:选品决定成败,教你多种大爆款选品方法(12节课)

课程目录 001.第一讲:选品决定成败.mp4 002.第二讲:选品也有生辰八字,mp4 003.第三讲:高热度选品底层逻辑,mp4 004,第四讲:高动销选品底层逻辑,mp4 005,第五讲:高点击选品底层逻辑,mp4 006.第六讲:高转化选品底层逻辑.mp4 007.第七讲:低付费选品底层逻辑.mp4 008,第八讲…

kubernetes多master集群架构

一、完成master02节点的初始化操作 master02环境准备,详细过程参考上一期博客环境准备 #添加主机映射 vim /etc/hosts 192.168.88.3 master01 192.168.88.8 master02 192.168.88.4 node01 192.168.88.5 node021、准备master02节点需要的文件 从 master01 节点上拷…

USB-OTG:1、OTG原理介绍

目录 🍅点击这里查看所有博文 随着自己工作的进行,接触到的技术栈也越来越多。给我一个很直观的感受就是,某一项技术/经验在刚开始接触的时候都记得很清楚。往往过了几个月都会忘记的差不多了,只有经常会用到的东西才有可能真正记…