机器学习概述

文章目录

  • 机器学习应用背景
        • 数据挖掘
        • 个性化定制
        • 替代人力的软件应用
  • 什么是机器学习
      • 示例
  • 机器学习系统举例
      • IBM Watson DeepQA
        • IBM Watson
        • 技术需求
        • 相关技术 -- DeepQA
  • 通用机器学习系统设计
      • 设计一个学习系统 1
        • 系统设计1 —— 用于训练的经验
      • 设计学习系统 2
        • 系统设计2 —— 到底应该学什么?
      • 设计学习系统 3
        • 系统设计3 —— 假设的表示
      • 设计学习系统 4
        • 系统设计4 —— 学习算法
      • 设计学习系统 5
        • 系统设计 5 —— 综合起来
    • 总结
      • 系统设计与方案选择
  • 机器学习领域的基本概念
    • 基本概念 (通常在机器学习领域中使用)
  • 总结

机器学习应用背景

数据挖掘

  • 使用历史数据改善决策
  • 商业智能
    • 例子:商品摆放位置(P&G, Walmart, … )
  • ……
  • 信用危机分析
    在这里插入图片描述

个性化定制

  • 学习用户兴趣的应用( e.g. 信息流、论坛、社交网络 …)
  • 电子商务中的推荐
  • 邮件过滤
  • … …
    在这里插入图片描述
    在这里插入图片描述

替代人力的软件应用

  • 模式识别:人脸识别,语音识别 ,手势识别, OCR, ……
  • 自动驾驶
  • 信息检索(如搜索引擎)
  • … …
    在这里插入图片描述
    例:自动驾驶: Google Driverless Car
    在这里插入图片描述
    http://www.extremetech.com/extreme/189486-how-googles-self-driving-cars-detect-and-avoid- obstacles

Uber 无人驾驶汽车事故 Sunday, Mar. 18 2018

  • 2018 年 3 月 18 日,一辆 Uber 无人驾驶汽车发生事故导致 49
    岁的 Elaine Herzberg 死亡。
  • 一位 Uber 工程师在汽车驾驶座上,但发生事故时正处于自动
    驾驶模式。这被认为是第一起有关自动驾驶的严重事故。
  • Toyota停止了自动驾驶技术在公共道路上的测试

例:信息检索(续)
• 相关性反馈
• e.g. 图像检索、视频检索 …

在这里插入图片描述
在这里插入图片描述

什么是机器学习

在这里插入图片描述

  • “学习是要表示出系统中的变化 … 使得系统在下次进行同样的任务时变得更有效” – Herbert Simon
  • Herbert Simon (1916 – 2001)
    • 1956,达特茅斯会议,“人工智能之父” • 1975 年获得图灵奖
    • 1978年获的诺贝尔经济学奖
    • 1986年获得国家科学奖章
    • 1993年由于其心理学方面的杰出贡献被授予美国心理学会奖
    • 1994年他成为一名外籍中科院科学家
      在这里插入图片描述
  • “学习是对经验的表示方法的构造或修改” --Ryszard S. Michalski
  • Ryszard S. Michalski (1937-2007)
    http://www.mli.gmu.edu/michalski/
    • Michalski, Ryszard S. and Kodratoff, Y. Machine Learning, an AI approach (《机器学习:一种人工智能方法》) 1990
    • 共同创始人: Machine learning research field
    • 共同创始人: Machine Learning (Journal)
    • 共同创始人: ICML
      在这里插入图片描述
  • 学习 = 在某种任务上基于经验不断进步
  • Tom M. Mitchell (CMU)
    • 1973 MIT S.B. ; 1979 Ph.D. Stanford Uni.
    • 共同创始人: Machine Learning (Journal)
    • 共同创始人: ICML
    • IJCAI Computers and Thought Award, 1983
  • T (Task 任务)
  • E (Experience 经验)
  • P (Performance 性能)
    学习:变化 / 构造或修改 / 进步

示例

  • 学习如何下国际跳棋
    • T: 下国际跳棋
    • P:获胜率
    • E:e.g. 和自己下棋
  • 手写识别
    • T: 识别字符
    • P: 识别精度
    • E: 已知类别的字符集

机器学习系统举例

IBM Watson DeepQA

在这里插入图片描述
Jeopardy:
一个美国的电视节目。需要参赛者分辨出笑话、双关、反讽、字谜等语句中的微妙之处
在这里插入图片描述

IBM Watson @ Jeopardy

  • February 14, 15, and 16, 2011
    • Jeopardy 的两个著名冠军
    • Brad Rutter(右):
      • 赢得 Jeopardy 史上最多的奖金 (325 万美金)
      • Johns Hopkins 大学辍学生
  • Ken Jennings(左):
    • Jeopardy 连胜纪录保持者(2004年连续获胜 74 场)
    • 拥有 Brigham Young 大学的计算机和英语学位以及Seoul Foreign 的学士学位

IBM Watson 在 Jeopardy 中获胜
- 体现了在问答领域的出色成果
在这里插入图片描述
最终结果:
$77,147 (5,000 + 35,734 +41,413) vs. $21,600 & $24,000.

IBM Watson

  • 开发 4 年
  • 90 台 Power 7 服务器 (每台有4 个 8 核 power 7 处理器)
  • 基于大规模知识库而不是互联网的检索(没有联网)
    • 3 秒内在上百亿的页面进行检索
  • 用之前节目的题目进行训练
    • Jeopardy 参与者: 77 (2009) + 55 (2010, 优胜者)
    • 缺乏实时学习的能力

Category: US City
Q: “Its largest airport was named for a World War II hero; its second largest,
for a World War II battle.”
A: “What is Toronto?” (Chicago)

技术需求

  • 回答任意话题的问题

    • 自然科学、地理、流行文化 …
  • 准确度:不只是一个答案,还需要高置信度

  • 速度:3 秒内甚至更快

  • 语言理解

    • 解析复杂句子,理解笑话、双关、反讽等
  • 问题的实时分析

  • 从错误中学习

  • 应对意料之外的情况 …

相关技术 – DeepQA

  • 一种大规模的基于概率和实例的问答架构
    • 不基于数据库
    • 深度文本分析
      • NLP 以及基于统计的 NLP
    • 确定多种相似可能性的置信度
      • 投票、问题解释… • 搜索
    • 风险评估
    • Hadoop、UIMA
  • 现实应用场景中的挑战 / 问题

通用机器学习系统设计

设计一个学习系统 1

例 :让机器学习下国际跳棋

  • 有什么经验?

在这里插入图片描述

系统设计1 —— 用于训练的经验

-经验是否代表目标性能?
例 :国际跳棋游戏
- 训练中看到的数据(游戏对局) 能代表实际中遇到的数据吗?
- 自我对抗 vs. 与大师对抗

  • 意料之外的结果
    • 示例1 :月亮还是香蕉?
    • 示例2:神经网络数字识别
    • 示例3:IBM Watson 认为多伦多是 “美国城市”

意料之外的结果

  • 问题出在哪里?
  • 注意训练数据偏差
    • 数据 (月亮还是香蕉)
    • 训练过程 ( NN数字识别)
    • 特征 ( IBM Watson)

设计学习系统 2

例 :让机器学习下国际跳棋

  • 有什么经验?
    • 注意训练数据偏差
      • 数据, 训练过程,功能
  • 到底应该学什么?

系统设计2 —— 到底应该学什么?

  • 要学习一个 目标 函数 (目标概念)
  • 什么类型?即有哪些概念种类
  • 例 :国际跳棋游戏: 目标函数 V(b) 的可能定义
    • 如果 b 是一个最后获胜的棋盘状态,则V(b) = 100
    • 如果 b 是一个最后失败的棋盘状态,则V(b) = -100
    • 如果 b 是一个最后平局的棋盘状态,则V(b) = 0
  • 如果b不是最终棋盘状态,则 V(b) = V(b’)
    • b’ 是从b开始能达到的最优终盘状态。
  • 能给出正确的结果,但是不可行
    • 计算过于低效
  • 通常使用一个 V 的近似 V ^ \hat V V^, 又称作假设
    • 例: V ( b ) ← V ^ ( S u c c e s s o r ( b ) ) V(b) \leftarrow \hat V(Successor(b)) V(b)V^(Successor(b))

设计学习系统 3

例 :让机器学习下国际跳棋

  • 有什么经验?
    • 注意训练数据偏差
      • 数据, 训练过程,功能
  • 到底应该学什么?
    • 正确 vs. 可行 :近似 (假设)
  • 应该如何表示?

系统设计3 —— 假设的表示

  • 例 :国际跳棋: 可能的表示
    • 状态表
    • 规则集合
    • 棋盘特征的多项式函数
    • 神经网络
    • ……
  • 函数类型必须依据表达能力仔细选取
    • 的近似 vs. 数据要求
  • 例 :国际跳棋的训练样例 < b, Vtrain(b) >
    • Vtrain(b) 是 b 的 label
    • wp(b) :棋盘 b 上的白色棋子数量
    • rp(b) :棋盘b上的红色棋子数量
    • wk(b):棋盘b上的白色国王数量
    • rk(b):棋盘b上的红色国王数量
    • wt(b) :受红方威胁的白色棋子数量(在红方下一回合将被吃掉)
    • rt(b) :受白方威胁的红色棋子数量
      V ^ ( b ) = w 0 + w 1 ⋅ w p ( b ) + w 2 ⋅ r p ( b ) + w 3 ⋅ r k ( b ) + w 4 ⋅ r k ( b ) + w 5 ⋅ w t ( b ) + w 6 ⋅ r t ( b ) \hat V(b) = w_0 + w_1\cdot wp(b) + w_2 \cdot rp(b) + w_3\cdot rk(b) + w_4 \cdot rk(b)+w_5 \cdot wt(b) + w_6 \cdot rt(b) V^(b)=w0+w1wp(b)+w2rp(b)+w3rk(b)+w4rk(b)+w5wt(b)+w6rt(b)
  • 例如: <<wp=0, rp=3, wk=0, rk=1, wt=0, rt=0>,+100>

设计学习系统 4

例 :让机器学习下国际跳棋

  • 有什么经验?
    • 注意训练数据偏差
      • 数据, 训练过程,功能
  • 到底应该学什么?
    • 正确 vs. 可行 :近似 (假设)
  • 应该如何表示?
    • 表达能力:的近似 vs. 数据要求
      • 具体用什么算法去学习?

系统设计4 —— 学习算法

  • 本例: 选择一个权重训练的规则 :数据的最优拟合
  • 一个常用算法:**最小均方误差 Least Mean Squares (LMS) ** ∑ t r a i n i n g s e t ( V t r a i n ( b ) − V ^ ( b ) ) 2 \sum_{training set} (V_{train}(b) - \hat V(b))^2 trainingset(Vtrain(b)V^(b))2
    • 初始化权重
    • 重复:
      1. 随机地选择一个训练样例 b
      2. 计算 e r r o r ( b ) = V t r a i n ( b ) – V ^ ( b ) error(b) = V_{train}(b) –\hat V(b) error(b)=Vtrain(b)V^(b)
      3. 对于每个棋盘特征fi ,fi 属于 {wp, rp, …, rt},更新权重 wi
        w i ← w i + c ⋅ f i ⋅ e r r o r ( b ) w_i \leftarrow w_i + c \cdot f_i \cdot error(b) wiwi+cfierror(b)
        c是一个小常数(如0.1),以控制学习速度

设计学习系统 5

例 :让机器学习下国际跳棋

  • 有什么经验?
    • 注意训练数据偏差
      • 数据, 训练过程,功能
  • 到底应该学什么?
    • 正确 vs. 可行 :近似 (假设)
  • 应该如何表示?
    • 表达能力:的近似 vs. 数据要求
      • 具体用什么算法去学习?
      综合起来: 最终设计

系统设计 5 —— 综合起来

  • 初始化 V ^ \hat V V^的权重
  • V ^ \hat V V^和自己下棋,输出每局游戏的棋盘状态序列
  • V ^ ( S u c c e s s o r ( b ) ) \hat V(Successor(b)) V^(Successor(b))标注每个 b
    在这里插入图片描述
  • 学习新的权重,产生新的
  • 开始新的游戏

总结

系统设计与方案选择

在这里插入图片描述

机器学习领域的基本概念

基本概念 (通常在机器学习领域中使用)

  • 给定:
    • 实例空间(Instance Space) X
      • 例 :每一天由一些属性描述 天空,空气温度,湿度, 风,水,预报
    • 假设空间(Hypothesis Space) H
      • 例 :一个假设 if (温度 = 寒冷 AND湿度 = 高) then 打网球 = 否
    • **训练样例空间(Sample Space) D 目标概念(Target Concept) C **
      • 正例和负例 (基于问题设定) <x1 ,c(x1)>,……, <xm , c(xm)>
  • 求 :假设 h ∈ H 满足
    h ( x ) = c ( x )    f o r   a l l   x ∈ X h(x) = c(x)\ \ for\ all\ x \in X h(x)=c(x)  for all xX
    -通常 X 是的大小是指数级甚至更大,所以通常我们无法保证 h(x)=c(x) 对所有 x∈X
    • 作为替代,我们寻求一个好的近似,例: h(x)=c(x) 对 所有 x ∈D

例如:假设h为n 个二值属性 / 特征(例:温暖 / 寒冷)

  • 实例空间 X:2^n 元素
  • 概念(假设)空间 H:最多 2 2 n 2^{2^n} 22n 个元素(为什么?)

总结

  • 应用背景
  • 什么是机器学习
    • T (Task,任务)
    • E (Experience,经验)
    • P ( Performance,性能)
  • 机器学习系统举例
  • 通用机器学习系统设计
    • 有什么经验?数据
    • 到底应该学什么? 特征和表示
    • 如何表示?算法
    • 具体用算法学习?评价
  • 机器学习领域的基本概念

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/96454.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

胜券汇:底部显现 三大因素有望助推股市短期内探底回升

胜券汇以为&#xff0c;权益商场的底部特征现已开始闪现&#xff0c;估值触底、危险偏好反弹、盈余逐渐修正三大要素有望助推股市短期内探底上升。不过&#xff0c;中长期而言&#xff0c;A股的核心矛盾在于经济复苏的斜率&#xff0c;从当时经济形势看&#xff0c;方针仍有必要…

vue数组对象中按某一字段排序

给下列数组字段中的month排序 第一步&#xff1a;methods中写一个方法如下&#xff1a; sortBy(attr, rev) {//第二个参数没有传递 默认升序排列if(rev undefined) {rev 1;} else {rev (rev) ? 1 : -1;}return function(a, b) {a a[attr];b b[attr];if(a < b) {retu…

四信重磅推出5G RedCap AIoT摄像机 RedCap轻量级5G终端新品首发!

6月6日&#xff0c;四信受邀出席移动物联网高质量发展论坛&#xff0c;并在移动物联网新产品发布环节隆重推出5G RedCap AIoT摄像机&#xff0c;再次抓紧需求先机&#xff0c;为行业用户创造无限可能&#xff01; 两大应用场景 助推RedCap走深向实 火遍全网络的RedCap应用场景可…

F5负载均衡器参与的Kubernetes架构选项介绍

F5负载均衡器在业内有着很高的知名度&#xff0c;因为它不仅是F5的代表作&#xff0c;负载均衡&#xff08;Load Balance&#xff09;这一词汇正是由F5发明并引入国内的。当前&#xff0c;F5的能力不断拓展&#xff0c;从早期聚焦F5负载均衡器到现在的分布式云应用架构&#xf…

豆瓣《乡村振兴战略下传统村落文化旅游设计》中国建筑出版传媒许少辉八一新书

豆瓣《乡村振兴战略下传统村落文化旅游设计》中国建筑出版传媒许少辉八一新书

Linux服务器安装部署MongoDB数据库 – 【无公网IP远程连接】

文章目录 前言1.配置Mongodb源2.安装MongoDB数据库3.局域网连接测试4.安装cpolar内网穿透5.配置公网访问地址6.公网远程连接7.固定连接公网地址8.使用固定公网地址连接 前言 MongoDB是一个基于分布式文件存储的数据库。由 C 语言编写&#xff0c;旨在为 WEB 应用提供可扩展的高…

【论文精读】Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 前言Abstract1. Introduction2. Related Work3. Method3.1. Overall Architecture3.2. Shifted Window based Self-AttentionSelf-attention in non-overlapped windowsShifted window partitioning …

Leetcode17电话号码的组合

思路&#xff1a;用字典的形式保存号码的映射&#xff0c;实际组合是前一个数字串的组合加上后面一个数字的所有可能组合 answer_dict{2:[a,b,c],3:[d,e,f],4:[g,h,i],5:[j,k,l],6:[m,n,o],7:[p,q,r,s],8:[t,u,v],9:[w,x,y,z]} class Solution:def letterCombinations(self, d…

DataWhale 机器学习夏令营第三期——任务二:可视化分析

DataWhale 机器学习夏令营第三期 学习记录二 (2023.08.23)——可视化分析1.赛题理解2. 数据可视化分析2.1 用户维度特征分布分析2.2 时间特征分布分析 DataWhale 机器学习夏令营第三期 ——用户新增预测挑战赛 学习记录二 (2023.08.23)——可视化分析 2023.08.17 已跑通baseli…

二极管:常用二极管封装

常用二极管封装 1、DO-41 2、DO-201AD 3、DO-35 4、LL-34 5、DO-214AC (SMA) 6、SMB

Docker之私有仓库 RegistryHarbor

目录 一、Docker私有仓库&#xff08;Registry&#xff09; 1.1 Registry的介绍 二、搭建本地私有仓库 2.1首先下载 registry 镜像 2.2在 daemon.json 文件中添加私有镜像仓库地址 2.3运行 registry 容器 2.4Docker容器的重启策略 2.5为镜像打标签 2.6上传到私有仓库 2…

ThinkPHP 资源路由的简单使用,restfull风格API

ThinkPHP 资源路由的简单使用&#xff0c;restfull风格API 一、资源控制器二、资源控制器简单使用 一、资源控制器 资源控制器可以轻松的创建RESTFul资源控制器&#xff0c;可以通过命令行生成需要的资源控制器&#xff0c;例如生成index应用的TestR资源控制器使用&#xff1a…

Nginx详解之Nginx高级配置

Nginx详解之Nginx高级配置 1、网页的状态页2、Nginx第三方模块2.1echo模块 3、变量3.1内置变量3.2自定义变量 4、自定义访问日志4.1 自定义访问日志的格式4.2自定义json 格式日志 5、Nginx压缩功能&#xff08;重要&#xff09;6、https 功能6.1Nginx的HTTPS工作原理的详解6.2启…

配置DNS服务的正反向解析

正向解析 安装DNS服务 2.在服务器端 编辑区域配置文件&#xff0c;选择一个解析模版进行修改---------/etc/named.rfc1912.zones 修改第一第三行 编辑数据配置文件&#xff0c;使用cp -a命令完全拷贝一份正向解析模版&#xff08;named.localhost&#xff09;&#xff0c;在…

微服务项目容器编排docker-compose.yml、Dockerfile文件模板、相关配置文件、shell脚本

nacos Dockerfile&#xff08;不需要特殊处理&#xff0c;使用docker conpose可以不写&#xff09; # 基础镜像 FROM nacos/nacos-server # author MAINTAINER jianglifeng<jlifengfoxmail.com> # 复制conf文件到路径 COPY ./conf/application.properties /home/nacos/c…

Unity Canvas动画不显示的问题

问题描述: 我通过角色创建了一个walk的动画&#xff0c;当我把这个动画给到Canvas里面的一个image上&#xff0c;这个动画就不能正常播放了&#xff0c;经过一系列的查看我才发现&#xff0c;canvas里面动画播放和非canvas得动画播放&#xff0c;他们的动画参数是不一样的。一个…

项目详细描述

目录、 一、SOC智能游戏机&#xff08;集创赛-西南赛区三等奖&#xff09; 二、AXI2AHB Bridge 三、基于FPGA智能导盲拐杖&#xff08;FPGA竞赛全国二等奖&#xff09; 三、基于FPGA的倾角监测系统 四、图像压缩核心算法 一、SOC智能游戏机&#xff08;集创赛-西南赛区三等…

Kubernetes快速进阶与实战:构建可靠的容器化应用平台

&#x1f482; 个人网站:【工具大全】【游戏大全】【神级源码资源网】&#x1f91f; 前端学习课程&#xff1a;&#x1f449;【28个案例趣学前端】【400个JS面试题】&#x1f485; 寻找学习交流、摸鱼划水的小伙伴&#xff0c;请点击【摸鱼学习交流群】 1. 什么是Kubernetes&am…

数据分析基础-数据可视化学习笔记03-可视化的符号与表示-图形符号学

概念 图型符号学&#xff08;Cartographic Symbolization&#xff09;是地图学领域中的一个重要概念&#xff0c;涉及到如何使用不同的符号、颜色、图案和标记来在地图上表示地理信息和数据。图型符号学旨在传达地理信息&#xff0c;使得地图能够清晰、有效地传达各种空间数据…

【PHP】PHP基本语法

1、PHP标记 当解析一个文件时&#xff0c;PHP 会寻找起始和结束标记&#xff0c;也就是 <?php 和 ?>&#xff0c;告诉 PHP 开始和停止解析二者之间的代码。此种解析方式使得 PHP 可以被嵌入到各种不同的文档中去&#xff0c;而任何起始和结束标记之外的部分都会被 PHP…