04 supervised learning

Summary:

  • unspervised learning
    • clustering(聚类算法)
    • Anomaly detection(异常检测)
  • Recommender Systems(推荐系统)
  • Reinforcement Learning(强化学习)

一 、 K-means算法

1.Notion

a) K-means做的

​ k-means重复做的两件事中

​ 第一件:是分配簇质心,然后将样本点距离近的变成相关的颜色

​ 第二件:重新遍历所有相同类型的点,然后取平均值,选出新的簇质心,检测每个点距离谁最近

b) some symbol & cost function

在这里插入图片描述

2. k-means 聚类的步骤

a) Random initialization k

​ 簇质心随机选择样本中的点,然后循环多次选择不同的样本为簇质心,用于来找到 J 最小的时候的簇质心,次数如果太多也会降低效果

在这里插入图片描述

b ) how many k do we need ?

i . elbow method(肘部法则)

​ 当我们将k 从1增加到m时候,代价函数 J 的函数图像会从大到小的递减,函数会有一个从递减迅速到缓慢的点,类似于人类的肘部 (但是有时很多J都是平缓下降的 没有肘部)
在这里插入图片描述

二 、 Anomaly detection

1. notion

在这里插入图片描述
如何计算正态分布的两个变量

在这里插入图片描述

2. 计算步骤

在这里插入图片描述

  • 首先算出每一个特征的均值和方差
  • 利用每个特征的方差和均值算出某一个样本中的概率p(x)
  • 用计算出的p(x)和阈值比较,如果满足则表示有问题
  • 查看算法在交叉验证集中没能检测出的异常,然后考虑是否需要新建一个特征,使得发现这些异常
  • 原理: 算出每个样本的feature相较于所有样本中的异常大或者小的feature,然后p(x)乘出来会很小所以标记为异常
    在这里插入图片描述

3. algorithm evaluation system(异常评估系统)

在这里插入图片描述

4 . Anomaly detection VS supervised learning

a) how to choose right algorithm

  • 当有很少的正样本时,异常检测算法通常是更合适的选择,负样本用于算p(x)的参数,而正样本只用于测试集中的交叉验证集,用于参数调整和评估
  • 异常检测适用于经常出现新的异常,以前样本不包含的异常,而监督学习适用于垃圾邮件类对类型基本不变的情况

5. choose feature

​ 因为异常检测算法很难找出要忽略的特征 所以选择特征是很重要的

在这里插入图片描述

​ 首先根据plt.hist函数画出直方图,查看是否类似高斯曲线,如果是则可以直接用,如果不是则对x进行变化,变成x的函数。最后再形成高斯曲线的形式

三、Recommended systems (推荐系统)

1.notion

在这里插入图片描述

2. 协同过滤算法

		假如我们无法从样本中获取足够的特征时候,怎么才能使用线性回归来

a) cost function

在这里插入图片描述

在这里插入图片描述

​ b) gradient descent

在这里插入图片描述

3. Mean Normalization(均值归一化)

作用: 当新用户进行预测时,会直接全部都预测为0,但均值归一化会出手,使得等于已评价用户的平均值。

在这里插入图片描述

4. build collaborative filtering algorithm by tensorflow

5 . 协同过滤和基于内容的协同过滤对比

在这里插入图片描述

6 . 从大型目录中推荐

在这里插入图片描述
在这里插入图片描述

第一步:检索,找到许多大范围的可以推荐的相似电影

第二步:排名,将用户和检索到的电影的特征向量都输入到这个神经网络中去,得到用户对电影的评分预测值

四 、 Reinforcement learning

​ 做一个奖罚机制,告诉他什么时候做的好,什么时候做不好,在学习的过程中,经常会看到四个变量:状态,行动,奖励,下一个状态

1 . reward of reinforcement learning

​ 最终的奖励不仅仅是单独和目的地的值有关,还有到达的时间有关,奖励等于一步一步的时间的加权值到最后终点的值的乘积

2 . decision on reinforcement learning

​ 找到一个函数,告诉我们程序下一步需要往哪里

3 . import notation

在这里插入图片描述

4 . State action value function(状态动作价值函数)

​ **Q(state,action)**在某个状态时做出不同动作得到的奖励,如果有办法计算每一个状态的不同动作对应的Q(s,a)则可以得到最大的奖励

5 . Bellman Equation (贝尔曼方程)

a)notion

在这里插入图片描述

b) Explanation of Equation

在这里插入图片描述

c) random or stochastic environments(模拟随机的环境)

​ 因为实际的环境中,机器不能完全按照我们的思想去进行,有一定的概率犯错,所以最大化的奖励需要取好多次折扣奖励的平均值,也叫期望

6. 算法的改进

a)mini-batch

​ 既可以用于supervised learning 也可以用于强化学习

作用: 监督学习中,当数据量很大的时候,做梯度下降时,每次只看前一次的数据集的子集,所以迭代的更快

b) soft-update

​ 强化学习算法更好的收敛

a)mini-batch

​ 既可以用于supervised learning 也可以用于强化学习

作用: 监督学习中,当数据量很大的时候,做梯度下降时,每次只看前一次的数据集的子集,所以迭代的更快

b) soft-update

​ 强化学习算法更好的收敛

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/295225.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Visual studio 2010的安装与使用

一、下载及安装 1、下载软件。 百度网盘: 链接:https://pan.baidu.com/s/115RibV7dOI_y8LUGW-94cA?pwd4hrs 提取码:4hrs 2、右键解压下载好的文件。 3、找到cn_visual_2010_……/Setup.hta,双击运行。 4、选择第三个“ Visual…

Spring学习之——AOP(面向切面)

AOP 概念 AOP:全称是Aspect Oriented Programming即:面向切面编程。 简单的说它就是把我们程序重复的代码抽取出来,在需要执行的时候,使用动态代理的技术,在不修改源码的基础上,对程序进行增强&#xff…

Mac上安装 Node.js 的版本管理工具 n,以及 n 使用,的使用

安装 最近刚更换 Mac 本进行项目的开发,刚上手 Mac 本还不是很熟练,需要安装 Node.js 的包管理工具 在 Windows 上我是实用的 nvm 来管理的 Node 版本,但是我尝试下载 Nvm ,发现下载安装后的 Nvm 无法使用,提示 “Th…

基于web3.js和ganache实现智能合约调用

目的:智能合约发布到本地以太坊模拟软件ganache并完成交互 准备工作: web3.jsganache模拟软件 ganache参数配置 从ganache获取一个url,和一个账号的地址, url直接使用图中的rpc server位置的数据即可 账号address从下列0x开头…

解决报错Exception encountered during context initialization

推荐阅读 智能化校园:深入探讨云端管理系统设计与实现(一) 智能化校园:深入探讨云端管理系统设计与实现(二) 文章目录 推荐阅读报错解决 报错 今天在测试一个类时,突然间报了以下错误。 juni…

【电路笔记】-电感器

电感器 文章目录 电感器1、概述2、电感器的时间常数3、电感器示例1 电感器是一种由线圈组成的无源电气元件,其设计目的是利用电流通过线圈而产生的磁力和电力之间的关系。 1、概述 在本中,我们将看到电感器是一种电子元件,用于将电感引入到电…

qiankun 公共依赖

1、提取公共依赖的目的 减少相同资源的重复加载资源版本不同步打包文件庞大2、如何提取公共依赖 基本思路:1、相同依赖 采用 CDN 的方式加载,并把 所有依赖的 CDN 链接 统一放到一个文件中进行管理 2、把存放 CDN 链接的文件,引入到 vue.conf…

【mysql】报错1349 - View‘s SELECT contains a subquery in the FROM clause

操作 创建视图的sql语句中有不支持子查询 mysql创建视图 select * from (select name,age from table_name where 11 and namea ) tb where 11 and type1问题 报错1349 - View’s SELECT contains a subquery in the FROM clause 原因 原因创建视图的sql语句中有不支持子查…

2024最新阿里云服务器地域(城市)对照表

2024年阿里云服务器地域分布表,地域指数据中心所在的地理区域,通常按照数据中心所在的城市划分,例如华北2(北京)地域表示数据中心所在的城市是北京。阿里云地域分为四部分即中国、亚太其他国家、欧洲与美洲和中东&…

在mybatis中编写SQL时,提示表名和字段名的设置方法

一、在设置中搜索SQL Dialects 二、将Global SQL Dialect和Project SQL Dialect设置为MySQL 三、添加Path,选择当前项目,完成后应用 四、连接要使用的数据库,连接到具体要使用的数据库 五、连接完成后,在xml中编写sql语句就会有…

鸡目标检测数据集VOC格式500张

鸡,一种家禽,是人类的重要食物来源之一,也是农业生产中的重要组成部分。 鸡的外观相对较为简单,身体呈圆锥形,羽毛密集,双翅短小,无法飞行。鸡的头部较小,嘴巴尖锐,方便…

DZ-200系列中间继电器 板后不带底座 DZY-212X DC220V JOSEF约瑟

DZY-200系列中间继电器 系列型号: DZY-201中间继电器 DZY-222中间继电器 DZY-202中间继电器 DZY-203中间继电器 DZY-204中间继电器 DZY-205中间继电器 DZY-206中间继电器 DZY-207中间继电器 DZY-208中间继电器 DZY-209中间继电器 DZY-210中间继电器 DZY-211中间继电…

全视通-医院智能视讯系统 病房视讯系统解决方案 智能医院对讲系统信息发布系统

医院智能视讯系统解决方案 1、行业背景 对于患者来说现阶段各大医院的住院部大都面临同样的问题,例如患者就医缺乏精准化医疗,缺乏对患者的心理健康引导,缺乏多维度沟通渠道,缺乏多元增值服务等。 对于传统医院住院部病房&am…

zookeeper应用场景之分布式的ID生成器

1. 分布式ID生成器的使用场景 在分布式系统中,分布式ID生成器的使用场景非常之多: 大量的数据记录,需要分布式ID。大量的系统消息,需要分布式ID。大量的请求日志,如restful的操作记录,需要唯一标识&#x…

腾讯云服务器和轻量服务器选哪个好(各自的优势区别)

腾讯云轻量服务器和云服务器CVM该怎么选?不差钱选云服务器CVM,追求性价比选择轻量应用服务器,轻量真优惠呀,活动 https://curl.qcloud.com/oRMoSucP 轻量应用服务器2核2G3M价格62元一年、2核2G4M价格118元一年,540元三…

带你玩转AM62x开发板的显示接口——LVDS的显示和修改方式

此前小编已为大家介绍过OK6254-C开发板的RGB显示和修改方式,今天将继续为大家介绍OK6254-C开发板的LVDS显示和修改方式。话不多说,我们进入正题。 1 、LVDS接口规格 飞凌嵌入式OK6254-C开发板提供2个4-lane LVDS显示串行接口,每lane最高支持…

Mac——VsCode使用格式化工具进行整理和格式化

1. 打开VSCode编辑器。 2. 点击左下角⚙️图标,打开设置 3. 进入设置后,你会看到一个搜索框,在搜索框中输入 format on save 来查找相关设置项。 4. 在设置列表中找到 Editor: Format On Save 选项,勾选它以启用在保存文件时自动格…

智能分析网关V4太阳能风光互补远程视频智能监控方案

一、背景需求 在一些偏远地区,也具有视频监控的需求。但是这类场景中,一般无法就近获取市电,如果要长距离拉取市电,建设的成本非常高且长距离传输有安全隐患,因此风光互补远程视频监控方案的需求也较多。利用风光电转化…

JavaScript之常用的事件

文章目录 前言为什么使用事件呢?常用的触发事件窗口事件onbluronfocusonresize窗口加载事件 表单事件onchangeoninput 键盘事件onkeydownonkeyup 鼠标事件onclickondblclickonmousemoveonmouseoutonscroll 总结窗口事件总结表单事件总结键盘事件总结鼠标事件总结 前言 在网页中…

PCIe 6.0生态业内进展分析总结

上一篇,我们针对PCIe 6.0的功能更新与实现挑战做了简单的分析与总结。更多详细内容可以参考: 扩展阅读:浅析PCIe 6.0功能更新与实现的挑战 那么,PCIe 6.0已经发布了一段时间了,业内硬件支持PCIe 6.0目前有哪些进展呢…