数据的属性与数据集:
2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开
测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库
这oracle比sql安全,强大多了,所以你需要学习,最重要的,你要是考网络警察公务员,这玩意你不会就别去报名了,耽误时间!
文章目录
- 数据的属性与数据集:
- @[TOC](文章目录)
- 数据相似与相异性
- 数据的质量
- 数据的预处理
- 数据变换
- 数据ETL基础
- 数据仓库的模型
- ETL
- OLAP
- 总结
文章目录
- 数据的属性与数据集:
- @[TOC](文章目录)
- 数据相似与相异性
- 数据的质量
- 数据的预处理
- 数据变换
- 数据ETL基础
- 数据仓库的模型
- ETL
- OLAP
- 总结
数据相似与相异性
相似度是p的话,相异度p1
s是相似度的话,
当xy差别不大还行
当xz差别太大不行
实际数据集中,样本差异可能很大,对象多
这样就要计算plcc皮尔森先关系数或者斯皮尔曼等级相关
类似于差值构成的点积
相当于把数量级的差异抹去了
美滋滋,只要零头
预先相似度改造之后就上上面的问题
目的仍然是抹掉数量级 的差异
数据的质量
数据的预处理
数据变换
数据ETL基础
OLAP
面相分析的
OLDP是面向数据好像
小型快速的数据仓库
多数据源集合
及时分析
数据仓库的模型
人和车,就是开车的关系
实体就是抽象概念
非规范化的
是因为它可能重复的
所以这个数据仓库很骚
内存消耗大,查询不便捷
ETL
OLAP
数据仓库就是OLAP
这些应该也会考
冲
总结
提示:重要经验:
1)
2)学好oracle,即使经济寒冬,整个测开offer绝对不是问题!同时也是你考公网络警察的必经之路。
3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。