数据获取
数据清洗
对导入的数据进行数据整理的过程一般称为「数据清洗」,之所以称之为清洗,是因为在数据分析师眼中,杂乱的数据就是脏数据,只有被清洗成干净的数据后才可以进行分析使用。
数据丰富
操作
1.复制列
点击列名选中要复制的列,右击鼠标,点击重置列就可以了(英文版就是点击Duplicate Column),这样表中就会多一列新的和你要复制的列100%一致的列。
补充
1.二维表:
- 二维表就是由行列组成的,知道行号列号就可以确定一个表中的数据,这是二维表的特点。在关系数据库中,存放在数据库中的数据的逻辑结构以二维表为主.
- 在二维表中惟一标识元组的最小属性值称为该表的键或码。二维表中可能有若干个健,它们称为表的侯选码或侯选健。从二维表的所有侯选键选取一个作为用户使用的键称为主键或主码。表A中的某属性集是某表B的键,则称该属性值为A的外键或外码。
二维表和一维表的区别:
-
一维表,一行或者一列就是完整的信息
-
二维表单独的行列读不出完整的信息。
-
一维表:将表头(列名称)删除,没影响
二维表:将表头(列名称)删除,数据无法解释 -
一维表是指表格的每个字段都是事物的属性,而不是具体形态,如字段 是月份而不是一月、二月、三月…,是性别而不是男、女,是所在部门而不是财务部、行政部;每一条记录都是在一次性产生的。
-
二维表的字段通常包含属性的具体形态,如一月、二月、三月…;男生人数、女生人数;部门人数等。
-
例1、二维表,大部分字段都是属性的具体形态。
-
例2、一维表,每个字段都是属性,而不是具体的形态。
-
通俗来讲,一维表就是明细记录表,二维表就是统计汇总表。
-
一维表(明细记录表)是用来详细记录信息的,是数据库;二维表(统计汇总表)是用来展示各类情形下的统计分析结果的,是进行决策的基础。
-
一维表通常用于采集原始数据、基础数据、记录流水等理为详尽的信息。
-
二维表通常作为最终报表,提供给报表使用者,方便报表阅读者快速掌握重要信息,汇总或分类信息,分析或决策信息。