DataFrame介绍
Dateframe
结构和列表类似,区别是对于DataFrame
的每一列和每一行均有一个标签。例如以下数据,
上述数据中,日期作为每行的标签。a、b、c、d、e分别是每列的标签
生成连续日期数据
使用方法date_range()
,该方法有两个参数,分别是其实日期、数据个数,例如
生成DataFrame数据
直接使用pd.DataFrame()
方法可以生成。其中参数分别是值(可以是多种形式,可以是np中的array数组)、index(行标签)、columns(列标签)。
例如以下代码
获取DataFrame中的值
获取值方法有多种,例如直接根据列名索引
该方法和以下方法相同
iloc()
方法根据索引名查找值。例如
如果想要取连续多列可以使用:
符号,如果想要非连续取多列可以嵌一个列表。例如上图[1,3]
表示取1和3列(索引从0开始)
loc()
方法根据标签名查找值,例如
该方法取连续和间断值和iloc
方法相同。
获取满足条件的值,在[]
中输入条件表达式,即可查找。如果该值不满足就返回NaN
例如:
插入数据
可以指定列插入输入,指定标签即可
例如
去除空数据
drops()
方法用于去除空数据,有2个参数分别是维度、how。其中维度是指如果发现空数据是将该行删除还是将该列删除。如果指定how为any值该行/列发现一个空值就删除,而指定how为all则是,该行/列全为空值才删除。该删除是将处理后结果放回,原值不做修改
例如
判断是否有空值
isnull()
返回DataFrame,如果该值为NaN则为True,否则为False。使用any
方法默认参数axis值为1,如果某行/列有一个值为True返回True,如果全是False则返回False