目录
前言
第一点:导入模块
第二点:创建excel表
第三点:读取数据表
总结
前言
数据分析和处理过程中,我们经常需要从外部文件中读取数据。本文将介绍如何使用Python中的Pandas库来读取CSV和Excel文件,以及提取纯数组的方法。通过学习本文,你将了解如何高效地读取不同格式的数据文件,并将其转换成Pandas的DataFrame或纯数组,为后续的数据分析和处理奠定基础。
第一点:导入模块
import pandas as pd
第二点:创建excel表
保存的时候,保存类型分别存为.xlsx和csv格式的数据表
第三点:读取数据表
#读取csv格式表数据
df=pd.read_csv("Data.csv",encoding='utf-8',index_col=0)
print(df)
# 0 1 2 3
# 0 10 女 1 是
# 1 21 男 2 否
# 2 32 女 3 是
# 3 43 男 4 否
# 4 54 女 5 是
# 5 65 男 6 否
#提取纯数组
arr=df.values
print(arr)
# [[10 '女' 1 '是']
# [21 '男' 2 '否']
# [32 '女' 3 '是']
# [43 '男' 4 '否']
# [54 '女' 5 '是']
# [65 '男' 6 '否']]
#读取xlsx格式表数据
df=pd.read_excel("Data.xlsx",index_col=0)
print(df)
# 0 1 2 3
# 0 10 女 1 是
# 1 21 男 2 否
# 2 32 女 3 是
# 3 43 男 4 否
# 4 54 女 5 是
# 5 65 男 6 否
总结
本文详细介绍了如何使用Python中的Pandas库读取CSV和Excel文件,以及提取纯数组的方法。通过示例代码,我们展示了如何使用pd.read_csv()
和pd.read_excel()
函数读取外部数据文件,并将其转换成Pandas的DataFrame。同时,我们还演示了如何使用.values
属性将DataFrame转换成纯数组,方便进行进一步的数据处理和分析。掌握这些方法将帮助你更高效地处理数据文件,提升数据处理的效率和准确性。