1、准备
首先准备好Excel表,并向里面填充好内容
2、相关算法
import pandas as pd
# file_path = r'E:\data.xlsx' # r对路径进行转义,windows需要
file_path = r'data.xlsx'
# 这行代码括号里的head=0,表示excel文件中第一行是表头,自动去除了。如果你没有设置表头,全部是文件内容,改为head=None,即可
raw_data = pd.read_excel(file_path, header=0) # header=0表示第一行是表头,就自动去除了
data = raw_data.values # 只提取表中信息。若没有这行,则打印的数据旁边会出现行数
print(data) # 读取数据,并且数据存储为数组形式
import pandas as pd
# file_path = r'E:\relate_code\svm\dataset\data.xlsx' # r对路径进行转义,windows需要
file_path = r'Obtained_Pareto_1.xlsx'
# 这行代码括号里的head=0,表示excel文件中第一行是表头,自动去除了。如果你没有设置表头,全部是文件内容,改为head=None,即可
raw_data = pd.read_excel(file_path, header=0) # header=0表示第一行是表头,就自动去除了
data = raw_data.values # 只提取表中信息
'''
2、可以选择想要的数据,比如想把x和y分开,毕竟一个是特征,另一个是标签,这时候可以使用以下代码。
'''
features = data[:, 0:1] # 由于是二维数组,所以第一个冒号表示选择所有行,之后0:1表示只要前1列的数据
print(features)
3、封装成方法
将这个读取表格内容的操作写成一个方法
import pandas as pd
def read_excel_to_array(file_path, header=0):
"""
读取 Excel 文件并返回数据数组
:param file_path: Excel 文件路径
:param header: 表头行数,默认为0
:return: 数据数组
"""
try:
raw_data = pd.read_excel(file_path, header=header)
data = raw_data.values
return data
except Exception as e:
print(f"An error occurred while reading the Excel file: {e}")
return None
# 调用方法读取 Excel 文件并返回数据数组
file_path = r'Obtained_Pareto_1.xlsx'
data = read_excel_to_array(file_path)
if data is not None:
print(data)
在这个方法中,我们定义了一个名为read_excel_to_array的函数,它接受两个参数:file_path表示 Excel 文件的路径,header表示表头行数,默认为0。函数内部使用 pd.read_excel 方法读取 Excel 文件,并将结果存储为数据数组。
通过将代码封装成一个方法,你可以在需要的时候简单地调用这个方法来读取 Excel 文件并获得数据数组,提高代码的复用性和可维护性。