数据的形式:保存在CSV中,第一列为姓名,第二列之后为特征。
标准化
输入文件的路径,设置保存转化后的文件路径
import pandas as pd
from sklearn.preprocessing import StandardScaler
# 读取CSV文件
data = pd.read_csv(r'C:\Users\Administrator\Desktop\Breast\benign.csv')
# 提取特征列
features = data.drop('Name', axis=1)
# 初始化标准化器
scaler = StandardScaler()
# 对特征进行标准化
scaled_features = scaler.fit_transform(features)
# 将标准化后的特征重新添加到原始DataFrame中
scaled_data = pd.DataFrame(scaled_features, columns=features.columns)
scaled_data.insert(0, 'Name', data['Name'])
# 定义标准化后的文件路径
output_file = r'C:\Users\Administrator\Desktop\Breast\benign_standardized.csv'
# 将标准化后的数据保存到CSV文件中
scaled_data.to_csv(output_file, index=False)
# 打印成功信息
print("数据已经成功标准化并保存到文件:", output_file)
归一化
输入文件的路径,设置保存转化后的文件路径
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
# 读取CSV文件
data = pd.read_csv(r'C:\Users\Administrator\Desktop\Breast\benign.csv')
# 提取特征列
features = data.drop('Name', axis=1)
# 初始化归一化器
scaler = MinMaxScaler()
# 对特征进行归一化
normalized_features = scaler.fit_transform(features)
# 将归一化后的特征重新添加到原始DataFrame中
normalized_data = pd.DataFrame(normalized_features, columns=features.columns)
normalized_data.insert(0, 'Name', data['Name'])
# 定义归一化后的文件路径
output_file = r'C:\Users\Administrator\Desktop\Breast\benign_normalized.csv'
# 将归一化后的数据保存到CSV文件中
normalized_data.to_csv(output_file, index=False)
# 打印成功信息
print("数据已经成功归一化并保存到文件:", output_file)