KNN-手写数字数据集:
使用sklearn中的KNN算法工具包( KNeighborsClassifier)替换实现分类器的构建,注意使用的是汉明距离;
分段解释代码:
import os import pandas as pd from Levenshtein import hamming
导入所需的库,包括os用于文件操作,pandas用于数据处理,以及hamming函数来计算字符串之间的汉明距离。
def get_train(): path = 'digits/trainingDigits' trainingFileList0 = os.listdir(path) trainingFileList = [file[2:] if file.startswith('._') else file for file in trainingFileList0] train = pd.DataFrame() img