获取数据+数据处理+特征工程+机器学习+模型调优
一:机器学习的定义
二:工作流程
三:工作流程解释
pandas + numpy + matplotlib
四:机器学习算法分类
4.1 监督学习
4.1.2 回归问题
目标值是连续的
4.1.2 分类问题
目标值是离散的
4.2 无监督学习
没有被标记,没有目标值
4.3 有监督学习和无监督学习的区别
4.4 半监督学习
4.5 强化学习
4.6 监督学习和强化学习的区别
4.7 小结
五:模型评估
5.1 分类模型评估
5.2 回归模型评估
六:拟合、欠拟合、过拟合
欠拟合:训练不好,测试不好
过拟合:训练过于优越,测试不好