机器学习已经强大到可以独立成为人工智能的一个子领域。
可以通过对机器编程实现比如执行网络搜索、理解人类语言、通过x光诊断疾病,或制造自动驾驶汽车。
机器学习定义
一般来说,给一个算法学习的机会越多,它的表现就越好。
机器学习的两种主要类型是监督学习和无监督学习(强化学习在课程中不细讲)
监督学习是进步最快和创新最多的算法。
在课程中会学习一些实践机器学习算法的实用技巧。
监督学习
如今,机器学习正在创造巨大的经济价值。现在99%机器学习产生的价值是由一种叫做监督学习的算法所创造的。
监督式机器学习,或者更常见的说法——监督学习,是指学习x到y 或者 输入到输出映射的算法。
监督学习的主要特点是:算法学习你提供的例子。这些例子中有正确答案,即,对于给定的输入x,标上正确的标签y,通过学习正确的输入x和期望的输出y,算法最终能够只接受输入,而不需要接受输出标签,就能给出合理准确的输出预测或猜测。
机器学习的实际应用场景举例
- 如果输入x是一封电子邮件,输出y是这封电子邮件是不是垃圾邮件,这就有了个垃圾邮件过滤器。
- 或者输入的是音频片段,算法输出的是文本,那么这就是语音识别。
- 或者如果你想输入英语之后,得到相应的西班牙语,阿拉伯语,印地语,汉语,日语,或者其他语言的翻译,这就是机器翻译。
- 如今,监督学习最赚钱的产业大概就是在线广告。几乎所有大型在线广告平台都会有这样的机器学习算法,通过输入一则广告和一些关于你的信息,然后试着计算你是否会点击那个广告。因为通过展示广告人们就有可能点击它,对于这些大型在线广告平台来说,每一次点击都是收入,这实际上为这些公司带来了很多收入。
- 或者如果你想造一辆自动驾驶汽车,学习算法的输入就是图像、来自传感器的信息,如雷达或者其他设备,然后算法尝试输出位置,比如其他车的位置,这样,你的无人驾驶汽车可以安全地穿梭于其他车辆中。
- 再举个汽车制造的例子,你可以有一个这样的学习算法,输入一个产品成品的图片,比如说刚从生产线上下来的手机,算法会输出手机有没有刮伤、凹痕或其他产品缺陷。这叫做视觉检测,它帮助制造商减少或避免产品出现纰漏。
回归
回归问题比如就房价预测来说
回归需要预测一个数字无限多个可能的输出
分类
回归
预测一个数字
无限多的可能输出,少量的可能输出
分类
预测分类
无监督学习
监督学习,从标有“正确答案”的数据中学习
无监督学习,在无标记的数据中寻找有趣的东西。
案列
集群:谷歌news
比如百度头条,会根据panda,twin,zoo进行相关关键字推送
聚类:DNA微阵列
聚类:对客户进行分组
无监督学习
数据只有输入x,而没有输出标签y。
算法必须在数据中找到结构。
聚类:将相似数据分组分在一起。
降维:使用更少的数据压缩数据数字
异常检测:发现不寻常的数据点
Jupyter Notebooks
如今,机器学习和数据科学从业者使用最广泛的工具就是Jupyter Notebook。这是大多数人默认会使用到的写代码、做实验的开发环境。
在吴恩达老师这门课中,会学习如何用浏览器,构建一个Jupyter Notebook环境,去测试我们自己的一些想法。
这并不是简化后的开发环境,你用的是和许多大国开发人员同款的开发环境。
课程地址:https://www.coursera.org/specializations/machine-learning-introduction
在这门课提供的所有Lab中,有一种选做的Lab,你可以打开它,运行一行试试,这通常不用你再补充代码。
请随意上下滚动屏幕浏览内容,鼠标停留在菜单上,可以看到这些的不同选项。
这里有两种类型的模块,按Shift+Enter键,你可以随意地编辑和修改代码,然后运行它,看看会发生什么。
如果你还没有使用过Jupyter Notebook环境,我希望你能在Jupyter Notebook中更加熟悉Python。
线性回归模型
让我们从一个可以用线性回归解决的问题开始。
假设你想根据房子的大小来预测房子的价格。我们将使用波特兰的房屋大小和价格数据集,该图中:横轴是房子的面积,单位是平方英尺;纵轴是房子的价格,单位是千美元。
这里每个数据点,每一个小X都是对应房子的大小和最近的售价。现在,假设你是波特兰的一个房地产经纪人,你正在帮一个客户卖她的房子。她现在问你,你觉得这房子能卖多少钱?
这个数据集也许能帮你估计出她的房子能卖多少钱。
首先,你测量房子的大小,结果发现房子的面积是1250平方英尺。你觉得这房子能卖多少钱呢?
通过这个数据集,你的模型将把数据拟合成一条直线,根据这条拟合好的直线,你可以看到如果房子有1250平方英尺,它会在这里和直线相交,而且如果你看向左边的纵轴,你可以看到价格大概在这里,22万美元左右。
这就是所谓的监督学习模型的一个例子。
该文章记录我在b站学习的《2022吴恩达机器学习Deeplearning.ai课程》笔记,学习视频地址在:https://www.bilibili.com/video/BV1Pa411X76s/?p=11&spm_id_from=pageDriver&vd_source=5db49e51dca44fd53a43d740419ed842