深度学习
学习自李沐老师的课程。笔记主要以总结老师所讲解的内容以及我个人的想法为主,侵删!
课程链接:课程安排 - 动手学深度学习课程 (d2l.ai)
介绍
AI地图:
我们以前写的非 AI 类程序基本都是人自己去想会遇到什么样的问题,让程序做怎样的逻辑处理来解决.
那么,如果我们期望机器自己总结以往的经验来对我们没有考虑到过的未知情况做操作,要怎么做?
这就是机器学习要做的事情。
AI 对问题处理分为四个层次:感知,推理,(形成自己的)知识,(未来)规划。简单理解的话我认为机器学习做了这么些操作:
- 根据输入参数,生成模型。
- 对于后续情况的预测,把参数输入模型,来进行计算得到其预测的结果。
几大技术方向:
- 自然语言处理 NLP,比如中译英。这个还在感知的层面。老师认为,如果任务量是人脑几秒钟可以处理掉的就属于感知的简单层面哈哈,比如翻译官听到一句英文翻译成中文。语言属于一种符号,因此 NLP 属于符号学。
- 计算机视觉 CV,可以对图片进行进一步的推理处理比如分类。像素不算是“符号”,不属于符号学。
几大应用领域:
- 图片分类。17年左右大多数团队可以把错误率降低至5%。
- 物品检测分割。我曾经接过分割图片的接单,没累死我。
- 样式迁移:比如把期望的滤镜合成到图片上。
- 人脸合成:计算机合成假脸。
- 字生图:AI 绘图。
- 文字生成:gpt。
- 无人驾驶。
比如,拿一个广告预测的案例来说。当我们在搜索框搜索一个物品的时候,算法如何给我们呈现出更容易骗我们点击的广告?
首先需要形成一个预测模型,使用训练数据,分析其中的特征和用户点击的统计数据来构建模型。
对于一个搜索内容,我们提取其特征后放入模型中,并进行点击率预测。
而且在实际应用过程中,模型还可以不断迭代。
安装
为了防止不必要的麻烦,我选用的是购买云服务器方案。我在 AutoDL 上购买了自带 Conda 环境的 ubuntu 服务器并在其上进一步安装包配置环境。AutoDL 非常便宜,我租的是 50GB 数据盘 90GB 内存的服务器,每小时2元。不过是抢占式的,要么就是等空闲机器释放,要么把当前环境克隆到另一台空闲机器上运行。我在敲下这篇博客时就在等待释放hh。
按照老师的说明 安装 — 动手学深度学习 2.0.0 documentation (d2l.ai),下载 torch, jupyter, torchvision, d2l
具体下载方式全部是进入 conda activate base
环境中使用 pip 下载。torch 下载好久呀,我的钱钱qaq
最后执行 jupyter notebook,并把端口映射到本地打开,即可看到 jupyter 本课程的笔记本(AutoDL 只有一个端口供用户映射。但是当我们使用 vscode remote SSH 远程连接的时候端口会自动映射到本地,直接打开链接即可)。