《动手学深度学习(Pytorch版)》Task01:初识深度学习——4.22打卡

深度学习介绍

AI地图

在这里插入图片描述

  • 自然语言处理:起源于符号学,如机器翻译,人在几秒钟能反应过来,属于感知问题
  • 计算机视觉:图片由像素组成,难以用符号学解释,在图片中进行推理,大部分用概率模型或者机器学习
  • 深度学习:机器学习的一种

深度学习任务

图片分类

输入图像识别类别

著名数据集Image-net

物体检测和分割

  • 目标检测:输入图像识别图像中每个物体的类别和框
  • 语义分割:识别每个像素的类别

在这里插入图片描述

样式迁移

将一个图像中的样式应用在另一图像之上

在这里插入图片描述

人脸合成

请添加图片描述

文字生成图片

在这里插入图片描述

文字生成

以QA形式进行文字生成,如GPT-3

在这里插入图片描述

无人驾驶

在这里插入图片描述

案例:广告点击

场景:给定用户输入如何返回相应的广告

三个阶段:

  1. 触发
  2. 点击率预估 —> 机器学习模型
  3. 排序

**预测:**特征提取 —> 模型 —> 点击率预测

**训练:**训练数据(过去广告展现和用户点击) —> 特征和用户点击 —> 模型

完整过程

在这里插入图片描述

领域专家:关心模型应用产生的影响,提需求的人,甲方

数据科学家:将原始数据转换成机器可以理解的数据,乙方

AI专家:训练模型并且关注模型的进一步提升

QA

Q:机器学习的可解释性:机器学习在图片分割领域为什么有效?

A:深度学习的可解释性(人类理解层面)现在很难定论,但是可以从一些角度解释模型为什么有效

Q:深度学习无法用数学规范表述,只能从直觉上理解对吗?

A:不一定,模型可以用数学表述,但是目前难以用数学来解释模型为什么工作/不工作

引言-相关名词整理

关键组件

数据(data)

数据集(dataset)

模型(model):任一调整参数后的程序

参数(parameter):可以调整程序行为的旋钮

学习算法(learning algorithm):使用数据集来选择参数的元程序

样本(example, sample)数据点(data point)数据实例(data instance):组成数据集的数据

独立同分布(independently and identically distributed, i.i.d.)

特征(features,或协变量(covariates)):一组特征属性组成一个样本

维数(dimensionality):特征向量的长度

深度学习(deep learning):关注功能强大的模型,这些模型由神经网络错综复杂的交织在一起,包含层层数据转换

目标函数(objective function):量化模型的有效性的函数

损失函数(loss function,或cost function):习惯上取目标函数越低越好,所以叫损失

训练数据集(training dataset,或称为训练集(training set)):用于模型训练而收集的样本,拟合模型参数

测试数据集(test dataset,或称为测试集(test set)):用于测试模型性能,模型没有见过的“新数据集”,评估拟合的模型

过拟合(overfitting):模型在训练集上表现良好,但测试集效果很差

梯度下降(gradient descent):常用的优化算法,在每个步骤中,梯度下降法都会检查每个参数,看看如果仅对该参数进行少量变动,训练集损失会朝哪个方向移动。 然后,它在可以减少损失的方向上优化参数。

监督学习

监督学习(supervised learning):在“给定输入特征”的情况下预测标签。每个“特征-标签”对都称为一个样本(example)。

回归

回归(regression):训练一个回归函数来输出一个数值

平方误差(squared error):预测值与实际值之差的平方,预测数值最常用

分类

分类(classification):练一个分类器来输出预测的类别

类别(category,正式称为(class))

二项分类(binomial classification):只有两个类别的分类

多项分类(multiclass classification):有两个以上的类别

交叉熵(cross-entropy):所有标签分布的预期损失值

层次分类(hierarchical classification):一些分类任务的变体可以用于寻找层次结构,层次结构假定在许多类之间存在某种关系

标记问题

多标签分类(multi-label classification):学习预测不相互排斥的类别的问题

推荐系统

推荐系统(recommender system):向特定用户进行“个性化”推荐

序列学习

序列学习(sequence Learning):摄取可变长度的输入序列 和/或 预测可变长度的输出序列

无监督学习

无监督学习(unsupervised learning):数据中不含有“目标”的机器学习问题

聚类(clustering):没有标签的情况下给数据分类

主成分分析(principal component analysis):用少量的参数来准确地捕捉数据的线性相关属性

因果关系(causality)和概率图模型(probabilistic graphical models):根据经验数据发现属性之间的关系

生成对抗性网络(generative adversarial networks):通过两个神经网络相互博弈的方式进行学习,生成数据

与环境互动

离线学习(offline learning):根据预先收集的数据进行模型训练,训练开始后不与环境交互

分布偏移(distribution shift):训练集和测试集之间的数据分布不同,导致模型的泛化性能很差。

强化学习

强化学习(reinforcement learning):让智能体(agent)在与环境交互的过程中,通过学习最优的行为策略,来实现最大的回报或目标。

智能体(agent)

观察(observation)

动作(action)

奖励(reward)

策略(policy):强化学习的目标是产生一个好的策略

在这里插入图片描述

学分分配(credit assignment):决定哪些行为是值得奖励的,哪些行为是需要惩罚的。

马尔可夫决策过程(markov decision process):环境可被完全观察到的强化学习问题

上下文赌博机(contextual bandit problem):状态不依赖于之前的操作的强化学习问题

多臂赌博机(multi-armed bandit problem):没有状态,只有一组最初未知回报的可用动作的强化学习问题

神经网络(neural networks):一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。

(layers):线性和非线性处理单元的交替

链式规则(也称为反向传播(backpropagation)):一次性调整网络中的全部参数的规则

dropout :有助于减轻过拟合

表示学习(representation learning):模型自动从数据中抽取特征或表达,以方便后续任务

Datawhale环境配置讲解

视频分为Linux和windows环境配置,本人使用笔记本自带的RTX4060显卡进行配置,所以是windows环境,视频在20:30左右开始

视频内容:

下载 Miniconda

更换镜像源

下载GIT

下载课程 Repo

之前已经配置过conda和pytorch,所以跳过

安装

因为已经安装conda,所以跳过安装Miniconda

安装深度学习框架和d2l软件包

创建conda虚拟环境

conda create -n learning_pytorch python=3.9

激活虚拟环境

conda activate learning_pytorch

确定CUDA driver的版本

运行nvidia-smi, CUDA版本为12.4

在这里插入图片描述

pytorch官网选择比CUDA driver小的最新版本

在这里插入图片描述

conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

安装d2l

pip install d2l==0.17.6

下载 D2L Notebook

创建文件夹d2l-zh并下载压缩包

mkdir d2l-zh && cd d2l-zh
curl https://zh-v2.d2l.ai/d2l-zh-2.0.0.zip -o d2l-zh.zip

问题:‘unzip’ 不是内部或外部命令,也不是可运行的程序
或批处理文件。

原因:unzip是linux系统下,windows不自带。

解决方法:下载unzip,官网地址:https://gnuwin32.sourceforge.net/packages/unzip.htm

  1. 选择Binaries;
  2. 下载ZIP;
  3. 最后将下载下来的unzip-5.51-1-bin\bin\unzip.exe文件复制到 C:\Windows\System32 即可。

在这里插入图片描述

在这里插入图片描述

解压,可以正常运行

unzip d2l-zh.zip && del d2l-zh.zip

PS:windows命令提示符(CMD)使用 del 命令来删除文件。

cd pytorch

打开Jupyter笔记本(在Window系统的命令行窗口中运行以下命令前,需先将当前路径定位到刚下载的本书代码解压后的目录)

jupyter notebook

成功打开

在这里插入图片描述

李沐:GPT时代AI怎么学?

原来的深度学习:人在5s可以决策出来的问题

现在的深度学习:一个专业人士1h的工作量

机器学习这么多年在训练上其实没有本质的变化

不同:每几年会把一类模型的做到智能顶点

transformer的智能上限仍在探索中

就算遇到上限,也会去探索新的模型架构

现状:transformer的了解不够深入,下一个架构仍未出现

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/566054.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Nginx+Lua+OpenResty(详解及使用)

一、 Nginx简介 Nginx是一个高性能的Web服务器和反向代理的软件。 Web服务器:就是运行我们web服务的容器,提供web功能,还有tomcat也提供类似的功能。 代理是软件架构和网络设计中,非常重要的一个概念。 二、Nginx的反向代理&…

Scrapy爬虫框架入门(豆瓣电影Top 250)

文章目录 Scrapy 官网Scrapy 文档GithubScrapy 简介项目结构爬虫实现XPath 教程创建 Scrapy 项目配置用户代理网页 dom 元素 IP 代理池IP代理池作用配置IP代理池申请IP代理池 Scrapy 官网 https://scrapy.org/ Scrapy 文档 https://docs.scrapy.org/en/latest/ Github htt…

Opencv_2_ 图像色彩空间转换

ColorInvert.h 内容如下&#xff1a; #pragma once #include <opencv.hpp> using namespace std; #include <opencv.hpp> using namespace cv; using namespace std; class ColorInvert{ public : void colorSpaceInvert(Mat&image); }; ColorInvert.cpp…

构建云原生湖仓:Apache Iceberg与Amoro的结合实践

随着大数据技术的快速发展&#xff0c;企业对数据的处理和分析需求日益增长。传统的数据仓库已逐渐无法满足现代业务对数据多样性和实时性的要求&#xff0c;这促使了数据湖和数据仓库的融合&#xff0c;即湖仓一体架构的诞生。在云原生技术的推动下&#xff0c;构建云原生湖仓…

数据库服务类--Redis--未授权访问终端Getshell

免责声明:本文仅做技术交流与学习. 目录 前提条件: windows上开启redis服务: Linux上创建&开启redis服务: 操作: 1-连接靶机redis 2-写入webshell 3-访问后门 redis--->webshell Redis未授权访问漏洞复现与利用 - 知乎 (zhihu.com) 前提条件: 端口开放(6379) 目录…

[LeetCode]—— 226——翻转二叉树

1.题目 . - 力扣&#xff08;LeetCode&#xff09; 给你一棵二叉树的根节点 root &#xff0c;翻转这棵二叉树&#xff0c;并返回其根节点。 示例 1&#xff1a; 输入&#xff1a;root [4,2,7,1,3,6,9] 输出&#xff1a;[4,7,2,9,6,3,1]示例 2&#xff1a; 输入&#xff1a…

标题Selenium IDE 常见错误笔记

Selenium IDE 常见错误笔记 错误1&#xff1a;Failed:Exceeded waiting time for new window to appear 2000ms 这个错误通常出现在第一次运行时&#xff0c;有两个原因&#xff1a; Firefox阻止了弹出式窗口&#xff0c;在浏览器设置里允许这个操作即可。 有些网站设置了反…

modelsim波形高度异常,值为X

一、问题 波形高度异常&#xff0c;忽高忽低&#xff0c;正常波形高电平和低电平是统一高度的 timescale 1ns/1nsmodule key_test_tb();//parameter define parameter CLK_PERIOD 20; parameter CNT_MAX 25d25; //仅用于仿真,对应 500nsreg sys_clk; //周期 20ns reg d; wir…

Spark 中的分桶分化

Spark 中的分桶分化 Bucketing是 Spark 和 Hive 中用于优化任务性能的一种技术。在分桶桶&#xff08;集群列&#xff09;中确定数据分区并防止数据混洗。根据一个或多个分桶列的值&#xff0c;将数据分配给预定义数量的桶。 分桶有两个主要好处&#xff1a; 改进的查询性能&…

【存储】cosbench对象存储测试工具

目录 简略说明 原理 用法 详细说明 简介 用法 一 安装 二 简单验证 三 编写配置文件 四 提交配置文件下IO 五 测试结果查看 结果概览 查看详情 每秒钟的io情况查看 工作负载配置 参数配置&#xff08;controller和driver&#xff09; 查看错误的方法和错误记录 查看错误的方法 …

[BT]BUUCTF刷题第20天(4.22)

第20天 Web [GWCTF 2019]我有一个数据库 打开网站发现乱码信息&#xff08;查看其他题解发现显示的是&#xff1a;我有一个数据库&#xff0c;但里面什么也没有~ 不信你找&#xff09; 但也不是明显信息&#xff0c;通过dirsearch扫描得到robots.txt&#xff0c;然后在里面得…

123.Mit6.S081-实验1-Xv6 and Unix utilities

今天我们来进行Mit6.S081实验一的内容。 实验任务 一、启动xv6(难度&#xff1a;Easy) 获取实验室的xv6源代码并切换到util分支。 $ git clone git://g.csail.mit.edu/xv6-labs-2020 Cloning into xv6-labs-2020... ... $ cd xv6-labs-2020 $ git checkout util Branch util …

xshell的基本命令

1. 创建虚拟环境: conda create -n 虚拟环境名称 python3.7 2. 激活进入虚拟环境 conda activate 虚拟环境名称 3. 退出虚拟环境 conda deactivate 4. 查看所有虚拟环境 conda env list 5. 卸载环境 conda remove -n 虚拟环境名称 --all 6. 执行py文件: python3.py文…

微软刚开源就删库的WizardLM-2:MT-Bench 榜单评测超越GPT-4,7B追平Qwen1.5-32B

前言 微软最近发布的WizardLM-2大型语言模型因其先进的技术规格和短暂的开源后突然撤回&#xff0c;引起了科技界的广泛关注。WizardLM-2包括三个不同规模的模型&#xff0c;分别是8x22B、70B和7B&#xff0c;均展现了在多语言处理、复杂对话、推理和代理任务上的卓越能力。 H…

如何用PHP语言实现远程语音播报

如何用PHP语言实现远程语音播报呢&#xff1f; 本文描述了使用PHP语言调用HTTP接口&#xff0c;实现语音播报。通过发送文本信息&#xff0c;来实现远程语音播报、语音提醒、语音警报等。 可选用产品&#xff1a;可根据实际场景需求&#xff0c;选择对应的规格 序号设备名称1…

IDEA代码重构

重构 重构的目的&#xff1a; 提高代码的可读性、可维护性、可扩展性和性能。 重命名元素 重命名类 当我们进行重命名操作的时候可以看到第六行存在一个R(rename)&#xff0c;点击后就会弹出所偶有引用&#xff0c;这样可以避免我们在修改后存在遗漏引用处未修改。 我们可以通过…

操作系统安全:Windows与Linux的安全标识符,身份鉴别和访问控制

「作者简介」&#xff1a;2022年北京冬奥会中国代表队&#xff0c;CSDN Top100&#xff0c;学习更多干货&#xff0c;请关注专栏《网络安全自学教程》 操作系统有4个安全目标&#xff0c;也就是说想要保证操作系统的安全&#xff0c;就必须实现这4个需求&#xff1a; 标识系统…

YoloV9改进策略:下采样改进|自研下采样模块(独家改进)|疯狂涨点|附结构图

文章目录 摘要自研下采样模块及其变种第一种改进方法 YoloV9官方测试结果改进方法测试结果总结 摘要 本文介绍我自研的下采样模块。本次改进的下采样模块是一种通用的改进方法&#xff0c;你可以用分类任务的主干网络中&#xff0c;也可以用在分割和超分的任务中。已经有粉丝用…

单细胞+RIP-seq项目文章| Cell ReportshnRNPU蛋白在小鼠精原干细胞池建立的关键作用

精原干细胞&#xff08;SSCs&#xff09;是负责精子发生的干细胞&#xff0c;具有自我更新和分化产生功能性精子的能力。SSCs的持续再生对于维持雄性生育力至关重要。然而&#xff0c;SSC池的发育起源尚不清楚。在哺乳动物中&#xff0c;SSCs源自名为 prospermatogonia&#xf…

端口被占用的解决方案汇总

端口被占用的解决方案汇总 【一】windows系统端口被占用【二】Linux系统端口被占用【三】Linux的ps命令查找&#xff08;1&#xff09;ps命令常用的方式有三种&#xff08;2&#xff09;ps -ef |grep 8080 【一】windows系统端口被占用 &#xff08;1&#xff09;键盘上按住Wi…