vit及其变体（swin Deit）

vit及其变体（swin Deit）

article2024/12/25 2:10:39/文章来源:https://blog.csdn.net/weixin_41012399/article/details/143574666

参考：https://www.zhihu.com/question/538049269/answer/2773898603
ViT模型变体：DeiT模型（Data-Efficient Image Transformer）；Swin Transformer模型（Shifted Windows Transformer）；DINO模型（Self-distillation with no labels）；

DeiT模型（Data-Efficient Image Transformer）Touvron等人通过数据增强（data augmentation）等精细训练策略，在不依靠大型专有数据集的情况下实现了出色的模型性能（依然以ImageNet图像分类任务为衡量标准），这一点与原始ViT模型相反，ViT模型是在Google的JFT-300M闭源数据集上训练的。Touvron等人还使用一种专门针对Transformer模型的蒸馏（distillation）技术进一步改进ViT模型。将一个性能强大，但可能庞大而难以训练的teacher模型“蒸馏”为一个基于Transformer架构的student模型，做法和Hinton等人提出的”知识蒸馏“相似（Hinton et al. 2014）。这种模型称为DeiT模型（Data-Efficient Image Transformer）。ViT模型一般都需要在很大的数据集上预训练效果才会比较好，而DeiT在imagenet1k上就有比较好的效果。

为了解决ViT模型中图像块边缘空间信息部分丢失和计算复杂度二次方增长的问题，Liu等人引入了一种基于分层特征图和移位窗口（shifted window, Swin）的ViT模型（Liu et al. 2021）。Swin Transformer有两个核心贡献，如图7所示。
在这里插入图片描述

DINO模型（Self-distillation with no labels）目前谈及的ViT模型都经过有监督的分类任务（预）训练。Caron等人从另一个方向进行研究，在DeiT的基础上构建了一种自监督训练ViT模型，也取得了良好成果。这种模型无需使用DeiT所用的显式teacher模型，而是引入了一种无标签自蒸馏（self-distillation with no labels, DINO，https://openaccess.thecvf.com/content/ICCV2021/html/Caron_Emerging_Properties_in_Self-Supervised_Vision_Transformers_ICCV_2021_paper.html）方法。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/909773.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

盲盒潮玩小程序，盲盒市场的巨大商业机遇！

盲盒潮玩小程序，盲盒市场的巨大商业机遇！

近几年，盲盒展现出了强劲的发展态势，成为了消费者热衷的娱乐消费方式，各种大热IP在市场中大放异彩！在网络中，关于盲盒的讨论度更是持续火热，显而易见，盲盒成为了一个不容小觑的行业！…

阅读更多...

聊一聊Elasticsearch的索引的分片分配机制

聊一聊Elasticsearch的索引的分片分配机制

1、什么是分片分配分片分配是由ES主节点将索引分片移动到ES集群中各个节点上的过程。该过程尽量保证，同一个索引的分片尽量分配到更多的节点上，以此来达到读写索引的时候可以利用更多硬件资源的效果。在分配过程当中，也不能将某个主分片…

阅读更多...

DAY21|二叉树Part08|LeetCode: 669. 修剪二叉搜索树、108.将有序数组转换为二叉搜索树、538.把二叉搜索树转换为累加树

DAY21|二叉树Part08|LeetCode: 669. 修剪二叉搜索树、108.将有序数组转换为二叉搜索树、538.把二叉搜索树转换为累加树

目录 LeetCode: 669. 修剪二叉搜索树基本思路 C代码 LeetCode: 108.将有序数组转换为二叉搜索树基本思路 C代码 LeetCode: 538.把二叉搜索树转换为累加树基本思路 C代码 LeetCode: 669. 修剪二叉搜索树力扣代码链接文字讲解：LeetCode: 669. 修剪二叉搜…

阅读更多...

Halcon edges_sub_pix

Halcon edges_sub_pix

1、算子帮助文档 edges_sub_pix 使用递归实现的滤波器（根据Deriche、Lanser和Shen的方法）或Canny提出的常规实现的“高斯导数”滤波器（使用滤波器掩模）来检测阶梯边缘。因此，以下边缘算子可用于滤波器： der…

阅读更多...

SpringBoot配置Rabbit中的MessageConverter对象

SpringBoot配置Rabbit中的MessageConverter对象

SpringAMQP默认使用SimpleMessageConverter组件对消息内容进行转换 SimpleMessageConverter： only supports String, byte[] and Serializable payloads仅仅支持String、Byte[]和Serializable对象Jackson2JsonMessageConverter：was expecting (JSON Str…

阅读更多...

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-30

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-30

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-30 目录文章目录计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-30目录1. Step Guided Reasoning: Improving Mathematical Reasoning using Guidance Generation and Step Reasoning摘要研究背…

阅读更多...

LabVIEW在Windows和Linux开发的差异

LabVIEW在Windows和Linux开发的差异

LabVIEW广泛应用于工程和科研领域的自动化和测量控制系统开发，其在Windows和Linux平台上的开发环境有所不同。这些差异主要体现在操作系统兼容性、硬件支持、软件库和驱动程序、实时系统开发以及部署选择上。以下从各个方面详细对比分析LabVIEW在Windows与Linux系统…

阅读更多...

大模型日报｜7 篇必读的大模型论文

大模型日报｜7 篇必读的大模型论文

大家好，今日必读的大模型论文来啦！ 1.加州大学团队推出“罕见病”大模型 Zebra-Llama 罕见病为医疗保健带来了独特的挑战，通常会出现诊断延迟和信息分散的情况。这些疾病的可靠知识稀缺，给大语言模型（LLM&#xff09…

阅读更多...

Docker篇（基础命令）

Docker篇（基础命令）

目录一、启动与停止二、镜像相关的命令 1. 查看镜像 2. 搜索镜像 3. 拉取镜像 4. 删除镜像三、容器创建与启动容器 1. 查看容器 2. 创建容器交互式方式创建容器守护式方式创建容器 3. 容器启动与停止四、容器操作命令 1. 文件拷贝 2. 目录（文件…

阅读更多...

网络安全认证的证书有哪些？

网络安全认证的证书有哪些？

在网络安全领域，专业认证不仅是个人技术能力的象征，也是职业发展的重要推动力。随着网络安全威胁的日益严峻，对网络安全专业人才的需求也在不断增长。本文将介绍一些网络安全认证的证书，帮助有志于从事网络安全行业的人士了解并选…

阅读更多...

论文阅读笔记：Image Processing GNN: Breaking Rigidity in Super-Resolution

论文阅读笔记：Image Processing GNN: Breaking Rigidity in Super-Resolution

论文阅读笔记：Image Processing GNN: Breaking Rigidity in Super-Resolution 1 背景2 创新点3 方法4 模块4.1 以往SR模型的刚性4.2 图构建4.2.1 度灵活性4.2.2 像素节点灵活性4.2.3 空间灵活性 4.3 图聚合4.4 多尺度图聚合模块MGB4.5 图聚合层GAL 5 效果5.1 和SOTA…

阅读更多...

tomato靶机

tomato靶机

下载tomato地址:https://vulnhub.com/entry/tomato-1,557/ 直接拖进虚拟机中 tomato靶机和kali虚拟机必须在同一网段所以使用nat模式扫描主机 arp-scan -I eth0 -l 发现新主机ip 192.168.142.147 nmap扫描端口 namp -p- -A -T4 --min-rate10000 192.168.142.147 有用的信息…

阅读更多...

集成旺店通旗舰版售后单至MySQL数据库

集成旺店通旗舰版售后单至MySQL数据库

旺店通旗舰版-售后单集成到MySQL的技术实现在数据驱动的业务环境中，如何高效、准确地将旺店通旗舰奇门的数据集成到MySQL数据库，是许多企业面临的重要挑战。本文将分享一个具体的系统对接案例：旺店通旗舰版-售后单-->BI泰海-售后订单表(…

阅读更多...

随着FAB的发布，在FAB中使用Megascans的简单方法（适用于Unreal Engine 5）

随着FAB的发布，在FAB中使用Megascans的简单方法（适用于Unreal Engine 5）

UE5系列文章目录文章目录 UE5系列文章目录前言一、如何在2024年12月31之前免费获取Quixel Megascans所有资源前言随着FAB的发布,Quixel Megascans的资源在2024年12月31号之后将不再免费，一个资源1美元 Fab是Epic Games推出的一个全新的数字内容平台，…

阅读更多...

论文阅读：Computational Long Exposure Mobile Photography (二)

论文阅读：Computational Long Exposure Mobile Photography (二)

这篇文章是谷歌发表在 2023 ACM transaction on Graphic 上的一篇文章，介绍如何在手机摄影中实现长曝光的一些拍摄效果。 Abstract 长曝光摄影能拍出令人惊叹的影像，用运动模糊来呈现场景中的移动元素。它通常有两种模式，分别产生前景模糊或…

阅读更多...

Linux云计算 |【第五阶段】PROJECT3-DAY1

Linux云计算 |【第五阶段】PROJECT3-DAY1

主要内容： 跳板机（堡垒机）的概念、部署JumpeServer 一、跳板机（堡垒机）的概念跳板机（Jump Server 或 Bastion Host）是一种网络安全设备或服务器，也称堡垒机，是一类可作…

阅读更多...

一款根据图片内的文字，把图片分类的软件

一款根据图片内的文字，把图片分类的软件

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants 创建一个自定义列表如何创建一个…

阅读更多...

文件操作：Xml转Excel

文件操作：Xml转Excel

1 添加依赖 Spire.Xls.jar <dependency><groupId>e-iceblue</groupId><artifactId>spire.xls</artifactId><version>5.3.3</version></dependency>2 代码使用 package cctd.controller;import com.spire.xls.FileFormat; im…

阅读更多...

从底层技术到实际应用：Claude与ChatGPT谁更适合学术写作？

从底层技术到实际应用：Claude与ChatGPT谁更适合学术写作？

学境思源，一键生成论文初稿： AcademicIdeas - 学境思源AI论文写作使用大模型智能AI进行学术写作和科研已经成为学者、研究人员和高校学生的强大助手。Anthropic的Claude和OpenAI的ChatGPT作为该领域的两个主要参与者，正在不断发展和完善。随…

阅读更多...

linux 磁盘配额 quota

linux 磁盘配额 quota

增加一个facl的的知识点： linux中默认的文件系统支持facl，如果是新挂载的分区，则不支持facl应用。需要在挂载文件系统时使用-o acl选项来启用facl支持。如下图显示在/etc/fstab添加defaults,acl 1.启用磁盘配额功能：修改/etc/f…

阅读更多...

最新文章