论文阅读---VITC----Early Convolutions Help Transformers See Better

论文题目:Early Convolutions Help Transformers See Better

早期的卷积网络帮助transformers性能提升

vit 存在不合格的可优化性,它们对优化器的选择很敏感。相反现代卷积神经网络更容易优化。

vit对优化器的选择[40](AdamW [27] vs. SGD),对特定于数据的学习超参数的选择[13,40],对训练计划长度,网络深度[41]等都很敏感。这些问题使得以前的训练食谱和直觉无效,阻碍了研究

为什么vit会有这样的问题:ViT将输入图像“贴片”为p×p不重叠的贴片,以形成转换器编码器的输入集。这个补丁系统是作为一个stride-p p×p卷积实现的,p = 16是默认值。这种大内核加大步幅卷积与典型的设计背道而驰

相互融合之后与原始cnn相比的好处是:vit多头自注意进行的全局处理取代了卷积固有的局部处理的归纳偏见[42]这种设计有可能提高视觉任务的性能,类似于在自然语言处理中观察到的趋势

.vit+cnn融合之后的好处:ViT中使用卷积干可以显著提高优化稳定性,并提高峰值性能(ImageNet-1k中提高1-2%top-1精度),同时保持故障和运行时间. 这种改进可以在模型复杂性(1G36G)数据集规模(ImageNet-1kImageNet-21k)的广泛范围内观察到

具体改进:

作者推测,与cnn相比,ViT模型的次优性主要源于其patchify系统执行的早期视觉处理,该系统由非重叠stride-p p×p卷积实现,默认p = 16。我们用一个只有~ 5个卷积的标准卷积系统最小限度地替换了ViT中的补丁系统,该系统与单个变压器transformer blocks块具有大致相同的复杂性。我们将变压器块的数量减少了一个(即,L−1 vs. L),以维持一致性失败、参数和运行时间。我们将得到的模型称为ViTC,将原始的ViT称为vitp。这两个模型执行的绝大多数计算是相同的,但令人惊讶的是,我们观察到ViTC (i)收敛得更快,(ii)第一次使用AdamWor SGD而没有显着的精度下降,(iii)在学习率和权重衰减选择方面表现出更大的稳定性,(iv)ImageNet top-1误差方面取得了改进,使ViTC优于最先进的cnn,而ViTP则没有

另外作者测试了这个vitc模型

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/490909.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

中间件学习--InfluxDB部署(docker)及springboot代码集成实例

一、需要了解的概念 1、时序数据 时序数据是以时间为维度的一组数据。如温度随着时间变化趋势图,CPU随着时间的使用占比图等等。通常使用曲线图、柱状图等形式去展现时序数据,也就是我们常常听到的“数据可视化”。 2、时序数据库 非关系型数据库&#…

机器学习实验作业一----knn算法

机器学习课程的第一个算法knn算法,全称K-Nearest Neighbor,k最邻近算法,为机器学习中最常用,也是最简单的算法。KNN通过测量不同特征值之间的距离来进行分类。本文实现的是较为简单的knn算法,包括测试集,训…

pytorch中关于BF16、FP16的一些操作

文章目录 前提创建BF16和FP16的数据BF16和FP16的二进制存储格式如何根据十进制数得到对应的二进制存储如何根据二进制存储计算对应的十进制数?第一种方法第二种方法 二进制乘法如果是负数怎么办?如何手动计算BF16对应的的二进制存储格式参考链接 前提 好…

湖北汽车工业学院 实验一 关系数据库标准语言SQL

头歌 实验一 关系数据库标准语言SQL 制作不易!点个关注呗!为大家创造更多的价值! 目录 头歌 实验一 关系数据库标准语言SQL**制作不易!点个关注呗!为大家创造更多的价值!** 第一关:创建数据库第…

Chrome/Edge 使用 Markdown Viewer 查看 Markdown 格式文件

Chrome/Edge 使用 Markdown Viewer 查看 Markdown 格式文件 0. 引言1. 安装 Markdown Viewer 插件2. 使用 Markdown Viewer 阅读 Markdown 格式文件 0. 引言 大部分程序员都喜欢 Markdown 格式的文件,这时给一些没有在电脑上安装 Markdown 编辑器的同事分享资料时&…

脏牛提权(靶机复现)

目录 一、脏牛漏洞概述 二、漏洞复现 1.nmap信息收集 1.1.查看当前IP地址 1.2.扫描当前网段,找出目标机器 1.3.快速扫描目标机全端口 三、访问收集到的资产 192.168.40.134:80 192.168.40.134:1898 四、msf攻击 1.查找对应exp 2.选择对应exp并配置相关设…

基于nodejs+vue健美操评分系统python-flask-django-php

本系统采用的数据库是MySQL,使用nodejs技术开发。在设计过程中,很好地发挥了该开发方式的优势,让实现代码有了良好的可读性,而且使代码的更新和维护更加的方便,操作方便,对以后的维护减少了很多麻烦。系统的…

wpf程序调用macad的c++编写的dll

1.把macad里的build,source文件夹复制到一个文件夹里 2.创建一个wpf项目,在解决方案里添加macad.occt项目 3.把macad.occt设为dll文件,修改平台工具集,在macadtest里引用macad.occt 4.运行,应该会报错,说找…

「09」媒体源:播放本地或在线的音视频GIF文件

「09」媒体源播放本地或在线的音视频GIF文件 通过媒体源功能,您可以添加自己想要展示的各种视频内容,例如自己的视频课程、电影或客户见证视频、以及GIF动画等。 (图层叠加效果) (绿幕抠像叠加效果) 缺点…

Covalent Network(CQT)的以太坊时光机:在 Rollup 时代确保长期数据可用性

以太坊正在经历一场向 “Rollup 时代” 的转型之旅,这一转型由以太坊改进提案 EIP-4844 推动。这标志着区块链技术的一个关键转折,采用了一种被称为“数据块(blobs)”的新型数据结构。为了与以太坊的扩容努力保持一致,…

解析汽车充电桩主板的常见故障表现、原因及应对方法

充电桩主板作为充电桩的核心组件,直接影响着充电桩运行的安全性与稳定性。然而,在使用过程中,充电桩主板难免会因各种原因而出现一些故障情况,因此,了解这些原因并采取相应的应对方法对维护充电桩的正常运行起着至关重…

c语言应该怎么系统的学习?

c语言应该怎么系统的学习? 系统性学习C语言,这个描述首先是给人目标不明确,概念不清晰的映像。在开始前我有一些资料,是我根据网友给的问题精心整理了一份「c语言的资料从专业入门到高级教程」, 点个关注在评论区回复“888”之后…

centos7 安装influxdb+telegraf+grafana 监控服务器

influxdb influxdb是一个时间序列数据库, 所有数据记录都会打上时间戳, 适合存储数字类型的内容 telegraf telegraf 可以用于收集系统和服务的统计数据并发送到influxdb grafana grafana 是一个界面非常漂亮, 可直接读取influxdb数据展示成各种图表的开源可视化web软件 安…

探索 JDK 11 的新特性:迈向 Java 平台的下一个里程碑

随着时间的推移,Java 平台一直在不断演进和改进,为开发人员提供更好的工具和功能。JDK 11 是 Java 平台的一个重要版本,引入了许多新的特性和改进,为开发人员带来了全新的体验和可能性。本文将介绍 JDK 11 中一些重要的新特性&…

python基础语法--快速入门

目录 一、字面量1.1定义 二、关键字三、注释四、引号五、输入输出六、缩进七、数据类型转换八、标识符九、运算符 一、字面量 1.1定义 字面量:在代码中,被写下来的固定的值。 python中哪些值可以被写下来,如何在代码中写他们呢?…

JavaWeb开发-前端HTML基础

1.HTML的基本语法 HTML是什么?:HTML是一种超文本标记语言,负责网页的结构,设计页面的元素内容等 超文本:超越文本限制,除了文本信息,还可以定义图片,音频,视频等标记语言…

2024 年广西职业院校技能大赛高职组《云计算应用》赛项赛题第 5 套

#需要资源或有问题的,可私博主!!! #需要资源或有问题的,可私博主!!! #需要资源或有问题的,可私博主!!! 某企业根据自身业务需求&…

中科数安 || 公司办公文件资料加密、防泄密管理软件系统

#文件防泄密软件# 中科数安提供专业的公司文件资料加密与防泄密管理系统,这套软件主要服务于企业用户,以强化内部信息安全、防止重要数据泄露为核心目标。 中科数安 | 电脑文件防泄密软件 PC地址: www.weaem.com 该系统具备以下功能特性&a…

如何解决kafka rebalance导致的暂时性不能消费数据问题

文章目录 背景思考答案排它故障转移共享 背景 之前在review同组其它业务的时候,发现竟然把kafka去掉了,问了下原因,有一个单独的服务,我们可以把它称为agent,就是这个服务是动态扩缩容的,会采集一些指标&a…

格瑞纳电子邀您参观2024杭州快递物流展

2024长三角快递物流供应链与技术装备展览会 2024.7.8-10 杭州国际博览中心 参展企业介绍 北京格瑞纳电子产品有限公司是一家立足于专业科学技术领域集产品代理、培训咨询和个性化增值服务的高科技公司,于2009年成立于北京,立足于复杂系统仿真领域&…