Note-backbone预训练权重对模型收敛速度的影响和mmlab实验测试

简介

在训练一些复杂模型时候,通常会考虑读取backbone的预训练权重,这种方法有以下好处:
初始化网络参数:在深度学习模型训练过程中,通常需要随机初始化神经网络的参数。然而,如果采用Backbone预训练权重进行初始化,模型就能从一个已经学习过大量数据的权重开始,而不是从零开始。这可以大大提高模型在初始阶段的性能,因为它已经具备了一定的特征提取能力。
加速模型收敛:由于Backbone预训练权重已经包含了大量的通用特征表示,这些特征表示对于许多计算机视觉任务都是有用的。因此,当使用这些预训练权重进行模型训练时,模型可以更快地适应新的任务,并加速收敛。
提高模型性能:通过使用Backbone预训练权重,模型能够利用已经在大型数据集上学习到的特征表示,从而在新任务上获得更好的性能。这可以体现在更高的准确率、更低的错误率等方面。
减少过拟合:在深度学习中,过拟合是一个常见的问题。然而,通过使用Backbone预训练权重,模型已经具备了一定的泛化能力,因此在新的任务上更不容易出现过拟合现象。
节省计算资源:从头开始训练一个深度学习模型通常需要大量的计算资源和时间。然而,通过使用Backbone预训练权重,模型可以更快地收敛,并节省大量的计算资源。这对于那些计算资源有限的研究者或开发者来说是非常有用的。

实验测试:

利用mmdet工程进行实验,读取backbone的预训练权重,并将这部分学习率设置为其他权重的0.05倍:
修改配置文件:

pts_backbone=dict(
        type='XXX',
        ......
        pretrained='work_dirs/pretrain_xxx.pth'),
......
optimizer = dict(type='AdamW',
                 lr=0.001,
                 paramwise_cfg=dict(
                     custom_keys={
                         'pts_backbone': dict(lr_mult=0.05),
                     }),
                 weight_decay=0.01)

对比测试效果如下:
不读取预训练权重:
在这里插入图片描述
读取预训练权重:
在这里插入图片描述
又实验可知:读取预训练权重可以有效提高收敛速度,所以现在市面上的transfomer检测都会读取预训练模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/594664.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

拼多多不花钱推广能做起来吗

拼多多推广可以使用3an推客。3an推客(CPS模式)给商家提供的营销工具,由商家自主设置佣金比例,激励推广者去帮助商家推广商品链接,按最终有效交易金额支付佣金,不成交不扣费。是商家破零、积累基础销量的重要…

背景音乐广播系统解决方案

背景音乐广播系统解决方案18123651365 在公共广播背景音乐系统虽然是一个小小分支,但是却与人们的生活质量直接挂钩,如早晨时间,可以通过播放一些愉快的音乐,使得住宅居名、上班一族和晨运一族有一个愉快的心情,精神抖…

《QT实用小工具·五十六》自适应界面变化的控件

1、概述 源码放在文章末尾 该项目实现了网格显示多张带文字的图片在界面中自适应布局 特点 跟随窗口大小变换位置,并带移动动画 响应鼠标事件,图片缩放动画 点击水波纹动画 项目demo演示如下所示: 项目部分代码如下所示: #i…

剖析QMS质量管理系统:推动企业效益提升的关键因素

质量管理系统(QMS)是企业管理中至关重要的一环,它涵盖了组织的所有流程和活动,并旨在提高产品和服务的质量。通过实施和运营一个有效的QMS,企业能够不断改进其业务,满足客户需求,提高竞争力&…

书生浦语第三节茴香豆:搭建你的RAG智能助理笔记

RAG(Retrieval Augmented Generation)是一项通过检索与用户输入相关的信息片段,并结合外部知识库来生成更准确、更丰富的回答的技术。解决 LLMs 在处理知识密集型任务时可能遇到的挑战, 如幻觉、知识过时和缺乏透明、可追溯的推理过程等。提供…

4月威胁态势 | 0day占比82%!Polyransom勒索家族强势来袭

近日,亚信安全正式发布《2024年4月威胁态势报告》(以下简称“报告”),报告显示,4月份新增安全漏洞1260个,涉及0day漏洞占82%;监测发现当前较活跃的勒索病毒家族是Polyransom和Blocker&#xff0…

SPI思想机制

目录 如何解释简单概括SPI 和 APISPI 实现原理(重要-线程上下文类加载器) 如何使用一个Demo功能介绍使用效果(直接在本地模拟服务商提供服务)使用效果(通过 jar 的方式引入) 应用分析参考文章 如何解释 简…

Docker容器:Docker-Consul的容器服务更新与发现

目录 前言 一、什么是服务注册与发现 二、 Docker-Consul 概述 1、Consul 概念 2、Consul 提供的一些关键特性 3、Consul 的优缺点 4、传统模式与自动发现注册模式的区别 4.1 传统模式 4.2 自动发现注册模式 5、Consul 核心组件 5.1 Consul-Template组件 5.2 Consu…

Blazor流程编排的艺术:深入Z.Blazor.Diagrams库的使用与实践

合集 - .Net(3)1.基于AntSK与LLamaSharp打造私人定制的离线AI知识库03-032.深入解析:AntSK 0.1.7版本的技术革新与多模型管理策略03-123.Blazor流程编排的艺术:深入Z.Blazor.Diagrams库的使用与实践05-05收起 为现代网页应用开发提供动力的其中一…

招展工作的接近尾声“2024上海国际科技创新展会”即将盛大开幕

2024上海国际科技创新展会,即将于6月中旬在上海新国际博览中心盛大召开。随着招展工作的接近尾声,目前仍有少量余位可供各企业和机构预定。这一盛大的科技展会,将汇聚全球智能科技领域的精英,共同展示最新的科技成果,探…

【Spring】JdbcTemplate

JdbcTemplate 是 Spring 提供的一个 JDBC 模板类,是对 JDBC 的封装,简化 JDBC 代码 也可以让 Spring 集成其它的 ORM 框架,例如:MyBatis、Hibernate 等 使用 JdbcTemplate 完成增删改查 一、环境准备 数据库: 准备…

【JavaEE 初阶(二)】线程安全问题

❣博主主页: 33的博客❣ ▶️文章专栏分类:JavaEE◀️ 🚚我的代码仓库: 33的代码仓库🚚 🫵🫵🫵关注我带你了解更多线程知识 目录 1.前言2.synchronized2.1例子2.2synchronized修饰代码块2.3 synchronized修饰方法2.4sy…

one command each day on Linux- big synopsis

url address 1.12) grep Linux下面查找文本命令grep, 类似于Window编辑器的ctrlF查找我们想要的内容, PS:对比learning skill 看一下它的基础用法,准备一个目录文件和文本文件, 打印出这个单词,或者包含有这个字母的所有字符串 [rootiZ2vc5lqzt23aweti4j777Z ~]# grep hel…

智慧校园需要从哪些维度去做?

智慧校园作为校园信息化的关键产品,已经成为校园建设的标配。智慧校园是一个业务平台,他涉及校园事务的各个方面。智慧校园同时又是一个数据中心,他存储了所有的校园基础数据与业务数据,包括教工数据、学工数据、教务数据等。那么…

嘴尚绝卤味:传承经典,缔造美食新风尚

卤味,作为中国传统美食的代表之一,历经千年的传承与发展,早已成为无数食客餐桌上的宠儿。而在这个美食盛行的时代,嘴尚绝卤味凭借其独特的口感和精湛的工艺,成为卤味市场中的佼佼者,引领着卤味文化的新潮流…

基于java,SpringBoot和Vue的智慧校园在线考试留言讨论系统设计

摘要 基于Java, SpringBoot和Vue的智慧校园在线考试留言讨论系统是一个为现代教育需求定制的Web应用,它结合了最新的前后端技术来提供一个互动性强、用户友好的学习和交流平台。该系统旨在通过提供实时留言和讨论功能,增进学生间的互动以及师生之间的沟…

Altman确认:神秘Chatbot非GPT-4.5,OpenAI搜索引擎即将上线

🚀 Altman确认:神秘Chatbot非GPT-4.5,OpenAI搜索引擎即将上线 摘要:近日,Sam Altman在哈佛大学的演讲中确认,引发广泛猜测的gpt2-chatbot并非OpenAI即将发布的下一代模型GPT-4.5。与此同时,关于…

游戏AI的智能化:机器学习在虚拟生命中的应用

文章目录 写在前面游戏AI的智能化:机器学习在虚拟生命中的应用游戏内容的自动化创作:机器学习的革新性应用玩家体验的个性化优化:机器学习的定制化力量未来展望:机器学习塑造游戏行业新纪元游戏AI的智能化发展自动化内容生成的革命…

proteus使用问题

1、无法和视频里面一样新建工程 2、实验效果和视频不也一样 自己的电路图(灯不亮):