多标签分类新建模方法

多标签分类新建模方法

article2025/1/11 22:35:57/文章来源:https://blog.csdn.net/transformer_WSZ/article/details/136795162

常见的多标签分类方法是同时生成多个标签的logits，然后接一个sigmoid激活函数做二分类。该方法简单直接，但忽略了标签之间的相关性。虽然业界针对该问题提出了很多解决思路，但大多是任务特定，通用性不强，也不够优雅。

Transformer decoder倒是可以序列输出多个标签，但却加入了位置偏差。而标签之间是没有位置关系的，谁先谁后无所谓，只要输出全就行。这样也导致数据集不好构造。

C-Tran

General Multi-label Image Classification with Transformers 这篇论文提供了新思路，类似BERT的MLM预训练任务：通过在输入端对多个标签做随机mask，然后预测被mask的标签，从而强制模型去学习标签之间的依赖关系：

model

模型细节：
detail

params

Label Embeddings: 可学习的参数矩阵，由模型隐式学习到标签的语义信息和标签间依赖。有点像DETR的query。
State Embeddings: 控制标签的mask比例，这样就跟标签学习实现了解耦，也方便在推理阶段注入全比例mask

实验结果

不说了，全是sota：

exp

旷视用gcn来建模多标签方法(被C-Tran超越了，建模思路可以学习)：Multi-Label Image Recognition with Graph Convolutional Networks

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/465147.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

利用生成式人工智能进行功能管理测试

利用生成式人工智能进行功能管理测试

就 DevOps 而言，生成式 AI与功能管理测试的新兴集成标志着一次重大演变。我们将认真研究这项技术如何彻底改变我们创建测试环境的方式。使用人工智能生成测试使我们能够模拟大量的用户场景和环境，这意味着我们可以开发和部署不仅好而且很棒的功能&…

阅读更多...

pyspark基础 -- DataFrame的理解与案例

pyspark基础 -- DataFrame的理解与案例

DataFrame(df)介绍 datafram就是一个内存中的二维表结构，具备表结构的三个基本属性： 行列表结构描述在结构层面，pyspark中的StructType对象描述了表结构，StructField对象描述了表的一个列信息；在数据层面&#xff…

阅读更多...

Epuck2 在 ROS 下的运动控制

Epuck2 在 ROS 下的运动控制

文章目录前言一、初始配置二、运动控制三、移动机器人总结前言在对Epuck2机器人进行完固件更新及IP地址查询后，接下来通过ROS来对Epuck2机器人进行运动控制。一、初始配置 （1）创建一个 catkin 工作空间 mkdir -p ~/catkin_ws/src cd ~…

阅读更多...

2023年蓝桥杯模拟省赛——列名

2023年蓝桥杯模拟省赛——列名

目录题目链接：2.列名 - 蓝桥云课 (lanqiao.cn) 思路高级思路：进制转换难点一难点二难点三总结题目链接：2.列名 - 蓝桥云课 (lanqiao.cn) 思路先来看我的暴力的思路吧主要有以下步骤： 初始化一个长度为3的数组res用…

阅读更多...

WEB前端项目开发——（一）（2024）

WEB前端项目开发——（一）（2024）

目录 1 通过Git Bash安装 vue-cli 2 创建项目 3 解决Git Bash方向键失效 4 重新进行项目创建 5 浏览器输入地址查看 6 案例——简单修改v3-calendar中的内容 7 测试页面效果本篇文章介绍通过了Git Bash创建v3-calendar项目，之后对v3-calendar进行简单…

阅读更多...

ChatGPT国内镜像站大全

ChatGPT国内镜像站大全

#今天在知乎看到一个问题：“平民不参与内测的话没有账号还有机会使用ChatGPT吗？” 从去年GPT大火到现在，关于GPT的消息铺天盖地，真要有心想要去用，途径很多，别的不说，国内GPT的镜像站到处都是&…

阅读更多...

【GPT-SOVITS-04】SOVITS 模块-鉴别模型解析

【GPT-SOVITS-04】SOVITS 模块-鉴别模型解析

说明：该系列文章从本人知乎账号迁入，主要原因是知乎图片附件过于模糊。知乎专栏地址： 语音生成专栏系列文章地址： 【GPT-SOVITS-01】源码梳理【GPT-SOVITS-02】GPT模块解析【GPT-SOVITS-03】SOVITS 模块-生成模型解析【G…

阅读更多...

【C语言】linux内核软中断

【C语言】linux内核软中断

一、什么是软中断？ 内核中的软中断（Softirqs）和任务下半部（Tasklets）是Linux内核中用于在中断上下文之外处理中断服务的一种底层机制。这些机制解决了不能在中断服务例程（ISR）中执行耗时操作或…

阅读更多...

ChatGPT ：确定性AI源自于确定性数据

ChatGPT ：确定性AI源自于确定性数据

ChatGPT 幻觉大模型实际应用落地过程中，会遇到幻觉（Hallucination）问题。对于语言模型而言，当生成的文本语法正确流畅，但不遵循原文（Faithfulness），或不符合事实（Factua…

阅读更多...

Linux下进程的调度与切换

Linux下进程的调度与切换

🌎进程的调度与切换文章目录： 进程的调度与切换进程切换进程调度活动状态进程队列位图判断过期队列总结前言： 在Linux操作系统中，进程的调度与切换是操作系统核心功能之一&#xff…

阅读更多...

【LabVIEW FPGA入门】流水线

【LabVIEW FPGA入门】流水线

LabVIEW中流水线在当今多核处理器和多线程应用程序的世界中，程序员在开发应用程序时需要不断思考如何最好地利用尖端 CPU 的强大功能。尽管用传统的基于文本的语言构建并行代码可能难以编程和可视化，但 NI LabVIEW 等图形开发环境越来越多地允许工程师和…

阅读更多...

学习笔记 | 微信小程序项目day02

学习笔记 | 微信小程序项目day02

今日学习内容安装uni-ui跟uni-helper/uni-ui-types配置pinia持久化请求工具类的拦截器请求工具类的请求函数安装uni-ui跟uni-helper/uni-ui-types npm install -g cnpm --registryhttps://registry.npmmirror.com npm set registry https://registry.npmmirror.com npm i …

阅读更多...

电脑充电器能充手机吗？如何给手机充电？

电脑充电器能充手机吗？如何给手机充电？

电脑充电器可以给手机充电吗？ 电脑充电器可以给手机充电，但前提是电脑充电器的功率输出与手机的功率匹配且接口匹配。假设电脑充电器的输出功率为5V/2A，手机也支持5V/2A的输入功率。只要接口匹配，就可以使用电脑充电器给手机充…

阅读更多...

2024智慧农场系统微信小程序前端如何上传以及配置

2024智慧农场系统微信小程序前端如何上传以及配置

2024智慧农场系统微信小程序前端如何上传以及配置首先下载微信开发者工具下载好以后打开，然后导入项目前端修改：siteinfo.js 里面的域名信息改完之后开始在微信开发者工具中开发工具中编译、上传、发布即可

阅读更多...

vim | 介绍vim以及配置vimrc文件

vim | 介绍vim以及配置vimrc文件

好像熟练使用vim 是玩linux 必修课当然，初代玩家能在vim 完成编辑并保存已是入门了，想当初在大学的时候，死活转不过来，玩不过来，甚至有些恐惧但后来，弄清楚原理，反倒觉得简简单单已是完美了。…

阅读更多...

19. UE5 RPG使用GameplayEffect的Attribute Based Modifiers

19. UE5 RPG使用GameplayEffect的Attribute Based Modifiers

前几篇文章我也说了GE的基础使用，但是，对一些属性的应用没有述说，后续，我将一点一点的将它们如何使用书写下来。这一篇，主要就讲解一下Attribute Based Modifiers使用，先说一下它的应用场景，一…

阅读更多...

C++ -- 多态

C++ -- 多态

多态 1. 多态的概念多态的概念：通俗来说，就是多种形态，具体点就是去完成某个行为，当不同的对象去完成时会产生出不同的状态。 2. 多态的定义及实现 2.1多态的构成条件多态是在不同继承关系的类对象，去调用同一函…

阅读更多...

实现界面跳转及注册界面编写（AndroidStudio）

实现界面跳转及注册界面编写（AndroidStudio）

目录一、代码二、最后效果一、代码 1.先新建一个activity文件 2.注册界面的代码如下： <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas.android.com/apk/res/android"android:la…

阅读更多...

Docker学习之数据管理（超详解析）

Docker学习之数据管理（超详解析）

Docker存储资源类型： 用户在使用 Docker 的过程中，势必需要查看容器内应用产生的数据，或者需要将容器内数据进行备份，甚至多个容器之间进行数据共享，这必然会涉及到容器的数据管理： （1&#xff…

阅读更多...

Java代码基础算法练习-判断素数-2024.03.17

Java代码基础算法练习-判断素数-2024.03.17

任务描述： 输入一个数x，判断它是否是素数。提示：素数是只能被1和它本身整除的数，1不是素数。任务要求： 代码示例： package march0317_0331;import java.util.Scanner;public class March0317 {public …

阅读更多...

最新文章