论文阅读--GLIP

论文阅读--GLIP

article2024/12/25 15:48:14/文章来源:https://blog.csdn.net/m0_73202283/article/details/139177875

把detection和phrase ground(对于给定的sentence，要定位其中提到的全部物体)这两个任务合起来变成统一框架，从而扩展数据来源，因为文本图像对的数据还是很好收集的

目标检测的loss是分类loss+定位loss，它与phrase ground的定位loss差不多，但是二者分类loss不同，因为对于目标检测，它的标签是一个或者两个单词，是one-hot标签，但是对于vision grounding它的标签是一个句子

目标检测的分类loss：分类头预测bonding box类别，nms排序，跟ground truth算交叉熵

vision grounding的分类loss：先计算匹配分数s，看看图像中的区域和句子中的单词是怎么匹配的。图像经过image backbone得到一些region feature，但是接下来不用分类头，而是一个文本编码器生成的文本特征做相似度计算，得到s

改动：判断什么时候算是一个positive match，什么时候算是negative match。当这些sub-words的phrase与目标region匹配时，每个positive sub-word都与目标region所匹配。例如，吹风机的phrase是“Hair dryer”，那么吹风机的region就会与“Hair”和“dryer”这两个词都匹配

中间的deep fusion是加几个层让文本和图像的模态信息融合得更好一点

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/641310.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

内网穿透--Nps-自定义-上线

内网穿透--Nps-自定义-上线

免责声明:本文仅做技术交流与学习... 目录 Nps项目: 一图通解: 1-下载nps/npc 2-服务端启动访问web网页: 添加客户端，生成密匙. 3-kali客户端连接服务端 4-添加协议隧道. 5-kali生成后门： 6-kali创建监听: Nps项目: https://github.com/ehang…

阅读更多...

《2024年中国机器人行业投融资报告》| 附下载

《2024年中国机器人行业投融资报告》| 附下载

近年来，国内机器人行业取得了显著的技术进步，包括人工智能、感知技术、自主导航等技术方面的突破，使得机器人能够更好地适应复杂环境和任务需求，带动了机器人行业加快发展。当然，技术的进步是外在驱动因素&#xff0…

阅读更多...

【JAVA基础之网络编程】UDP和TCP协议以及三次握手和四次挥手的过程

【JAVA基础之网络编程】UDP和TCP协议以及三次握手和四次挥手的过程

🔥作者主页：小林同学的学习笔录 🔥mysql专栏：小林同学的专栏目录 1. 网络编程 1.1 概述 1.2 网络编程的三要素 1.2.1 IP地址 1.2.2 InetAddress 1.2.3 端口和协议 1.3 UDP协议 1.3.1 UDP发送数据 1.3.2 UDP接收数据 1.4…

阅读更多...

Terminal Web终端基础（Web IDE 技术探索二）

Terminal Web终端基础（Web IDE 技术探索二）

Terminal是web终端技术，类似cmd命令窗口，Webcontainer 中推荐使用的是Xterm.js，这里就不细说Xterm.js 的使用了，我们使用第三方库来实现（原生确实有点难用）。 vue-web-terminal 一个由 Vue 构建的支持多内容…

阅读更多...

基础5 探索JAVA图形编程桌面：字符操作组件详解

基础5 探索JAVA图形编程桌面：字符操作组件详解

在繁华都市的一个角落，卧龙和凤雏相聚在他们常去的台球厅。灯光洒在绿色的台球桌上，彩色的台球整齐地排列着，仿佛在等待着一场激烈的角逐。卧龙轻轻地拿起球杆，微微瞄准，然后用力一击，白球带着一股强大的力…

阅读更多...

Vue.js - Vue 的安装以及常用的 Vue 指令【0基础向 Vue 基础学习】

Vue.js - Vue 的安装以及常用的 Vue 指令【0基础向 Vue 基础学习】

文章目录 Vue 快速上手1、Vue.js 官网 & Vue.js 的获取2、创建 Vue 实例，初始化渲染3、插值表达式安装 Vue 开发者工具：装插件调试 Vue 应用Vue 指令1、v-show 指令2、v-if3、v-else & v-else-if4、v-onv-on 调用传参 5、v-bindv-bind 对于样式…

阅读更多...

类和对象（下篇）（未完结）！

类和对象（下篇）（未完结）！

文章目录在谈构造函数1.构造函数体赋值2.初始化列表尽量使用初始化列表？初始化列表的初始化顺序？成员变量声明处的缺省值构造函数支持类型转换3.explicit关键字 static成员在谈构造函数 1.构造函数体赋值 class Date{public:Date(int year, int mont…

阅读更多...

Python设计模式之适配器模式

Python设计模式之适配器模式

目录一、适配器模式适配器模式的组成部分适配器模式的种类应用场景实现步骤二、测试例子一、适配器模式适配器模式（Adapter Pattern）是一种结构型设计模式，它通过将一个现有接口转换为另一个期望的接口来让不兼容的接口能够合作…

阅读更多...

香港服务器负载过高的原因和应对办法

香港服务器负载过高的原因和应对办法

保持网站正常运行看似简单，但事实上，有许多问题会影响网站和应用程序的性能，并可能导致停机。其中一个问题就是服务器过载。而香港服务器作为一种常见的服务器类型，有时会出现负载过高的情况。为了帮助您确保在香港服务器过载不会…

阅读更多...

跨境电商投放Facebook广告推广攻略！

跨境电商投放Facebook广告推广攻略！

在出海浪潮中，跨境电商已经成为企业连接不同市场、拓展国际业务的重要途径。Facebook，作为全球最大的社交平台之一，拥有超过20亿的活跃用户，为跨境卖家提供了一个无与伦比的营销舞台。有效利用Facebook广告，不仅能帮助…

阅读更多...

捕捉二氧化碳也能赚钱？深入探索CCUS技术与商业前景

捕捉二氧化碳也能赚钱？深入探索CCUS技术与商业前景

引言随着全球变暖和气候变化的加剧，如何有效减少二氧化碳（CO2）排放成为各国亟待解决的问题。近日，全球最大的二氧化碳捕集工厂在冰岛正式运营，这一消息引起了广泛关注。本文将深入探讨捕集二氧化碳技术（C…

阅读更多...

海康威视NVR通过ehome协议接入视频监控平台，视频浏览显示3011超时错误的问题解决，即：The request timeout! 【3011】

海康威视NVR通过ehome协议接入视频监控平台，视频浏览显示3011超时错误的问题解决，即：The request timeout! 【3011】

目录一、问题描述二、问题分析 2.1 初步分析 2.2 查看日志 2.3 问题验证 1、查看防火墙 2、查看安全组 3、问题原因三、问题解决 3.1 防火墙开放相关端口 3.2 安全组增加规则 3.3 测试 1、TCP端口能够联通的情况 2、TCP端口不能够联通的情况四、验证五、云…

阅读更多...

JWT使用方法

JWT使用方法

目录基础概念依赖生成令牌工具类控制层解析令牌工具类网关过滤器效果基础概念 Json web token (JWT), 是为了在网络应用环境间传递声明而执行的一种基于JSON的开放标准（(RFC 7519).该token被设计为紧凑且安全的，特别适用于分布式站点…

阅读更多...

Hsql每日一题 | day03

Hsql每日一题 | day03

前言就一直向前走吧，沿途的花终将绽放~ 题目：打折日期交叉问题如下为平台商品促销数据：字段为品牌，打折开始日期，打折结束日期 brand stt edt oppo,2021-06-05,2021-06-09 oppo,2021-06-11,2021-06-21 vivo,…

阅读更多...

共享经济中的创新演示：打造案例分析PPT，让想法流动起来

共享经济中的创新演示：打造案例分析PPT，让想法流动起来

在当今这个看图说话的时代，无论是在职场打拼还是学术殿堂，一份牛气冲天的案例分析PPT无疑是你专业形象的加分项。不管你是刚出道的小鲜肉，还是已经混迹江湖多年的老鸟，一份有深度、有力度的PPT都能帮你在人群中脱颖而出&#xf…

阅读更多...

IT行业已经饱和？2024年报考计算机类专业还有出路吗？

IT行业已经饱和？2024年报考计算机类专业还有出路吗？

👆点击关注获取更多编程干货👆 “高薪”光环加持，IT行业一直是不少人心仪的职业选择，计算机专业一度成为最热门的本科专业。然而，正因报考计算机专业、想要入行IT行业的人越来越多，“行业饱和”、“人才…

阅读更多...

Nodejs 第七十三章（网关层）

Nodejs 第七十三章（网关层）

什么是网关层(getway)？ 技术选型fastify 速度快适合网关层 fastify教程上一章有讲网关层是位于客户端和后端服务之间的中间层，用于处理和转发请求。它充当了请求的入口点，并负责将请求路由到适当的后端服务，并将后端服务的响应…

阅读更多...

免费的八字软件

免费的八字软件

无敌八字排盘软件完全免费使用，即使用不需要付费且无任何限制。同时推出手机版电脑版，两版本数据互通互用，即电脑版的数据可以备份到手机版上导入，手机版的数据也可以备份到电脑版上恢复导入，方便手机和电脑共用的朋友…

阅读更多...

山东大学软件学院项目实训-创新实训-基于大模型的旅游平台（十九）- JUC（5）

山东大学软件学院项目实训-创新实训-基于大模型的旅游平台（十九）- JUC（5）

synchronized优化原理轻量级锁如果一个对象有多个线程访问，但多线程访问的时间是错开的（没有竞争），可以用轻量级锁优化 Slf4j(topic "c.ExerciseTransfer")public class Test {static final Object obj new Obj…

阅读更多...

AI爆文写作：如果你有一篇文章爆了，正确的做法是：自己抄袭自己，重复发，还可以继续爆！

AI爆文写作：如果你有一篇文章爆了，正确的做法是：自己抄袭自己，重复发，还可以继续爆！

爆款总是相似的，如果你有一篇文章爆了，正确的做法，就是重复发，让它继续爆下去。以前我在小红书看到一个人，将一篇自己火的笔记，连续发了5次，每次点赞数据都不错。公众号文章也是一样的。我…

阅读更多...

最新文章