CV计算机视觉每日开源代码Paper with code速览-2023.11.28

点击@CV计算机视觉,关注更多CV干货

论文已打包,点击进入—>下载界面

点击加入—>CV计算机视觉交流群

1.【图像分割】Stable Segment Anything Model

  • 论文地址:https://arxiv.org//pdf/2311.15776

  • 开源代码(即将开源):https://github.com/fanq15/Stable-SAM

2.【目标跟踪】Single-Model and Any-Modality for Video Object Tracking

  • 论文地址:https://arxiv.org//pdf/2311.15851

  • 开源代码(即将开源):https://github.com/Zongwei97/UnTrack

3.【视频超分辨率重建】Enhancing Perceptual Quality in Video Super-Resolution through Temporally-Consistent Detail Synthesis using Diffusion Models

  • 论文地址:https://arxiv.org//pdf/2311.15908

  • 开源代码(即将开源):https://github.com/claudiom4sir/StableVSR

4.【多模态】Video-Bench: A Comprehensive Benchmark and Toolkit for Evaluating Video-based Large Language Models

  • 论文地址:https://arxiv.org//pdf/2311.16103

  • 开源代码:https://github.com/PKU-YuanGroup/Video-Bench

5.【多模态】ViT-Lens-2: Gateway to Omni-modal Intelligence

  • 论文地址:https://arxiv.org//pdf/2311.16081

  • 开源代码:https://github.com/TencentARC/ViT-Lens

6.【多模态】GaussianEditor: Editing 3D Gaussians Delicately with Text Instructions

  • 论文地址:https://arxiv.org//pdf/2311.16037

  • 工程主页:GaussianEditor: Editing 3D Gaussians Delicately with Text Instructions

  • 代码即将开源

7.【多模态】EVCap: Retrieval-Augmented Image Captioning with External Visual-Name Memory for Open-World Comprehension

  • 论文地址:https://arxiv.org//pdf/2311.15879

  • 工程主页:EVCap: Retrieval-Augmented Image Captioning with External Visual-Name Memory for Open-World Comprehension

  • 代码即将开源

8.【多模态】FlowZero: Zero-Shot Text-to-Video Synthesis with LLM-Driven Dynamic Scene Syntax

  • 论文地址:https://arxiv.org//pdf/2311.15813

  • 工程主页:FlowZero: Zero-Shot Text-to-Video Synthesis with LLM-Driven Dynamic Scene Syntax

  • 开源代码(即将开源):https://github.com/aniki-ly/FlowZero

9.【多模态】GPT4Vis: What Can GPT-4 Do for Zero-shot Visual Recognition?

  • 论文地址:https://arxiv.org//pdf/2311.15732

  • 开源代码:https://github.com/whwu95/GPT4Vis

10.【多模态】Breathing Life Into Sketches Using Text-to-Video Priors

  • 论文地址:https://arxiv.org//pdf/2311.13608

  • 工程主页:Breathing Life Into Sketches Using Text-to-Video Priors

  • 开源代码(即将开源):https://github.com/yael-vinker/live_sketch

11.【数字人】Animatable Gaussians: Learning Pose-dependent Gaussian Maps for High-fidelity Human Avatar Modeling

  • 论文地址:https://arxiv.org//pdf/2311.16096

  • 工程主页:Projectpage of Animatable Gaussians

  • 开源代码(即将开源):https://github.com/lizhe00/AnimatableGaussians

12.【自动驾驶:Occupancy Prediction】OccWorld: Learning a 3D Occupancy World Model for Autonomous Driving

  • 论文地址:https://arxiv.org//pdf/2311.16038

  • 开源代码:https://github.com/wzzheng/OccWorld

13.【视频理解】Side4Video: Spatial-Temporal Side Network for Memory-Efficient Image-to-Video Transfer Learning

  • 论文地址:https://arxiv.org//pdf/2311.15769

  • 开源代码(即将开源):https://github.com/HJYao00/Side4Video

14.【视频理解】Vamos: Versatile Action Models for Video Understanding

  • 论文地址:https://arxiv.org//pdf/2311.13627

  • 工程主页:Vamos: Versatile Action Models for Video Understanding

  • 代码即将开源

15.【行人重识别】Multi-scale Semantic Correlation Mining for Visible-Infrared Person Re-Identification

  • 论文地址:https://arxiv.org//pdf/2311.14395

  • 开源代码:https://github.com/Hua-XC/MSCMNet

16.【Diffusion】Continual Learning of Diffusion Models with Generative Distillation

  • 论文地址:https://arxiv.org//pdf/2311.14028

  • 开源代码:https://github.com/Atenrev/difussion_continual_learning

17.【知识蒸馏】Knowledge From the Dark Side: Entropy-Reweighted Knowledge Distillation for Balanced Knowledge Transfer

  • 论文地址:https://arxiv.org//pdf/2311.13621

  • 开源代码:https://github.com/cpsu00/ER-KD

18.【Continual Learning】Density Distribution-based Learning Framework for Addressing Online Continual Learning Challenges

  • 论文地址:https://arxiv.org//pdf/2311.13623

  • 代码即将开源

论文已打包,下载链接​​​​​​​

CV计算机视觉交流群

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,不定期分享技术知识、面试技巧和内推招聘信息

想进群的同学请添加微信号联系管理员:PingShanHai666。添加好友时请备注:学校/公司+研究方向+昵称

推荐阅读:

​​​​​​​CV计算机视觉每日开源代码Paper with code速览-2023.11.27

CV计算机视觉每日开源代码Paper with code速览-2023.11.23

CV计算机视觉每日开源代码Paper with code速览-2023.11.22

CV计算机视觉每日开源代码Paper with code速览-2023.11.21

CV计算机视觉每日开源代码Paper with code速览-2023.11.20

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/208348.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

文件重命名不再困难:文件智能化重命名技巧,告别手动提升效率

在日常工作中,经常会遇到要修改文件名的场景。传统的文件重命名方法往往要手动输入新的文件名,不仅耗时而且容易出错。为了提高效率,可以采用一些智能化重命名的技巧,告别手动修改文件名的繁琐过程,让文件重命名变得更…

SpringBoot+mysql+vue实现大学生健康档案管理系统前后端分离

一、项目简介 本项目是一套基于SpringBoot实现大学生健康档案管理系统,主要针对计算机相关专业的正在做bishe的学生和需要项目实战练习的Java学习者。 包含:项目源码、数据库脚本等,该项目可以直接作为bishe使用。 项目都经过严格调试&#…

BootLoader升级过程讲解与串口升级案列

一、芯片选择 STM32F103RCT6 FLASH容量:512K RAM容量:48K 二、升级方式选择: 串口升级、网口升级、4G升级、SD卡升级等等。 1、SD卡升级属于升级文件事先存储在外部FLASH,不需要考虑获取升级文件的代码和升级文件存放的位置&am…

RabbitMQ学习一

RabbitMQ学习 RabbitMQ相关概念Virtual host数据隔离SpringAMQP第一种 基本消息模型第二种 WorkQueues模型第三种 发布订阅模型(fanout交换机)fanout交换机实例 第四种 Direct交换机direct交换机实例基于注解的方式声明——direct交换机 第五种Topic交换…

[原创]Delphi的SizeOf(), Length(), 动态数组, 静态数组的关系.

[简介] 常用网名: 猪头三 出生日期: 1981.XX.XXQQ: 643439947 个人网站: 80x86汇编小站 https://www.x86asm.org 编程生涯: 2001年~至今[共22年] 职业生涯: 20年 开发语言: C/C、80x86ASM、PHP、Perl、Objective-C、Object Pascal、C#、Python 开发工具: Visual Studio、Delphi…

MySQL核心知识点整理大全1-笔记

MySQL 是一种流行的关系型数据库管理系统,它是以C和C语言编写的,最初是由瑞典公司MySQL AB开发的,现在是由Oracle公司维护和支持。MySQL是开源软件,可在Windows、Linux、Mac OS、FreeBSD等各种操作系统上运行。MySQL的主要特点是速…

图像增强与复原、车牌检测与识别,交通最优路径搜索模型,并且基于PyQt完成GUI设计

背景: 综合实训教学大纲 一、实训科目设置: 序号 内容提要 教学 条件 一 图像增强与复原、车牌检测与识别,并且基于PyQt完成GUI设计 计算机、Python软件 二 交通最优路径搜索模型,并且基于PyQt完成GUI设计 计算机、Pytho…

[每周一更]-(第75期):Go相关粗浅的防破解方案

Go作为编译语言,天然存在跨平台的属性,我们在编译完成后,可以再不暴露源代码的情况下,运行在对应的平台中,但是 还是架不住有逆向工程师的反编译、反汇编的情形;(当然我们写的都不希望被别人偷了…

ringboot-cve_2021_21234:latestSpring Boot 目录遍历 (CVE-2021-21234)漏洞复现

Spring Boot 目录遍历 (CVE-2021-21234)漏洞复现 Spring-boot-actuator-logview 0.2.13之前版本存在路径遍历漏洞,攻击者可通过该缺陷读取系统任意文件。 名称: Spring Boot 目录遍历 (CVE-2021-21234) 描述: Sprin…

【Java 基础】13 异常

1.异常是什么 异常是指在程序运行过程中可能发生的、与正常执行流程不符的事件。这些事件可能包括错误、不合理的输入、资源不足等。在 Java 中,异常是通过 throw 语句抛出的,可以是 Java 内置的异常类,也可以是自定义的异常类。 2. 异常类…

12月01日,每日信息差//阿里国际发布3款AI设计生态工具//美团买菜升级为“小象超市”//外国人永居证换新、6国游客免签来华

_灵感 🎖 阿里国际发布3款AI设计生态工具 🎄 AITO问界系列11月交付新车18827辆 🌍 美团买菜升级为“小象超市” 🌋 全球首个金融风控大模型国际标准出炉,由腾讯牵头制定 🎁 支付宝:支持外国人…

【代码】基于算术优化算法(AOA)优化参数的随机森林(RF)六分类机器学习预测算法/matlab代码

代码名称:基于算术优化算法(AOA)优化参数的随机森林(RF)六分类机器学习预测算法/matlab代码 使用算术优化算法(AOA)优化分类预测模型的参数,收敛性好,准确率提升明显&am…

中职组网络安全-web-PYsystem003.img-(环境+解析)

​ web安全渗透 1.通过URL访问http://靶机IP/1,对该页面进行渗透测试,将完成后返回的结果内容作为flag值提交; 访问该网页后发现F12被禁用,使用ctrlshifti查看 ctrlshifti 等效于 F12 flag{fc35fdc70d5fc69d269883a822c7a53e}…

二叉树刷题Leetcode

文章目录 104.二叉树的最大深度100.相同的树965.单值二叉树 104.二叉树的最大深度 int maxDepth(struct TreeNode* root) {if(rootNULL)return 0; int left1maxDepth(root->left); int right1maxDepth(root->right); return left>right?left:right; }处理二叉树最大深…

分享88个清新唯美PPT,总有一款适合您

分享88个清新唯美PPT,总有一款适合您 88个清新唯美PPT下载链接:https://pan.baidu.com/s/1XUUjxjmWFw2fJKENjk6_Yg?pwd8888 提取码:8888 Python采集代码下载链接:采集代码.zip - 蓝奏云 学习知识费力气,收集整…

unicloud云函数url化后,客户端通过url地址向云函数发送数据流并传递到云存储中

在不久前录制过这样一门课程,使用uniapp生态开发API接口,通过这套课程,你不需要后后端Java、Python、PHP等后端语言,你只需要用前端的知识就可以构建这样一套API接口,而且使用uniapp生态开发接口更简单高效&#xff0c…

VMware17 下载、安装、成功安装效果、完整卸载

VMware17 下载、安装、卸载 下载 VMware17 安装 更改安装路径 去掉这两个复选框,点击安装。 安装结束,点击许可证。 输入序列号,点击【输入】 序列号:MC60H-DWHD5-H80U9-6V85M-8280D 点击完成 测试安装效果 永不过期&am…

跨模态图像翻译:使用具有感知监督的多生成网络合成MR脑图像的CT图像

Cross-modality image translation: CT image synthesis of MR brain images using multi generative network with perceptual supervision 跨模态图像翻译:使用具有感知监督的多生成网络合成MR脑图像的CT图像背景贡献实验方法损失函数Thinking 跨模态图像翻译&…

【已解决】Cannot find project Scala library 2.11.8 for module XXX

问题描述 在 flink 示例程序调试过程中,reload project 报错 Cannot find project Scala library 2.11.8 for module HbasePrint 报错如下图所示: 问题解决 经过搜索,初步判定是 pom 文件中 Scala 版本配置和项目中实际使用的版本不一致导…

java+springboot停车场小区车库租赁预订系统ssm+jsp

该平台为客户和业主提供等信息服务平台的运营方,管理方,如何通过车库平台建立实现优化管理的方法提供参考。能够实现在一个相对广阔的地域内(例如一座城市)的多个停车场的随意停车。管理平台会统一调度车位资源,自动进行交易结算。…