CV计算机视觉每日开源代码Paper with code速览-2023.11.23

点击@CV计算机视觉,关注更多CV干货

论文已打包,点击进入—>下载界面

点击加入—>CV计算机视觉交流群

1.【基础网络架构:Transformer】White-Box Transformers via Sparse Rate Reduction: Compression Is All There Is?

  • 论文地址:https://arxiv.org//pdf/2311.13110

  • 工程主页:White-Box Transformers via Sparse Rate Reduction

  • 开源代码:https://github.com/Ma-Lab-Berkeley/CRATE

2.【旋转目标检测】Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for Advanced Object Detection

  • 论文地址:https://arxiv.org//pdf/2311.12956

  • 开源代码:https://github.com/SashaMatsun/LSKDiffDet

3.【图像分割】Visual In-Context Prompting

  • 论文地址:https://arxiv.org//pdf/2311.13601

  • 开源代码(即将开源):https://github.com/UX-Decoder/DINOv

4.【医学图像分割】SegVol: Universal and Interactive Volumetric Medical Image Segmentation

  • 论文地址:https://arxiv.org//pdf/2311.13385

  • 开源代码:https://github.com/BAAI-DCAI/SegVol

5.【域自适应】DA-STC: Domain Adaptive Video Semantic Segmentation via Spatio-Temporal Consistency

  • 论文地址:https://arxiv.org//pdf/2311.13254

  • 开源代码:https://github.com/ZHE-SAPI/DA-STC

6.【多模态】Soulstyler: Using Large Language Model to Guide Image Style Transfer for Target Object

  • 论文地址:https://arxiv.org//pdf/2311.13562

  • 开源代码(即将开源):https://github.com/yisuanwang/Soulstyler

7.【多模态】PG-Video-LLaVA: Pixel Grounding Large Video-Language Models

  • 论文地址:https://arxiv.org//pdf/2311.13435

  • 开源代码(即将开源):https://github.com/mbzuai-oryx/Video-LLaVA

8.【多模态】FusionFrames: Efficient Architectural Aspects for Text-to-Video Generation Pipeline

  • 论文地址:https://arxiv.org//pdf/2311.13073

  • 开源代码:https://github.com/ai-forever/KandinskyVideo

9.【多模态】LiveChat: Video Comment Generation from Audio-Visual Multimodal Contexts

  • 论文地址:https://arxiv.org//pdf/2311.12826

  • 开源代码:https://github.com/yy1lab/LiveChat

10.【数字人】XAGen: 3D Expressive Human Avatars Generation

  • 论文地址:https://arxiv.org//pdf/2311.13574

  • 工程主页:XAGen - Project Page

  • 开源代码(即将开源):https://github.com/magic-research/xagen

11.【深度估计】Camera-Independent Single Image Depth Estimation from Defocus Blur

  • 论文地址:https://arxiv.org//pdf/2311.13045

  • 开源代码:https://github.com/sleekEagle/defocus_camind

12.【Diffusion】DiffusionMat: Alpha Matting as Sequential Refinement Learning

  • 论文地址:https://arxiv.org//pdf/2311.13535

  • 工程主页:DiffusionMat

  • 开源代码(即将开源):https://github.com/cnnlstm/DiffusionMat

13.【目标计数】T-Rex: Counting by Visual Prompting

  • 论文地址:https://arxiv.org//pdf/2311.13596

  • 工程主页:T-Rex Counting

  • 开源代码(即将开源):https://github.com/IDEA-Research/T-Rex

14.【NeRF】PIE-NeRF: Physics-based Interactive Elastodynamics with NeRF

  • 论文地址:https://arxiv.org//pdf/2311.13099

  • 工程主页:PIE-NeRF

  • 代码即将开源

15.【图像合成】Diffusion360: Seamless 360 Degree Panoramic Image Generation based on Diffusion Models

  • 论文地址:https://arxiv.org//pdf/2311.13141

  • 开源代码:https://github.com/ArcherFMY/SD-T2I-360PanoImage

论文已打包,下载链接

CV计算机视觉交流群

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,不定期分享技术知识、面试技巧和内推招聘信息

想进群的同学请添加微信号联系管理员:PingShanHai666。添加好友时请备注:学校/公司+研究方向+昵称

推荐阅读:

CV计算机视觉每日开源代码Paper with code速览-2023.11.22

CV计算机视觉每日开源代码Paper with code速览-2023.11.21

CV计算机视觉每日开源代码Paper with code速览-2023.11.20

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/204370.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

解决:uniapp项目打包微信小程序时,报错:failed to load config from /xx/xx-mall/vite.config.ts

复现步骤:在vscode终端中运行:pnpm build:mp-weixin-prod 命令,打包小程序生产包时,报错failed to load xxx/vite.config.ts,但实际项目根目录中有该vite.config.ts文件。 项目使用技术:uniapp vue3 node…

抖音本地生活服务商申请入口门槛过高,该怎么办?

近年来,短视频平台的举起让直播带货和本地生活服务行业逐渐兴起,并且以其便捷、高效的特点受到了广大用户的欢迎。很多创业者也加入了本地生活服务商的行列中,但有消息传出,抖音本地生活服务商申请入口可能会关闭,由于…

virtualbox安装时报错:无法访问你试图使用的功能所在的网络位位置。旧版本的msi文件误删问题解决。

错误如下图所示: 无法访问你试图使用的功能所在的网络位位置。单击“确定”重试,或在下面的框中输入包含安装程序包“xxxxxxxxxxxxx.msi”的文件夹路径。 今天在帮同学安装时发生这个问题,然后各种网站搜索教程,最后也是花了将近…

Python之Appium 2自动化测试(Android篇)

一、环境搭建及准备工作 1、Appium 2 环境搭建 请参考另一篇文章: Windows系统搭建Appium 2 和 Appium Inspector 环境 2、安装 Appium-Python-Client,版本要求3.0及以上 pip install Appium-Python-ClientVersion: 3.1.03、手机连接电脑,并在dos窗口…

中通快递查询,中通快递单号查询,分析筛选出多次揽收件

批量查询中通快递单号的物流信息,并将其中的多次揽收件分析筛选出来。 所需工具: 一个【快递批量查询高手】软件 中通快递单号若干 操作步骤: 步骤1:运行【快递批量查询高手】软件,第一次使用的朋友记得先注册&…

什么是软阈值,硬阈值,软聚类,硬聚类!!软和硬指的是什么呢?详细解释看这里!!!

文章目录 一、软阈值和硬阈值的基本概念和区别二、软聚类和硬聚类的详细概念和区别 一、软阈值和硬阈值的基本概念和区别 在我所研究的领域中,经常出现小波降噪,就拿小波降噪举例子吧!! 在信号处理中,小波降噪是一种…

ECONGU4280 Corporate Finance

ECONGU4280 Corporate Finance WeChat: zh6-86

SpringBoot+SSM项目实战 苍穹外卖(1)

目录 产品原型与技术选型后端环境搭建Git版本控制IDEA中运行sql脚本文件nginx反向代理和负载均衡完善登录功能 MD5加密 Builder 导入接口文档SwaggerSwagger常用注解 产品原型与技术选型 管理端原型图: 用户端原型图: 餐饮企业内部员工使用。 主要功能有…

ClassCMS2.4漏洞复现

ClassCMS2.4漏洞复现 环境搭建 任意文件下载漏洞复现 漏洞成因 ClassCMS2.4漏洞复现 CMS源码在附件中 环境搭建 使用phpstudy2016搭建web环境,php版本为5.5 安装CMS 这里选择Mysql数据库进行安装 用户名和密码都写默认的admin方便记忆 输入完成后点击安装 点…

如何制作一个数字人?流程是怎样的?

​​虚拟人概念从早期动漫领域的初音未来用一首《甩葱歌》让绿色双马尾的“歌姬”形象火出圈,到洛天依登上央视春晚舞台,再到众多虚拟歌手、虚拟主播、KOL、代言人等活跃于各种情境中。 去年以来,元宇宙和虚拟人技术进入全球科技产业的聚光灯…

IDEA解决Git冲突详解

目录 前言: 何为冲突 冲突演示 IDEA冲突解决 小结: 前言: 相信大家多多少少都有了解和使用过Git,作为Java程序员idea可谓是无敌的存在了,那么如何使用idea解决Git冲突呢?不瞒大家前段时间在公司把同事…

怎样搭建好Google关键词广告账号结构

搭建好Google关键词广告账号结构对于实现广告效果的最大化至关重要。本文小编将为您提供一些关于如何搭建好Google关键词广告账号结构的建议和步骤。 1、设定目标和策略 在开始搭建广告账号结构之前,首先需要明确您的广告目标和策略。您想要增加网站流量还是提高转…

基于GAN的多尺度门合并多模态MRI图像合成

Multi-Modal MRI Image Synthesis via GAN With Multi-Scale Gate Mergence 基于GAN的多尺度门合并多模态MRI图像合成背景贡献实验方法生成器gate mergence (GM) strategy(门控融合策略)判别器 损失函数Thinking 基于GAN的多尺度门合并多模态MRI图像合成…

什么牌子的led台灯质量好?考研必备五款护眼台灯推荐

眼睛更是心灵的窗户,我们通过这扇窗来欣赏这个美好的世界。而如今,近视在儿童中已司空见惯,近视率逐年提高,并且低龄化的现状更加突出。据世界卫生组织的最新研究报告,目前中国近视患者人数多达6亿,其中我国…

揭秘Steam充值卡的那些坑

揭秘Steam充值卡的那些坑 steam充值卡有两种形式,一种是实体礼品卡图,即老外线下购买实体卡然后刮开卡密拍照传给买家。另一种是电子版礼品卡,即一串卡密,没有实体卡。 而实体礼品卡的可靠性肯定远高于电子版礼品卡。 相信很多人…

UIkit-UIAlertContent

简单Demo //注意!!!必须放在viewController的viewDidAppear里面,viewDidLoad里面不行 - (void)viewDidAppear:(BOOL)animated {// 创建 UIAlertControllerUIAlertController *alertController [UIAlertController alertControll…

2023第二届全国大学生数据分析实践赛思路及代码

比赛时间 2023.12.16 09:00 至 2023.12.23 16:00 一、建模思路及代码 比赛开始后第一时间更新,建议先收藏哦 思路及代码更新地址 二、大赛时间 大赛报名截止时间:即日起—2023年12月15日 题目公布时间:2023年12月16日早上9点 论文提交…

SpringBoot参数校验@Validated和@Valid的使用

1、Validated和Valid区别 Validated:可以用在类、方法和方法参数上。但是不能用在成员属性(字段)上Valid:可以用在方法、构造函数、方法参数和成员属性(字段)上 2、引入依赖 Spring Boot 2.3 1 之前&…

关于SseEmitter(SSE)在本地可以响应,部署到服务器后无法响应的问题

关于SseEmitter(SSE)在本地可以响应,部署到服务器后无法响应的问题 GetMapping(value "/v3/detail", produces MediaType.TEXT_EVENT_STREAM_VALUE) ResponseBody public SseEmitter v3Detail(String id) {SseEmitter emitter new SseEmitter((long) …

Parasoft:正确的静态应用程序安全测试 (SAST) 解决方案

随着软件开发从Web应用扩展到工业物联网(IIoT)设备,静态应用安全测试(SAST)越来越有必要从根本上帮助确保软件的功能安全。根据 Forrester Research的研究,网络攻击是近两年安全漏洞的主要来源。因此&#…