计算机视觉顶刊《International Journal of Computer Vision》2025年5月前沿热点可视化分析

news2025/6/7 11:55:04

追踪计算机视觉领域的前沿热点是把握技术发展方向、推动创新落地的关键,分析这些热点,不仅能洞察技术趋势,更能为科研选题和工程实践提供重要参考。本文对计算机视觉顶刊《International Journal of Computer Vision》2025年5月前沿热点进行了可视化分析。欢迎阅读和转发。

本文作者为韩煦,审核为邓镝。

一、期刊介绍

《国际计算机视觉杂志》(International Journal of Computer Vision简称IJCV)是计算机视觉领域的顶级期刊。该期刊现为月刊(每年出版12期),致力于发表高质量、原创性的学术论文,以推动计算机视觉科学与工程的蓬勃发展。期刊影响因子11.6(2023),5年期刊影响因子14.5(2023),提交首次决定(中位数)96天。表1展示了IJCV近5年发表文章的数量及期刊的影响因子(IF)的变化情况。

1 IJCV每年的文章数量和影响因子

年度

文章数/年

IF

2023

198

11.6

2022

187

19.5

2021

130

13.3

2020

187

7.4

2019

90

5.7

该期刊的讨论主题领域主要聚焦于计算机视觉领域,具体来说包括图像形成、处理、分析与解读、机器学习技术、统计方法;传感器技术;基于图像的渲染、计算机图形学、机器人技术、影像解译、图像检索、视频分析与标注、多媒体等;视觉计算模型及人脑视觉架构研究。

期刊网址https://link.springer.com/journal/11263

二、热点分析

2 论文标题中出现的高频主题词

高频主题

翻译

出现次数

核心方向

Generation

生成

8

故事 / 图像 / 视频生成

Consistency

一致性

6

多视图、跨模态、角色身份一致性

Re-identification

重识别

4

行人 / 视频重识别

Semantic Segmentation

语义分割

4

弱监督 / 跨模态 / 医学场景

Diffusion Models

扩散模型

3

动态跟踪、长视频生成

3D Reconstruction

3D 重建

3

神经场景、形状表示

Self-Supervised

自监督学习

3

无监督 / 少监督复杂任务

Multi-modal

多模态

3

视觉 - 语言、跨模态蒸馏

Medical Image

医学影像

2

分割、肿瘤预测

Adversarial Learning

对抗学习

2

质量评估、攻击防御

Multi-view

多视图

2

SLIDE(多视图一致性)、多视图立体网络(深度估计)

Unsupervised

无监督

2

跨模态蒸馏语义分割

Semi-supervised

半监督

2

医学影像分割、联邦半监督学习

DeepFake Detection

DeepFake 检测

2

鲁棒序列检测、双级适配器检测

Cross-Modal

跨模态

2

跨模态蒸馏

1 研究热点词云图

表2列出了在本次会议中,被录用的38篇论文标题中的15个高频主题词。图1展示了基于IJCV研究热点生成的词云图,涵盖语义分割、扩散模型、一致性等研究领域。表3总结了本期IJCV的已被接受的投稿论文。

3 2025年5月IJCV发表论文的列表

题目

中文翻译

AutoStory: Generating Diverse Storytelling Images with Minimal Human Efforts

AutoStory:以最小人力生成多样化故事图像

SLIDE: A Unified Mesh and Texture Generation Framework with Enhanced Geometric Control and Multi-view Consistency

SLIDE:具有增强几何控制与多视角一致性的统一网格与纹理生成框架

Exploring Homogeneous and Heterogeneous Consistent Label Associations for Unsupervised Visible-Infrared Person ReID

探索同质与异质一致标签关联的无监督可见光–红外行人重识别

AniClipart: Clipart Animation with Text-to-Video Priors

AniClipart:基于文本到视频先验的剪贴画动画

Combating Label Noise with a General Surrogate Model for Sample Selection

使用通用替代模型进行样本选择以对抗标签噪声

CSFRNet: Integrating Clothing Status Awareness for Long-Term Person Re-identification

CSFRNet:融合服装状态感知的长时跨度行人重识别网络

Pseudo-Plane Regularized Signed Distance Field for Neural Indoor Scene Reconstruction

伪平面正则化签名距离场用于神经室内场景重建

RepSNet: A Nucleus Instance Segmentation Model Based on Boundary Regression and Structural Re-Parameterization

RepSNet:基于边界回归与结构重参数化的细胞核实例分割模型

Blind Image Quality Assessment: Exploring Content Fidelity Perceptibility via Quality Adversarial Learning

盲图像质量评估:通过质量对抗学习探索内容保真性感知

HUPE: Heuristic Underwater Perceptual Enhancement with Semantic Collaborative Learning

HUPE:基于语义协同学习的启发式水下感知增强

Robust Sequential DeepFake Detection

强健序列化 DeepFake 检测

PICK: Predict and Mask for Semi-supervised Medical Image Segmentation

PICK:用于半监督医学图像分割的预测与掩码方法

Relation-Guided Versatile Regularization for Federated Semi-Supervised Learning

基于关系引导的联邦半监督学习通用正则化

General Class-Balanced Multicentric Dynamic Prototype Pseudo-Labeling

通用类平衡多中心动态原型伪标签

Diving Deep into Simplicity Bias for Long-Tailed Image Recognition

深入探讨长尾图像识别中的简单性偏差

Context-Aware Multi-view Stereo Network for Efficient Edge-Preserving Depth Estimation

面向高效边缘保留深度估计的上下文感知多视角立体网络

LDTrack: Dynamic People Tracking by Service Robots Using Diffusion Models

LDTrack:服务机器人基于扩散模型的动态人群跟踪

Learning Meshing from Delaunay Triangulation for 3D Shape Representation

从 Delaunay 三角化学习网格以进行三维形状表示

RIGID: Recurrent GAN Inversion and Editing of Real Face Videos and Beyond

RIGID:真实人脸视频的循环 GAN 反演与编辑

UniCanvas: Affordance-Aware Unified Real Image Editing via Customized Text-to-Image Generation

UniCanvas:通过定制文本到图像生成功能感知的统一真实图像编辑

Generalized Robot Vision-Language Model via Linguistic Foreground-Aware Contrast

通过语言前景感知对比的通用机器人视觉-语言模型

Rethinking Generalizability and Discriminability of Self-Supervised Learning from Evolutionary Game Theory Perspective

从进化博弈论视角重新思考自监督学习的泛化性与判别性

Pre-trained Trojan Attacks for Visual Recognition

预训练木马攻击用于视觉识别

GL-MCM: Global and Local Maximum Concept Matching for Zero-Shot Out-of-Distribution Detection

GL-MCM:用于零样本分布外检测的全局与局部最大概念匹配

A Mutual Supervision Framework for Referring Expression Segmentation and Generation

一种用于指代表达式分割与生成的互监督框架

DeepFake-Adapter: Dual-Level Adapter for DeepFake Detection

DeepFake-Adapter:用于 DeepFake 检测的双层适配器

MoonShot: Towards Controllable Video Generation and Editing with Motion-Aware Multimodal Conditions

MoonShot:面向可控视频生成与编辑的运动感知多模态条件

SeaFormer++: Squeeze-Enhanced Axial Transformer for Mobile Visual Recognition

SeaFormer++:用于移动视觉识别的压缩增强轴向 Transformer

Dual-Space Video Person Re-identification

双空间视频行人重识别

Image Synthesis Under Limited Data: A Survey and Taxonomy

有限数据条件下的图像合成:调查与分类

Sample-Cohesive Pose-Aware Contrastive Facial Representation Learning

基于样本内聚性与姿态感知的对比人脸表征学习

Learning with Enriched Inductive Biases for Vision-Language Models

面向视觉-语言模型的富归纳偏置学习

Self-supervised Shutter Unrolling with Events

基于事件的自监督快门反展开

TryOn-Adapter: Efficient Fine-Grained Clothing Identity Adaptation for High-Fidelity Virtual Try-On

TryOn-Adapter:用于高保真虚拟试穿的高效细粒度服装身份适配

Correction: CMAE-3D: Contrastive Masked AutoEncoders for Self-Supervised 3D Object Detection

勘误:CMAE-3D:用于自监督三维目标检测的对比掩码自编码器

Correction: Deep Attention Learning for Pre-operative Lymph Node Metastasis Prediction in Pancreatic Cancer via Multi-object Relationship Modeling

勘误:基于多目标关系建模的胰腺癌术前淋巴结转移预测深度注意力学习

Correction: Few Annotated Pixels and Point Cloud Based Weakly Supervised Semantic Segmentation of Driving Scenes

勘误:基于少量标注像素与点云的驾驶场景弱监督语义分割

投稿的论文主题反映出本期研究热点集中在一下几个方向:

  1. 图像/视频生成与编辑:包括故事图像生成(AutoStory)、文本到视频/图像生成(AniClipart、UniCanvas、MoonShot)、Diffusion Models 驱动的生成与编辑(LDTrack、RIGID)等。这一方向兼顾“多模态条件下的内容创生”和“运动感知的可控编辑”两大主题。
  2.  一致性建模与行人重识别:涉及多视角一致性(SLIDE)、可见-红外一致标签关联(Unsupervised Visible-Infrared Person ReID)、长时序状态感知重识别(CSFRNet)等。关注场景中跨视角、跨模态的一致性约束与特征对齐技术。
  3. 语义分割与三维重构:包括神经签名距离场重建(Pseudo-Plane Regularized SDF)、Delaunay三角网格重建(Learning Meshing from Delaunay Triangulation)、核实例分割(RepSNet)、弱监督/半监督分割(PICK、Few Annotated Pixels)等。兼顾平面、体素、点云等多种三维表示与精细分割任务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2402861.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

python学习打卡day45

DAY 45 Tensorboard使用介绍 知识点回顾: tensorboard的发展历史和原理tensorboard的常见操作tensorboard在cifar上的实战:MLP和CNN模型 效果展示如下,很适合拿去组会汇报撑页数: 作业:对resnet18在cifar10上采用微调策…

Verilog编程技巧01——如何编写三段式状态机

前言 Verilog编程技巧系列文章将聚焦于介绍Verilog的各种编程范式或者说技巧,编程技巧和编程规范有部分重合,但并非完全一样。规范更注重编码的格式,像变量命名、缩进、注释风格等,而编程技巧则更偏重更直观易读、更便于维护、综合…

智启未来:当知识库遇见莫奈的调色盘——API工作流重构企业服务美学

目录 引言 一、初识蓝耘元生代MaaS平台 1.1 平台架构 1.2 平台的优势 1.3 应用场景 二、手把手教你如何在蓝耘进行注册 (1)输入手机号,将验证码正确填入即可快速完成注册 (2)进入下面的页面表示已经成功注册&…

如何在 Windows 11 中永久更改默认浏览器:阻止 Edge 占据主导地位

在 Windows 11 中更改默认浏览器对于新手或技术不太熟练的用户来说可能会令人沮丧。 为什么要在 Windows 11 中更改默认浏览器? 这是一个重要的问题:你为什么要从 Microsoft Edge 切换过来? 生态系统集成:如果你已经在广泛使用 Google 服务,Chrome 可以提供无缝集成。同…

量子比特实现方式

经典计算机是通过电子电路运转起来的。使用硅制半导体制成的名为晶体管的小元件发挥了开关的作用,将其与金属布线组合起来即可实现逻辑门,再将逻辑门集成起来就能制造出经典计算机。量子计算机的制造过程则要复杂许多,因为量子计算机既需要量…

智慧水务发展迅猛:从物联网架构到AIoT系统的跨越式升级

AI大模型引领智慧水务迈入新纪元 2025年5月25日,水利部自主研发的“水利标准AI大模型”正式发布,它标志着水务行业智能化进程的重大突破。该模型集成1800余项水利标准、500余项法规及海量科研数据,支持立项、编制、审查等全流程智能管理&…

Java高级 | 【实验五】Spring boot+mybatis操作数据库

隶书文章:Java高级 | (二十二)Java常用类库-CSDN博客 系列文章:Java高级 | 【实验一】Springboot安装及测试 |最新-CSDN博客 Java高级 | 【实验二】Springboot 控制器类相关注解知识-CSDN博客 Java高级 | 【实验三】Springboot 静…

在MATLAB中使用自定义的ROS2消息

简明结论: 无论ROS2节点和MATLAB运行在哪,MATLAB本机都必须拥有自定义消息源码并本地用ros2genmsg生成,才能在Simulink里订阅这些消息。只要你想让MATLAB或Simulink能识别自定义消息,必须把消息包源码(.msg等)拷到本机指定目录&a…

【MATLAB去噪算法】基于ICEEMDAN联合小波阈值去噪算法

ICEEMDAN联合小波阈值去噪算法相关文献 (注:目前相关论文较少,应用该套代码可发直接一些水刊) 一、CEEMDAN的局限性 模式残留噪声问题:原始CEEMDAN在计算每个IMF时直接对噪声扰动的信号进行模态分解并平均。 后果&a…

XXTEA,XTEA与TEA

TEA、XTEA和XXTEA都是分组加密算法,它们在设计、安全性、性能等方面存在显著区别。以下是它们的主要区别: 密钥长度 TEA:使用128位密钥。 XTEA:通常使用128位或256位密钥。 XXTEA:密钥长度更灵活,可以使用任…

机器人玩转之---嵌入式开发板基础知识到实战选型指南(包含ORIN、RDK X5、Raspberry pi、RK系列等)

1. 基础知识讲解 1.1 什么是嵌入式开发板? 嵌入式开发板是一种专门设计用于嵌入式系统开发的硬件平台,它集成了微处理器、内存、存储、输入输出接口等核心组件于单块印刷电路板上。与传统的PC不同,嵌入式开发板具有体积小、功耗低、成本适中…

腾讯云国际版和国内版账户通用吗?一样吗?为什么?

在当今全球化的数字化时代,云计算服务成为众多企业和个人拓展业务、存储数据的重要选择。腾讯云作为国内领先的云服务提供商,其国际版和国内版备受关注。那么,腾讯云国际版和国内版账户是否通用?它们究竟一样吗?背后又…

OrCAD X Capture CIS设计小诀窍系列第二季--03.如何在Capture中输出带有目录和元器件信息的PDF

背景介绍:我们在进行原理图设计时,经常需要输出PDF来查看或评审,但通过”Print”功能导出的PDF较为简单,只能查看设计视图;而通过使用Ghostscript软件可以输出带有目录和元器件信息的PDF,让设计师可以直接在…

汽车的安全性能测试:试验台铁地板的重要性

汽车的安全性能测试是非常重要的,其中试验台铁地板的设计和材料选择起着至关重要的作用。试验台铁地板是指在进行汽车碰撞、侧翻等试验时,用于支撑汽车底部和提供稳定支撑的重要部件。 在进行汽车碰撞试验时,试验台铁地板的设计和材料需要具…

实践指南:从零开始搭建RAG驱动的智能问答系统

LLM 赋能的最强大的应用之一是复杂的问答 (Q&A) 聊天机器人。这些是可以回答关于特定来源信息问题的应用程序。这些应用程序使用一种称为检索增强生成的技术,或 RAG。本文将展示如何基于 LangChain 构建一个简单的基于非结构化数据文本数据源的问答应用程序。 温…

边缘计算服务器

边缘计算服务器的核心要点解析,综合技术架构、应用场景与部署方案: 一、核心定义与技术特性‌ 本质定位‌ 部署在网络边缘侧的专用计算设备(如工厂车间、智慧路灯等),直接处理终端设备(传感器、摄像头等…

第R9周:阿尔茨海默病诊断(优化特征选择版)

文章目录 1. 导入数据2. 数据处理2.1 患病占比2.2 相关性分析2.3 年龄与患病探究 3. 特征选择4. 构建数据集4.1 数据集划分与标准化4.2 构建加载 5. 构建模型6. 模型训练6.1 构建训练函数6.2 构建测试函数6.3 设置超参数 7. 模型训练8. 模型评估8.1 结果图 8.2 混淆矩阵9. 总结…

电动螺丝刀-多实体拆图建模案例

多实体建模要注意下面两点: 多实体建模的合并结果一定要谨慎在实际工作中多实体建模是一个非常好的思路,先做产品的整体设计,再将个体零件导出去做局部细节设计 电动螺丝刀模型动图展示 爆炸视图动图展示 案例素材点击此处获取 建模步骤 1. …

当丰收季遇上超导磁测量:粮食产业的科技新征程

麦浪藏光阴,心田种丰年!又到了一年中最令人心潮澎湃的粮食丰收季。金色的麦浪随风翻滚,沉甸甸的稻穗谦逊地低垂着,处处洋溢着丰收的喜悦。粮食产业,无疑是国家发展的根基与命脉,是民生稳定的压舱石。在现代…

电子电气架构 --- 什么是功能架构?

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 做到欲望极简,了解自己的真实欲望,不受外在潮流的影响,不盲从,不跟风。把自己的精力全部用在自己。一是去掉多余,凡事找规律,基础是诚信;二是…