WACV - RankMe – RankMe

930 papers

Year	Title / Authors
2025	360PanT: Training-Free Text-Driven 360-Degree Panorama-to-Panorama Translation. Hai Wang, Jing-Hao Xue
2025	3D Edge Sketch from Multiview Images. Yilin Zheng, Chiang-Heng Chien, Ricardo Fabbri, Benjamin B. Kimia
2025	3D Part Segmentation via Geometric Aggregation of 2D Visual Features. Marco Garosi, Riccardo Tedoldi, Davide Boscaini, Massimiliano Mancini, Nicu Sebe, Fabio Poiesi
2025	3D Shape Completion using Multi-resolution Spectral Encoding. Pallabjyoti Deka, Saumik Bhattacharya, Debashis Sen, Prabir Kumar Biswas
2025	3D Synthesis for Architectural Design. I-Ting Tsai, Bharath Hariharan
2025	3D Understanding of Deformable Linear Objects: Datasets and Transferability Benchmark. Bare Luka Zagar, Mingyu Liu, Tim Hertel, Ekim Yurtsever, Alois Knoll
2025	@BENCH: Benchmarking Vision-Language Models for Human-centered Assistive Technology. Xin Jiang, Junwei Zheng, Ruiping Liu, Jiahang Li, Jiaming Zhang, Sven Matthiesen, Rainer Stiefelhagen
2025	A 0-Shot Self-Attention Mechanism for Accelerated Diagonal Attention. Viti Mario, Nadiya Shvai, Arcadi Llanza, Amir Nakib
2025	A Conflict-Guided Evidential Multimodal Fusion for Semantic Segmentation. Lucas Deregnaucourt, Hind Laghmara, Alexis Lechervy, Samia Ainouz
2025	A Conic Transformation Approach for Solving the Perspective-Three-Point Problem. Haidong Wu, Snehal Bhayani, Janne Heikkilä
2025	A Data Perspective on Enhanced Identity Preservation for Diffusion Personalization. Xingzhe He, Zhiwen Cao, Nicholas I. Kolkin, Lantao Yu, Kun Wan, Helge Rhodin, Ratheesh Kalarot
2025	A Generic Vehicle-to-Sensor Calibration Framework. Sumin Hu, Youngmin Yoo, Jeeseong Kim, Changsoo Lim, Doohyun Cho, Bongnam Kang
2025	A Mamba-Based Siamese Network for Remote Sensing Change Detection. Jay N. Paranjape, Celso De Melo, Vishal M. Patel
2025	A Multi-Task Supervised Compression Model for Split Computing. Yoshitomo Matsubara, Matteo Mendula, Marco Levorato
2025	A New Benchmark and Baseline for Real-Time High-Resolution Image Inpainting on Edge Devices. Marcelo Sanchez, Gil Triginer, Coloma Ballester, Ignacio Sarasua, Lara Raad
2025	A Novel Perspective for Multi-Modal Multi-Label Skin Lesion Classification. Yuan Zhang, Yutong Xie, Hu Wang, Jodie C. Avery, M. Louise Hull, Gustavo Carneiro
2025	A Parametric Approach to Adversarial Augmentation for Cross-Domain Iris Presentation Attack Detection. Debasmita Pal, Redwan Sony, Arun Ross
2025	A Pipeline and NIR-Enhanced Dataset for Parking Lot Segmentation. Shirin Qiam, Saipraneeth Devunuri, Lewis J. Lehe
2025	A Rapid Test for Accuracy and Bias of Face Recognition Technology. Manuel Knott, Ignacio Serna, Ethan Mann, Pietro Perona
2025	A Realistic Protocol for Evaluation of Weakly Supervised Object Localization. Shakeeb Murtaza, Soufiane Belharbi, Marco Pedersoli, Eric Granger
2025	A Reality Check on Pre-training for Exemplar-free Class-Incremental Learning. Eva Feillet, Adrian Popescu, Céline Hudelot
2025	A Recipe for Geometry-Aware 3D Mesh Transformers. Mohammad Farazi, Yalin Wang
2025	A Regional-Level Resource-Saving Model for Winter Road Surface Snow Detection in Extreme Weathers. Xinhao Zhou, Tong Wang, Zhaodong Liu, Hao Wei, Guangyuan Pan
2025	A Semantically Impactful Image Manipulation Dataset: Characterizing Image Manipulations Using Semantic Significance. Yuwei Chen, Ming-Ching Chang, Matthias Kirchner, Zhenfei Zhang, Xin Li, Arslan Basharat, Anthony Hoogs
2025	A Simple-but-Effective Baseline for Training-Free Class-Agnostic Counting. Yuhao Lin, Haiming Xu, Lingqiao Liu, Javen Qinfeng Shi
2025	A Spatio-Temporal Representation Learning as an Alternative to Traditional Glosses in Sign Language Translation and Production. Eui Jun Hwang, Sukmin Cho, Huije Lee, Youngwoo Yoon, Jong C. Park
2025	A Two-Head Loss Function for Deep Average-K Classification. Camille Garcin, Maximilien Servajean, Alexis Joly, Joseph Salmon
2025	A Versatile and Differentiable Hand-Object Interaction Representation. Théo Morales, Omid Taheri, Gerard Lacey
2025	A Video is Worth 10, 000 Words: Training and Benchmarking with Diverse Captions for Better Long Video Retrieval. Matthew Gwilliam, Michael Cogswell, Meng Ye, Karan Sikka, Abhinav Shrivastava, Ajay Divakaran
2025	AC-IND: Sparse CT Reconstruction Based on Attenuation Coefficient Estimation and Implicit Neural Distribution. Wangduo Xie, Richard Schoonhoven, Tristan van Leeuwen, Matthew B. Blaschko
2025	ACE: Action Concept Enhancement of Video-Language Models in Procedural Videos. Reza Ghoddoosian, Nakul Agarwal, Isht Dwivedi, Behzad Darisuh
2025	ACE: Anatomically Consistent Embeddings in Composition and Decomposition. Ziyu Zhou, Haozhe Luo, Mohammad Reza Hosseinzadeh Taher, Jiaxuan Pang, Xiaowei Ding, Michael B. Gotway, Jianming Liang
2025	AH-OCDA: Amplitude-Based Curriculum Learning and Hopfield Segmentation Model for Open Compound Domain Adaptation. Jaehyun Choi, Junwon Ko, Dong-Jae Lee, Junmo Kim
2025	AIC3DOD: Advancing Indoor Class-Incremental 3D Object Detection with Point Transformer Architecture and Room Layout Constraints. Zhongyao Cheng, Fang Wu, Peisheng Qian, Ziyuan Zhao, XuLei Yang
2025	ALPI: Auto-Labeller with Proxy Injection for 3D Object Detection using 2D Labels Only. Saad Lahlali, Nicolas Granger, Hervé Le Borgne, Quoc-Cuong Pham
2025	ALSTER: A Local Spatio-Temporal Expert for Online 3D Semantic Reconstruction. Silvan Weder, Francis Engelmann, Johannes L. Schönberger, Akihito Seki, Marc Pollefeys, Martin R. Oswald
2025	AMNCutter: Affinity-Attention-Guided Multi-View Normalized Cutter for Unsupervised Surgical Instrument Segmentation. Mingyu Sheng, Jianan Fan, Dongnan Liu, Ron Kikinis, Weidong Cai
2025	AMP-ViT: Optimizing Vision Transformer Efficiency with Adaptive Mixed-Precision Post-Training Quantization. Yu-Shan Tai, An-Yeu Andy Wu
2025	ANTHROPOS-V: Benchmarking the Novel Task of Crowd Volume Estimation. Luca Collorone, Stefano D'Arrigo, Massimiliano Pappa, Guido Maria D'Amely di Melendugno, Giovanni Ficarra, Fabio Galasso
2025	ARD-VAE: A Statistical Formulation to Find the Relevant Latent Dimensions of Variational Autoencoders. Surojit Saha, Sarang C. Joshi, Ross T. Whitaker
2025	ARF-Plus: Controlling Perceptual Factors in Artistic Radiance Fields for 3D Scene Stylization. Wenzhao Li, Tianhao Wu, Fangcheng Zhong, Cengiz Öztireli
2025	ARTIST: Improving the Generation of Text-Rich Images with Disentangled Diffusion Models and Large Language Models. Jianyi Zhang, Yufan Zhou, Jiuxiang Gu, Curtis Wigington, Tong Yu, Yiran Chen, Tong Sun, Ruiyi Zhang
2025	ARTeFACT: Benchmarking Segmentation Models on Diverse Analogue Media Damage. Daniela Ivanova, Marco Aversa, Paul Henderson, John Williamson
2025	Achieving Byzantine-Resilient Federated Learning via Layer-Adaptive Sparsified Model Aggregation. Jiahao Xu, Zikai Zhang, Rui Hu
2025	ActionDiffusion: An Action-Aware Diffusion Model for Procedure Planning in Instructional Videos. Lei Shi, Paul C. Bürkner, Andreas Bulling
2025	Active Event Alignment for Monocular Distance Estimation. Nan Cai, Pia Bideau
2025	Active Learning for Image Segmentation with Binary User Feedback. Debanjan Goswami, Shayok Chakraborty
2025	Active Learning for Vision-Language Models. Bardia Safaei, Vishal M. Patel
2025	Active Learning with Context Sampling and One-vs-Rest Entropy for Semantic Segmentation. Fei Wu, Pablo Márquez-Neila, Hedyeh Rafii-Tari, Raphael Sznitman
2025	Ad Lei Zhu, Yanyu Xu, Yong Liu, Rick Siow Mong Goh, Xinxing Xu
2025	AdQuestA: Knowledge-Guided Visual Question Answer Framework for Advertisements. Neha Choudhary, Poonam Goyal, Devashish Siwatch, Atharva Chandak, Harsh Mahajan, Varun Khurana, Yaman Kumar
2025	Ada-VE: Training-Free Consistent Video Editing Using Adaptive Motion Prior. Tanvir Mahmud, Mustafa Munir, Radu Marculescu, Diana Marculescu
2025	AdaPrefix++: Integrating Adapters, Prefixes and Hypernetwork for Continual Learning. Sayanta Adhikari, Dupati Srikar Chandra, P. K. Srijith, Pankaj Wasnik, Naoyuki Onoe
2025	Adaptive Deviation Learning for Visual Anomaly Detection with Data Contamination. Anindya Sundar Das, Guansong Pang, Monowar Bhuyan
2025	Adaptive and Temporally Consistent Gaussian Surfels for Multi-View Dynamic Reconstruction. Decai Chen, Brianne Oberson, Ingo Feldmann, Oliver Schreer, Anna Hilsmann, Peter Eisert
2025	Advancing Chart Question Answering with Robust Chart Component Recognition. Hanwen Zheng, Sijia Wang, Chris Thomas, Lifu Huang
2025	Advancing Weight and Channel Sparsification with Enhanced Saliency. Xinglong Sun, Maying Shen, Hongxu Yin, Lei Mao, Pavlo Molchanov, José M. Álvarez
2025	Adversarial Attention Deficit: Fooling Deformable Vision Transformers with Collaborative Adversarial Patches. Quazi Mishkatul Alam, Bilel Tarchoun, Ihsen Alouani, Nael B. Abu-Ghazaleh
2025	Adversarial Learning Based Knowledge Distillation on 3D Point Clouds. Sanjay S J, Akash J, Sreehari Rajan, Dimple A. Shajahan, Charu Sharma
2025	Aerial Mirage: Unmasking Hallucinations in Large Vision Language Models. Debolena Basak, Soham Bhatt, Sahith Kanduri, Maunendra Sankar Desarkar
2025	Aggregated Attributions for Explanatory Analysis of 3D Segmentation Models. Maciej Chrabaszcz, Hubert Baniecki, Piotr Komorowski, Szymon Plotka, Przemyslaw Biecek
2025	AgroGPT : Efficient Agricultural Vision-Language Model with Expert Tuning. Muhammad Awais, Ali Husain Salem Abdulla Alharthi, Amandeep Kumar, Hisham Cholakkal, Rao Muhammad Anwer
2025	Agtech Framework for Cranberry-Ripening Analysis Using Vision Foundation Models. Faith M. Johnson, Ryan Meegan, Jack Lowry, Peter Oudemans, Kristin J. Dana
2025	AiDe: Improving 3D Open-Vocabulary Semantic Segmentation by Aligned Vision-Language Learning. Yimu Wang, Krzysztof Czarnecki
2025	AlignIT: Enhancing Prompt Alignment in Customization of Text-to-Image Models. Aishwarya Agarwal, Srikrishna Karanam, Balaji Vasan Srinivasan
2025	All-in-One Image Compression and Restoration. Huimin Zeng, Jiacheng Li, Ziqiang Zheng, Zhiwei Xiong
2025	An Encoder-Agnostic Weakly Supervised Method For Describing Textures. Shangbo Mao, Deepu Rajan
2025	An Image is Worth Multiple Words: Multi-Attribute Inversion for Constrained Text-To-Image Synthesis. Aishwarya Agarwal, Srikrishna Karanam, Tripti Shukla, Balaji Vasan Srinivasan
2025	An Investigation on LLMs' Visual Understanding Ability Using SVG for Image-Text Bridging. Mu Cai, Zeyi Huang, Yuheng Li, Utkarsh Ojha, Haohan Wang, Yong Jae Lee
2025	Analyzing and Improving the Skin Tone Consistency and Bias in Implicit 3D Relightable Face Generators. Libing Zeng, Nima Khademi Kalantari
2025	Anchored Diffusion for Video Face Reenactment. Idan Kligvasser, Regev Cohen, George Leifman, Ehud Rivlin, Michael Elad
2025	Anomaly Detection for People with Visual Impairments Using an Egocentric 360-Degree Camera. Inpyo Song, Sanghyeon Lee, Minjun Joo, Jangwon Lee
2025	AnomalyDINO: Boosting Patch-based Few-Shot Anomaly Detection with DINOv2. Simon Damm, Mike Laszkiewicz, Johannes Lederer, Asja Fischer
2025	Are Exemplar-Based Class Incremental Learning Models Victim of Black-Box Poison Attacks? Neeresh Kumar Perla, Md. Iqbal Hossain, Afia Sajeeda, Ming Shao
2025	Assessing Visually-Continuous Corruption Robustness of Neural Networks Relative to Human Performance. Huakun Shen, Boyue Caroline Hu, Krzysztof Czarnecki, Lina Marsso, Marsha Chechik
2025	Assessing the Quality of 3D Reconstruction in the Absence of Ground Truth: Application to a Multimodal Archaeological Dataset. Benjamin Coupry, Baptiste Brument, Antoine Laurent, Jean Mélou, Yvain Quéau, Jean-Denis Durou
2025	Attention-Based Class-Conditioned Alignment for Multi-Source Domain Adaptation of Object Detectors. Atif Belal, Akhil Meethal, Francisco Perdigon Romero, Marco Pedersoli, Eric Granger
2025	Attention-Guided Masked Autoencoders for Learning Image Representations. Leon Sick, Dominik Engel, Pedro Hermosilla, Timo Ropinski
2025	Attribute Diffusion: Diffusion Driven Diverse Attribute Editing. Rishubh Parihar, Prasanna Balaji, Raghav Magazine, Sarthak Vora, Varun Jampani, R. Venkatesh Babu
2025	AutoProSAM: Automated Prompting SAM for 3D Multi-Organ Segmentation. Chengyin Li, Rafi Ibn Sultan, Prashant Khanduri, Yao Qiang, Chetty J. Indrin, Dongxiao Zhu
2025	Automated Evaluation of Large Vision-Language Models on Self-Driving Corner Cases. Kai Chen, Yanze Li, Wenhua Zhang, Yanxin Liu, Pengxiang Li, Ruiyuan Gao, Lanqing Hong, Meng Tian, Xinhai Zhao, Zhenguo Li, Dit-Yan Yeung, Huchuan Lu, Xu Jia
2025	Automated Patient Positioning with Learned 3D Hand Gestures. Zhongpai Gao, Abhishek Sharma, Meng Zheng, Benjamin Planche, Terrence Chen, Ziyan Wu
2025	Autoregressive Adaptive Hypergraph Transformer for Skeleton-Based Activity Recognition. Abhisek Ray, Ayush Raj, Maheshkumar H. Kolekar
2025	BASED: Bundle-Adjusting Surgical Endoscopic Dynamic Video Reconstruction Using Neural Radiance Fields. Shreya Saha, Zekai Liang, Shan Lin, Jingpei Lu, Michael C. Yip, Sainan Liu
2025	BIV-Priv-Seg: Locating Private Content in Images Taken by People With Visual Impairments. Yu-Yun Tseng, Tanusree Sharma, Lotus Zhang, Abigale Stangl, Leah Findlater, Yang Wang, Danna Gurari
2025	Background-Aware Moment Detection for Video Moment Retrieval. Minjoon Jung, Youwon Jang, Seongho Choi, Joochan Kim, Jin-Hwa Kim, Byoung-Tak Zhang
2025	Balancing Shared and Task-Specific Representations: A Hybrid Approach to Depth-Aware Video Panoptic Segmentation. Kurt H. W. Stolle
2025	Bandit-based Attention Mechanism in Vision Transformers. Amartya Roy Chowdhury, Raghuram Bharadwaj Diddigi, Prabuchandran K. J., Achyut Mani Tripathi
2025	Bandwidth-Efficient Communication Modelling for Autonomous Vehicle Collaborative Perception. Dinghao Jin, Yuan Zeng, Yi Gong
2025	Bayesian Optimal Latent Projection for Noisy Image Restoration. Ziqiang Shi, Rujie Liu, Jun Takahashi, Takuma Yamamoto
2025	BeautyBank: Encoding Facial Makeup in Latent Space. Qianwen Lu, Xingchao Yang, Takafumi Taketomi
2025	Benchmarking VLMs' Reasoning About Persuasive Atypical Images. Sina Malakouti, Aysan Aghazadeh, Ashmit Khandelwal, Adriana Kovashka
2025	Beta Sampling is All You Need: Efficient Image Generation Strategy for Diffusion Models Using Stepwise Spectral Analysis. Haeil Lee, Hansang Lee, Seoyeon Gye, Junmo Kim
2025	Beyond Boxes: Mask-Guided Spatio-Temporal Feature Aggregation for Video Object Detection. Khurram Azeem Hashmi, Talha Uddin Sheikh, Didier Stricker, Muhammad Zeshan Afzal
2025	Beyond Grids: Exploring Elastic Input Sampling for Vision Transformers. Adam Pardyl, Grzegorz Kurzejamski, Jan Olszewski, Tomasz Trzcinski, Bartosz Zielinski
2025	Beyond Spatial Explanations: Explainable Face Recognition in the Frequency Domain. Marco Huber, Naser Damer
2025	Bidirectional Multi-Step Domain Generalization for Visible-Infrared Person Re-Identification. Mahdi Alehdaghi, Pourya Shamsolmoali, Rafael M. O. Cruz, Eric Granger
2025	BioNet and NeFF: Crop Biomass Prediction from Point Clouds to Drone Imagery. Xuesong Li, Zeeshan Hayder, Ali Zia, Connor Cassidy, Shiming Liu, Warwick Stiller, Eric A. Stone, Warren Conaty, Lars Petersson, Vivien Rolland
2025	BioPose: Biomechanically-Accurate 3D Pose Estimation from Monocular Videos. Farnoosh Koleini, Muhammad Usama Saleem, Pu Wang, Hongfei Xue, Ahmed Helmy, Abbey Fenwick
2025	Bit-Flip Induced Latency Attacks in Object Detection. Manojna Sistla, Yu Wen, Aamir Bader Shah, Chenpei Huang, Lening Wang, Xuqing Wu, Jiefu Chen, Miao Pan, Xin Fu
2025	Blind Image Deblurring with FFT-ReLU Sparsity Prior. Abdul Mohaimen Al Radi, Prothito Shovon Majumder, Md. Mosaddek Khan
2025	Boosting Diffusion Guidance via Learning Degradation-Aware Models for Blind Super Resolution. Shao-Hao Lu, Ren Wang, Ching-Chun Huang, Wei-Chen Chiu
2025	Boosting Semi-Supervised Video Action Detection with Temporal Context. Donghyeon Kwon, Inho Kim, Suha Kwak
2025	Breaking the Frame: Visual Place Recognition by Overlap Prediction. Tong Wei, Philipp Lindenberger, Jirí Matas, Daniel Barath
2025	BroadTrack: Broadcast Camera Tracking for Soccer. Floriane Magera, Thomas Hoyoux, Olivier Barnich, Marc Van Droogenbroeck
2025	CACE: Sim-to-Real Indoor 3D Semantic Segmentation via Context-Aware Augmentation and Consistency Enforcement. Tsung-Yu Chen, Luyu Yang, Tzu-Yu Chuang, Shang-Hong Lai
2025	CAMEL: Confidence-Aware Multi-Task Ensemble Learning with Spatial Information for Retina OCT Image Classification and Segmentation. Juho Jung, Migyeong Yang, Hyunseon Won, Jiwon Kim, Jeong Mo Han, Joon Seo Hwang, Daniel Duck-Jin Hwang, Jinyoung Han
2025	CAMS: Convolution and Attention-Free Mamba-Based Cardiac Image Segmentation. Abbas Khan, Muhammad Asad, Martin Benning, Caroline H. Roney, Gregory G. Slabaugh
2025	CATALOG: A Camera Trap Language-Guided Contrastive Learning Model. Julian D. Santamaria, Claudia Isaza, Jhony H. Giraldo
2025	CCASeg: Decoding Multi-Scale Context with Convolutional Cross-Attention for Semantic Segmentation. Jiwon Yoo, Dami Ko, Gyeonghwan Kim
2025	CE-VAE: Capsule Enhanced Variational AutoEncoder for Underwater Image Enhancement. Rita Pucci, Niki Martinel
2025	CEMIL: Contextual Attention Based Efficient Weakly Supervised Approach for Histopathology Image Classification. Tawsifur Rahman, Alexander S. Baras, Rama Chellappa
2025	CIRCOD: Co-Saliency Inspired Referring Camouflaged Object Discovery. Avi Gupta, Koteswar Rao Jerripothula, Tammam Tillo
2025	CISOL: An Open and Extensible Dataset for Table Structure Recognition in the Construction Industry. David Tschirschwitz, Volker Rodehorst
2025	CL-Cross VQA: A Continual Learning Benchmark for Cross-Domain Visual Question Answering. Yao Zhang, Haokun Chen, Ahmed Frikha, Denis Krompass, Gengyuan Zhang, Jindong Gu, Volker Tresp
2025	CLASS: Conditional Latent Architecture for Search and Synthesis of Design Layouts. Dipu Manandhar, Paul Guerrero, Zhaowen Wang, John P. Collomosse
2025	CLFace: A Scalable and Resource-Efficient Continual Learning Framework for Lifelong Face Recognition. Md Mahedi Hasan, Shoaib Meraj Sami, Nasser M. Nasrabadi
2025	CLIP-Fusion: A Spatio-Temporal Quality Metric for Frame Interpolation. Göksel Mert Çökmez, Yang Zhang, Christopher Schroers, Tunç Ozan Aydin
2025	CLIPArTT: Adaptation of CLIP to New Domains at Test Time. Gustavo Adolfo Vargas Hakim, David Osowiechi, Mehrdad Noori, Milad Cheraghalikhani, Ali Bahri, Moslem Yazdanpanah, Ismail Ben Ayed, Christian Desrosiers
2025	CLIPScope: Enhancing Zero-Shot OOD Detection with Bayesian Scoring. Hao Fu, Naman Patel, Prashanth Krishnamurthy, Farshad Khorrami
2025	CLIPping Imbalances: A Novel Evaluation Baseline and PEARL Dataset for Pedestrian Attribute Recognition. Kamalakar Vijay Thakare, Lalit Lohani, Kamakshya Prasad Nayak, Debi Prosad Dogra, Heeseung Choi, Hyungjoo Jung, Ig-Jae Kim
2025	CM3T: Framework for Efficient Multimodal Learning for Inhomogeneous Interaction Datasets. Tanay Agrawal, Mohammed Guermal, Michal Balazia, François Brémond
2025	COSNet: A Novel Semantic Segmentation Network using Enhanced Boundaries in Cluttered Scenes. Muhammad Ali, Mamoona Javaid, Mubashir Noman, Mustansar Fiaz, Salman H. Khan
2025	CRAAC: Consistency Regularised Active Learning with Automatic Corrections for Real-Life Road Image Annotations. Percy Lam, Sooyong Park, Weiwei Chen, Lavindra de Silva, Ioannis K. Brilakis
2025	CRAFT: Class Ranking Aware Fine-Tuning for Enhanced Out-of-Distribution Detection. Naveen Karunanayake, Suranga Seneviratne, Sanjay Chawla
2025	CRAFT: Designing Creative and Functional 3D Objects. Michelle Guo, Mia Tang, Hannah Cha, Ruohan Zhang, C. Karen Liu, Jiajun Wu
2025	CT to PET Translation: A Large-Scale Dataset and Domain-Knowledge-Guided Diffusion Approach. Dac Thai Nguyen, Trung Thanh Nguyen, Huu Tien Nguyen, Thanh Trung Nguyen, Huy Hieu Pham, Thanh Hung Nguyen, Truong Thao Nguyen, Phi Le Nguyen
2025	CTIP: Towards Accurate Tabular-to-Image Generation for Tire Footprint Generation. Daeyoung Roh, Donghee Han, Jihyun Nam, Jungsoo Oh, Youngbin You, Jeongheon Park, Mun Yong Yi
2025	CUNSB-RFIE: Context-Aware Unpaired Neural Schrödinger Bridge in Retinal Fundus Image Enhancement. Xuanzhao Dong, Vamsi Krishna Vasa, Wenhui Zhu, Peijie Qiu, Xiwen Chen, Yi Su, Yujian Xiong, Zhangsihao Yang, Yanxi Chen, Yalin Wang
2025	CabNIR: A Benchmark for In-Vehicle Infrared Monocular Depth Estimation. Ugo Leone Cavalcanti, Matteo Poggi, Fabio Tosi, Valerio Cambareri, Vladimir Zlokolica, Stefano Mattoccia
2025	Calib3D: Calibrating Model Preferences for Reliable 3D Scene Understanding. Lingdong Kong, Xiang Xu, Jun Cen, Wenwei Zhang, Liang Pan, Kai Chen, Ziwei Liu
2025	CamoFA: A Learnable Fourier-Based Augmentation for Camouflage Segmentation. Minh-Quan Le, Minh-Triet Tran, Trung-Nghia Le, Tam V. Nguyen, Thanh-Toan Do
2025	Can Adversarial Examples be Parsed to Reveal Victim Model Information? Yuguang Yao, Jiancheng Liu, Yifan Gong, Xiaoming Liu, Yanzhi Wang, Xue Lin, Sijia Liu
2025	Can Location Embeddings Enhance Super-Resolution of Satellite Imagery? Daniel Panangian, Ksenia Bittner
2025	Can Multimodal Large Language Models Truly Perform Multimodal In-Context Learning? Shuo Chen, Zhen Han, Bailan He, Jianzhe Liu, Mark Buckley, Yao Qin, Philip Torr, Volker Tresp, Jindong Gu
2025	Can Out-of-Domain Data Help to Learn Domain-Specific Prompts for Multimodal Misinformation Detection? Amartya Bhattacharya, Debarshi Brahma, Suraj Nagaje Mahadev, Anmol Asati, Vikas Verma, Soma Biswas
2025	Cap2Aug: Caption Guided Image data Augmentation. Aniket Roy, Anshul Shah, Ketul Shah, Anirban Roy, Rama Chellappa
2025	CardioSyntax: End-to-End SYNTAX Score Prediction - Dataset, Benchmark and Method. Alexander Ponomarchuk, Ivan Kruzhilov, Gleb Mazanov, Ruslan Utegenov, Artem Shadrin, Galina Zubkova, Ivan Bessonov, Pavel Blinov
2025	Cascaded Dual Vision Transformer for Accurate Facial Landmark Detection. Ziqiang Dang, Jianfang Li, Lin Liu
2025	Channel Propagation Networks for Refreshable Vision Transformer. Junhyeong Go, Jongbin Ryu
2025	CharDiff: Improving Sampling Convergence via Characteristic Function Consistency in Diffusion Models. Abhishek Kumar Sinha, S. Manthira Moorthi
2025	ChromaDistill: Colorizing Monochrome Radiance Fields with Knowledge Distillation. Ankit Dhiman, R. Srinath, Srinjay Sarkar, Lokesh R. Boregowda, R. Venkatesh Babu
2025	Clarity Amidst Blur: A Deterministic Method for Synthetic Generation of Water Droplets on Camera Lenses. Tim Dieter Eberhardt, Tim Brühl, Robin Schwager, Tin Stribor Sohn, Wilhelm Stork
2025	Class-Agnostic Visio-Temporal Scene Sketch Semantic Segmentation. Aleyna Kütük, Tevfik Metin Sezgin
2025	Class-Conditioned Transformation for Enhanced Robust Image Classification. Tsachi Blau, Roy Ganz, Chaim Baskin, Michael Elad, Alex M. Bronstein
2025	Click&Describe: Multimodal Grounding and Tracking for Aerial Objects. Rupanjali Kukal, Jay Patravali, Fuxun Yu, Simranjit Singh, Nikolaos Karianakis, Rishi Madhok
2025	Closing the Domain Gap in Manga Colorization via Aligned Paired Dataset. Maksim Golyadkin, Ianis Plevokas, Ilya Makarov
2025	CoVLA: Comprehensive Vision-Language-Action Dataset for Autonomous Driving. Hidehisa Arai, Keita Miwa, Kento Sasaki, Kohei Watanabe, Yu Yamaguchi, Shunsuke Aoki, Issei Yamamoto
2025	ColFigPhotoAttnNet: Reliable Finger Photo Presentation Attack Detection Leveraging Window-Attention on Color Spaces. Anudeep Vurity, Emanuela Marasco, Raghavendra Ramachandra, Jongwoo Park
2025	ColorizeDiffusion: Improving Reference-Based Sketch Colorization with Latent Diffusion Model. Dingkun Yan, Liang Yuan, Erwin Wu, Yuma Nishioka, Issei Fujishiro, Suguru Saito
2025	ComFace: Facial Representation Learning with Synthetic Data for Comparing Faces. Yusuke Akamatsu, Terumi Umematsu, Hitoshi Imaoka, Shizuko Gomi, Hideo Tsurushima
2025	Combining Inherent Knowledge of Vision-Language Models with Unsupervised Domain Adaptation Through Strong-Weak Guidance. Thomas Westfechtel, Dexuan Zhang, Tatsuya Harada
2025	Comparative Evaluation of 3D Reconstruction Methods for Object Pose Estimation. Varun Burde, Assia Benbihi, Pavel Burget, Torsten Sattler
2025	Comparative Knowledge Distillation. Alex Tianyi Xu, Alex Wilf, Paul Pu Liang, Alexander Obolenskiv, Daniel Fried, Louis-Philippe Morency
2025	Composed Image Retrieval for Training-FREE DOMain Conversion. Nikos Efthymiadis, Bill Psomas, Zakaria Laskar, Konstantinos Karantzalos, Yannis Avrithis, Ondrej Chum, Giorgos Tolias
2025	Compositional Segmentation of Cardiac Images Leveraging Metadata. Abbas Khan, Muhammad Asad, Martin Benning, Caroline H. Roney, Gregory G. Slabaugh
2025	ConDiSR: Contrastive Disentanglement and Style Regularization for Single Domain Generalization. Aleksandr Matsun, Numan Saeed, Fadillah Adamsyah Maani, Mohammad Yaqub
2025	Conceptual Learning via Embedding Approximations for Reinforcing Interpretability and Transparency. Maor Dikter, Tsachi Blau, Chaim Baskin
2025	Conditional GAN for Enhancing Diffusion Models in Efficient and Authentic Global Gesture Generation from Audios. Yongkang Cheng, Mingjiang Liang, Shaoli Huang, Gaoge Han, Jifeng Ning, Wei Liu
2025	Context-Aware Optimal Transport Learning for Retinal Fundus Image Enhancement. Vamsi Krishna Vasa, Peijie Qiu, Wenhui Zhu, Yujian Xiong, Oana M. Dumitrascu, Yalin Wang
2025	Context-Aware Outlier Rejection for Robust Multi-View 3D Tracking of Similar Small Birds in An Outdoor Aviary. Keon Moradi, Ethan Haque, Jasmeen Kaur, Alexandra B. Bentz, Eli S. Bridge, Golnaz Habibi
2025	ContextIQ: A Multimodal Expert-Based Video Retrieval System for Contextual Advertising. Ashutosh Chaubey, Anoubhav Agrawal, Sartaki Sinha Roy, Aayush Agrawal, Susmita Ghose
2025	Continual Learning in 3D Point Clouds: Employing Spectral Techniques for Exemplar Selection. Hossein Resani, Behrooz Nasihatkon, Mohammadreza Alimoradi Jazi
2025	Continual Learning of Personalized Generative Face Models with Experience Replay. Annie N. Wang, Luchao Qi, Roni Sengupta
2025	Continuous Spatio-Temporal Memory Networks for 4D Cardiac Cine MRI Segmentation. Meng Ye, Bingyu Xin, Leon Axel, Dimitris N. Metaxas
2025	Contrastive Learning of Image Representations Guided by Spatial Relations. Logan Servant, Michaël Clément, Laurent Wendling, Camille Kurtz
2025	Contrastive Sequential-Diffusion Learning: Non-Linear and Multi-Scene Instructional Video Synthesis. Vasco Ramos, Yonatan Bitton, Michal Yarom, Idan Szpektor, João Magalhães
2025	Controlling Human Shape and Pose in Text-to-Image Diffusion Models via Domain Adaptation. Benito Buchheim, Max Reimann, Jürgen Döllner
2025	ConvMixFormer- A Resource-Efficient Convolution Mixer for Transformer-Based Dynamic Hand Gesture Recognition. Mallika Garg, Debashis Ghosh, Pyari Mohan Pradhan
2025	Copy or Not? Reference-Based Face Image Restoration with Fine Details. Min Jin Chong, Dejia Xu, Yi Zhang, Zhangyang Wang, David A. Forsyth, Gurunandan Krishnan, Yicheng Wu, Jian Wang
2025	Corgi: Cached Memory Guided Video Generation. Xindi Wu, Uriel Singer, Zhaojiang Lin, Andrea Madotto, Xide Xia, Yifan Xu, Paul A. Crook, Xin Luna Dong, Seungwhan Moon
2025	CorrFill: Enhancing Faithfulness in Reference-Based Inpainting with Correspondence Guidance in Diffusion Models. Kuan-Hung Liu, Cheng-Kun Yang, Min-Hung Chen, Yu-Lun Liu, Yen-Yu Lin
2025	Counting Guidance for High Fidelity Text-to-Image Synthesis. Wonjun Kang, Kevin Galim, Hyung Il Koo, Nam Ik Cho
2025	Covariance-Based Space Regularization for Few-Shot Class Incremental Learning. Yijie Hu, Guanyu Yang, Zhaorui Tan, Xiaowei Huang, Kaizhu Huang, Qiufeng Wang
2025	Crackstructures and Crackensembles: The Power of Multi-View for 2.5D Crack Detection. Christian Benz, Volker Rodehorst
2025	Crafting Distribution Shifts for Validation and Training in Single Source Domain Generalization. Nikos Efthymiadis, Giorgos Tolias, Ondrej Chum
2025	Cross Image Feature Perturbation with Pseudo Label Fusion for Semi-Supervised Medical Image Segmentation. Minxia Xu, Han Yang, Bo Song, Weida Hu, Jinshui Miao, Erkang Cheng
2025	Cross-Aligned Fusion For Multimodal Understanding. Abhishek Rajora, Shubham Gupta, Suman Kundu
2025	Cross-Domain Multi-Modal Few-Shot Object Detection via Rich Text. Zeyu Shangguan, Daniel Seita, Mohammad Rostami
2025	Cross-Domain and Cross-Dimension Learning for Image-to-Graph Transformers. Alexander H. Berger, Laurin Lux, Suprosanna Shit, Ivan Ezhov, Georgios Kaissis, Martin J. Menten, Daniel Rueckert, Johannes C. Paetzold
2025	Cross-Modal Feature Alignment and MMD Improve Robustness of Prompt Tuning. Jingchen Sun, Rohan Sharma, Vishnu Suresh Lokhande, Changyou Chen
2025	Cross-Task Affinity Learning for Multitask Dense Scene Predictions. Dimitrios Sinodinos, Narges Armanfard
2025	Cross-View Meets Diffusion: Aerial Image Synthesis with Geometry and Text Guidance. Ahmad Arrabi, Xiaohan Zhang, Waqas Sultani, Chen Chen, Safwan Wshah
2025	Crossroads of Continents: Automated Artifact Extraction for Cultural Adaptation with Large Multimodal Models. Anjishnu Mukherjee, Ziwei Zhu, Antonios Anastasopoulos
2025	CrowdMAC: Masked Crowd Density Completion for Robust Crowd Density Forecasting. Ryo Fujii, Ryo Hachiuma, Hideo Saito
2025	CryoMAE: Few-Shot Cryo-EM Particle Picking with Masked Autoencoders. Chentianye Xu, Xueying Zhan, Min Xu
2025	CusConcept: Customized Visual Concept Decomposition with Diffusion Models. Zhi Xu, Shaozhe Hao, Kai Han
2025	CycleCrash: A Dataset of Bicycle Collision Videos for Collision Prediction and Analysis. Nishq Poorav Desai, Ali Etemad, Michael A. Greenspan
2025	D-LUT: Photorealistic Style Transfer via Diffusion Process. Mujing Li, Guanjie Wang, Xingguang Zhang, Qifeng Liao, Chenxi Xiao
2025	D2FP: Learning Implicit Prior for Human Parsing. Junyoung Hong, Hyeri Yang, Ye Ju Kim, Haerim Kim, Shinwoong Kim, Euna Shim, Kyungjae Lee
2025	DARDA: Domain-Aware Real-Time Dynamic Neural Network Adaptation. Shahriar Rifat, Jonathan D. Ashdown, Francesco Restuccia
2025	DASC-SPT: Towards Self-Supervised Panoramic Semantic Segmentation. Tianlong Tan, Bin Chen, Hongliang Cao, Chenggang Yan, Yike Ma, Feng Dai
2025	DDPM-CD: Denoising Diffusion Probabilistic Models as Feature Extractors for Remote Sensing Change Detection. Wele Gedara Chaminda Bandara, Nithin Gopalakrishnan Nair, Vishal M. Patel
2025	DDS: Decoupled Dynamic Scene-Graph Generation Network. A S. M. Iftekhar, Raphael Ruschel, Satish Kumar, Suya You, B. S. Manjunath
2025	DLCR: A Generative Data Expansion Framework via Diffusion for Clothes-Changing Person Re-Id. Nyle Siddiqui, Florinel-Alin Croitoru, Gaurav Kumar Nayak, Radu Tudor Ionescu, Mubarak Shah
2025	DMPT: Decoupled Modality-Aware Prompt Tuning for Multi-Modal Object Re-Identification. Minghui Lin, Shu Wang, Xiang Wang, Jianhua Tang, Longbin Fu, Zhengrong Zuo, Nong Sang
2025	DMRN: A Dynamical Multi-Order Response Network for the Robust Lung Airway Segmentation. Sheng Zhang, Jinge Wu, Junzhi Ning, Guang Yang
2025	DN-Splatter: Depth and Normal Priors for Gaussian Splatting and Meshing. Matias Turkulainen, Xuqian Ren, Iaroslav Melekhov, Otto Seiskari, Esa Rahtu, Juho Kannala
2025	DPA: Dual Prototypes Alignment for Unsupervised Adaptation of Vision-Language Models. Eman Ali, Sathira Silva, Muhammad Haris Khan
2025	DSTR: Dual Scenes Transformer for Cross-Modal Fusion in 3D Object Detection. Haojie Cai, Dongfu Yin, Fei Richard Yu, Siting Xiong
2025	DT-LSD: Deformable Transformer-Based Line Segment Detection. Sebastian Janampa, Marios Pattichis
2025	DTA: Dual Temporal-channel-wise Attention for Spiking Neural Networks. Minje Kim, Minjun Kim, Xu Yang
2025	Dam: Dynamic Adapter Merging for Continual Video QA Learning. Feng Cheng, Ziyang Wang, Yi-Lin Sung, Yan-Bo Lin, Mohit Bansal, Gedas Bertasius
2025	Dance any Beat: Blending Beats with Visuals in Dance Video Generation. Xuanchen Wang, Heng Wang, Dongnan Liu, Weidong Cai
2025	DarSwin-Unet: Distortion Aware Architecture. Akshaya Athwale, Ichrak Shili, Émile Bergeron, Ola Ahmad, Jean-François Lalonde
2025	DashCop: Automated E-Ticket Generation for Two-Wheeler Traffic Violations Using Dashcam Videos. Deepti Rawat, Keshav Gupta, Aryamaan Basu Roy, Ravi Kiran Sarvadevabhatla
2025	Data Augmentation for Image Classification Using Generative AI. Fazle Rahat, M. Shifat Hossain, Md Rubel Ahmed, Sumit Kumar Jha, Rickard Ewetz
2025	Data Augmentation for Surgical Scene Segmentation with Anatomy-Aware Diffusion Models. Danush Kumar Venkatesh, Dominik Rivoir, Micha Pfeiffer, Fiona R. Kolbinger, Stefanie Speidel
2025	Data Generation for Hardware-Friendly Post-Training Quantization. Lior Dikstein, Ariel Lapid, Arnon Netzer, Hai Victor Habi
2025	Data-Efficient 3D Visual Grounding via Order-Aware Referring. Tung-Yu Wu, Sheng-Yu Huang, Yu-Chiang Frank Wang
2025	Data-Efficient Alignment in Medical Imaging via Reconfigurable Generative Networks. Divya Saxena, Jiannong Cao, Jiahao Xu, Tarun Kulshrestha
2025	Dataset Augmentation by Mixing Visual Concepts. Abdullah Al Rahat, Hemanth Venkateswara
2025	DeCLIP: Decoding CLIP Representations for Deepfake Localization. Stefan Smeu, Elisabeta Oneata, Dan Oneata
2025	Debiasify: Self-Distillation for Unsupervised Bias Mitigation. Nourhan Bayasi, Jamil Fayyad, Ghassan Hamarneh, Rafeef Garbi, Homayoun Najjaran
2025	Deciphering the Complaint Aspects: Towards an Aspect-Based Complaint Identification Model with Video Complaint Dataset in Finance. Sarmistha Das, Basha Mujavarsheik, R. E. Zera Lyngkhoi, Sriparna Saha, Alka Maurya
2025	Decomposed Distribution Matching in Dataset Condensation. Sahar Rahimi Malakshan, Mohammad Saeed Ebrahimi Saadabadi, Ali Dabouei, Nasser M. Nasrabadi
2025	Decoupled PROB: Decoupled Query Initialization Tasks and Objectness-Class Learning for Open World Object Detection. Riku Inoue, Masamitsu Tsuchiya, Yuji Yasui
2025	Deduce and Select Evidences with Language Models for Training-Free Video Goal Inference. Ee Yeo Keat, Hao Zhang, Alexander Matyasko, Basura Fernando
2025	Deep Geometric Moments Promote Shape Consistency in Text-to-3D Generation. Utkarsh Nath, Rajeev Goel, Eun Som Jeon, Changhoon Kim, Kyle Min, Yezhou Yang, Yingzhen Yang, Pavan K. Turaga
2025	Deep Joint Unrolling for Deblurring and Low-Light Image Enhancement (JUDE). Tu Vo, Chan Y. Park
2025	Deep Metric Learning for Unsupervised Remote Sensing Change Detection. Wele Gedara Chaminda Bandara, Vishal M. Patel
2025	DeepCA: Deep Learning-Based 3D Coronary Artery Tree Reconstruction from Two 2D Non-Simultaneous X-Ray Angiography Projections. Yiying Wang, Abhirup Banerjee, Robin P. Choudhury, Vicente Grau
2025	DeepMIM: Deep Supervision for Masked Image Modeling. Sucheng Ren, Fangyun Wei, Samuel Albanie, Zheng Zhang, Han Hu
2025	Defending Against Repetitive Backdoor Attacks on Semi-Supervised Learning Through Lens of Rate-Distortion-Perception Trade-Off. Cheng-Yi Lee, Ching-Chia Kao, Cheng-Han Yeh, Chun-Shien Lu, Chia-Mu Yu, Chu-Song Chen
2025	Delta-NAS: Difference of Architecture Encoding for Predictor-Based Evolutionary Neural Architecture Search. Arjun Sridhar, Yiran Chen
2025	Denoising Diffusion Models for High-Resolution Microscopy Image Restoration. Pamela Osuna-Vargas, Maren H. Wehrheim, Lucas Zinz, Johanna V. Rahm, Ashwin Balakrishnan, Alexandra Kaminer, Mike Heilemann, Matthias Kaschube
2025	Dense Depth from Event Focal Stack. Kenta Horikawa, Mariko Isogawa, Hideo Saito, Shohei Mori
2025	Dense Scene Reconstruction from Light-Field Images Affected by Rolling Shutter. Hermes McGriff, Renato Martins, Nicolas Andreff, Cédric Demonceaux
2025	DepthSSC: Monocular 3D Semantic Scene Completion via Depth-Spatial Alignment and Voxel Adaptation. Jiawei Yao, Jusheng Zhang, Xiaochao Pan, Tong Wu, Canran Xiao
2025	Dequantization and Color Transfer with Diffusion Models. Vaibhav Vavilala, Faaris Shaik, David A. Forsyth
2025	Design Principles of Multi-Scale J-Invariant Networks for Self-Supervised Image Denoising. Hayeong Yu, Seungjae Han, Young-Gyu Yoon
2025	Design-O-Meter: Towards Evaluating and Refining Graphic Designs. Sahil Goyal, Abhinav Mahajan, Swasti Mishra, Prateksha Udhayanan, Tripti Shukla, K. J. Joseph, Balaji Vasan Srinivasan
2025	Detecting Origin Attribution for Text-to-Image Diffusion Models. Katherine Xu, Lingzhi Zhang, Jianbo Shi
2025	Detecting Wildfires on UAVs with Real-Time Segmentation Trained by Larger Teacher Models. Julius Pesonen, Teemu Hakala, Väinö Karjalainen, Niko Koivumäki, Lauri Markelin, Anna-Maria Raita-Hakola, Juha Suomalainen, Ilkka Pölönen, Eija Honkavaara
2025	Detective Networks: Enhancing Disaster Recognition in Images Through Attention Shifting Using Optimal Masking. Narongthat Thanyawet, Photchara Ratsamee, Yuki Uranishi, Haruo Takemura
2025	DiHuR: Diffusion-Guided Generalizable Human Reconstruction. Jinnan Chen, Chen Li, Gim Hee Lee
2025	DiL: An Explainable and Practical Metric for Abnormal Uncertainty in Object Detection. Amit Giloni, Omer Hofman, Ikuya Morikawa, Toshiya Shimizu, Yuval Elovici, Asaf Shabtai
2025	DiTAS: Quantizing Diffusion Transformers via Enhanced Activation Smoothing. Zhenyuan Dong, Sai Qian Zhang
2025	DiaMond: Dementia Diagnosis with Multi-Modal Vision Transformers Using MRI and PET. Yitong Li, Morteza Ghahremani, Youssef Wally, Christian Wachinger
2025	DiffMesh: A Motion-Aware Diffusion Framework for Human Mesh Recovery from Videos. Ce Zheng, Xianpeng Liu, Qucheng Peng, Tianfu Wu, Pu Wang, Chen Chen
2025	DiffPAD: Denoising Diffusion-Based Adversarial Patch Decontamination. Jia Fu, Xiao Zhang, Sepideh Pashami, Fatemeh Rahimian, Anders Holst
2025	DiffQRCoder: Diffusion-Based Aesthetic QR Code Generation with Scanning Robustness Guided Iterative Refinement. Jia-Wei Liao, Winston Wang, Tzu-Sian Wang, Li-Xuan Peng, Ju-Hsuan Weng, Cheng-Fu Chou, Jun-Cheng Chen
2025	Differential Privacy Mechanisms in Neural Tangent Kernel Regression. Jiuxiang Gu, Yingyu Liang, Zhizhou Sha, Zhenmei Shi, Zhao Song
2025	Differentially Private Integrated Decision Gradients (IDG-DP) for Radar-Based Human Activity Recognition. Idris Zakariyya, Linda Tran, Kaushik Bhargav Sivangi, Paul Henderson, Fani Deligianni
2025	Difficulty, Diversity, and Plausibility: Dynamic Data-Free Quantization. Cheeun Hong, Sungyong Baik, Junghun Oh, Kyoung Mu Lee
2025	DiffuCE: Expert-Level CBCT Image Enhancement Using a Novel Conditional Denoising Diffusion Model with Latent Alignment. Fang-Yi Su, Tzu-Hung Chang, Jung-Hsien Chiang
2025	DiffuPT: Class Imbalance Mitigation for Glaucoma Detection via Diffusion Based Generation and Model Pretraining. Youssof Nawar, Nouran Soliman, Moustafa Wassel, Mohamed ElHabebe, Noha Adly, Marwan Torki, Ahmed Elmassry, Islam Ahmed
2025	DiffuseKronA: A Parameter Efficient Fine-tuning Method for Personalized Diffusion Models. Shyam Marjit, Harshit Singh, Nityanand Mathur, Sayak Paul, Chia-Mu Yu, Pin-Yu Chen
2025	Diffusion Model Guided Sampling with Pixel-Wise Aleatoric Uncertainty Estimation. Michele De Vita, Vasileios Belagiannis
2025	Diffusion-Based Conditional Image Editing Through Optimized Inference with Guidance. Hyunsoo Lee, Minsoo Kang, Bohyung Han
2025	Diffusion-Based Generative Regularization for Supervised Discriminative Learning. Takuya Asakura, Nakamasa Inoue, Koichi Shinoda
2025	Diffusion-Based Particle-DETR for BEV Perception. Asen Nachkov, Danda Pani Paudel, Martin Danelljan, Luc Van Gool
2025	Diffusion-based Visual Anagram as Multi-task Learning. Zhiyuan Xu, Yinhe Chen, Huan-ang Gao, Weiyan Zhao, Guiyu Zhang, Hao Zhao
2025	DisCo: Discovering Common Affordance from Large Models for Actionable Part Perception. Youpeng Wen, Yi Zhu, Zhihao Zhan, Pengzhen Ren, Jianhua Han, Hang Xu, Shen Zhao, Xiaodan Liang
2025	DisFlowEm : One-Shot Emotional Talking Head Generation Using Disentangled Pose and Expression Flow-Guidance. Sanjana Sinha, Brojeshwar Bhowmick, Lokender Tiwari, Sushovan Chanda
2025	Discriminative Score Suppression for Weakly Supervised Video Anomaly Detection. Chen Xu, Chunguo Li, Hongjie Xing
2025	Disentangle Source and Target Knowledge for Continual Test-Time Adaptation. Tianyi Ma, Maoying Qiao
2025	Disentangling Disentangled Representations: Towards Improved Latent Units via Diffusion Models. Youngjun Jun, Jiwoo Park, Kyobin Choo, Tae Eun Choi, Seong Jae Hwang
2025	Disentangling Spatio-Temporal Knowledge for Weakly Supervised Object Detection and Segmentation in Surgical Video. Guiqiu Liao, Matjaz Jogan, Sai Koushik, Eric Eaton, Daniel A. Hashimoto
2025	Disentangling Subject-Irrelevant Elements in Personalized Text-to-Image Diffusion via Filtered Self-Distillation. Seunghwan Choi, Jooyeol Yun, Jeonghoon Park, Jaegul Choo
2025	Distillation of Diffusion Features for Semantic Correspondence. Frank Fundel, Johannes Schusterbauer, Vincent Tao Hu, Björn Ommer
2025	Distilling Aggregated Knowledge for Weakly-Supervised Video Anomaly Detection. Jash Dalvi, Ali Dabouei, Gunjan Dhanuka, Min Xu
2025	Distribution Optimization Under Gaussian Hypothesis for Domain Adaptive Semantic Segmentation. Liang Chen, Weihua Chen, Xin Zhao, Junyan Wang, Lijun Cao, Junge Zhang
2025	DivAvatar: Diverse 3D Avatar Generation with a Single Prompt. Weijing Tao, Biwen Lei, Kunhao Liu, Shijian Lu, Miaomiao Cui, Xuansong Xie
2025	Divergent Domains, Convergent Grading: Enhancing Generalization in Diabetic Retinopathy Grading. Sharon Chokuwa, Muhammad Haris Khan
2025	DocMatcher: Document Image Dewarping via Structural and Textual Line Matching. Felix Hertlein, Alexander Naumann, York Sure-Vetter
2025	DocTTT: Test-Time Training for Handwritten Document Recognition Using Meta-Auxiliary Learning. Wenhao Gu, Li Gu, Ziqiang Wang, Ching Yee Suen, Yang Wang
2025	Domain Generalization using Large Pretrained Models with Mixture-of-Adapters. Gyuseong Lee, Wooseok Jang, Jinhyeon Kim, Jaewoo Jung, Seungryong Kim
2025	Domain-Generalized Object Anti-Spoofing: Bridging Gaps and Patch Selection for Robust Detection Across Domains. Geonu Lee, Yonghyun Jeong, Haneol Jang, Youngjoon Yoo
2025	Domain-Guided Weight Modulation for Semi-Supervised Domain Generalization. Chamuditha Jayanga Galappaththige, Zachary Izzo, Xilin He, Honglu Zhou, Muhammad Haris Khan
2025	DrIFT: Autonomous Drone Dataset with Integrated Real and Synthetic Data, Flexible Views, and Transformed Domains. Fardad Dadboud, Hamid Azad, Varun Mehta, Miodrag Bolic, Iraj Mantegh
2025	DragonTrack: Transformer-Enhanced Graphical Multi-Person Tracking in Complex Scenarios. Bishoy Galoaa, Somaieh Amraee, Sarah Ostadabbas
2025	Dragtext: Rethinking Text Embedding in Point-Based Image Editing. Gayoon Choi, Taejin Jeong, Sujung Hong, Seong Jae Hwang
2025	DreaMo: Articulated 3D Reconstruction from a Single Casual Video. Tao Tu, Ming-Feng Li, Chieh Hubert Lin, Yen-Chi Cheng, Min Sun, Ming-Hsuan Yang
2025	DreamBlend: Advancing Personalized Fine-Tuning of Text-to-Image Diffusion Models. Shwetha Ram, Tal Neiman, Qianli Feng, Andrew Stuart, Son Tran, Trishul Chilimbi
2025	Dropout Connects Transformers and CNNs: Transfer General Knowledge for Knowledge Distillation. Bokyeung Lee, Jonghwan Hong, Hyunuk Shin, Bonhwa Ku, Hanseok Ko
2025	Dropout the High-Rate Downsampling: A Novel Design Paradigm for UHD Image Restoration. Chen Wu, Ling Wang, Long Peng, Dianjie Lu, Zhuoran Zheng
2025	Dual-Representation Interaction Driven Image Quality Assessment with Restoration Assistance. Jingtong Yue, Xin Lin, Zijiu Yang, Chao Ren
2025	Dual-Schedule Inversion: Training- and Tuning-Free Inversion for Real Image Editing. Jiancheng Huang, Yi Huang, Jianzhuang Liu, Donghao Zhou, Yifan Liu, Shifeng Chen
2025	DualCIR: Enhancing Training-Free Composed Image Retrieval via Dual-Directional Descriptions. Jingjiao Zhao, Jiaju Li, Dongze Lian, Liguo Sun, Pin Lv
2025	DyRoNet: Dynamic Routing and Low-Rank Adapters for Autonomous Driving Streaming Perception. Xiang Huang, Zhi-Qi Cheng, Jun-Yan He, Chenyang Li, Wangmeng Xiang, Baigui Sun
2025	Dynamic Adapter Tuning for Long-Tailed Class-Incremental Learning. Yanan Gu, Muli Yang, Xu Yang, Kun Wei, Hongyuan Zhu, Gabriel James Goenawan, Cheng Deng
2025	Dynamic Attention-Guided Diffusion for Image Super-Resolution. Brian B. Moser, Stanislav Frolov, Federico Raue, Sebastian Palacio, Andreas Dengel
2025	ECF-YOLOv7-Tiny: Improving Feature Fusion and the Receptive Field for Lightweight Object Detectors. Dan-Sebastian Bacea, Florin Oniga
2025	EDMB: Edge Detector with Mamba. Yachuan Li, Xavier Soria Poma, Yun Bai, Qian Xiao, Chaozhi Yang, Guanlin Li, Zongmin Li
2025	EFFICIENTMORPH: Parameter-Efficient Transformer-Based Architecture for 3D Image Registration. Abu Zahid Bin Aziz, Mokshagna Sai Teja Karanam, Tushar Kataria, Shireen Y. Elhabian
2025	EI-Nexus: Towards Unmediated and Flexible Inter-Modality Local Feature Extraction and Matching for Event-Image Data. Zhonghua Yi, Hao Shi, Qi Jiang, Kailun Yang, Ze Wang, Diyang Gu, Yufan Zhang, Kaiwei Wang
2025	ELBA: Learning by Asking for Embodied Visual Navigation and Task Completion. Ying Shen, Daniel Bis, Cynthia Lu, Ismini Lourentzou
2025	ELMGS: Enhancing Memory and Computation Scalability Through coMpression for 3D Gaussian Splatting. Muhammad Salman Ali, Sung-Ho Bae, Enzo Tartaglione
2025	ENAF: A Multi-Exit Network with an Adaptive Patch Fusion for Large Image Super Resolution. Manh Duong Nguyen, Tuan Nghia Nguyen, Xuan Truong Nguyen
2025	ERM++: An Improved Baseline for Domain Generalization. Piotr Teterwak, Kuniaki Saito, Theodoros Tsiligkaridis, Kate Saenko, Bryan A. Plummer
2025	ERUP-YOLO: Enhancing Object Detection Robustness for Adverse Weather Condition by Unified Image-Adaptive Processing. Yuka Ogino, Yuho Shoji, Takahiro Toizumi, Atsushi Ito
2025	EasyRet3D: Uncalibrated Multi-View Multi-Human 3D Reconstruction and Tracking. Junjie Oscar Yin, Ting Li, Jiahao Wang, Yi Zhang, Alan L. Yuille
2025	EchoDFKD: Data-Free Knowledge Distillation for Cardiac Ultrasound Segmentation Using Synthetic Data. Grégoire Petit, Nathan Palluau, Axel Bauer, Clemens Dlaska
2025	EdgeGaussians - 3D Edge Mapping via Gaussian Splatting. Kunal Chelani, Assia Benbihi, Torsten Sattler, Fredrik Kahl
2025	Effective Backdoor Learning on Open-Set Face Recognition Systems. Diana Voth, Leonidas Dane, Jonas Grebe, Sebastian Peitz, Philipp Terhörst
2025	Effective Scene Graph Generation by Statistical Relation Distillation. Thanh-Son Nguyen, Hong Yang, Basura Fernando
2025	Effective and Efficient Medical Image Segmentation with Hierarchical Context Interaction. Zehua Cheng, Di Yuan, Wenhu Zhang, Thomas Lukasiewicz
2025	Efficient Progressive Image Compression with Variance-Aware Masking. Alberto Presta, Enzo Tartaglione, Attilio Fiandrotti, Marco Grangetto, Pamela C. Cosman
2025	Efficient Video Object Segmentation via Modulated Cross-Attention Memory. Abdelrahman M. Shaker, Syed Talal Wasim, Martin Danelljan, Salman H. Khan, Ming-Hsuan Yang, Fahad Shahbaz Khan
2025	EfficientCrackNet: A Lightweight Model for Crack Segmentation. Abid Hasan Zim, Aquib Iqbal, Zaid Al-Huda, Asad Malik, Minoru Kuribayashi
2025	Ego-VPA: Egocentric Video Understanding with Parameter-Efficient Adaptation. Tz-Ying Wu, Kyle Min, Subarna Tripathi, Nuno Vasconcelos
2025	EgoCast: Forecasting Egocentric Human Pose in the Wild. María Escobar, Juanita Puentes, Cristhian Forigua, Jordi Pont-Tuset, Kevis-Kokitsi Maninis, Pablo Arbeláez
2025	EgoPoints: Advancing Point Tracking for Egocentric Videos. Ahmad Darkhalil, Rhodri Guerrier, Adam W. Harley, Dima Damen
2025	EgoSonics: Generating Synchronized Audio for Silent Egocentric Videos. Aashish Rai, Srinath Sridhar
2025	ElasticLaneNet: An Efficient Geometry-Flexible Lane Detection Framework. Yaxin Feng, Yuan Lan, Luchan Zhang, Yang Xiang
2025	Elemental Composite Prototypical Network: Few-Shot Object Detection on Outdoor 3D Point Cloud Scenes. Arkadipta De, Vartika Sengar, Daksh Thapar, Mahesh Chandran, Manohar Kaul
2025	Elucidating Optimal Reward-Diversity Tradeoffs in Text-to-Image Diffusion Models. Rohit Jena, Ali Taghibakhshi, Sahil Jain, Gerald Shen, Nima Tajbakhsh, Arash Vahdat
2025	Elucidating the Solution Space of Extended Reverse-Time SDE for Diffusion Models. Qinpeng Cui, Xinyi Zhang, Qiqi Bao, Qingmin Liao
2025	EmoVOCA: Speech-Driven Emotional 3D Talking Heads. Federico Nocentini, Claudio Ferrari, Stefano Berretti
2025	Endoscopic Scoring and Localization in Unconstrained Clinical Trial Videos. Jinlin Xiang, Hillol Sarker, Bozhao Qi, Ruisu Zhang, Roger Trullo, Salvatore Badalamenti, Maria Wiekowski, Annie Kruger, Etienne Pochet, Qi Tang, Wei Zhao
2025	Enhancing Embodied Object Detection with Spatial Feature Memory. Nicolas Harvey Chapman, Christopher F. Lehnert, Will N. Browne, Feras Dayoub
2025	Enhancing Image Layout Control with Loss-Guided Diffusion Models. Zakaria Patel, Kirill Serkh
2025	Enhancing Monocular Depth Estimation with Multi-Source Auxiliary Tasks. Alessio Quercia, Erenus Yildiz, Zhuo Cao, Kai Krajsek, Abigail Morrison, Ira Assent, Hanno Scharr
2025	Enhancing Novel Object Detection via Cooperative Foundational Models. Rohit K. Bharadwaj, Muzammal Naseer, Salman Khan, Fahad Shahbaz Khan
2025	Enhancing Predictive Imaging Biomarker Discovery Through Treatment Effect Analysis. Shuhan Xiao, Lukas Klein, Jens Petersen, Philipp Vollmuth, Paul F. Jaeger, Klaus H. Maier-Hein
2025	Enhancing Scene Graph Generation with Hierarchical Relationships and Commonsense Knowledge. Bowen Jiang, Zhijun Zhuang, Shreyas S. Shivakumar, Camillo J. Taylor
2025	Enhancing Skin Disease Diagnosis: Interpretable Visual Concept Discovery with SAM. Xin Hu, Janet Wang, Jihun Hamm, Rie Roselyne Yotsu, Zhengming Ding
2025	Enhancing Vision-Language Few-Shot Adaptation with Negative Learning. Ce Zhang, Simon Stepputtis, Katia P. Sycara, Yaqi Xie
2025	Enhancing Visual Classification Using Comparative Descriptors. Hankyeol Lee, Gawon Seo, Wonseok Choi, Geunyoung Jung, Kyungwoo Song, Jiyoung Jung
2025	Enhancing Zero-Shot Facial Expression Recognition by LLM Knowledge Transfer. Zengqun Zhao, Yu Cao, Shaogang Gong, Ioannis Patras
2025	Enriching Local Patterns with Multi-Token Attention for Broad-Sight Neural Networks. Hankyul Kang, Jongbin Ryu
2025	Epipolar Attention Field Transformers for Bird's Eye View Semantic Segmentation. Christian Witte, Jens Behley, Cyrill Stachniss, Marvin Raaijmakers
2025	Evaluating Sensitivity Consistency of Explanations. Hanxiao Tan
2025	Event-Guided Fusion-Mamba for Context-Aware 3D Human Pose Estimation. Bo Lang, Mooi Choo Chuah
2025	Event-Guided Low-Light Video Semantic Segmentation. Zhen Yao, Mooi Choo Chuah
2025	Event-Guided Video Transformer for End-to-End 3D Human Pose Estimation. Bo Lang, Mooi Choo Chuah
2025	EvoCL: Continual Learning over Evolving Domains. Vishnuprasadh Kumaravelu, P. K. Srijith, Sunil Gupta
2025	Exo2EgoDVC: Dense Video Captioning of Egocentric Procedural Activities Using Web Instructional Videos. Takehiko Ohkawa, Takuma Yagi, Taichi Nishimura, Ryosuke Furuta, Atsushi Hashimoto, Yoshitaka Ushiku, Yoichi Sato
2025	Explicit Guidance for Robust Video Frame Interpolation Against Discontinuous Motions. Jaehyun Park, Nam Ik Cho
2025	Exploiting Inter-Sample Information for Long-Tailed Out-of-Distribution Detection. Nimeshika Udayangani, Hadi M. Dolatabadi, Sarah M. Erfani, Christopher Leckie
2025	Exploiting VLM Localizability and Semantics for Open Vocabulary Action Detection. Wentao Bao, Kai Li, Yuxiao Chen, Deep Patel, Martin Renqiang Min, Yu Kong
2025	Exploring Scalability of Self-Training for Open-Vocabulary Temporal Action Localization. Jeongseok Hyun, Su Ho Han, Hyolim Kang, Joon-Young Lee, Seon Joo Kim
2025	Exploring the Stability Gap in Continual Learning: The Role of the Classification Head. Wojciech Lapacz, Daniel Marczak, Filip Szatkowski, Tomasz Trzcinski
2025	F2FLDM: Latent Diffusion Models with Histopathology Pre-Trained Embeddings for Unpaired Frozen Section to FFPE Translation. Man Minh Ho, Shikha Dubey, Yosep Chong, Beatrice Knudsen, Tolga Tasdizen
2025	F2former: When Fractional Fourier Meets Deep Wiener Deconvolution and Selective Frequency Transformer for Image Deblurring. Subhajit Paul, Sahil Kumawat, Ashutosh Gupta, Deepak Mishra
2025	FAIR-TAT: Improving Model Fairness Using Targeted Adversarial Training. Tejaswini Medi, Steffen Jung, Margret Keuper
2025	FALCON: Fair Face Recognition via Local Optimal Feature Normalization. Rouqaiah Al-Refai, Philipp Hempel, Clara Biagi, Philipp Terhörst
2025	FASTER: A Font-Agnostic Scene Text Editing and Rendering Framework. Alloy Das, Sanket Biswas, Prasun Roy, Subhankar Ghosh, Umapada Pal, Michael Blumenstein, Josep Lladós, Saumik Bhattacharya
2025	FDS: Feedback-Guided Domain Synthesis with Multi-Source Conditional Diffusion Models for Domain Generalization. Ali Bahri, Mehrdad Noori, Gustavo Adolfo Vargas Hakim, Ismail Ben Ayed, Milad Cheraghalikhani, David Osowiechi, Christian Desrosiers, Moslem Yazdanpanah
2025	FLAIR: A Conditional Diffusion Framework with Applications to Face Video Restoration. Zihao Zou, Jiaming Liu, Shirin Shoushtari, Yubo Wang, Ulugbek S. Kamilov
2025	FMD: Comprehensive Data Compression in Medical Domain via Fused Matching Distillation. Juheon Son, Jang-Hwan Choi
2025	FOR: Finetuning for Object Level Open Vocabulary Image Retrieval. Hila Levi, Guy Heller, Dan Levi
2025	FRAUD-Net: Fraud News Detection Using Sample Uncertainty & Domain Aware Generalized Network. Devendra Patel, Vikas Verma, Shreyas Kumar Tah, Shwetabh Biswas, Soma Biswas
2025	FT2TF: First-Person Statement Text-to-Talking Face Generation. Xingjian Diao, Ming Cheng, Wayner Barrios, SouYoung Jin
2025	FUN-AD: Fully Unsupervised Learning for Anomaly Detection with Noisy Training Data. Jiin Im, Yongho Son, Je Hyeong Hong
2025	FaVoR: Features via Voxel Rendering for Camera Relocalization. Vincenzo Polizzi, Marco Cannici, Davide Scaramuzza, Jonathan Kelly
2025	Face Anonymization Made Simple. Han-Wei Kung, Tuomas Varanka, Sanjay Saha, Terence Sim, Nicu Sebe
2025	Facial Expression Recognition with Controlled Privacy Preservation and Feature Compensation. Feng Xu, David Ahmedt-Aristizabal, Lars Petersson, Dadong Wang, Xun Li
2025	Fair Domain Generalization with Heterogeneous Sensitive Attributes Across Domains. Ragja Palakkadavath, Hung Le, Thanh Nguyen-Tang, Sunil Gupta, Svetha Venkatesh
2025	Fairer Analysis and Demographically Balanced Face Generation for Fairer Face Verification. Alexandre Fournier-Montgieux, Michaël Soumm, Adrian Popescu, Bertrand Luvison, Hervé Le Borgne
2025	FastVideoEdit: Leveraging Consistency Models for Efficient Text-to-Video Editing. Youyuan Zhang, Xuan Ju, James J. Clark
2025	Feasibility of Federated Learning from Client Databases with Different Brain Diseases and MRI Modalities. Felix Wagner, Wentian Xu, Pramit Saha, Ziyun Liang, Daniel Whitehouse, David K. Menon, Virginia F. J. Newcombe, Natalie Voets, J. Alison Noble, Konstantinos Kamnitsas
2025	Feature Augmentation Based Test-Time Adaptation. Younggeol Cho, Youngrae Kim, Junho Yoon, Seunghoon Hong, Dongman Lee
2025	Feature Design for Bridging SAM and CLIP Toward Referring Image Segmentation. Koichiro Ito
2025	Feature Fusion Transferability Aware Transformer for Unsupervised Domain Adaptation. Xiaowei Yu, Zhe Huang, Zao Zhang
2025	Feature Space Perturbation: A Panacea to Enhanced Transferability Estimation. Prafful Kumar Khoba, Zijian Wang, Chetan Arora, Mahsa Baktashmotlagh
2025	Feature-Level and Spatial-Level Activation Expansion for Weakly-Supervised Semantic Segmentation. Junsu Choi, Jin-Seop Lee, Noo-Ri Kim, SuHyun Yoon, Jee-Hyong Lee
2025	Federated Source-Free Domain Adaptation for Classification: Weighted Cluster Aggregation for Unlabeled Data. Junki Mori, Kosuke Kihara, Taiki Miyagawa, Akinori F. Ebihara, Isamu Teranishi, Hisashi Kashima
2025	Federated Voxel Scene Graph for Intracranial Hemorrhage. Antoine P. Sanner, Jonathan Stieber, Nils F. Grauhan, Suam Kim, Marc A. Brockmann, Ahmed E. Othman, Anirban Mukhopadhyay
2025	Federated-Continual Dynamic Segmentation of Histopathology Guided by Barlow Continuity. Niklas Babendererde, Haozhe Zhu, Moritz Fuchs, Jonathan Stieber, Anirban Mukhopadhyay
2025	Few-shot Structure-Informed Machinery Part Segmentation with Foundation Models and Graph Neural Networks. Michael Schwingshackl, Fabio Francisco Oberweger, Markus Murschitz
2025	Finding Dino: A Plug-and-Play Framework for Zero-Shot Detection of Out-of-Distribution Objects Using Prototypes. Poulami Sinhamahapatra, Franziska Schwaiger, Shirsha Bose, Huiyu Wang, Karsten Roscher, Stephan Günnemann
2025	Fine-Grained Spatial and Verbal Losses for 3D Visual Grounding. Sombit Dey, Ozan Unal, Christos Sakaridis, Luc Van Gool
2025	Fine-Tuning Image-Conditional Diffusion Models is Easier than you Think. Gonzalo Martin Garcia, Karim Abou Zeid, Christian Schmidt, Daan de Geus, Alexander Hermans, Bastian Leibe
2025	Fine-grained Controllable Video Generation via Object Appearance and Context. Hsin-Ping Huang, Yu-Chuan Su, Deqing Sun, Lu Jiang, Xuhui Jia, Yukun Zhu, Ming-Hsuan Yang
2025	FineControlNet: Fine-level Text Control for Image Generation with Spatially Aligned Text Control Injection. Hongsuk Choi, Isaac Kasahara, Selim Engin, Moritz A. Graule, Nikhil Chavan Dafle, Volkan Isler
2025	FitDiff: Robust Monocular 3D Facial Shape and Reflectance Estimation using Diffusion Models. Stathis Galanakis, Alexandros Lattas, Stylianos Moschoglou, Stefanos Zafeiriou
2025	FlashMix: Fast Map-Free LiDAR Localization via Feature Mixing and Contrastive-Constrained Accelerated Training. Raktim Gautam Goswami, Naman Patel, Prashanth Krishnamurthy, Farshad Khorrami
2025	FlashVTG: Feature Layering and Adaptive Score Handling Network for Video Temporal Grounding. Zhuo Cao, Bingqing Zhang, Heming Du, Xin Yu, Xue Li, Sen Wang
2025	Flatness Improves Backbone Generalisation in Few-Shot Classification. Rui Li, Martin Trapp, Marcus Klasson, Arno Solin
2025	Flowering Time Prediction of Wheat From DIA-MS Data. Yan Yang, Utpal Bose, James Broadbent, Sally Stockwell, Keren Byrne, Md. Zakir Hossain, Eric A. Stone, Shannon Dillon
2025	FluoNeRF: Fluorescent Novel-View Synthesis Under Novel Light Source Colors. Lin Shi, Kengo Matsufuji, Ryo Kawahara, Takahiro Okabe
2025	Focusing on what to Decode and what to Train: SOV Decoding with Specific Target Guided DeNoising and Vision Language Advisor. Junwen Chen, Yingcheng Wang, Keiji Yanai
2025	Forensic Iris Image-Based Post-Mortem Interval Estimation. Rasel Ahmed Bhuiyan, Adam Czajka
2025	Foundation Models and Adaptive Feature Selection: A Synergistic Approach to Video Question Answering. Sai Bhargav Rongali, Mohamad Hassan N C, Ankit Jha, Neha Bhargava, Saurabh Prasad, Biplab Banerjee
2025	Foundation X: Integrating Classification, Localization, and Segmentation Through Lock-Release Pretraining Strategy for Chest X-Ray Analysis. Nahid Ul Islam, Dongao Ma, Jiaxuan Pang, Shivasakthi Senthil Velan, Michael B. Gotway, Jianming Liang
2025	Frame by Familiar Frame: Understanding Replication in Video Diffusion Models. Aimon Rahman, Malsha V. Perera, Vishal M. Patel
2025	Frequency-Domain Refinement of Vision Transformers for Robust Medical Image Segmentation Under Degradation. Sanaz Karimijafarbigloo, Sina Ghorbani Kolahi, Reza Azad, Ulas Bagci, Dorit Merhof
2025	From Visual Explanations to Counterfactual Explanations with Latent Diffusion. Tung Luu, Nam Le, Duc Le, Bac Le
2025	GANESH: Generalizable NeRF for Lensless Imaging. Rakesh Raj Madavan, Akshat Kaimal, Badhrinarayanan K. V, Vinayak Gupta, Rohit Choudhary, Chandrakala Shanmuganathan, Kaushik Mitra
2025	GANFusion: Feed-Forward Text-to-3D with Diffusion in GAN Space. Souhaib Attaiki, Paul Guerrero, Duygu Ceylan, Niloy J. Mitra, Maks Ovsjanikov
2025	GAUDA: Generative Adaptive Uncertainty-Guided Diffusion-Based Augmentation for Surgical Segmentation. Yannik Frisch, Christina Bornberg, Moritz Fuchs, Anirban Mukhopadhyay
2025	GET-UP: GEomeTric-aware Depth Estimation with Radar Points UPsampling. Huawei Sun, Zixu Wang, Hao Feng, Julius Ott, Lorenzo Servadei, Robert Wille
2025	GEXIA: Granularity Expansion and Iterative Approximation for Scalable Multi-Grained Video-Language Learning. Yicheng Wang, Zhikang Zhang, Jue Wang, David Fan, Zhenlin Xu, Linda Liu, Xiang Hao, Vimal Bhat, Xinyu Li
2025	GHOST: Grounded Human Motion Generation with Open Vocabulary Scene-and-Text Contexts. Zoltán Ádám Milacski, Koichiro Niinuma, Ryosuke Kawamura, Fernando De la Torre, László A. Jeni
2025	GMT: Guided Mask Transformer for Leaf Instance Segmentation. Feng Chen, Sotirios A. Tsaftaris, Mario Valerio Giuffrida
2025	GStex: Per-Primitive Texturing of 2D Gaussian Splatting for Decoupled Appearance and Geometry Modeling. Victor Rong, Jingxiang Chen, Sherwin Bahmani, Kiriakos N. Kutulakos, David B. Lindell
2025	GTA-HDR: A Large-Scale Synthetic Dataset for HDR Image Reconstruction. Hrishav Bakul Barua, Kalin Stefanov, KokSheik Wong, Abhinav Dhall, Ganesh Krishnasamy
2025	GaitContour: Efficient Gait Recognition Based on a Contour-Pose Representation. Yuxiang Guo, Anshul Shah, Jiang Liu, Ayush Gupta, Rama Chellappa, Cheng Peng
2025	Gaitcloud: Leveraging Spatial-Temporal Information for Lidar-Base Gait Recognition With a True-3D Gait Representation. Shaoxiong Zhang, Hiromitsu Awano, Takashi Sato
2025	GauFRe: Gaussian Deformation Fields for Real-Time Dynamic Novel View Synthesis. Yiqing Liang, Numair Khan, Zhengqin Li, Thu Nguyen-Phuoc, Douglas Lanman, James Tompkin, Lei Xiao
2025	Gaussian Déjà-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities. Peizhi Yan, Rabab Ward, Qiang Tang, Shan Du
2025	GaussianBeV: 3D Gaussian Representation meets Perception Models for BeV Segmentation. Florian Chabot, Nicolas Granger, Guillaume Lapouge
2025	GazeSearch: Radiology Findings Search Benchmark. Trong-Thang Pham, Tien-Phat Nguyen, Yuki Ikebe, Akash Awasthi, Zhigang Deng, Carol C. Wu, Hien Nguyen, Ngan Le
2025	Generalist YOLO: Towards Real-Time End-to-End Multi-Task Visual Language Models. Hung-Shuo Chang, Chien-Yao Wang, Richard Robert Wang, Gene Chou, Hong-Yuan Mark Liao
2025	Generalizable Single-Source Cross-Modality Medical Image Segmentation via Invariant Causal Mechanisms. Boqi Chen, Yuanzhi Zhu, Yunke Ao, Sebastiano Caprara, Reto Sutter, Gunnar Rätsch, Ender Konukoglu, Anna Susmelj
2025	Generalizable Single-View Object Pose Estimation by Two-Side Generating and Matching. Yujing Sun, Caiyi Sun, Yuan Liu, Yuexin Ma, Siu Ming Yiu
2025	GeneralizeFormer: Layer-Adaptive Model Generation Across Test-Time Distribution Shifts. Sameer Ambekar, Zehao Xiao, Xiantong Zhen, Cees G. M. Snoek
2025	Generating Long-Take Videos via Effective Keyframes and Guidance. Hsin-Ping Huang, Yu-Chuan Su, Ming-Hsuan Yang
2025	Generating Visual Explanations from Deep Networks Using Implicit Neural Representations. Michal Byra, Henrik Skibbe
2025	Generation of Complex 3D Human Motion by Temporal and Spatial Composition of Diffusion Models. Lorenzo Mandelli, Stefano Berretti
2025	Generative Model-Based Fusion for Improved Few-Shot Semantic Segmentation of Infrared Images. Junno Yun, Mehmet Akçakaya
2025	GeoDiffuser: Geometry-Based Image Editing with Diffusion Models. Rahul Sajnani, Jeroen van Baar, Jie Min, Kapil Katyal, Srinath Sridhar
2025	GeoGuide: Geometric Guidance of Diffusion Models. Mateusz Poleski, Jacek Tabor, Przemyslaw Spurek
2025	GeoPos: A Minimal Positional Encoding for Enhanced Fine-Grained Details in Image Synthesis Using Convolutional Neural Networks. Mehran Hosseini, Peyman Hosseini
2025	Geometry-Aware Deep Learning for 3D Skeleton-Based Motion Prediction. Mayssa Zaier, Hazem Wannous, Hassen Drira
2025	Global-Guided Focal Neural Radiance Field for Large-Scale Scene Rendering. Mingqi Shao, Feng Xiong, Hang Zhang, Shuang Yang, Mu Xu, Wei Bian, Xueqian Wang
2025	GlobalDoc: A Cross-Modal Vision-Language Framework for Real-World Document Image Retrieval and Classification. Souhail Bakkali, Sanket Biswas, Zuheng Ming, Mickaël Coustaty, Marçal Rusiñol, Oriol Ramos Terrades, Josep Lladós
2025	Good Seed Makes a Good Crop: Discovering Secret Seeds in Text-to-Image Diffusion Models. Katherine Xu, Lingzhi Zhang, Jianbo Shi
2025	Graph-Jigsaw Conditioned Diffusion Model for Skeleton-Based Video Anomaly Detection. Ali Karami, Thi Kieu Khanh Ho, Narges Armanfard
2025	GroundingMate: Aiding Object Grounding for Goal-Oriented Vision-and-Language Navigation. Qianyi Liu, Siqi Zhang, Yanyuan Qiao, Junyou Zhu, Xiang Li, Longteng Guo, Qunbo Wang, Xingjian He, Qi Wu, Jing Liu
2025	Guardian of the Ensembles: Introducing Pairwise Adversarially Robust Loss for Resisting Adversarial Attacks in DNN Ensembles. Shubhi Shukla, Subhadeep Dalui, Manaar Alam, Shubhajit Datta, Arijit Mondal, Debdeep Mukhopadhyay, Partha Pratim Chakrabarti
2025	Guess Future Anomalies from Normalcy: Forecasting Abnormal Behavior in Real-World Videos. Snehashis Majhi, Mohammed Guermal, Antitza Dantcheva, Quan Kong, Lorenzo Garattoni, Gianpiero Francesca, François Brémond
2025	HDPNet: Hourglass Vision Transformer with Dual-Path Feature Pyramid for Camouflaged Object Detection. Jinpeng He, Biyuan Liu, Huaixin Chen
2025	HEX: Hierarchical Emergence Exploitation in Self-Supervised Algorithms. Kiran Kokilepersaud, Seulgi Kim, Mohit Prabhushankar, Ghassan AlRegib
2025	HOPE: A Memory-Based and Composition-Aware Framework for Zero-Shot Learning with Hopfield Network and Soft Mixture of Experts. Do Huu Dat, Po Yuan Mao, Tien Hoang Nguyen, Wray L. Buntine, Mohammed Bennamoun
2025	HSDA: High-Frequency Shuffle Data Augmentation for Bird's-Eye-View Map Segmentation. Calvin Glisson, Qiuxiao Chen
2025	HandCraft: Anatomically Correct Restoration of Malformed Hands in Diffusion Generated Images. Zhenyue Qin, Yiqun Zhang, Yang Liu, Dylan Campbell
2025	Harmonizing Attention: Training-free Texture-aware Geometry Transfer. Eito Ikuta, Yohan Lee, Akihiro Iohara, Yu Saito, Toshiyuki Tanaka
2025	Hausdorff Distance Matching with Adaptive Query Denoising for Rotated Detection Transformer. Hakjin Lee, Minki Song, Jamyoung Koo, Junghoon Seo
2025	HeightLane: BEV Heightmap Guided 3D Lane Detection. Chaesong Park, Eunbin Seo, Jongwoo Lim
2025	HeightMapNet: Explicit Height Modeling for End-to-End HD Map Learning. Wenzhao Qiu, Shanmin Pang, Hao Zhang, Jianwu Fang, Jianru Xue
2025	Heterogeneous Datasets for Unsupervised Image Anomaly Detection. Juan Pablo Lagos, Haider Ali, Adnan Faroque, Esa Rahtu
2025	HexaGen3D: StableDiffusion is One Step Away from Fast and Diverse Text-to-3D Generation. Antoine Mercier, Ramin Nakhli, Mahesh Reddy, Rajeev Yasarla, Hong Cai, Fatih Porikli, Guillaume Berger
2025	Hierarchical Light Transformer Ensembles for Multimodal Trajectory Forecasting. Adrien Lafage, Mathieu Barbier, Gianni Franchi, David Filliat
2025	High-Fidelity Document Stain Removal via A Large-Scale Real-World Dataset and A Memory-Augmented Transformer. Mingxian Li, Hao Sun, Yingtie Lei, Xiaofeng Zhang, Yihang Dong, Yilin Zhou, Zimeng Li, Xuhang Chen
2025	High-Pass Kernel Prediction for Efficient Video Deblurring. Bo Ji, Angela Yao
2025	Hijacking Vision-and-Language Navigation Agents with Adversarial Environmental Attacks. Zijiao Yang, Xiangxi Shi, Eric Slyman, Stefan Lee
2025	HybridDepth: Robust Metric Depth Fusion by Leveraging Depth from Focus and Single-Image Priors. Ashkan Ganj, Hang Su, Tian Guo
2025	Hyperdimensional Representation for Adaptive Information Association and Memorization. Zhuowen Zou, Prathyush Poduval, Narayan Srinivasa, Mohsen Imani
2025	I Dream My Painting: Connecting MLLMs and Diffusion Models via Prompt Generation for Text-Guided Multi-Mask Inpainting. Nicola Fanelli, Gennaro Vessio, Giovanna Castellano
2025	I Spy with My Little Eye a Minimum Cost Multicut Investigation of Dataset Frames. Katharina Prasse, Isaac Bravo, Stefanie Walter, Margret Keuper
2025	I3D-AE-LSTM: A 2-Stream Autoencoder for Action Quality Assessment Using a Newly Created Cricket Batsman Video Dataset. Tevin Moodley, Dustin van der Haar
2025	IEEE/CVF Winter Conference on Applications of Computer Vision, WACV 2025, Tucson, AZ, USA, February 26 - March 6, 2025
2025	IRIS-VIS: A New Dataset for Visibility Estimation in an Industrial Environment. Flavien Armangeon, Thibaud Ehret, Enric Meinhardt-Llopis, Rafael Grompone von Gioi, Guillaume Thibault, Marc Petit, Gabriele Facciolo
2025	Identify Backdoored Model in Federated Learning via Individual Unlearning. Jiahao Xu, Zikai Zhang, Rui Hu
2025	Identity Curvature Laplace Approximation for Improved Out-of-Distribution Detection. Maksim Zhdanov, Stanislav Dereka, Sergey Kolesnikov
2025	Image Adaptation for Colour Vision Deficient Viewers Using Vision Transformers. Tom Gillooly, Jean-Baptiste Thomas, Jon Yngve Hardeberg, Giuseppe Claudio Guarnera
2025	Image-Caption Encoding for Improving Zero-Shot Generalization. Eric Yang Yu, Christopher Liao, Sathvik Ravi, Theodoros Tsiligkaridis, Brian Kulis
2025	Image-Level Regression for Uncertainty-Aware Retinal Image Segmentation. Trung Dinh Quoc Dang, Huy Hoang Nguyen, Aleksei Tiulpin
2025	Importance-Guided Interpretability and Pruning for Video Transformers in Driver Action Recognition. Raquel Panadero, Dominik Schörkhuber, Margrit Gelautz
2025	Improving Accuracy and Generalization for Efficient Visual Tracking. Ram J. Zaveri, Shivang Patel, Yu Gu, Gianfranco Doretto
2025	Improving Conditional Diffusion Models through Re-Noising from Unconditional Diffusion Priors. Kangfu Mei, Nithin Gopalakrishnan Nair, Vishal M. Patel
2025	Improving Deep Detector Robustness via Detection-Related Discriminant Maximization and Reorganization. Jung Im Choi, Qizhen Lan, Qing Tian
2025	Improving Detail in Pluralistic Image Inpainting with Feature Dequantization. Kyungri Park, Woohwan Jung
2025	Improving Faithfulness of Text-to-Image Diffusion Models through Inference Intervention. Danfeng Guo, Sanchit Agarwal, Yu-Hsiang Lin, Jiun-Yu Kao, Tagyoung Chung, Nanyun Peng, Mohit Bansal
2025	Improving Pelvic MR-CT Image Alignment with Self-Supervised Reference-Augmented Pseudo-CT Generation Framework. Daniel Kim, Mohammed A. Al-masni, Jaehun Lee, Dong-Hyun Kim, Kanghyun Ryu
2025	Improving Shift Invariance in Convolutional Neural Networks with Translation Invariant Polyphase Sampling. Sourajit Saha, Tejas Gokhale
2025	Improving Uncertainty Estimation with Confidence-Aware Training Data. Sergey Korchagin, Ekaterina Zaychenkova, Aleksei Khalin, Aleksandr Yugay, Alexey Zaytsev, Egor I. Ershov
2025	Improving Zero-Shot Object-Level Change Detection by Incorporating Visual Correspondence. Hung Huy Nguyen, Pooyan Rahmanzadehgervi, Long Mai, Anh Totti Nguyen
2025	InDistill: Information flow-preserving knowledge distillation for model compression. Ioannis Sarridis, Christos Koutlis, Giorgos Kordopatis-Zilos, Ioannis Kompatsiaris, Symeon Papadopoulos
2025	Incorporating Task Progress Knowledge for Subgoal Generation in Robotic Manipulation through Image Edits. Xuhui Kang, Yen-Ling Kuo
2025	Infant Action Generative Modeling. Xiaofei Huang, Elaheh Hatamimajoumerd, Amal Mathew, Sarah Ostadabbas
2025	Inferring Past Human Actions in Homes with Abductive Reasoning. Clement Tan, Chai Kiat Yeo, Cheston Tan, Basura Fernando
2025	Information Extraction from Heterogeneous Documents Without Ground Truth Labels Using Synthetic Label Generation and Knowledge Distillation. Aniket Bhattacharyya, Anurag Tripathi
2025	Information Theoretic Pruning of Coupled Channels in Deep Neural Networks. Peyman Rostami, Nilotpal Sinha, Nidhal Eddine Chenni, Anis Kacem, Abd El Rahman Shabayek, Carl Shneider, Djamila Aouada
2025	Instance-Warp: Saliency Guided Image Warping for Unsupervised Domain Adaptation. Shen Zheng, Anurag Ghosh, Srinivasa G. Narasimhan
2025	Instructive3D: Editing Large Reconstruction Models with Text Instructions. Kunal Kathare, Ankit Dhiman, Vikas K. Gowda, Siddharth Aravindan, Shubham Monga, Basavaraja Shanthappa Vandrotti, Lokesh R. Boregowda
2025	Interactive Object Detection for Tiny Objects in Large Remotely Sensed Images. Marvin Burges, Sebastian Zambanini, Robert Sablatnig
2025	Invariant Shape Representation Learning for Image Classification. Tonmoy Hossain, Jing Ma, Jundong Li, Miaomiao Zhang
2025	Inverse Problems with Diffusion Models: A MAP Estimation Perspective. Sai Bharath Chandra Gutha, Ricardo Vinuesa, Hossein Azizpour
2025	Inverting the Generation Process of Denoising Diffusion Implicit Models: Empirical Evaluation and a Novel Method. Yan Zeng, Masanori Suganuma, Takayuki Okatani
2025	Investigating Imaging, Annotation and Self-Supervision for the Classification of Continuously Developing Cells in Histological Whole Slide Images. Sebastian Thiele, Jacqueline Kockwelp, Joachim Wistuba, Sabine Kliesch, Jörg Gromoll, Benjamin Risse
2025	InvisMark: Invisible and Robust Watermarking for AI-generated Image Provenance. Rui Xu, Mengya Hu, Deren Lei, Yaxi Li, David Lowe, Alex Gorevski, Mingyu Wang, Emily Ching, Alex Deng
2025	J-Invariant Volume Shuffle for Self-Supervised Cryo-Electron Tomogram Denoising on Single Noisy Volume. Xiwei Liu, Mohamad Kassab, Min Xu, Qirong Ho
2025	Joint Co-Speech Gesture and Expressive Talking Face Generation Using Diffusion with Adapters. Steven Hogue, Chenxu Zhang, Yapeng Tian, Xiaohu Guo
2025	Just Shift It: Test-Time Prototype Shifting for Zero-Shot Generalization with Vision-Language Models. Elaine Sui, Xiaohan Wang, Serena Yeung-Levy
2025	KDC-MAE: Knowledge Distilled Contrastive Mask Auto-Encoder. Maheswar Bora, Saurabh Atreya, Aritra Mukherjee, Abhijit Das
2025	Knockoff Branch: Model Stealing Attack via Adding Neurons in the Pre-Trained Model. Li-Ying Hung, Cooper Cheng-Yuan Ku
2025	LATTECLIP: Unsupervised CLIP Fine-Tuning via LMM-Synthetic Texts. Anh-Quan Cao, Maximilian Jaritz, Matthieu Guillaumin, Raoul de Charette, Loris Bazzani
2025	LIME: Localized Image Editing via Attention Regularization in Diffusion Models. Enis Simsar, Alessio Tonioni, Yongqin Xian, Thomas Hofmann, Federico Tombari
2025	LIPIDS: Learning-based Illumination Planning In Discretized (Light) Space for Photometric Stereo. Ashish Tiwari, Mihirkumar Sutariya, Shanmuganathan Raman
2025	LLM-Generated Rewrite and Context Modulation for Enhanced Vision Language Models in Digital Pathology. Cagla Deniz Bahadir, Gozde Bozdagi Akar, Mert R. Sabuncu
2025	LLM-RSPF: Large Language Model-Based Robotic System Planning Framework for Domain Specific Use-cases. Chandan Kumar Singh, Devesh Kumar, Vipul Sanap, Rajesh Sinha
2025	LLS: Local Learning Rule for Deep Neural Networks Inspired by Neural Activity Synchronization. Marco Paul E. Apolinario, Arani Roy, Kaushik Roy
2025	LLaVA-SpaceSGG: Visual Instruct Tuning for Open-Vocabulary Scene Graph Generation with Enhanced Spatial Relations. Mingjie Xu, Mengyang Wu, Yuzhi Zhao, Jason Chun Lok Li, Weifeng Ou
2025	LORD: Large Models Based Opposite Reward Design for Autonomous Driving. Xin Ye, Feng Tao, Abhirup Mallik, Burhaneddin Yaman, Liu Ren
2025	LQ-Adapter: ViT-Adapter with Learnable Queries for Gallbladder Cancer Detection from Ultrasound Images. Chetan Madan, Mayuna Gupta, Soumen Basu, Pankaj Gupta, Chetan Arora
2025	Label Calibration in Source Free Domain Adaptation. Shivangi Rai, Rini Smita Thakur, Kunal Jangid, Vinod K. Kurmi
2025	Label Convergence: Defining an Upper Performance Bound in Object Recognition Through Contradictory Annotations. David Tschirschwitz, Volker Rodehorst
2025	Label-Augmented Dataset Distillation. Seoungyoon Kang, Youngsun Lim, Hyunjung Shim
2025	Language-Guided Instance-Aware Domain-Adaptive Panoptic Segmentation. Elham Amin Mansour, Ozan Unal, Suman Saha, Benjamín Béjar, Luc Van Gool
2025	Latency Robust Cooperative Perception Using Asynchronous Feature Fusion. Junjie Wang, Tomas Nordström
2025	Learning Anatomy-Disease Entangled Representation. Fatemeh Haghighi, Michael B. Gotway, Jianming Liang
2025	Learning Deep Illumination-Robust Features from Multispectral Filter Array Images. Anis Amziane
2025	Learning Instance-Specific Parameters of Black-Box Models Using Differentiable Surrogates. Arnisha Khondaker, Nilanjan Ray
2025	Learning Keypoints for Multi-Agent Behavior Analysis using Self-Supervision. Daniel Khalil, Christina Liu, Pietro Perona, Jennifer J. Sun, Markus Marks
2025	Learning Multiple Object States from Actions via Large Language Models. Masatoshi Tateno, Takuma Yagi, Ryosuke Furuta, Yoichi Sato
2025	Learning Semantic Part-Based Graph Structure for 3D Point Cloud Domain Generalization. G. Ujwal Sai, Arkadipta De, Vartika Sengar, Anuj Rathore, Daksh Thapar, Manohar Kaul
2025	Learning Semi-Supervised Medical Image Segmentation from Spatial Registration. Qianying Liu, Paul Henderson, Xiao Gu, Hang Dai, Fani Deligianni
2025	Learning Under Noisy Labels, Spurious Points, and Diverse Structures: TS40K, a 3D Point Cloud Dataset of Rural Terrain and Electrical Transmission Systems. Diogo Lavado, Ricardo Santos, André Coelho, João Santos, Alessandra Micheletti, Cláudia Soares
2025	Learning Unified Distance Metric Across Diverse Data Distributions with Parameter-Efficient Transfer Learning. SungYeon Kim, Donghyun Kim, Suha Kwak
2025	Learning Visual Grounding from Generative Vision and Language Model. Shijie Wang, Dahun Kim, Ali Taalimi, Chen Sun, Weicheng Kuo
2025	Learning Visual-Semantic Hierarchical Attribute Space for Interpretable Open-Set Recognition. Zhuo Xu, Xiang Xiang
2025	Learning the Power of "No": Foundation Models with Negations. Jaisidh Singh, Ishaan Shrivastava, Mayank Vatsa, Richa Singh, Aparna Bharati
2025	Learning to Count from Pseudo-Labeled Segmentation. Jingyi Xu, Hieu Le, Dimitris Samaras
2025	Learning to Identify Seen, Unseen and Unknown in the Open World: A Practical Setting for Zero-Shot Learning. Sethupathy Parameswaran, Yuan Fang, Chandan Gautam, Savitha Ramasamy, Xiaoli Li
2025	Learning to Visually Connect Actions and Their Effects. Paritosh Parmar, Eric Peh, Basura Fernando
2025	Leveraging CLIP Encoder for Multimodal Emotion Recognition. Yehun Song, Sunyoung Cho
2025	Leveraging Vision Language Models for Specialized Agricultural Tasks. Muhammad Arbab Arshad, Talukder Zaki Jubery, Tirtho Roy, Rim Nassiri, Asheesh K. Singh, Arti Singh, Chinmay Hegde, Baskar Ganapathysubramanian, Aditya Balu, Adarsh Krishnamurthy, Soumik Sarkar
2025	LiCamPose: Combining Multi-View LiDAR and RGB Cameras for Robust Single-timestamp 3D Human Pose Estimation. Zhiyu Pan, Zhicheng Zhong, Wenxuan Guo, Yifan Chen, Jianjiang Feng, Jie Zhou
2025	LiGAR: LiDAR-Guided Hierarchical Transformer for Multi-Modal Group Activity Recognition. Naga Venkata Sai Raviteja Chappa, Khoa Luu
2025	LiLMaps: Learnable Implicit Language Maps. Evgenii Kruzhkov, Sven Behnke
2025	Lifting by Gaussians: A Simple, Fast and Flexible Method for 3D Instance Segmentation. Rohan Chacko, Nicolai Häni, Eldar Khaliullin, Lin Sun, Douglas Lee
2025	LoSA: Long-Short-Range Adapter for Scaling End-to-End Temporal Action Localization. Akshita Gupta, Gaurav Mittal, Ahmed Magooda, Ye Yu, Graham W. Taylor, Mei Chen
2025	Local Masked Reconstruction for Efficient Self-Supervised Learning on High-Resolution Images. Jun Chen, Faizan Farooq Khan, Ming Hu, Ammar Sherif, Zongyuan Ge, Boyang Li, Mohamed Elhoseiny
2025	Localized Gaussian Splatting Editing with Contextual Awareness. Hanyuan Xiao, Yingshu Chen, Huajian Huang, Haolin Xiong, Jing Yang, Pratusha Prasad, Yajie Zhao
2025	LogicNet: A Logical Consistency Embedded Face Attribute Learning Network. Haiyu Wu, Sicong Tian, Huayu Li, Kevin W. Bowyer
2025	Long-Term Ad Memorability: Understanding & Generating Memorable Ads. Harini S. I, Somesh Singh, Yaman Kumar Singla, Aanisha Bhattacharyya, Veeky Baths, Changyou Chen, Rajiv Ratn Shah, Balaji Krishnamurthy
2025	Looking at Model Debiasing through the Lens of Anomaly Detection. Vito Paolo Pastore, Massimiliano Ciranni, Davide Marinelli, Francesca Odone, Vittorio Murino
2025	Loose Social-Interaction Recognition in Real-World Therapy Scenarios. Abid Ali, Rui Dai, Ashish Marisetty, Guillaume Astruc, Monique Thonnat, Jean-Marc Odobez, Susanne Thümmler, François Brémond
2025	Low-Frequency Black-Box Backdoor Attack via Evolutionary Algorithm. Yanqi Qiao, Dazhuang Liu, Rui Wang, Kaitai Liang
2025	LowFormer: Hardware Efficient Design for Convolutional Transformer Backbones. Moritz Nottebaum, Matteo Dunnhofer, Christian Micheloni
2025	LumiGauss: Relightable Gaussian Splatting in the Wild. Joanna Kaleta, Kacper Kania, Tomasz Trzcinski, Marek Kowalski
2025	MAGMA: Manifold Regularization for MAEs. Alin Dondera, Anuj Singh, Hadi Jamali Rad
2025	MAISI: Medical AI for Synthetic Imaging. Pengfei Guo, Can Zhao, Dong Yang, Ziyue Xu, Vishwesh Nath, Yucheng Tang, Benjamin Simon, Mason Belue, Stephanie A. Harmon, Baris Turkbey, Daguang Xu
2025	MDCN-PS: Monocular-Depth-Guided Coarse Normal Attention for Robust Photometric Stereo. Masahiro Yamaguchi, Takashi Shibata, Shoji Yachida, Keiko Yokoyama, Toshinori Hosoi
2025	MENTOR: Human Perception-Guided Pretraining for Increased Generalization. Colton R. Crum, Adam Czajka
2025	MFNeRF: Memory Efficient NeRF with Mixed-Feature Hash Table. Yongjae Lee, Li Yang, Deliang Fan
2025	MFTIQ: Multi-Flow Tracker with Independent Matching Quality Estimation. Jonás Serých, Michal Neoral, Jiri Matas
2025	MFTrans: A Multi-Resolution Fusion Transformer for Robust Tumor Segmentation in Whole Slide Images. Sungkyu Yang, Woohyun Park, Kwangil Yim, Mansu Kim
2025	MIP-GAF: A MLLM-Annotated Benchmark for Most Important Person Localization and Group Context Understanding. Surbhi Madan, Shreya Ghosh, Lownish Rai Sookha, M. A. Ganaie, Ramanathan Subramanian, Abhinav Dhall, Tom Gedeon
2025	MLLM-LLaVA-FL: Multimodal Large Language Model Assisted Federated Learning. Jianyi Zhang, Hao Yang, Ang Li, Xin Guo, Pu Wang, Haiming Wang, Yiran Chen, Hai Li
2025	MLLM-Tool: A Multimodal Large Language Model for Tool Agent Learning. Chenyu Wang, Weixin Luo, Sixun Dong, Xiaohua Xuan, Zhengxin Li, Lin Ma, Shenghua Gao
2025	MONAS-ESNN: Multi-Objective Neural Architecture Search for Efficient Spiking Neural Networks. Esmat Ghasemi Saghand, Susana K. Lai-Yuen
2025	MOOSS: Mask-Enhanced Temporal Contrastive Learning for Smooth State Evolution in Visual Reinforcement Learning. Jiarui Sun, M. Ugur Akcal, Girish Chowdhary, Wei Zhang
2025	MRI Reconstruction with Regularized 3D Diffusion Model (R3DM). Arya Bangun, Zhuo Cao, Alessio Quercia, Hanno Scharr, Elisabeth Pfaehler
2025	MS-Glance: Bio-Inspired Non-Semantic Context Vectors and Their Applications in Supervising Image Reconstruction. Ziqi Gao, Wendi Yang, Yujia Li, Lei Xing, S. Kevin Zhou
2025	MSI-NeRF: Linking Omni-Depth with View Synthesis Through Multi-Sphere Image Aided Generalizable Neural Radiance Field. Dongyu Yan, Guanyu Huang, Fengyu Quan, Haoyao Chen
2025	MVAD: A Multiple Visual Artifact Detector for Video Streaming. Chen Feng, Duolikun Danier, Fan Zhang, Alex Mackin, Andrew Collins, David Bull
2025	MVFNet: Multipurpose Video Forensics Network using Multiple Forms of Forensic Evidence. Tai D. Nguyen, Matthew C. Stamm
2025	MVMD: A Multi-View Approach for Enhanced Mirror Detection. Yidan Shen, Yu Wen, Chen Zhang, Xin Fu, Renjie Hu
2025	MagicStick: Controllable Video Editing via Control Handle Transformations. Yue Ma, Xiaodong Cun, Sen Liang, Jinbo Xing, Yingqing He, Chenyang Qi, Siran Chen, Qifeng Chen
2025	Make VLM Recognize Visual Hallucination on Cartoon Character Image with Pose Information. Bumsoo Kim, Wonseop Shin, Kyuchul Lee, Yonghoon Jung, Sanghyun Seo
2025	Make-A-Texture: Fast Shape-Aware Texture Generation in 3 Seconds. Xiaoyu Xiang, Liat Sless Gorelik, Yuchen Fan, Omri Armstrong, Forrest N. Iandola, Yilei Li, Ita Lifshitz, Rakesh Ranjan
2025	Mamba-ST: State Space Model for Efficient Style Transfer. Filippo Botti, Alex Ergasti, Leonardo Rossi, Tomaso Fontanini, Claudio Ferrari, Massimo Bertozzi, Andrea Prati
2025	MambaRecon: MRI Reconstruction with Structured State Space Models. Yilmaz Korkmaz, Vishal M. Patel
2025	MaskVD: Region Masking for Efficient Video Object Detection. Sreetama Sarkar, Gourav Datta, Souvik Kundu, Kai Zheng, Chirayata Bhattacharyya, Peter A. Beerel
2025	MatSpectNet: Material Segmentation Network with Domain-Aware and Physically-Constrained Hyperspectral Reconstruction. Yuwen Heng, Yihong Wu, Srinandan Dasmahapatra, Hansung Kim
2025	McCaD: Multi-Contrast MRI Conditioned, Adaptive Adversarial Diffusion Model for High-Fidelity MRI Synthesis. Sanuwani Dayarathna, Kh Tohidul Islam, Bohan Zhuang, Guang Yang, Jianfei Cai, Meng Law, Zhaolin Chen
2025	MegaFusion: Extend Diffusion Models towards Higher-resolution Image Generation without Further Tuning. Haoning Wu, Shaocheng Shen, Qiang Hu, Xiaoyun Zhang, Ya Zhang, Yanfeng Wang
2025	MemControl: Mitigating Memorization in Diffusion Models via Automated Parameter Selection. Raman Dutt, Ondrej Bohdal, Pedro Sanchez, Sotirios A. Tsaftaris, Timothy M. Hospedales
2025	MemFusionMap: Working Memory Fusion for Online Vectorized HD Map Construction. Jingyu Song, Xudong Chen, Liupei Lu, Jie Li, Katherine A. Skinner
2025	Memory-Efficient Pseudo-Labeling for Online Source-Free Universal Domain Adaptation using a Gaussian Mixture Model. Pascal Schlachter, Simon Wagner, Bin Yang
2025	Memory-efficient Continual Learning with Neural Collapse Contrastive. Trung-Anh Dang, Vincent Nguyen, Ngoc-Son Vu, Christel Vrain
2025	Meta-Learning for Color-to-Infrared Cross-Modal Style Transfer. Evelyn A. Stump, Francesco Luzi, Leslie M. Collins, Jordan M. Malof
2025	MetaVIn: Meteorological and Visual Integration for Atmospheric Turbulence Strength Estimation. Ripon Kumar Saha, Scott McCloskey, Suren Jayasuriya
2025	Metric Compatible Training for Online Backfilling in Large-Scale Retrieval. Seonguk Seo, Mustafa Gökhan Uzunbas, Bohyung Han, Sara Cao, Ser-Nam Lim
2025	MimicGait: A Model Agnostic approach for Occluded Gait Recognition Using Correlational Knowledge Distillation. Ayush Gupta, Rama Chellappa
2025	Mind the Map! Accounting for Existing Maps When Estimating Online HDMaps from Sensors. Rémy Sun, Li Yang, Diane Lingrand, Frédéric Precioso
2025	Mind the Prompt: A Novel Benchmark for Prompt-Based Class-Agnostic Counting. Luca Ciampi, Nicola Messina, Matteo Pierucci, Giuseppe Amato, Marco Avvenuti, Fabrizio Falchi
2025	Missiongnn: Hierarchical Multimodal GNN-Based Weakly Supervised Video Anomaly Recognition with Mission-Specific Knowledge Graph Generation. Sanggeon Yun, Ryozo Masukawa, Minhyoung Na, Mohsen Imani
2025	MixDiff: Mixing Natural and Synthetic Images for Robust Self-Supervised Representations. Reza Akbarian Bafghi, Nidhin Harilal, Claire Monteleoni, Maziar Raissi
2025	Mixed Patch Visible-Infrared Modality Agnostic Object Detection. Heitor Rapela Medeiros, David Latortue, Eric Granger, Marco Pedersoli
2025	Modality-Incremental Learning with Disjoint Relevance Mapping Networks for Image-Based Semantic Segmentation. Niharika Hegde, Shishir Muralidhara, René Schuster, Didier Stricker
2025	Moment of Untruth: Dealing with Negative Queries in Video Moment Retrieval. Kevin Flanagan, Dima Damen, Michael Wray
2025	MonoPP: Metric-Scaled Self-Supervised Monocular Depth Estimation by Planar-Parallax Geometry in Automotive Applications. Gasser Elazab, Torben Gräber, Michael Unterreiner, Olaf Hellwich
2025	Morag - Multi-Fusion Retrieval Augmented Generation for Human Motion. Sai Shashank Kalakonda, Shubh Maheshwari, Ravi Kiran Sarvadevabhatla
2025	MulModSeg: Enhancing Unpaired Multi-Modal Medical Image Segmentation with Modality-Conditioned Text Embedding and Alternating Training. Chengyin Li, Hui Zhu, Rafi Ibn Sultan, Hassan Bagher-Ebadian, Prashant Khanduri, Chetty J. Indrin, Kundan Thind, Dongxiao Zhu
2025	Multi-Aperture Transformers for 3D (MAT3D) Segmentation of Clinical and Microscopic Images. Muhammad Sohaib, Siyavash Shabani, Sahar A. Mohammed, Garrett Winkelmaier, Bahram Parvin
2025	Multi-Class Textual-Inversion Secretly Yields a Semantic-Agnostic Classifier. Kai Wang, Fei Yang, Bogdan Raducanu, Joost van de Weijer
2025	Multi-HexPlanes: A Lightweight Map Representation for Rendering and 3D Reconstruction. Jianhao Zheng, Gábor Valasek, Daniel Barath, Iro Armeni
2025	Multi-Label Continual Learning for the Medical Domain: A Novel Benchmark. Marina Ceccon, Davide Dalle Pezze, Alessandro Fabris, Gian Antonio Susto
2025	Multi-Level Feature Distillation of Joint Teachers Trained on Distinct Image Datasets. Adrian Iordache, Bogdan Alexe, Radu Tudor Ionescu
2025	Multi-Modal Large Language Model with RAG Strategies in Soccer Commentary Generation. Xiang Li, Yangfan He, Shuaishuai Zu, Zhengyang Li, Tianyu Shi, Yiting Xie, Kevin Zhang
2025	Multi-Modal Large Language Models are Effective Vision Learners. Li Sun, Chaitanya Ahuja, Peng Chen, Matt D'Zmura, Kayhan Batmanghelich, Philip Bontrager
2025	Multi-Resolution Guided 3D GANs for Medical Image Translation. Juhyung Ha, Jong Sung Park, David Crandall, Eleftherios Garyfallidis, Xuhong Zhang
2025	Multi-Scale Grouped Prototypes for Interpretable Semantic Segmentation. Hugo Porta, Emanuele Dalsasso, Diego Marcos, Devis Tuia
2025	Multi-Spectral Image Color Reproduction. Jiacheng Li, Chang Chen, Xue Hu, Fenglong Song, Youliang Yan, Zhiwei Xiong
2025	Multi-Surrogate-Teacher Assistance for Representation Alignment in Fingerprint-Based Indoor Localization. Son Minh Nguyen, Tran Duy Linh, Duc Viet Le, Paul J. M. Havinga
2025	Multi-View Factorizing and Disentangling: A Novel Framework for Incomplete Multi-View Multi-Label Classification. Wulin Xie, Lian Zhao, Jiang Long, Xiaohuan Lu, Bingyan Nie
2025	Multi-View Image Diffusion via Coordinate Noise and Fourier Attention. Justin Theiss, Norman Müller, Daeil Kim, Aayush Prakash
2025	Multi-task Learning of Classification and Generation for Set-structured Data. Fumioki Sato, Hideaki Hayashi, Hajime Nagahara
2025	Multimodal Fusion Learning with Dual Attention for Medical Imaging. Joy Dhar, Nayyar Zaidi, Maryam Haghighat, Sudipta Roy, Puneet Goyal, Azadeh Alavi, Vikas Kumar
2025	Multimodal Interpretable Depression Analysis Using Visual, Physiological, Audio and Textual Data. Puneet Kumar, Shreshtha Misra, Zhuhong Shao, Bin Zhu, Balasubramanian Raman, Xiaobai Li
2025	Multispectral Object Detection Enhanced by Cross-Modal Information Complementary and Cosine Similarity Channel Resampling Modules. Junbo Jang, Chanyeong Park, Heegwang Kim, Jiyoon Lee, Joonki Paik
2025	My3DGen: A Scalable Personalized 3D Generative Model. Luchao Qi, Jiaye Wu, Annie N. Wang, Shengze Wang, Roni Sengupta
2025	NAT: Learning to Attack Neurons for Enhanced Adversarial Transferability. Krishna Kanth Nakka, Alexandre Alahi
2025	NCAP: Scene Text Image Super-Resolution with Non-CAtegorical Prior. Dongwoo Park, Suk Pil Ko
2025	NCAdapt: Dynamic Adaptation with Domain-Specific Neural Cellular Automata for Continual Hippocampus Segmentation. Amin Ranem, John Kalkhof, Anirban Mukhopadhyay
2025	NPL-MVPS: Neural Point-Light Multi-View Photometric Stereo. Fotios Logothetis, Ignas Budvytis, Roberto Cipolla
2025	NarrAD: Automatic Generation of Audio Descriptions for Movies with Rich Narrative Context. Jaehyeong Park, Juncheol Ye, Seungkook Lee, Hyun W. Ka, Dongsu Han
2025	Navigating Heterogeneity and Privacy in One-Shot Federated Learning with Diffusion Models. Matías Mendieta, Guangyu Sun, Chen Chen
2025	NeRFs are Mirror Detectors: Using Structural Similarity for Multi-View Mirror Scene Reconstruction with 3D Surface Primitives. Leif Van Holland, Michael Weinmann, Jan U. Müller, Patrick Stotko, Reinhard Klein
2025	Needles & Haystacks: Dataset and Benchmark for Domain-Agnostic Image-Based Rigid Slice-to-Volume Registration. Anton Frolov, Florian Kleiner, Christiane Rößler, Volker Rodehorst
2025	Negative-Prompt Inversion: Fast Image Inversion for Editing with Text-Guided Diffusion Models. Daiki Miyake, Akihiro Iohara, Yu Saito, Toshiyuki Tanaka
2025	Nestedmorph: Enhancing Deformable Medical Image Registration With Nested Attention Mechanisms. Gurucharan Marthi Krishna Kumar, Janine D. Mendola, Amir Shmuel
2025	NeuManifold: Neural Watertight Manifold Reconstruction with Efficient and High-Quality Rendering Support. Xinyue Wei, Fanbo Xiang, Sai Bi, Anpei Chen, Kalyan Sunkavalli, Zexiang Xu, Hao Su
2025	Neural Graph Map: Dense Mapping with Efficient Loop Closure Integration. Leonard Bruns, Jun Zhang, Patric Jensfelt
2025	Neural SDF for Shadow-Aware Unsupervised Structured Light. Kazuto Ichimaru, Diego Thomas, Takafumi Iwaguchi, Hiroshi Kawasaki
2025	NeuroViG - Integrating Event Cameras for Resource-Efficient Video Grounding. Dulanga Weerakoon, Vigneshwaran Subbaraju, Joo Hwee Lim, Archan Misra
2025	No Annotations for Object Detection in Art Through Stable Diffusion. Patrick Ramos, Nicolas Gonthier, Selina Khan, Yuta Nakashima, Noa Garcia
2025	Noise-Aware Evaluation of Object Detectors. Jeffri Murrugarra-Llerena, Cláudio R. Jung
2025	Non-Cross Diffusion for Semantic Consistency. Ziyang Zheng, Ruiyuan Gao, Qiang Xu
2025	Now you see Me: Context-Aware Automatic Audio Description. Seon-Ho Lee, Jue Wang, David Fan, Zhikang Zhang, Linda Liu, Xiang Hao, Vimal Bhat, Xinyu Li
2025	OPTIMUS: Observing Persistent Transformations in Multi-Temporal Unlabeled Satellite-Data. Raymond Yu, Paul Han, Piper Wolters, Favyen Bastani
2025	ORFormer: Occlusion-Robust Transformer for Accurate Facial Landmark Detection. Jui-Che Chiang, Hou-Ning Hu, Bo-Syuan Hou, Chia-Yu Tseng, Yu-Lun Liu, Min-Hung Chen, Yen-Yu Lin
2025	ORID: Organ-Regional Information Driven Framework for Radiology Report Generation. Tiancheng Gu, Kaicheng Yang, Xiang An, Ziyong Feng, Dongnan Liu, Tom Weidong Cai
2025	OT-VP: Optimal Transport-Guided Visual Prompting for Test-Time Adaptation. Yunbei Zhang, Akshay Mehra, Jihun Hamm
2025	OTCXR: Rethinking Self-supervised Alignment using Optimal Transport for Chest X-ray Analysis. Vandan Gorade, Azad Singh, Deepak Mishra
2025	OccFlowNet: Occupancy Estimation via Differentiable Rendering and Occupancy Flow. Simon Boeder, Benjamin Risse
2025	OccLoff: Learning Optimized Feature Fusion for 3D Occupancy Prediction. Ji Zhang, Yiran Ding, Zixin Liu
2025	OmniDiffusion: Reformulating 360 Monocular Depth Estimation Using Semantic and Surface Normal Conditioned Diffusion. Payal Mohadikar, Ye Duan
2025	OmniGS: Fast Radiance Field Reconstruction Using Omnidirectional Gaussian Splatting. Longwei Li, Huajian Huang, Sai-Kit Yeung, Hui Cheng
2025	On Explaining Knowledge Distillation: Measuring and Visualising the Knowledge Transfer Process. Gereziher Adhane, Mohammad Mahdi Dehshibi, Dennis Vetter, David Masip, Gemma Roig
2025	On Neural BRDFs: A Thorough Comparison of State-of-the-Art Approaches. Florian Hofherr, Bjoern Haefner, Daniel Cremers
2025	On Which Data Distribution (Synthetic or Real) We Should Rely for Soft Biometric Classification. Manju R. A, Atul Kumar, Akshay Agarwal
2025	On the Importance of Dual-Space Augmentation for Domain Generalized Object Detection. Hayoung Park, Choongsang Cho, Guisik Kim
2025	On-the-Fly Object-aware Representative Point Selection in Point Cloud. Xiaoyu Zhang, Ziwei Wang, Hai Dong, Zhifeng Bao, Jiajun Liu
2025	One VLM to Keep it Learning: Generation and Balancing for Data-free Continual Visual Question Answering. Deepayan Das, Davide Talon, Massimiliano Mancini, Yiming Wang, Elisa Ricci
2025	Online-LoRA: Task-Free Online Continual Learning via Low Rank Adaptation. Xiwen Wei, Guihong Li, Radu Marculescu
2025	OpenCapBench: A Benchmark to Bridge Pose Estimation and Biomechanics. Yoni Gozlan, Antoine Falisse, Scott D. Uhlrich, Anthony A. Gatti, Michael J. Black, Jennifer L. Hicks, Scott L. Delp, Akshay Chaudhari
2025	OpenCity3D: What do Vision-Language Models Know About Urban Environments? Valentin Bieri, Marco Zamboni, Nicolas S. Blumer, Qingxuan Chen, Francis Engelmann
2025	Optimizing Dense Visual Predictions Through Multi-Task Coherence and Prioritization. Maxime Fontana, Michael W. Spratling, Miaojing Shi
2025	Optimizing Neural Network Effectiveness via Non-monotonicity Refinement. Koushik Biswas, Amit Reza, Meghana Karri, Debesh Jha, Hongyi Pan, Nikhil Kumar Tomar, Aliza Subedi, Smriti Regmi, Ulas Bagci
2025	Optimizing Vision-Language Model for Road Crossing Intention Estimation. Roy Uziel, Oded Bialer
2025	Ordinal Multiple-instance Learning for Ulcerative Colitis Severity Estimation with Selective Aggregated Transformer. Kaito Shiku, Kazuya Nishimura, Daiki Suehiro, Kiyohito Tanaka, Ryoma Bise
2025	Oriented Cell Dataset: A Dataset and Benchmark for Oriented Cell Detection and Applications. Lucas N. Kirsten, Angelo Angonezi, Jose Marques, Fernanda Oliveira, Juliano Faccioni, Camila Cassel, Débora Santos de Sousa, Samlai Vedovatto, Guido Lenz, Cláudio R. Jung
2025	PACA: Perspective-Aware Cross-Attention Representation for Zero-Shot Scene Rearrangement. Shutong Jin, Ruiyu Wang, Kuangyi Chen, Florian T. Pokorny
2025	PC-GZSL: Prior Correction for Generalized Zero Shot Learning. S. Divakar Bhat, Amit More, Mudit Soni, Bhuvan Aggarwal
2025	PETALface: Parameter Efficient Transfer Learning for Low-Resolution Face Recognition. Kartik Narayan, Nithin Gopalakrishnan Nair, Jennifer Xu, Rama Chellappa, Vishal M. Patel
2025	PGRID: Power Grid Reconstruction in Informal Developments Using High-Resolution Aerial Imagery. Simone Fobi Nsutezo, Amrita Gupta, Duncan Kebut, Seema Iyer, Luana Marotti, Rahul Dodhia, Juan M. Lavista Ferres, Anthony Ortiz
2025	PICASSO: A Feed-Forward Framework for Parametric Inference of CAD Sketches via Rendering Self-Supervision. Ahmet Serdar Karadeniz, Dimitrios Mallis, Nesryne Mejri, Kseniya Cherenkova, Anis Kacem, Djamila Aouada
2025	PK-YOLO: Pretrained Knowledge Guided YOLO for Brain Tumor Detection in Multiplanar MRI Slices. Ming Kang, Fung Fung Ting, Raphaël C.-W. Phan, Chee-Ming Ting
2025	PLReMix: Combating Noisy Labels with Pseudo-Label Relaxed Contrastive Representation Learning. Xiaoyu Liu, Beitong Zhou, Zuogong Yue, Cheng Cheng
2025	PRoGS: Progressive Rendering of Gaussian Splats. Brent Zoomers, Maarten Wijnants, Ivan Molenaers, Joni Vanherck, Jeroen Put, Nick Michiels
2025	PTQ4VM: Post-Training Quantization for Visual Mamba. Younghyun Cho, Changhun Lee, Seonggon Kim, Eunhyeok Park
2025	PULSE: Physiological Understanding with Liquid Signal Extraction. Shahzad Ahmad, Sania Bano, Sachin Verma, Yogesh Singh Rawat, Sukalpa Chanda, Santosh Kumar Vipparthi, Subrahmanyam Murala
2025	PV-VTT: A Privacy-Centric Dataset for Mission-Specific Anomaly Detection and Natural Language Interpretation. Ryozo Masukwa, Sanggeon Yun, Yoshiki Yamaguchi, Mohsen Imani
2025	PVP: Polar Representation Boost for 3D Semantic Occupancy Prediction. Yujing Xue, Jiaxiang Liu, Jiawei Du, Joey Tianyi Zhou
2025	PVT: An Implicit Surface Reconstruction Framework via Point Voxel Geometric-Aware Transformer. Chuanmao Fan, Chenxi Zhao, Ye Duan
2025	Paladin: Understanding Video Intentions in Political Advertisement Videos. Hong Liu, Yuta Nakashima, Noboru Babaguchi
2025	Palo: A Polyglot Large Multimodal Model for 5B People. Hanoona Abdul Rasheed, Muhammad Maaz, Abdelrahman M. Shaker, Salman H. Khan, Hisham Cholakkal, Rao Muhammad Anwer, Tim Baldwin, Michael Felsberg, Fahad Shahbaz Khan
2025	Partial Filter-Sharing: Improved Parameter-sharing Method for Single Image Super-Resolution Networks. Karam Park, Nam Ik Cho
2025	Partial Texture VAE: Color and Texture Encoder for Rock Particle Images. Tetsushi Yamada, Simone Di Santo
2025	Patch Ranking: Token Pruning as Ranking Prediction for Efficient CLIP. Cheng-En Wu, Jinhong Lin, Yu Hen Hu, Pedro Morgado
2025	PatchFinder: Leveraging Visual Language Models for Accurate Information Retrieval Using Model Uncertainty. Roman Colman, Minh Vu, Manish Bhattarai, Martin Ma, Hari S. Viswanathan, Daniel O'Malley, Javier E. Santos
2025	Pay Attention to Your Neighbours: Training-Free Open-Vocabulary Semantic Segmentation. Sina Hajimiri, Ismail Ben Ayed, Jose Dolz
2025	Per-Pixel Solution of Multispectral Photometric Stereo. Shin Ishihara, Imari Sato
2025	Perceive. Query & Reason: Enhancing Video QA with Question-Guided Temporal Queries. Roberto Amoroso, Gengyuan Zhang, Rajat Koner, Lorenzo Baraldi, Rita Cucchiara, Volker Tresp
2025	Personalized Mixture of Experts for Multi-Site Medical Image Segmentation. Md Motiur Rahman, Mohamed Trabelsi, Hüseyin Uzunalioglu, Aidan Boyd
2025	Phaseformer: Phase-Based Attention Mechanism for Underwater Image Restoration and Beyond. Md Raqib Khan, Anshul Negi, Ashutosh Kulkarni, Shruti S. Phutke, Santosh Kumar Vipparthi, Subrahmanyam Murala
2025	Physiology-Aware PolySnake for Coronary Vessel Segmentation. Yizhe Ruan, Lin Gu, Yusuke Kurose, Junichi Iho, Youji Tokunaga, Makoto Horie, Yusaku Hayashi, Keisuke Nishizawa, Yasushi Koyama, Tatsuya Harada
2025	PivotAlign: Improve Semi-Supervised Learning by Learning Intra-Class Heterogeneity and Aligning with Pivots. Lingjie Yi, Tao Sun, Yikai Zhang, Songzhu Zheng, Weimin Lyu, Haibin Ling, Chao Chen
2025	Pix2Poly: A Sequence Prediction Method for End-to-End Polygonal Building Footprint Extraction from Remote Sensing Imagery. Yeshwanth Kumar Adimoolam, Charalambos Poullis, Melinos Averkiou
2025	PixSwap: High-Resolution Face Swapping for Effective Reflection of Identity via Pixel-Level Supervision with Synthetic Paired Dataset. Taewoo Kim, Geonsu Lee, Hyukgi Lee, Seongtae Kim, Younggun Lee
2025	Pixel-Wise Shuffling with Collaborative Sparsity for Melanoma Hyperspectral Image Classification. Favour Ekong, Jun Zhou, Kwabena Sarpong, Yongsheng Gao
2025	Planar Gaussian Splatting. Farhad G. Zanjani, Hong Cai, Hanno Ackermann, Leyla Mirvakhabova, Fatih Porikli
2025	PocoLoco: A Point Cloud Diffusion Model of Human Shape in Loose Clothing. Siddharth Seth, Rishabh Dabral, Diogo C. Luvizon, Marc Habermann, Ming-Hsuan Yang, Christian Theobalt, Adam Kortylewski
2025	Point Cloud Color Upsampling with Attention-Based Coarse Colorization and Refinement. Kohei Matsuzaki, Keisuke Nonaka
2025	Point-GN: A Non-Parametric Network Using Gaussian Positional Encoding for Point Cloud Classification. Marzieh Mohammadi, Amir Salarpour
2025	Point-JEPA: A Joint Embedding Predictive Architecture for Self-Supervised Learning on Point Cloud. Ayumu Saito, Prachi Kudeshia, Jiju Poovvancheri
2025	Polarization as Texture: Microscale 3D Shape from Polarized Light Focus. Ren Matsumoto, Takahiro Okabe, Ryo Kawahara
2025	PoolAtnRes: Towards Generalisable Differential Morphing Attack Detection. Raghavendra Ramachandra, Sushma Venkatesh, Guoqiang Li
2025	PositiveCoOp: Rethinking Prompting Strategies for Multi-Label Recognition with Partial Annotations. Samyak Rawlekar, Shubhang Bhatnagar, Narendra Ahuja
2025	PostoMETRO: Pose Token Enhanced Mesh Transformer for Robust 3D Human Mesh Recovery. Wendi Yang, Zihang Jiang, Shang Zhao, S. Kevin Zhou
2025	Pre-capture Privacy via Adaptive Single-Pixel Imaging. Yoko Sogabe, Shiori Sugimoto, Ayumi Matsumoto, Masaki Kitahara
2025	Pre-trained Multiple Latent Variable Generative Models are Good Defenders Against Adversarial Attacks. Dario Serez, Marco Cristani, Alessio Del Bue, Vittorio Murino, Pietro Morerio
2025	Precise Integral in NeRFs: Overcoming the Approximation Errors of Numerical Quadrature. Boyuan Zhang, Zhenliang He, Meina Kan, Shiguang Shan
2025	Predicting Event Memorability Using Personalized Federated Learning. Sourasekhar Banerjee, Debaditya Roy, Vigneshwaran Subbaraju, Monowar Bhuyan
2025	PrevPredMap: Exploring Temporal Modeling with Previous Predictions for Online Vectorized HD Map Construction. Nan Peng, Xun Zhou, Mingming Wang, Xiaojun Yang, Songming Chen, Guisong Chen
2025	Prior2Posterior: Model Prior Correction for Long-Tailed Learning. S. Divakar Bhat, Amit More, Mudit Soni, Surbhi Agrawal
2025	PrivateEye: In-Sensor Privacy Preservation Through Optical Feature Separation. Adith Boloor, Weikai Lin, Tianrui Ma, Yu Feng, Yuhao Zhu, Xuan Zhang
2025	Pruning One More Token is Enough: Leveraging Latency-Workload Non-Linearities for Vision Transformers on the Edge. Nicholas John Eliopoulos, Purvish Jajal, James C. Davis, Gaowen Liu, George K. Thiravathukal, Yung-Hsiang Lu
2025	Psych-Occlusion: Using Visual Psychophysics for Aerial Detection of Occluded Persons During Search and Rescue. Arturo Miguel Russell Bernal, Jane Cleland-Huang, Walter J. Scheirer
2025	PureForest: A Large-Scale Aerial Lidar and Aerial Imagery Dataset for Tree Species Classification in Monospecific Forests. Charles Gaydon, Floryne Roche
2025	Q-TempFusion: Quantization-Aware Temporal Multi-Sensor Fusion on Bird's-Eye View Representation. Pinrui Yu, Zhenglun Kong, Pu Zhao, Peiyan Dong, Hao Tang, Fei Sun, Xue Lin, Yanzhi Wang
2025	QuantAttack: Exploiting Quantization Techniques to Attack Vision Transformers. Amit Baras, Alon Zolfi, Yuval Elovici, Asaf Shabtai
2025	RAW-Diffusion: RGB-Guided Diffusion Models for High-Fidelity RAW Image Generation. Christoph Reinders, Radu Berdan, Beril Besbinar, Junji Otsuka, Daisuke Iso
2025	RD-DPP: Rate-Distortion Theory Meets Determinantal Point Process to Diversify Learning Data Samples. Xiwen Chen, Huayu Li, Peijie Qiu, Wenhui Zhu, Rahul Amin, Abolfazl Razi
2025	REEDIT: Multimodal Exemplar-Based Image Editing. Ashutosh Srivastava, Tarun Ram Menta, Abhinav Java, Avadhoot Jadhav, Silky Singh, Surgan Jandial, Balaji Krishnamurthy
2025	RGB-D Video Mirror Detection. Mingchen Xu, Peter Herbert, Yu-Kun Lai, Ze Ji, Jing Wu
2025	RGB2Point: 3D Point Cloud Generation from Single RGB Images. Jae Joong Lee, Bedrich Benes
2025	ROADS: Robust Prompt-Driven Multi-Class Anomaly Detection Under Domain Shift. Hossein Kashiani, Niloufar Alipour Talemi, Fatemeh Afghah
2025	ROSA: Reconstructing Object Shape and Appearance Textures by Adaptive Detail Transfer. Julian Kaltheuner, Patrick Stotko, Reinhard Klein
2025	RT-DETRv3: Real-Time End-to-End Object Detection with Hierarchical Dense Positive Supervision. Shuo Wang, Chunlong Xia, Feng Lv, Yifeng Shi
2025	Radiance Field-Based Pose Estimation via Decoupled Optimization Under Challenging Initial Conditions. Si-Yu Lu, Yung-Yao Chen, Yi-Tong Wu, Hsin-Chun Lin, Sin-Ye Jhong, Wen-Huang Cheng
2025	RapidNet: Multi-Level Dilated Convolution Based Mobile Backbone. Mustafa Munir, Md Mostafijur Rahman, Radu Marculescu
2025	RayGauss: Volumetric Gaussian-Based Ray Casting for Photorealistic Novel View Synthesis. Hugo Blanc, Jean-Emmanuel Deschaud, Alexis Paljic
2025	Re-Evaluating Group Robustness via Adaptive Class-Specific Scaling. Seonguk Seo, Bohyung Han
2025	Re-identifying People in Video via Learned Temporal Attention and Multi-modal Foundation Models. Cole Hill, Florence Yellin, Krishna Regmi, Dawei Du, Scott McCloskey
2025	ReBotNet: Fast Real-Time Video Enhancement. Jeya Maria Jose Valanarasu, Rahul Garg, Andeep Toor, Xin Tong, Weijuan Xi, Andreas Lugmayr, Vishal M. Patel, Anne Menini
2025	ReC- Ttt: Contrastive Feature Reconstruction for Test-Time Training. Marco Colussi, Sergio Mascetti, Jose Dolz, Christian Desrosiers
2025	ReFu: Recursive Fusion for Exemplar-Free 3D Class-Incremental Learning. Yi Yang, Lei Zhong, Huiping Zhuang
2025	ReMP: Reusable Motion Prior for Multi-domain 3D Human Pose Estimation and Motion Inbetweening. Hojun Jang, Young Min Kim
2025	ReMix: Training Generalized Person Re-Identification on a Mixture of Data. Timur Z. Mamedov, Anton Konushin, Vadim Konushin
2025	Realistic and Efficient Face Swapping: A Unified Approach with Diffusion Models. Sanoojan Baliah, Qinliang Lin, Shengcai Liao, Xiaodan Liang, Muhammad Haris Khan
2025	Recognizing Unseen States of Unknown Objects by Leveraging Knowledge Graphs. Filippos Gouidis, Konstantinos E. Papoutsakis, Theodore Patkos, Antonis A. Argyros, Dimitris Plexousakis
2025	Recoverable Anonymization for Pose Estimation: A Privacy-Enhancing Approach. Wenjun Huang, Yang Ni, Arghavan Rezvani, Sungheon Jeong, Hanning Chen, Yezi Liu, Fei Wen, Mohsen Imani
2025	Recurrence-Based Vanishing Point Detection. Skanda Bharadwaj, Robert T. Collins, Yanxi Liu
2025	Reducing the Content Bias for AI-generated Image Detection. Seoyeon Gye, Junwon Ko, Hyounguk Shon, Minchan Kwon, Junmo Kim
2025	RefVSR++: Exploiting Reference Inputs for Reference-based Video Super-resolution. Han Zou, Masanori Suganuma, Takayuki Okatani
2025	Refining Text-to-Image Generation: Towards Accurate Training-Free Glyph-Enhanced Image Generation. Sanyam Lakhanpal, Shivang Chopra, Vinija Jain, Aman Chadha, Man Luo
2025	Reflective Teacher: Semi-Supervised Multimodal 3D Object Detection in Bird's-Eye-View via Uncertainty Measure. Saheli Hazra, Sudip Das, Rohit Choudhary, Arindam Das, Ganesh Sistu, Ciarán Eising, Ujjwal Bhattacharya
2025	Reframing Image Difference Captioning with BLIP2IDC and Synthetic Augmentation. Gautier Evennou, Antoine Chaffin, Vivien Chappelier, Ewa Kijak
2025	ReinDiffuse: Crafting Physically Plausible Motions with Reinforced Diffusion Model. Gaoge Han, Mingjiang Liang, Jinglei Tang, Yongkang Cheng, Wei Liu, Shaoli Huang
2025	Relational Self-Supervised Distillation with Compact Descriptors for Image Copy Detection. Juntae Kim, Sungwon Woo, Jongho Nang
2025	Relaxing Binary Constraints in Contrastive Vision-Language Medical Representation Learning. Xiaoyang Wei, Camille Kurtz, Florence Cloppet
2025	Remote Blood Pressure Estimation from Facial Videos Using Transfer Learning: Leveraging PPG to rPPG Conversion. Chun-Hong Cheng, Jing Wei Chin, Kwan Long Wong, Tsz Tai Chan, Hau Ching Lo, Kwan Lok Pang, Richard Hau Yue So, Bryan Yan
2025	Removing Geometric Bias in One-Class Anomaly Detection with Adaptive Feature Perturbation. Romain Hermary, Vincent Gaudillière, Abd El Rahman Shabayek, Djamila Aouada
2025	RendBEV: Semantic Novel View Synthesis for Self-Supervised Bird's Eye View Segmentation. Henrique Piñeiro Monteagudo, Leonardo Taccari, Aurel Pjetri, Francesco Sambo, Samuele Salti
2025	Retaining and Enhancing Pre-trained Knowledge in Vision-Language Models with Prompt Ensembling. Donggeun Kim, Yujin Jo, Myungjoo Lee, Taesup Kim
2025	Rethinking Cluster-Conditioned Diffusion Models for Label-Free Image Synthesis. Nikolas Adaloglou, Tim Kaiser, Felix Michels, Markus Kollmann
2025	Rethinking Low-Rank Adaptation in Vision: Exploring Head-Level Responsiveness across Diverse Tasks. Yibo Zhong, Yao Zhou
2025	Retrieval Augmented Recipe Generation. Guoshan Liu, Hailong Yin, Bin Zhu, Jingjing Chen, Chong-Wah Ngo, Yu-Gang Jiang
2025	Reversing the Damage: A QP-Aware Transformer-Diffusion Approach for 8K Video Restoration under Codec Compression. Ali Mollaahmadi Dehaghi, Reza Razavi, Mohammad Moshirpour
2025	Revisiting Deep Archetypal Analysis for Phenotype Discovery in High Content Imaging. Mario Wieser, Daniel Siegismund, Stephan Steigele
2025	Revisiting Disparity from Dual-Pixel Images: Physics-Informed Lightweight Depth Estimation. Teppei Kurita, Yuhi Kondo, Legong Sun, Takayuki Sasaki, Sho Nitta, Yasuhiro Hashimoto, Yoshinori Muramatsu, Yusuke Moriuchi
2025	Revisiting Machine Unlearning with Dimensional Alignment. Seonguk Seo, Dongwan Kim, Bohyung Han
2025	Reviving Poor Object Segmentations in OOD Medical Images using Variational-Deep-PCA Modeling on Segmentation Maps with Sampling-Free Learning. Jimut B. Pal, Shantanu Welling, Himali Saini, Suyash P. Awate
2025	RiemStega: Covariance-Based Loss for Print-Proof Transmission of Data in Images. Aniana Cruz, Guilherme G. Schardong, Luiz Schirmer, João Marcos, Farhad Shadmand, Nuno Gonçalves
2025	Robot Instance Segmentation with Few Annotations for Grasping. Moshe Kimhi, David Vainshtein, Chaim Baskin, Dotan Di Castro
2025	Robust Long-Range Perception Against Sensor Misalignment in Autonomous Vehicles. Zi-Xiang Xia, Sudeep Fadadu, Yi Shi, Louis Foucard
2025	Robust Novelty Detection Through Style-Conscious Feature Ranking. Stefan Smeu, Elena Burceanu, Emanuela Haller, Andrei Liviu Nicolicioiu
2025	Robust Portrait Image Matting and Depth-of-field Synthesis via Multiplane Images. Zhefan Rao, Tianjia Zhang, Yuen-Fui Lau, Qifeng Chen
2025	RopeTP: Global Human Motion Recovery via Integrating Robust Pose Estimation with Diffusion Trajectory Prior. Mingjiang Liang, Yongkang Cheng, Hualin Liang, Shaoli Huang, Wei Liu
2025	Rubric-Constrained Figure Skating Scoring. Arushi Rai, Adriana Kovashka
2025	S3PT: Scene Semantics and Structure Guided Clustering to Boost Self-Supervised Pre-Training for Autonomous Driving. Maciej K. Wozniak, Hariprasath Govindarajan, Marvin Klingner, Camille Maurice, Ravi Kiran, Senthil Kumar Yogamani
2025	SADA: Semantic Adversarial Unsupervised Domain Adaptation for Temporal Action Localization. David Pujol-Perich, Albert Clapés, Sergio Escalera
2025	SADDLe: Sharpness-Aware Decentralized Deep Learning with Heterogeneous Data. Sakshi Choudhary, Sai Aparna Aketi, Kaushik Roy
2025	SALVE: A 3D Reconstruction Benchmark of Wounds from Consumer-Grade Videos. Remi Chierchia, Léo Lebrat, David Ahmedt-Aristizabal, Olivier Salvado, Clinton Fookes, Rodrigo Santa Cruz
2025	SAM-DA: Decoder Adapter for Efficient Medical Domain Adaptation. Javier Gamazo Tejero, Moritz Schmid, Pablo Márquez-Neila, Martin S. Zinkernagel, Sebastian Wolf, Raphael Sznitman
2025	SAM-Mamba: Mamba Guided SAM Architecture for Generalized Zero-Shot Polyp Segmentation. Tapas Kumar Dutta, Snehashis Majhi, Deepak Ranjan Nayak, Debesh Jha
2025	SAND: Enhancing Open-Set Neuron Descriptions through Spatial Awareness. Anvita A. Srinivas, Tuomas P. Oikarinen, Divyansh Srivastava, Wei-Hung Weng, Tsui-Wei Weng
2025	SANPO: A Scene Understanding, Accessibility and Human Navigation Dataset. Sagar M. Waghmare, Kimberly Wilber, Dave Hawkey, Xuan Yang, Matthew Wilson, Stephanie Debats, Cattalyya Nuengsigkapian, Astuti Sharma, Lars Pandikow, Huisheng Wang, Hartwig Adam, Mikhail Sirotenko
2025	SCOT: Self-Supervised Contrastive Pretraining for Zero-Shot Compositional Retrieval. Bhavin Jawade, João V. B. Soares, Kapil Thadani, Deen Dayal Mohan, Amir Erfan Eshratifar, Benjamin Culpepper, Paloma de Juan, Srirangaraj Setlur, Venu Govindaraju
2025	SEED4D: A Synthetic Ego-Exo Dynamic 4D Data Generator, Driving Dataset and Benchmark. Marius Kästingschäfer, Théo Gieruc, Sebastian Bernhard, Dylan Campbell, Eldar Insafutdinov, Eyvaz Najafli, Thomas Brox
2025	SEM-Net: Efficient Pixel Modelling for Image Inpainting with Spatially Enhanced SSM. Shuang Chen, Haozheng Zhang, Amir Atapour-Abarghouei, Hubert P. H. Shum
2025	SEMU-Net: A Segmentation-Based Corrector for Fabrication Process Variations of Nanophotonics with Microscopic Images. Rambod Azimi, Yijian Kong, Dusan Gostimirovic, James J. Clark, Odile Liboiron-Ladouceur
2025	SGD: Street View Synthesis with Gaussian Splatting and Diffusion Prior. Zhongrui Yu, Haoran Wang, Jinze Yang, Hanzhang Wang, Jiale Cao, Zhong Ji, Mingming Sun
2025	SHIP: Structural Hierarchies for Instance-Dependent Partial Labels. Tushar Kadam, Utkarsh Mishra, Aakarsh Malhotra
2025	SIGNN - Star Identification Using Graph Neural Networks. Floyd Hepburn-Dickins, Mark W. Jones, Mike Edwards, Jay Paul Morgan, Steve Bell
2025	SMDAF: A Scalable Sidewalk Material Data Acquisition Framework with Bidirectional Cross-Modal Knowledge Distillation. Jiawei Liu, Wayne Lam, Zhigang Zhu, Hao Tang
2025	SODA: Spectral Orthogonal Decomposition Adaptation for Diffusion Models. Xinxi Zhang, Song Wen, Ligong Han, Felix Juefei-Xu, Akash Srivastava, Junzhou Huang, Vladimir Pavlovic, Hao Wang, Molei Tao, Dimitris N. Metaxas
2025	SPACE: SPAtial-Aware Consistency rEgularization for Anomaly Detection in Industrial Applications. Daehwan Kim, Hyungmin Kim, Daun Jeong, Sungho Suh, Hansang Cho
2025	STAY Diffusion: Styled Layout Diffusion Model for Diverse Layout-to-Image Generation. Ruyu Wang, Xuefeng Hou, Sabrina Schmedding, Marco F. Huber
2025	STLight: A Fully Convolutional Approach for Efficient Predictive Learning by Spatio-Temporal Joint Processing. Andrea Alfarano, Alberto Alfarano, Linda Friso, Andrea Bacciu, Irene Amerini, Fabrizio Silvestri
2025	STRIDE: Single-Video Based Temporally Continuous Occlusion-Robust 3D Pose Estimation. Rohit Lal, Saketh Bachu, Yash Garg, Arindam Dutta, Calvin-Khang Ta, Hannah Dela Cruz, Dripta S. Raychaudhuri, M. Salman Asif, Amit K. Roy-Chowdhury
2025	SUM: Saliency Unification Through Mamba for Visual Attention Modeling. Alireza Hosseini, Amirhossein Kazerouni, Saeed Akhavan, Michael Brudno, Babak Taati
2025	SV-data2vec: Guiding Video Representation Learning with Latent Skeleton Targets. Zorana Dozdor, Tomislav Hrkac, Zoran Kalafatic
2025	Scene-LLM: Extending Language Model for 3D Visual Reasoning. Rao Fu, Jingyu Liu, Xilun Chen, Yixin Nie, Wenhan Xiong
2025	SeCo-INR: Semantically Conditioned Implicit Neural Representations for Improved Medical Image Super-Resolution. Mevan Ekanayake, Zhifeng Chen, Gary F. Egan, Mehrtash Harandi, Zhaolin Chen
2025	Secrets of Edge-Informed Contrast Maximization for Event-Based Vision. Pritam Karmokar, Quan H. Nguyen, William J. Beksi
2025	Seeing Eye to AI: Comparing Human Gaze and Model Attention in Video Memorability. Prajneya Kumar, Eshika Khandelwal, Makarand Tapaswi, Vishnu Sreekumar
2025	SegBuilder: A Semi-Automatic Annotation Tool for Segmentation. Md. Alimoor Reza, Eric Manley, Sean Chen, Sameer Chaudhary, Jacob Elafros
2025	SegDesicNet: Lightweight Semantic Segmentation in Remote Sensing with Geo-Coordinate Embeddings for Domain Adaptation. Sachin Verma, Frank Lindseth, Gabriel Kiss
2025	Segment Anything Meets Point Tracking. Frano Rajic, Lei Ke, Yu-Wing Tai, Chi-Keung Tang, Martin Danelljan, Fisher Yu
2025	Self-Aligning Depth-Regularized Radiance Fields for Asynchronous RGB-D Sequences. Yuxin Huang, Andong Yang, Yuantao Chen, Runyi Yang, Zhenxin Zhu, Chao Hou, Hao Zhao, Guyue Zhou
2025	Self-Relaxed Joint Training: Sample Selection for Severity Estimation with Ordinal Noisy Labels. Shumpei Takezaki, Kiyohito Tanaka, Seiichi Uchida
2025	Self-Supervised Anomaly Segmentation via Diffusion Models with Dynamic Transformer UNet. Komal Kumar, Snehashis Chakraborty, Dwarikanath Mahapatra, Behzad Bozorgtabar, Sudipta Roy
2025	Self-Supervised Incremental Learning of Object Representations from Arbitrary Image Sets. George Leotescu, Alin-Ionut Popa, Diana Grigore, Daniel Voinea, Pietro Perona
2025	Self-Supervised Learning with Probabilistic Density Labeling for Rainfall Probability Estimation. Junha Lee, Sojung An, Sujeong You, Nam Ik Cho
2025	Self-Supervised Pre-Training with Diffusion Model for Few-Shot Landmark Detection in X-Ray Images. Roberto Di Via, Francesca Odone, Vito Paolo Pastore
2025	Self-supervised Learning with Spectral Low-Rank Prior for Hyperspectral Image Reconstruction. Zijun He, Lishun Wang, Ziyi Meng, Xin Yuan
2025	Semantic Clustering of Image Retrieval Databases used for Visual Localization. Henry Hölzemann, Torsten Fiolka
2025	Semantic Prompt Learning for Weakly-Supervised Semantic Segmentation. Ci-Siang Lin, Chien-Yi Wang, Yu-Chiang Frank Wang, Min-Hung Chen
2025	Semantic Prompting with Image Token for Continual Learning. Jisu Han, Jaemin Na, Wonjun Hwang
2025	Semantic Segmentation Method for Automated Indoor 3D Reconstruction based on Architectural-Knowledge-Aware Features. Yahan Chen, Wenzheng Liu, Xiaowei Luo
2025	Semantically Conditioned Prompts for Visual Recognition Under Missing Modality Scenarios. Vittorio Pipoli, Federico Bolelli, Sara Sarto, Marcella Cornia, Lorenzo Baraldi, Costantino Grana, Rita Cucchiara, Elisa Ficarra
2025	Semiotic-Based Construction of a Large Emotional Image Dataset with Neutral Samples. Marco Blanchini, Giovanna Maria Dimitri, Lydia Abady, Benedetta Tondi, Tarcisio Lancioni, Mauro Barni
2025	SenCLIP: Enhancing Zero-Shot Land-Use Mapping for Sentinel-2 with Ground-Level Prompting. Pallavi Jain, Dino Ienco, Roberto Interdonato, Tristan Berchoux, Diego Marcos
2025	SensorFlow: Sensor and Image Fused Video Stabilization. Jiyang Yu, Tianhao Zhang, Fuhao Shi, Lei He, Chia-Kai Liang
2025	Separating Direct and Global Components from Novel Viewpoints. Kengo Matsufuji, Lin Shi, Ryo Kawahara, Takahiro Okabe
2025	Shadow Removal Refinement via Material-Consistent Shadow Edges. Shilin Hu, Hieu Le, Shahrukh Athar, Sagnik Das, Dimitris Samaras
2025	Shape-Biased Texture Agnostic Representations for Improved Textureless and Metallic Object Detection and 6D Pose Estimation. Peter Hönig, Stefan Thalhammer, Jean-Baptiste Weibel, Matthias Hirschmanner, Markus Vincze
2025	ShapeMorph: 3D Shape Completion via Blockwise Discrete Diffusion. Jiahui Li, Pourya Shamsolmoali, Yue Lu, Masoumeh Zareapoor
2025	Shapley Consensus Deep Learning for Ensemble Pruning. Youcef Djenouri, Ahmed Nabil Belbachir, Asma Belhadi, Nassim Belmecheri, Tomasz P. Michalak
2025	Shift Equivariant Pose Network. Pengxiao Wang, Tzu-Heng Lin, Chunyu Wang, Yizhou Wang
2025	Sifting Through the Haystack - Efficiently Finding Rare Animal Behaviors in Large-Scale Datasets. Shir Bar, Or Hirschorn, Roi Holzman, Shai Avidan
2025	Sigma: Siamese Mamba Network for Multi-Modal Semantic Segmentation. Zifu Wan, Pingping Zhang, Yuhao Wang, Silong Yong, Simon Stepputtis, Katia P. Sycara, Yaqi Xie
2025	Sign Language Recognition: A Large-scale Multi-view Dataset and Comprehensive Evaluation. Nguyen Son Dinh, Tuan Dung Nguyen, Duc Tri Tran, Nguyen Dang Huy Pham, Thuan Hieu Tran, Ngoc Anh Tong, Quang Huy Hoang, Phi Le Nguyen
2025	Similarity Over Factuality: Are we Making Progress on Multimodal Out-of-Context Misinformation Detection? Stefanos-Iordanis Papadopoulos, Christos Koutlis, Symeon Papadopoulos, Panagiotis C. Petrantonakis
2025	SimuScope: Realistic Endoscopic Synthetic Dataset Generation Through Surgical Simulation and Diffusion Models. Sabina Martyniak, Joanna Kaleta, Diego Dall'Alba, Michal Naskret, Szymon Plotka, Przemyslaw Korzeniowski
2025	Single-Layer Distillation with Fourier Convolutions for Texture Anomaly Detection. Simon Thomine, Hichem Snoussi
2025	Situational Scene Graph for Structured Human-Centric Situation Understanding. Chinthani Sugandhika, Chen Li, Deepu Rajan, Basura Fernando
2025	Skip-and-Play: Depth-Driven Pose-Preserved Image Generation for Any Objects. Kyungmin Jo, Jaegul Choo
2025	Skyeyes: Ground Roaming using Aerial View Images. Zhiyuan Gao, Wenbin Teng, Gonglin Chen, Jinsen Wu, Ningli Xu, Rongjun Qin, Andrew Feng, Yajie Zhao
2025	Sli2Vol+: Segmenting 3D Medical Images Based on an Object Estimation Guided Correspondence Flow Network. Delin An, Pengfei Gu, Milan Sonka, Chaoli Wang, Danny Z. Chen
2025	SmartKC++: Improving Performance of Smartphone-Based Corneal Topographers. Vaibhav Ganatra, Siddhartha Gairola, Pallavi Joshi, Anand Balasubramaniam, Kaushik Murali, Arivunithi Varadharajan, Bellamkonda Mallikarjuna, Nipun Kwatra, Mohit Jain
2025	Social EgoMesh Estimation. Luca Scofano, Alessio Sampieri, Edoardo De Matteis, Indro Spinelli, Fabio Galasso
2025	Socially-Informed Reconstruction for Pedestrian Trajectory Forecasting. Haleh Damirchi, Ali Etemad, Michael A. Greenspan
2025	Solar Multimodal Transformer: Intraday Solar Irradiance Predictor Using Public Cameras and Time Series. Yanan Niu, Roy Sarkis, Demetri Psaltis, Mario Paolone, Christophe Moser, Luisa Lambertini
2025	SoundLoc3D: Invisible 3D Sound Source Localization and Classification Using a Multimodal RGB-D Acoustic Camera. Yuhang He, Sangyun Shin, Anoop Cherian, Niki Trigoni, Andrew Markham
2025	SoundSil-DS: Deep Denoising and Segmentation of Sound-field Images with Silhouettes. Risako Tanigawa, Kenji Ishikawa, Noboru Harada, Yasuhiro Oikawa
2025	SpaGBOL: Spatial-Graph-Based Orientated Localisation. Tavis Shore, Oscar Mendez, Simon Hadfield
2025	Sparse-View 3D Reconstruction of Clothed Humans via Normal Maps. Jane Wu, Diego Thomas, Ronald Fedkiw
2025	Spatially-Adaptive Hash Encodings for Neural Surface Reconstruction. Thomas Walker, Octave Mariotti, Amir Vaxman, Hakan Bilen
2025	Spatio-Temporal Context Prompting for Zero-Shot Action Detection. Wei-Jhe Huang, Min-Hung Chen, Shang-Hong Lai
2025	SpectFormer: Frequency and Attention is what you need in a Vision Transformer. Badri N. Patro, Vinay P. Namboodiri, Vijay Srinivas Agneeswaran
2025	SpiralMLP: A Lightweight Vision MLP Architecture. Haojie Mu, Burhan Ul Tayyab, Nicholas Chua
2025	Spk2ImgMamba: Spiking Camera Image Reconstruction with Multi-Scale State Space Models. Jiaoyang Yin, Bin Fan, Chao Xu, Tiejun Huang, Boxin Shi
2025	SplatFace: Gaussian Splat Face Reconstruction Leveraging an Optimizable Surface. Jiahao Luo, Jing Liu, James Davis
2025	SpotDiffusion: A Fast Approach for Seamless Panorama Generation Over Time. Stanislav Frolov, Brian B. Moser, Andreas Dengel
2025	Stable Autofocus with Focal Consistency Loss. Sangwon Lee, Myungsub Choi, Nagyeong Lee, Hyong-Euk Lee
2025	Strategic Base Representation Learning via Feature Augmentations for Few-Shot Class Incremental Learning. Parinita Nema, Vinod K. Kurmi
2025	Stratified Domain Adaptation: A Progressive Self-Training Approach for Scene Text Recognition. Kha Nhat Le, Hoang-Tuan Nguyen, Hung Tien Tran, Thanh Duc Ngo
2025	Street TryOn: Learning In-the-Wild Virtual Try-On from Unpaired Person Images. Aiyu Cui, Jay Mahajan, Viraj Shah, Preeti Gomathinayagam, Chang Liu, Svetlana Lazebnik
2025	Structure-Aware Human Body Reshaping with Adaptive Affinity-Graph Network. Qiwen Deng, Yangcen Liu
2025	Structured Human Assessment of Text-to-Image Generative Models. Ciprian A. Corneanu, Qianli Feng, Aleix M. Martínez
2025	Style-Pro: Style-Guided Prompt Learning for Generalizable Vision-Language Models. Niloufar Alipour Talemi, Hossein Kashiani, Fatemeh Afghah
2025	Sun Off, Lights on: Photorealistic Monocular Nighttime Simulation for Robust Semantic Perception. Konstantinos Tzevelekakis, Shutong Zhang, Luc Van Gool, Christos Sakaridis
2025	Supplementary Material AnonyNoise: Anonymizing Event Data with Smart Noise to Outsmart Re-Identification and Preserve Privacy. Katharina Bendig, René Schuster, Nicole Thiemer, Karen Joisten, Didier Stricker
2025	Survival Prediction in Lung Cancer through Multi-Modal Representation Learning. Aiman Farooq, Deepak Mishra, Santanu Chaudhury
2025	Swap Path Network for Robust Person Search Pre-training. Lucas Jaffe, Avideh Zakhor
2025	Swin-∇: Gradient-Based Image Restoration from Image Sequences using Video Swin-Transformers. Monika Kwiatkowski, Simon Matern, Olaf Hellwich
2025	SwinIA: Self-Supervised Blind-Spot Image Denoising Without Convolutions. Mikhail Papkov, Pavel Chizhov, Leopold Parts
2025	SynDRA: Synthetic Dataset for Railway Applications. Gianluca D'Amico, Federico Nesti, Giulio Rossolini, Mauro Marinoni, Salvatore Sabina, Giorgio C. Buttazzo
2025	SynDroneVision: A Synthetic Dataset for Image-Based Drone Detection. Tamara R. Lenhard, Andreas Weinmann, Kai Franke, Tobias Koch
2025	SyncDiff: Diffusion-Based Talking Head Synthesis with Bottlenecked Temporal Visual Prior for Improved Synchronization. Xulin Fan, Heting Gao, Ziyi Chen, Peng Chang, Mei Han, Mark Hasegawa-Johnson
2025	SyncViolinist: Music-Oriented Violin Motion Generation Based on Bowing and Fingering. Hiroki Nishizawa, Keitaro Tanaka, Asuka Hirata, Shugo Yamaguchi, Qi Feng, Masatoshi Hamanaka, Shigeo Morishima
2025	TACLE: Task and Class-Aware Exemplar-Free Semi-Supervised Class Incremental Learning. Jayateja Kalla, Rohit Kumar, Soma Biswas
2025	TAM-VT: Transformation-Aware Multi-Scale Video Transformer for Segmentation and Tracking. Raghav Goyal, Wan-Cyuan Fan, Mennatullah Siam, Leonid Sigal
2025	TFM Yaoxin Zhuo, Zachary Bessinger, Lichen Wang, Naji Khosravan, Baoxin Li, Sing Bing Kang
2025	TLDR: Text Based Last-Layer Retraining for Debiasing Image Classifiers. Juhyeon Park, Seokhyeon Jeong, Taesup Moon
2025	TORE: Token Recycling in Vision Transformers for Efficient Active Visual Exploration. Jan Olszewski, Dawid Rymarczyk, Piotr Wójcik, Mateusz Pach, Bartosz Zielinski
2025	TPD-STR: Text Polygon Detection with Split Transformers. Sangyeon Kim, Sangkuk Lee, Jeesoo Kim, Nojun Kwak
2025	TPP-Gaze: Modelling Gaze Dynamics in Space and Time with Neural Temporal Point Processes. Alessandro D'Amelio, Giuseppe Cartella, Vittorio Cuculo, Manuele Lucchi, Marcella Cornia, Rita Cucchiara, Giuseppe Boccignone
2025	TRH2TQA: Table Recognition with Hierarchical Relationships to Table Question-Answering on Business Table Images. Pongsakorn Jirachanchaisiri, Nam Tuan Ly, Atsuhiro Takasu
2025	TRNeRF: Restoring Blurry, Rolling Shutter, and Noisy Thermal Images with Neural Radiance Fields. Spencer Carmichael, Manohar Bhat, Mani Ramanagopal, Austin Buchan, Ram Vasudevan, Katherine A. Skinner
2025	TRUST: Time-Domain Residual Unsupervised Stability Technique for Improved Heart Rate Estimation. Shahzad Ahmad, Sania Bano, Sukalpa Chanda, Santosh Kumar Vipparthi, Subrahmanyam Murala
2025	TaCOS: Task-Specific Camera Optimization with Simulation. Chengyang Yan, Donald G. Dansereau
2025	Talking Head Anime 4: Distillation for Real-Time Performance. Pramook Khungurn
2025	Task Configuration Impacts Annotation Quality and Model Training Performance in Crowdsourced Image Segmentation. Benjamin Bauchwitz, Mary L. Cummings
2025	TaxaBind: A Unified Embedding Space for Ecological Applications. Srikumar Sastry, Subash Khanal, Aayush Dhakal, Adeel Ahmad, Nathan Jacobs
2025	TempA-VLP: Temporal-Aware Vision-Language Pretraining for Longitudinal Exploration in Chest X-Ray Image. Zhuoyi Yang, Liyue Shen
2025	Temporal Dynamics in Visual Data: Analyzing the Impact of Time on Classification Accuracy. Tom Pégeot, Eva Feillet, Adrian Popescu, Inna Kucher, Bertrand Delezoide
2025	Temporally Grounding Instructional Diagrams in Unconstrained Videos. Jiahao Zhang, Frederic Z. Zhang, Cristian Rodriguez, Yizhak Ben-Shabat, Anoop Cherian, Stephen Gould
2025	Temporally Streaming Audio-Visual Synchronization for Real-World Videos. Jordan Voas, Wei-Cheng Tseng, Layne Berry, Xixi Hu, Puyuan Peng, James Stuedemann, David Harwath
2025	Test-Time Adaptation in Point Clouds: Leveraging Sampling Variation with Weight Averaging. Ali Bahri, Moslem Yazdanpanah, Mehrdad Noori, Sahar Dastani, Milad Cheraghalikhani, David Osowiechi, Farzad Beizaee, Gustavo Adolfo Vargas Hakim, Ismail Ben Ayed, Christian Desrosiers
2025	Test-Time Adaptation of 3D Point Clouds via Denoising Diffusion Models. Hamidreza Dastmalchi, Aijun An, Ali Cheraghian, Shafin Rahman, Sameera Ramasinghe
2025	Test-Time Low Rank Adaptation via Confidence Maximization for Zero-Shot Generalization of Vision-Language Models. Raza Imam, Hanan Gani, Muhammad Huzaifa, Karthik Nandakumar
2025	Text Change Detection in Multilingual Documents Using Image Comparison. Doyoung Park, Naresh Reddy Yarram, Sunjin Kim, Minkyu Kim, Seongho Cho, Taehee Lee
2025	Text-to-Image Synthesis for Domain Generalization in Face Anti-Spoofing. Naeun Ko, Yonghyun Jeong, Jong Chul Ye
2025	Texture, Shape and Order Matter: A New Transformer Design for Sequential DeepFake Detection. Yunfei Li, Yuezun Li, Xin Wang, Baoyuan Wu, Jiaran Zhou, Junyu Dong
2025	The FineView Dataset: A 3D Scanned Multi-View Object Dataset of Fine-Grained Category Instances. Suguru Onda, Ryan Farrell
2025	Through the Curved Cover: Synthesizing Cover Aberrated Scenes with Refractive Field. Liuyue Xie, Jiancong Guo, László A. Jeni, Zhiheng Jia, Mingyang Li, Yunwen Zhou, Chao Guo
2025	TimberVision: A Multi-Task Dataset and Framework for Log-Component Segmentation and Tracking in Autonomous Forestry Operations. Daniel Steininger, Julia Simon, Andreas Trondl, Markus Murschitz
2025	To Ask or Not to Ask? Detecting Absence of Information in Vision and Language Navigation. Savitha Sam Abraham, Sourav Garg, Feras Dayoub
2025	Token Turing Machines are Efficient Vision Models. Purvish Jajal, Nick John Eliopoulos, Benjamin Shiue-Hal Chou, George K. Thiravathukal, James C. Davis, Yung-Hsiang Lu
2025	TokenBinder: Text-Video Retrieval with One-to-Many Alignment Paradigm. Bingqing Zhang, Zhuo Cao, Heming Du, Xin Yu, Xue Li, Jiajun Liu, Sen Wang
2025	Towards Accurate Unified Anomaly Segmentation. Wenxin Ma, Qingsong Yao, Xiang Zhang, Zhelong Huang, Zihang Jiang, S. Kevin Zhou
2025	Towards Generalized Face Anti-Spoofing from a Frequency Shortcut View. Junyi Cao, Chao Ma
2025	Towards High-fidelity Head Blending with Chroma Keying for Industrial Applications. Hah Min Lew, Sahng-Min Yoo, Hyunwoo Kang, Gyeong-Moon Park
2025	Towards On-the-Fly Novel Category Discovery in Dynamic Long-Tailed Distributions. Hoin Jung, Xiaoqian Wang
2025	Towards Privacy-Preserving Split Learning for ControlNet. Dixi Yao
2025	Towards Real-Time Open-Vocabulary Video Instance Segmentation. Bin Yan, Martin Sundermeyer, David Joseph Tan, Huchuan Lu, Federico Tombari
2025	Towards Robust Training via Gradient-Diversified Backpropagation. Xilin He, Cheng Luo, Qinliang Lin, Weicheng Xie, Muhammad Haris Khan, Siyang Song, Linlin Shen
2025	Towards Secure and Usable 3D Assets: A Novel Framework for Automatic Visible Watermarking. Gursimran Singh, Tianxi Hu, Mohammad Akbari, Qiang Tang, Yong Zhang
2025	Towards Unbiased Continual Learning: Avoiding Forgetting in the Presence of Spurious Correlations. Giacomo Capitani, Lorenzo Bonicelli, Angelo Porrello, Federico Bolelli, Simone Calderara, Elisa Ficarra
2025	Towards Unsupervised Blind Face Restoration Using Diffusion Prior. Tianshu Kuai, Sina Honari, Igor Gilitschenski, Alex Levinshtein
2025	Towards Utilising a Range of Neural Activations for Comprehending Representational Associations. Laura O'Mahony, Nikola S. Nikolov, David J. P. O'Sullivan
2025	Towards Zero-shot 3D Anomaly Localization. Yizhou Wang, Kuan-Chuan Peng, Yun Fu
2025	Towards a Training Free Approach for 3D Scene Editing. Vivek Madhavaram, Shivangana Rawat, Chaitanya Devaguptapu, Charu Sharma, Manohar Kaul
2025	TrackDiffusion: Tracklet-Conditioned Video Generation via Diffusion Models. Pengxiang Li, Kai Chen, Zhili Liu, Ruiyuan Gao, Lanqing Hong, Dit-Yan Yeung, Huchuan Lu, Xu Jia
2025	Training-free Medical Image Inverses via Bi-level Guided Diffusion Models. Hossein Askari, Fred Roosta, Hongfu Sun
2025	Transferable-Guided Attention Is All You Need for Video Domain Adaptation. André Sacilotti, Samuel Felipe dos Santos, Nicu Sebe, Jurandy Almeida
2025	Transferring Foundation Models for Generalizable Robotic Manipulation. Jiange Yang, Wenhui Tan, Chuhao Jin, Keling Yao, Bei Liu, Jianlong Fu, Ruihua Song, Gangshan Wu, Limin Wang
2025	Transientangelo: Few-Viewpoint Surface Reconstruction Using Single-Photon Lidar. Weihan Luo, Anagh Malik, David B. Lindell
2025	Treading Towards Privacy-Preserving Table Structure Recognition. Sachin Raja, Ajoy Mandal, C. V. Jawahar
2025	TreeFormer: Single-View Plant Skeleton Estimation via Tree-Constrained Graph Generation. Xinpeng Liu, Hiroaki Santo, Yosuke Toda, Fumio Okura
2025	Tumor Synthesis Conditioned on Radiomics. Jonghun Kim, Inye Na, Eun Sook Ko, Hyunjin Park
2025	Tuned Contrastive Learning. Chaitanya Animesh, Manmohan Chandraker
2025	U-MixFormer: UNet-Like Transformer with Mix-Attention for Efficient Semantic Segmentation. Seul-Ki Yeom, Julian von Klitzing
2025	UAL-Bench: The First Comprehensive Unusual Activity Localization Benchmark. Hasnat Md Abdullah, Tian Liu, Kangda Wei, Shu Kong, Ruihong Huang
2025	UCDR-Adapter: Exploring Adaptation of Pre-Trained Vision-Language Models for Universal Cross-Domain Retrieval. Haoyu Jiang, Zhi-Qi Cheng, Gabriel Moreira, Jiawen Zhu, Jingdong Sun, Bukun Ren, Jun-Yan He, Qi Dai, Xian-Sheng Hua
2025	USWformer: Efficient Sparse Wavelet Transformer for Underwater Image Enhancement. Priyanka Mishra, Nancy Mehta, Santosh Kumar Vipparthi, Subrahmanyam Murala
2025	UW-GS: Distractor-Aware 3D Gaussian Splatting for Enhanced Underwater Scene Reconstruction. Haoran Wang, Nantheera Anantrasirichai, Fan Zhang, David Bull
2025	UnDIVE: Generalized Underwater Video Enhancement Using Generative Priors. Suhas Srinath, Aditya Chandrasekar, Hemang Jamadagni, Rajiv Soundararajan, Prathosh AP
2025	Uncertainty Aware Interest Point Detection and Description. Jingbo Zeng, Zaiwang Gu, Weide Liu, Lile Cai, Jun Cheng
2025	Uncertainty Awareness Enables Efficient Labeling for Cancer Subtyping in Digital Pathology. Nirhoshan Sivaroopan, Chamuditha Jayanga Galappaththige, Chalani Ekanayake, Hasindri Watawana, Ranga Rodrigo, Chamira U. S. Edussooriya, Dushan N. Wadduwage
2025	Uncertainty and Energy based Loss Guided Semi-Supervised Semantic Segmentation. Rini Smita Thakur, Vinod K. Kurmi
2025	Uncertainty-Aware Online Extrinsic Calibration: A Conformal Prediction Approach. Mathieu Cocheteux, Julien Moreau, Franck Davoine
2025	Uncertainty-Aware Regularization for Image-to-Image Translation. Anuja Vats, Ivar Farup, Marius Pedersen, Kiran B. Raja
2025	Uncertainty-Guided Cross Attention Ensemble Mean Teacher for Semi-Supervised Medical Image Segmentation. Meghana Karri, Amit Soni Arya, Koushik Biswas, Nicolo Gennaro, Vedat Cicek, Gorkem Durak, Yuri S. Velichko, Ulas Bagci
2025	Uncertainty-Guided Metric Learning Without Labels. Dhanunjaya Varma Devalraju, C. Chandra Sekhar
2025	Uncertainty-based Data-wise Label Smoothing for Calibrating Multiple Instance Learning in Histopathology Image Classification. Hyeongmin Park, Sungrae Hong, Chanjae Song, Jongwoo Kim, Mun Yong Yi
2025	Unconstrained Open Vocabulary Image Classification: Zero-Shot Transfer from Text to Image via CLIP Inversion. Philipp Allgeuer, Kyra Ahrens, Stefan Wermter
2025	Uni-SLAM: Uncertainty-Aware Neural Implicit SLAM for Real-Time Dense Indoor Scene Reconstruction. Shaoxiang Wang, Yaxu Xie, Chun-Peng Chang, Christen Millerdurai, Alain Pagani, Didier Stricker
2025	UniTMGE: Uniform Text-Motion Generation and Editing Model via Diffusion. Ruoyu Wang, Yangfan He, Tengjiao Sun, Xiang Li, Tianyu Shi
2025	Unified Framework for Open-World Compositional Zero-Shot Learning. Hirunima Jayasekara, Khoi Pham, Nirat Saini, Abhinav Shrivastava
2025	Uniform Attention Maps: Boosting Image Fidelity in Reconstruction and Editing. Wenyi Mo, Tianyu Zhang, Yalong Bai, Bing Su, Ji-Rong Wen
2025	Unifying Low-Resolution and High-Resolution Alignment by Event Cameras for Space-Time Video Super-Resolution. Hoonhee Cho, Jae-Young Kang, Taewoo Kim, Yuhwan Jeong, Kuk-Jin Yoon
2025	Unleashing Potentials of Vision-Language Models for Zero-Shot HOI Detection. Moyuru Yamada, Nimish Dharamshi, Ayushi Kohli, Prasad Kasu, Ainulla Khan, Manu Ghulyani
2025	Unsupervised Denoising for Signal-Dependent and Row-Correlated Imaging Noise. Benjamin Salmon, Alexander Krull
2025	Unsupervised Domain Adaptive Visual Question Answering in the Era of Multi-Modal Large Language Models. Weixi Weng, Rui Zhang, Xiaojun Meng, Jieming Zhu, Qun Liu, Chun Yuan
2025	Unsupervised Single-Image Intrinsic Image Decomposition with LiDAR Intensity Enhanced Training. Shogo Sato, Takuhiro Kaneko, Kazuhiko Murasaki, Taiga Yoshida, Ryuichi Tanida, Akisato Kimura
2025	Unsupervised Video Highlight Detection by Learning from Audio and Visual Recurrence. Zahidul Islam, Sujoy Paul, Mrigank Rochan
2025	User-in-the-Loop Evaluation of Multimodal LLMs for Activity Assistance. Mrinal Verghese, Brian Chen, Hamid Eghbalzadeh, Tushar Nagarajan, Ruta Desai
2025	Utilizing Uncertainty in 2D Pose Detectors for Probabilistic 3D Human Mesh Recovery. Tom Wehrbein, Marco Rudolph, Bodo Rosenhahn, Bastian Wandt
2025	V-MIND: Building Versatile Monocular Indoor 3D Detector with Diverse 2D Annotations. Jin-Cheng Jhang, Tao Tu, Fu-En Wang, Ke Zhang, Min Sun, Cheng-Hao Kuo
2025	VADet: Multi-Frame LiDAR 3D Object Detection Using Variable Aggregation. Chengjie Huang, Vahdat Abdelzad, Sean Sedwards, Krzysztof Czarnecki
2025	VG-SSL: Benchmarking Self-Supervised Representation Learning Approaches for Visual Geo-Localization. Jiuhong Xiao, Gao Zhu, Giuseppe Loianno
2025	VHS: High-Resolution Iterative Stereo Matching with Visual Hull Priors. Markus Plack, Hannah Dröge, Leif Van Holland, Matthias B. Hullin
2025	VIIS: Visible and Infrared Information Synthesis for Severe Low-Light Image Enhancement. Chen Zhao, Mengyuan Yu, Fan Yang, Peiguang Jing
2025	VILLS: Video-Image Learning to Learn Semantics for Person Re-Identification. Siyuan Huang, Ram Prabhakar, Yuxiang Guo, Rama Chellappa, Cheng Peng
2025	VISIONARY: Novel Spatial-Spectral Attention Mechanism for Hyperspectral Image Denoising. Aditya Dixit, Nischit Hosamani, Puneet Gupta, Ankur Garg
2025	VLTP: Vision-Language Guided Token Pruning for Task-Oriented Segmentation. Hanning Chen, Yang Ni, Wenjun Huang, Yezi Liu, Sungheon Jeong, Fei Wen, Nathaniel D. Bastian, Hugo Latapie, Mohsen Imani
2025	VM-Gait: Multi-Modal 3D Representation Based on Virtual Marker for Gait Recognition. Zhao-Yang Wang, Jiang Liu, Jieneng Chen, Rama Chellappa
2025	VMAs: Video-to-Music Generation via Semantic Alignment in Web Music Videos. Yan-Bo Lin, Yu Tian, Linjie Yang, Gedas Bertasius, Heng Wang
2025	Valid: Variable-Length Input Diffusion for Novel View Synthesis. Shijie Li, Farhad G. Zanjani, Haitam Ben Yahia, Yuki M. Asano, Jürgen Gall, Amirhossein Habibian
2025	VerA: Versatile Anonymization Applicable to Clinical Facial Photographs. Majed El Helou, Doruk Cetin, Petar Stamenkovic, Niko Benjamin Huber, Fabio Zünd
2025	Videogamebunny: Towards Vision Assistants for Video Games. Mohammad Reza Taesiri, Cor-Paul Bezemer
2025	VioPose: Violin Performance 4D Pose Estimation by Hierarchical Audiovisual Inference. Seong Jong Yoo, Snehesh Shrestha, Irina Muresanu, Cornelia Fermüller
2025	VipDiff: Towards Coherent and Diverse Video Inpainting via Training-Free Denoising Diffusion Models. Chaohao Xie, Kai Han, Kwan-Yee K. Wong
2025	Vision-Aware Text Features in Referring Image Segmentation: From Object Understanding to Context Understanding. Hai Nguyen-Truong, E-Ro Nguyen, Tuan-Anh Vu, Minh-Triet Tran, Binh-Son Hua, Sai-Kit Yeung
2025	Vision-Based Landing Guidance Through Tracking and Orientation Estimation. João P. K. Ferreira, João P. L. Pinto, Júlia S. Moura, Yi Li, Cristiano Leite Castro, Plamen Angelov
2025	Visual Robustness Benchmark for Visual Question Answering (VQA). Md Farhan Ishmam, Ishmam Tashdeed, Talukder Asir Saadat, Md. Hamjajul Ashmafee, Abu Raihan Mostofa Kamal, Md. Azam Hossain
2025	VisualFusion: Enhancing Blog Content with Advanced Infographic Pipeline. Anurag Deo, Savita Bhat, Shirish S. Karande
2025	Volumetric Conditioning Module to Control Pretrained Diffusion Models for 3D Medical Images. Suhyun Ahn, Wonjung Park, Jihoon Cho, Jinah Park
2025	VortSDF: 3D Modeling with Centroidal Voronoi Tessellation on Signed Distance Field. Diego Thomas, Briac Toussaint, Jean-Sébastien Franco, Edmond Boyer
2025	WAFFLE: Multimodal Floorplan Understanding in the Wild. Keren Ganon, Morris Alper, Rachel Mikulinsky, Hadar Averbuch-Elor
2025	WARLearn: Weather-Adaptive Representation Learning. Shubham Agarwal, Raz Birman, Ofer Hadar
2025	WINE: Wavelet-Guided GAN Inversion and Editing for High-Fidelity Refinement. Chaewon Kim, Seung Jun Moon, Gyeong-Moon Park
2025	Wavelength- and Depth-Aware Deep Image Prior for Blind Hyperspectral Imagery Deblurring with Coarse Depth Guidance. Jiahuan Li, Xiaoyu Dong, Wei He, Naoto Yokoya
2025	WeedsGalore: A Multispectral and Multitemporal UAV-Based Dataset for Crop and Weed Segmentation in Agricultural Maize Fields. Ekin Celikkan, Timo Kunzmann, Yertay Yeskaliyev, Sibylle Itzerott, Nadja Klein, Martin Herold
2025	Weight Copy and Low-Rank Adaptation for Few-Shot Distillation of Vision Transformers. Diana-Nicoleta Grigore, Mariana-Iuliana Georgescu, Jon Álvarez Justo, Tor Arne Johansen, Andreea Iuliana Ionescu, Radu Tudor Ionescu
2025	When Cars Meet Drones: Hyperbolic Federated Learning for Source-Free Domain Adaptation in Adverse Weather. Giulia Rizzoli, Matteo Caligiuri, Donald Shenaj, Francesco Barbato, Pietro Zanuttigh
2025	When Visual State Space Model Meets Backdoor Attacks. Sankalp Nagaonkar, Achyut Mani Tripathi, Ashish Mishra
2025	Which Transformer to Favor: A Comparative Analysis of Efficiency in Vision Transformers. Tobias Christian Nauen, Sebastian Palacio, Federico Raue, Andreas Dengel
2025	Who Brings the Frisbee: Probing Hidden Hallucination Factors in Large Vision-Language Model via Causality Analysis. Po-Hsuan Huang, Jeng-Lin Li, Chin-Po Chen, Ming-Ching Chang, Wei-Chao Chen
2025	WiGNet: Windowed Vision Graph Neural Network. Gabriele Spadaro, Marco Grangetto, Attilio Fiandrotti, Enzo Tartaglione, Jhony H. Giraldo
2025	XPose: Towards Extreme Low Light Hand Pose Estimation. Green Rosh K. S, Meghana Shankar, Prateek Kukreja, Anmol Namdev, B. H. Pawan Prasad
2025	XR-MBT: Multi-Modal Full Body Tracking for XR Through Self-Supervision with Learned Depth Point Cloud Registration. Denys Rozumnyi, Nadine Bertsch, Othman Sbai, Filippo Arcadu, Yuhua Chen, Artsiom Sanakoyeu, Manoj Kumar, Catherine Herold, Robin Kips
2025	ZAHA: Introducing the Level of Facade Generalization and the Large-Scale Point Cloud Facade Semantic Segmentation Benchmark Dataset. Olaf Wysocki, Yue Tan, Thomas Froech, Yan Xia, Magdalena Wysocki, Ludwig Hoegner, Daniel Cremers, Christoph Holst
2025	Zero-Shot Class Unlearning in CLIP with Synthetic Samples. Alexey Kravets, Vinay P. Namboodiri
2025	Zero-Shot Detection of Out-of-Context Objects Using Foundation Models. Anirban Roy, Adam D. Cobb, Ramneet Kaur, Sumit Jha, Nathaniel D. Bastian, Alexander M. Berenbeim, Robert H. Thomson, Iain Cruickshank, Alvaro Velasquez, Susmit Jha
2025	Zerocomp: Zero-Shot Object Compositing from Image Intrinsics via Diffusion. Zitian Zhang, Frédéric Fortier-Chouinard, Mathieu Garon, Anand Bhattad, Jean-François Lalonde
2025	eLIR-Net: an Efficient AI Solution for Image Retouching. Tingting Zhao, Chenguang Liu, Kamal Jnawali, Chang Su
2025	uLayout: Unified Room Layout Estimation for Perspective and Panoramic Images. Jonathan Lee, Bolivar Solarte, Chin-Hsuan Wu, Jin-Cheng Jhang, Fu-En Wang, Yi-Hsuan Tsai, Min Sun