ICME - RankMe – RankMe

662 papers

Year	Title / Authors
2024	3D Nodule Content-Based Metric Learning for Evidence-Based Lung Cancer Screening. Xiaoxi Lu, Xingyue Wang, Jiansheng Fang, Na Zeng, Jingqi Huang, Chuangguang Huang, Jingfeng Zhang, Jianjun Zheng, Heng Meng, Jiang Liu
2024	3D Point Cloud Pre-Training with Knowledge Distilled from 2D Images. Yuan Yao, Yuanhan Zhang, Zhenfei Yin, Jiebo Luo, Wanli Ouyang, Xiaoshui Huang
2024	A Benchmark of Zero-Shot Cross-Lingual Task-Oriented Dialogue Based on Adversarial Contrastive Representation Learning. Shuang Cheng, Zhanyu Ma, Jian Ye
2024	A Cascade Multimodal Fine-Grained MRI Image Grading Network For Preoperative Microvascular Invasion In Hepatocellular Carcinoma. Xinyu Liu, Yong Yi, Ye Luo
2024	A Channel-Wise Guidance Sparse Transformer for Effective Dark Image Enhancement. Haiyan Jin, Yifan Shuai, Fengyuan Zuo, Haonan Su, Zhaolin Xiao, Bin Wang, Yuanlin Zhang
2024	A Coarse-to-Fine Reconstruction Framework for Non-Lambertian Photometric Stereo. Zhigang Wang, Yunpeng Gao, Xun Li, Peipei Gu, Bin Zhao, Xuelong Li
2024	A Dataset with Multi-Modal Information and Multi-Granularity Descriptions for Video Captioning. Mingrui Xiao, Zijian Zeng, Yue Zheng, Shu Yang, Yali Li, Shengjin Wang
2024	A Dual-Branch Network Based on Connectivity Mask for Retinal Vessel Segmentation. Zejun He, Fei Chen, Fan Jiang, Wanling Liu, Zhangyan Ye
2024	A Fast and Tunable Privacy-Preserving Action Recognition Framework over Compressed Video. Qingfeng Zheng, Peijia Zheng, Weiqi Luo, Wei Lu
2024	A Lightweight CNN and Spatial-Channel Transformer Hybrid Network for Image Super-Resolution. Sumei Li, Xiaoxuan Chen, Peiming Lin
2024	A Lightweight Multi-Level Relation Network for Few-shot Action Recognition. Enqi Liu, Liyuan Pan
2024	A Multi-View Double Alignment Hashing Network with Weighted Contrastive Learning. Tianlong Zhang, Zhe Xue, Yuchen Dong, Junping Du, MeiYu Liang
2024	A Multimodal Transformer for Live Streaming Highlight Prediction. Jiaxin Deng, Shiyao Wang, Dong Shen, Liqin Zhao, Fan Yang, Guorui Zhou, Gaofeng Meng
2024	A Noise Robust Framework via Uncertainty Guidance for Medical Image Segmentation with Noisy Label. Zihang Huang, Yukun Yang, Tianyu Zhao, Xin Yang
2024	A Novel Decoupled Prototype Completion Network for Incomplete Multimodal Emotion Recognition. Zhangfeng Hu, Wenming Zheng, Yuan Zong, Mengting Wei, Xingxun Jiang, Mengxin Shi
2024	A Parallel Attention Network For Cattle Face Recognition. Jiayu Li, Xuechao Zou, Shiying Wang, Ben Chen, Junliang Xing, Pin Tao
2024	A Patch-wise Adversarial Denoising Could Enhance the Robustness of Adversarial Training. Shuai Zhao, Shibin Liu, Boyuan Zhang, Yang Zhai, Ziyi Liu, Yahong Han
2024	A Region-Growing Supervised Geometry-Weighted Transformer for Normal Estimation. Rao Fu, Qian Li, Cheng Wen, Ning An, Fulin Tang
2024	A Self-Attention Network for Stereo Matching. Menglong Yang, Hanyong Wang, Yang Ren
2024	A Study On Incorporating Whisper For Robust Speech Assessment. Ryandhimas E. Zezario, Yu-Wen Chen, Szu-Wei Fu, Yu Tsao, Hsin-Min Wang, Chiou-Shann Fuh
2024	A Tri-Branch Network with Prototype-aware Matching for Universal Category Discovery. Haonan Lin, Wenbin An, Yan Chen, Feng Tian, Yuzhe Yao, Wei Ding, Qianying Wang, Ping Chen
2024	A Weakly Supervised and Globally Explainable Learning Framework for Brain Tumor Segmentation. Ruitao Xie, Limai Jiang, Xiaoxi He, Yi Pan, Yunpeng Cai
2024	AS-NeRF: Learning Auxiliary Sampling for Generalizable Novel View Synthesis from Sparse Views. Jilin Tang, Lincheng Li, Xingqun Qi, Yingfeng Chen, Changjie Fan, Xin Yu
2024	ASD: Towards Attribute Spatial Decomposition for Prior-Free Facial Attribute Recognition. Chuanfei Hu, Hang Shao, Bo Dong, Zhe Wang, Yongxiong Wang
2024	ASQuery: A Query-based Model for Action Segmentation. Ziliang Gan, Lei Jin, Lei Nie, Zheng Wang, Li Zhou, Liang Li, Zhecan Wang, Jianshu Li, Junliang Xing, Jian Zhao
2024	AdaForensics: Learning A Characteristic-aware Adaptive Deepfake Detector. Xiaoke Yang, Haixu Song, Xiangyu Lu, Shao-Lun Huang, Yueqi Duan
2024	AdaStyleSpeech: A Fast Stylized Speech Synthesis Model Based on Adaptive Instance Normalization. Yuming Yang, Dongsheng Zou
2024	Adaptive Feature Fusion Network for Infrared Small Target Detection. Boyuan Li, Xiuhong Li, Songlin Li, Yuye Zhang, Kangwei Liu
2024	Adaptive Global-local Fusion Network Based Deep Unsupervised Hashing for Remote Sensing Image Retrieval. Zekun Xu, Yipeng Zhou, Quan Z. Sheng, Chao Li, Tongtong Lou, Weipeng Jing
2024	Adaptive Learning via a Negative Selection Strategy for Few-Shot Bioacoustic Event Detection. Yaxiong Chen, Xueping Zhang, Yunfei Zi, Shengwu Xiong
2024	Adaptive Margin Contrastive Learning for Ambiguity-aware 3D Semantic Segmentation. Yang Chen, Yueqi Duan, Runzhong Zhang, Yap-Peng Tan
2024	Adaptive Oriented Adversarial Attacks on Visible and Infrared Image Fusion Models. Yuchen Wang, Xiaoguang Li, Li Yang, Lu Zhou, Jianfeng Ma, Hui Li
2024	Adaptive Prompt Learning with Negative Textual Semantics and Uncertainty Modeling for Universal Multi-Source Domain Adaptation. Yuxiang Yang, Lu Wen, Yuanyuan Xu, Jiliu Zhou, Yan Wang
2024	Adaptive Style Transfer Learning for Generalizable Person Re-identification. Xu Wang, Kairui Zhang
2024	Adaptive Temporal Motion Guided Graph Convolution Network for Micro-expression Recognition. Fengyuan Zhang, Zhaopei Huang, Xinjie Zhang, Qin Jin
2024	Adversarial Training with OCR modality Perturbation for Scene-Text Visual Question Answering. Zhixuan Shen, Haonan Luo, Sijia Li, Tianrui Li
2024	Agent-Oriented Joint Decision Support for Data Owners in Auction-Based Federated Learning. Xiaoli Tang, Han Yu, Xiaoxiao Li
2024	Agnostic Feature Compression with Semantic Guided Channel Importance Analysis. Ying Tang, Wei Yang, Junqing Yu, Zikai Song
2024	Align-RDW: Alignment-based Redirected Walking for Multi-User VR scenarios. Tianyang Dong, Huanbo Zhang, Hubin Kong, Shuqian Lv, Fenghao Li
2024	Alternating Direction Method of Multipliers for Negative Binomial Model with the Weighted Difference of Anisotropic and Isotropic Total Variation. Yu Lu, Kevin Bui, Roummel F. Marcia
2024	Ambiguity Consistency and Uncertainty Minimization for Semi-Supervised Medical Image Segmentation. Xiaolin Huang, Biqing Zeng, Jiahui Pan, Yujiang Yao, Zheng Zhou, Bingzhi Chen
2024	An Aesthetic-Guided Multimodal Framework for Video Summarization. Jiehang Xie, Xuanbai Chen, Shao-Ping Lu
2024	An Empirical Study of Parameter Efficient Fine-tuning on Vision-Language Pre-train Model. Yuxin Tian, Mouxing Yang, Yunfan Li, Dayiheng Liu, Xingzhang Ren, Xi Peng, Jiancheng Lv
2024	An Images Regeneration Method for CG Anti-Forensics Based on Sensor Device Trace. Yihong Lu, Jianyi Liu, Ru Zhang
2024	Analyzing Behavior and Intention in Multi-Agent Systems Using Graph Neural Networks. Jintai Du, Jinlong Wang, Jiansheng Chen, Xinlong Ding, Jiehui Wu, Tianyu Hu, Huimin Ma
2024	Anchor Based Multi-view Clustering for Partially View-Aligned Data. Liang Zhao, Yukun Yuan, Qiongjie Xie, Ziyue Wang
2024	Annotation-Free Automatic Music Transcription with Scalable Synthetic Data and Adversarial Domain Confusion. Gakusei Sato, Taketo Akama
2024	Area Intervention for Enhancing Class Activation Maps in Weakly Supervised Semantic Segmentation. Xuewei Li, Yujie Diao, Mei Yu, Chenhan Wang, Jie Gao, Ruiguo Yu
2024	Artistry in Pixels: FVS - A Framework for Evaluating Visual Elegance and Sentiment Resonance in Generated Images. Weijie Li, Luwei Xiao, Xingjiao Wu, Tianlong Ma, Jiabao Zhao, Liang He
2024	AsCL: An Asymmetry-sensitive Contrastive Learning Method for Image-Text Retrieval with Cross-Modal Fusion. Ziyu Gong, Chengcheng Mai, Yihua Huang
2024	Attention in Attention for PET-CT Modality Consensus Lung Tumor Segmentation. Yuzhou Zhao, Xinyu Zhou, Haijing Guo, Qianyu Guo, Yan Zuo, Shaoli Song, Shuyong Gao, Wenqiang Zhang
2024	Attentive Modeling and Distillation for Out-of-Distribution Generalization of Federated Learning. Zhuang Qi, Weihao He, Xiangxu Meng, Lei Meng
2024	Audio-driven High-resolution Seamless Talking Head Video Editing via StyleGAN. Jiacheng Su, Kunhong Liu, Liyan Chen, Junfeng Yao, Qingsong Liu, Dongdong Lv
2024	Audiolog: LLMs-Powered Long Audio Logging with Hybrid Token-Semantic Contrastive Learning. Jisheng Bai, Han Yin, Mou Wang, Dongyuan Shi, Woon-Seng Gan, Jianfeng Chen, Susanto Rahardja
2024	Automatic Fusion for Multimodal Entity Alignment: A New Perspective from Automatic Architecture Search. Chenyang Bu, Yunpeng Hong, Shiji Zang, Guojie Chang, Xindong Wu
2024	AuxSegCount: Auxiliary Seg-Attention Based Network for Wheat Ears Counting in Field Conditions. Jie Zhang, Hao Xiong, Hecang Zang, Meng Zhou, Dong Liu, Zhonghua Liu, Hualei Shen
2024	BARTENDER: A simple baseline model for task-level heterogeneous federated learning. Yuwen Yang, Yuxiang Lu, Suizhi Huang, Shalayiding Sirejiding, Chang Liu, Muyang Yi, Zhaozhi Xie, Yue Ding, Hongtao Lu
2024	BFD: Binarized Frequency-enhanced Distillation for Vision Transformer. Hanglin Li, Peng Yin, Xiaosu Zhu, Lianli Gao, Jingkuan Song
2024	BFMEF: Brightness-Free Multi-exposure Image Fusion via Adaptive Correction. Pan Mu, Binjia Zhou, Qirui Wang, Zhiying Du, Xiaoyan Wang
2024	BTC: Bilateral-Branch Vision Transformer via Hilbert Patch Embedding for Image Clustering. Taizhang Hu, Fan Yang, Xing Wei, Chong Zhao, Li Meng, Bin Wen, Yang Lu
2024	Balanced Active Sampling for Person Re-identification. Tao He, Leqi Shen, Guiguang Ding, Zhiheng Zhou, Tianshi Xu, Xiaofeng Jin, Yuheng Huang
2024	Beimin: Serverless-based Adaptive Real-Time Video Processing. Jiaye Zhang, Zili Meng, Mingwei Xu
2024	Beyond Global Cues: Unveiling the Power of Fine Details in Image Matching. Dongyue Li, Songlin Du
2024	Bi-directional Boundary-object interaction and refinement network for Camouflaged Object Detection. Jicheng Yang, Qing Zhang, Yilin Zhao, Yuetong Li, Zeming Liu
2024	Bilevel Relational Graph Representation Learning-based Multimodal Emotion Recognition in Conversation. Huan Zhao, Yi Ju, Yingxue Gao
2024	Block-Wise Compression Of The Quantum Gray-Scale Image Using Lossy Preparation Approach. Md. Ershadul Haque, Manoranjan Paul
2024	Boosting Disfluency Detection with Large Language Model as Disfluency Generator. Zhenrong Cheng, Jiayan Guo, Hao Sun, Yan Zhang
2024	Boosting Multi-Speaker Expressive Speech Synthesis with Semi-Supervised Contrastive Learning. Xinfa Zhu, Yuke Li, Yi Lei, Ning Jiang, Guoqing Zhao, Lei Xie
2024	Boosting Node Injection Attack with Graph Local Sparsity. Wenxin Liang, Bingkai Liu, Han Liu, Hong Yu
2024	Boundary Contrast Domain Adaptation for Cross-modality Medical Image Segmentation. Haoran Zhang, Xi Lin, Suxian Xiang, Chenxi Huang, Lvqing Yang, Yan Wang
2024	Boundary-Aware Contrastive Learning for Single-Source Domain Generalization in Medical Image Segmentation. Chenbin Zhang, Zhiqiang Hu, Shuyu Dai, Qingyuan He, Defeng Liu, Kun Yan, Ping Wang
2024	Brain Waves Unleashed: Illuminating Neonatal Seizure Detection via Multi-scale Hierarchical Modeling. Bingheng Pang, Zhuoxuan Liang, Wei Li, Xiangxu Meng, Chenhao Wang, Yilin Ren
2024	Bringing Textual Prompt to AI-Generated Image Quality Assessment. Bowen Qu, Haohui Li, Wei Gao
2024	Build a Cross-modality Bridge for Image-to-Point Cloud Registration. Lin Bie, Shouan Pan, Kai Cheng, Li Han
2024	BézierFormer: A Unified Architecture for 2D and 3D Lane Detection. Zhiwei Dong, Xi Zhu, Xiya Cao, Ran Ding, Caifa Zhou, Wei Li, Yongliang Wang, Qiangbo Liu
2024	C2F-CCPE: Coarse-to-Fine Cross-View Camera Pose Estimation. Yong Tang, Qiang Huang, Yingying Zhu
2024	C3T: Contrastive Consistency Cross-Network Learning for Semi-Supervised Semantic Segmentation. Yucheng Shu, Jiaxin Xie, Lihong Qiao, Bin Xiao, Weisheng Li, Xinbo Gao
2024	CAM-Guided Translation for Unpaired Weakly-Supervised Medical Image Segmentation. Yuebin Xie, Xiaochen He, Baoyao Yang, Fei Lyu, Siqi Liu
2024	CAPformer: Compression-Aware Pre-trained Transformer for Low-Light Image Enhancement. Wei Wang, Zhi Jin
2024	CGCUT: Unpaired Image-to-Image Translation via Cluster-Guided Contrastive Learning. Longjie Qi, Yue Ding, Hongtao Lu
2024	CLIP-Driven Multi-Scale Instance Learning for Weakly Supervised Video Anomaly Detection. Zhangbin Qian, Jiawei Tan, Zhilong Ou, Hongxing Wang
2024	CLIPER: A Unified Vision-Language Framework for In-the-Wild Facial Expression Recognition. Hanting Li, Hongjing Niu, Zhaoqing Zhu, Feng Zhao
2024	CMSCL: Cross-Modal Spatial Contrastive Learning for 3D Medical Image Classification. Yuxuan Chen, Chengbo Wang, Xiuying Wang
2024	COCO is "ALL" You Need for Visual Instruction Fine-tuning. Xiaotian Han, Yiqi Wang, Bohan Zhai, Quanzeng You, Hongxia Yang
2024	COM3D: Leveraging Cross-View Correspondence and Cross-Modal Mining for 3D Retrieval. Hao Wu, Ruochong Li, Hao Wang, Hui Xiong
2024	CRNet: Cross-Reconstruction Network for Inconsistent Point Cloud Registration. Yunzhe Xiao, Xueqiong Li, Shaowu Yang, Wenjing Yang, Yong Dou
2024	CSMA-CNER: Multi-modal Chinese NER task with Cross- and Self-Modality Attention. Bo Kong, Shengquan Liu, Liang He, Liruizhi Jia, Yi Liang
2024	CSS-Net: Domain Generalization in Category-level Pose Estimation via Corresponding Structural Superpoints. Li Jin, Xibin Song, Jia Li, Changhe Tu, Xueying Qin
2024	CUS3D: Clip-Based Unsupervised 3D Segmentation via Object-Level Denoise. Fuyang Yu, Runze Tian, Zhen Wang, Xiaochuan Wang, Xiaohui Liang
2024	CaPAN: Class-aware Prototypical Adversarial Networks for Unsupervised Domain Adaptation. Zhenyu Yu, Pei Wang
2024	Camera Bias Regularization for Person Re-identification. Tao He, Leqi Shen, Guiguang Ding, Zhiheng Zhou, Tianshi Xu, Xiaofeng Jin, Yuheng Huang
2024	Camera Chameleon - The Creative Impact of Tracked Tangible Interfaces for Virtual Film Pre-Production. Will Kerr, Crescent Jicol, Tom S. F. Haines, Wenbin Li
2024	Cascaded Network with Hierarchical Self-Distillation for Sparse Point Cloud Classification. Kaiyue Zhou, Ming Dong, Peiyuan Zhi, Shengjin Wang
2024	Causal Denoising Framework for Generalizable Recommendation System using Graph Neural Network. Yibowen Zhao, Yonghui Xu, Ning Liu, Yixin Zhang, Wei Guo, Xudong Lu, Lizhen Cui
2024	Causal Fusion of Convolutional Neural Network and Vision Transformer for Image Anomaly Detection and Localization. Shuo Zhang, Xiongpeng Hu, Jing Liu
2024	Causal Intervention for Panoptic Scene Graph Generation. Shuang Liang, Long Zhang, Chi Xie, Lili Chen
2024	Chain-of-Thought Prompting for Demographic Inference with Large Multimodal Models. Yongsheng Yu, Jiebo Luo
2024	Class-Aware Feature Perturbation for Long-Tailed Visual Recognition. Xicheng Chen, Haibo Ye, Fangyu Zhou
2024	Client-Supervised Federated Learning: Towards One-Model-for-All Personalization. Peng Yan, Guodong Long
2024	ClipComb: Global-Local Composition Network based on CLIP for Composed Image Retrieval. Yingying Zhu, Dafeng Li, Zhihang Liu, Hong Zhou
2024	Clothing Sampling Based on Active Learning For Cloth-Changing Person Re-identification. Yujie Liu, Mingyue Li, Jiansen Jing, Yante Li, Guoying Zhao
2024	Clothmix: A Cloth Augmentation Strategy for Cloth-Changing Person Re-Identification. Wajahat Khalid, Bin Liu, Muhammad Waqas
2024	CoVLR: Coordinating Cross-Modal Consistency and Intra-Modal Relations for Vision-Language Retrieval. Fengqiang Wan, Xiangyu Wu, Zhihao Guan, Yang Yang
2024	Coarse-to-fine Alignment Makes Better Speech-image Retrieval. Lifeng Zhou, Yuke Li
2024	Coherentice: Invertible Concept-Based Explainability Framework for CNNs beyond Fidelity. Ugochukwu Ejike Akpudo, Yongsheng Gao, Jun Zhou, Andrew Lewis
2024	Collaborative Edge Caching in LEO Satellites Networks: A MAPPO Based Approach. Mingzhou Wu, Shiqi Dai, Han Hu, Zhi Wang
2024	Color Space Learning for Cross-Color Person Re-Identification. Jiahao Nie, Shan Lin, Alex C. Kot
2024	Color-SD: Stable Diffusion Model Already has a Color Style Noisy Latent Space. Jiancheng Huang, Mingfu Yan, Yifan Liu, Shifeng Chen
2024	Combining Soft and Hard Attentions for high-quality single-stage instance segmentation. Qiong Chen, Yaochi Zhao, Yujia Chen, He Zhang, Zhuhua Hu
2024	Common Sense Language-Guided Exploration and Hierarchical Dense Perception for Instruction Following Embodied Agents. Yuanwen Chen, Xinyao Zhang, Yaran Chen, Dongbin Zhao, Yunzhen Zhao, Zhe Zhao, Pengfei Hu
2024	Common-Memory Bridged Cross-Modal Adaptive Graph Embedding for Image-Text Retrieval. Zheng Cui, Yongli Hu, Jiapu Wang, Junbin Gao, Yanfeng Sun, Baocai Yin
2024	Completely Unpaired Cross-Modal Hashing Based on Coupled Subspace. Xuening Zhang, Xingbo Liu, Xiao Kang, Wen Xue, Xiushan Nie, Shaohua Wang, Yilong Yin
2024	ConfR: Conflict Resolving for Generalizable Deepfake Detection. Jin Chen, Jiahe Tian, Cai Yu, Xi Wang, Zhaoxing Li, Yesheng Chai, Jiao Dai, Jizhong Han
2024	Consensus Co-teaching for Dynamically Learning with Noisy Labels. Wenjing Wang, Si Li
2024	Context-Aware Text-Assisted Multimodal Framework for Cervical Cytology Cell Diagnosis and Chatting. Yuxuan Sun, Chenglu Zhu, Sunyi Zheng, Yunlong Zhang, Honglin Li, Lin Yang
2024	Contextual Interaction Enhancement Network for Smoke Detection. Jiefeng Lin, Chenlin Fu, Qiang Huang, Yingying Zhu
2024	Continual Semantic Segmentation via Mask-Based Class Rebalancing. Yongjie Guo, Siya Chen, Hongjian You
2024	Contour-Guided Modality Mitigation Network for Visible-Infrared Person Re-Identification. Qilong Xu, Xiuyang Zhao
2024	Contrastive masked auto-encoders based self-supervised hashing for 2D image and 3D point cloud cross-modal retrieval. Rukai Wei, Heng Cui, Yu Liu, Yanzhao Xie, Yufeng Hou, Ke Zhou
2024	Controllable Text-to-Audio Generation with Training-Free Temporal Guidance Diffusion. Tianjiao Du, Jun Chen, Jiasheng Lu, Qinmei Xu, Huan Liao, Yupeng Chen, Zhiyong Wu
2024	Controllable and Gradual Facial Blemishes Retouching Via Physics-Based Modelling. Chenhao Shuai, Rizhao Cai, Bandara Dissanayake, Amanda Newman, Dayan Guan, Dennis Sng, Ling Li, Alex C. Kot
2024	Convolutional Modulation Feature Distillation Network for Image Super-resolution. Xuan Wu, Liang Chen, Ming Tan, Yi Wu
2024	Cooperative Students: Navigating Unsupervised Domain Adaptation in Nighttime Object Detection. Jicheng Yuan, Anh Le-Tuan, Manfred Hauswirth, Danh Le Phuoc
2024	Correcting Pseudo Labels in Semi Supervised Object Detection with SAM. Pengyu Wang, Jianmin Li, Wenbo Ding, Jiachen Zhong, Jianyong Ai
2024	CosDiff: Code-Switching TTS Model Based on A Multi-Task DDIM. Ke Chen, Zhihua Huang, Kexin Lu, Yonghong Yan
2024	Counterfactual Explanations for Face Forgery Detection via Adversarial Removal of Artifacts. Yang Li, Songlin Yang, Wei Wang, Ziwen He, Bo Peng, Jing Dong
2024	Cross-Attention is not always needed: Dynamic Cross-Attention for Audio-Visual Dimensional Emotion Recognition. R. Gnana Praveen, Jahangir Alam
2024	Cross-Domain Feature Semantic Calibration for Zero-Shot Sketch-Based Image Retrieval. Xuewan He, Jielei Wang, Qianxin Xia, Guoming Lu, Yuan Tang, Hongxia Lu
2024	Cross-Evaluation and Re-weighting for Multi-Source-Free Domain Adaptation. Bingxin Li, Ying Li, Shihui Ying
2024	Cross-Lingual Transfer for Natural Language Inference via Multilingual Prompt Translator. Xiaoyu Qiu, Yuechen Wang, Jiaxin Shi, Wengang Zhou, Houqiang Li
2024	Cross-Modal Adapter: Parameter-Efficient Transfer Learning Approach for Vision-Language Models. Juncheng Yang, Zuchao Li, Shuai Xie, Weiping Zhu, Wei Yu, Shijun Li
2024	Cross-Modality Consistency Mining For Continuous Sign Language Recognition with Text-Domain Equivalents. Zhenghao Ke, Sheng Liu, Chengyuan Ke, Yuan Feng, Shengyong Chen
2024	Cross-Point Adversarial Attack Based on Feature Neighborhood Disruption Against Segment Anything Model. Yan Jiang, Guisheng Yin, Ye Yuan, Jingjing Chen, Zhipeng Wei
2024	Cross-modal Prominent Fragments Enhancement Aligning Network for Image-text Retrieval. Yang Zhang, Yue Zhou, Zonghao Yang, Ao Chen
2024	Crowd Counting and Localization in Haze and Rain. Weijun Yuan, Zhan Li, Xiaohan Li, Liangda Fang, Qingfeng Zhang, Zhixiang Qiu
2024	Customized Cross-device Neural Architecture Search with Images. Yang Yao, Xin Wang, Yijian Qin, Ziwei Zhang, Wenwu Zhu, Hong Mei
2024	Cycle Frequency-Harmonic-Time Transformer for Note-Level Singing Voice Transcription. Yulun Wu, Yaolong Ju, Simon Lui, Jing Yang, Fan Fan, Xuhao Du
2024	DA-LGNet: Enhancing Spatial-Spectral feature representation with Dual-Attention Local-General Network for Hyperspectral images and Multispectral images Fusion. Haozheng Zhang, Yanhong Yang, Zhixuan Jing, Shengyong Chen
2024	DARA: Domain- and Relation-Aware Adapters Make Parameter-Efficient Tuning for Visual Grounding. Ting Liu, Xuyang Liu, Siteng Huang, Honggang Chen, Quanjun Yin, Long Qin, Donglin Wang, Yue Hu
2024	DDLNet: Boosting Remote Sensing Change Detection with Dual-Domain Learning. Xiaowen Ma, Jiawei Yang, Rui Che, Huanting Zhang, Wei Zhang
2024	DNAF: Diffusion with Noise-Aware Feature for Pose-Guided Person Image Synthesis. Liyan Guo, Kaiyu Song, Mengying Xu, Hanjiang Lai
2024	DNPM: A Neural Parametric Model for the Synthesis of Facial Geometric Details. Haitao Cao, Baoping Cheng, Qiran Pu, Haocheng Zhang, Bin Luo, Yixiang Zhuang, Juncong Lin, Liyan Chen, Xuan Cheng
2024	DPP-Net: Difficulty Perception-Processing Heterogeneous Network for Semi-supervised Medical Image Segmentation. Qiqin Lin, Weixing Xie, Rongzhou Zhou, Xianpeng Cao, Jingze Chen, Junfeng Yao, Qingqi Hong
2024	DSENet: An Object-Wise Density-Informed Coarse-to-Fine Object Detector for Aerial Image. Haoran Jiang, Xiangjie Wang, Junjie Zhang, Jian Zhang, Dan Zeng
2024	Data Standardization for Robust Lip Sync. Chun Wang
2024	DeCMG: Denoise with Cross-modality Guidance Makes Better Text-Video Retrieval. Rui Deng, Yuke Li
2024	Debiased Prototypical Learning Improves Generalized Category Discovery. Yu Wang, Bingchen Zhao, Yongchun Lu, Guoqiang Xiao, Quan Lu
2024	Decoupled Federated Learning on Long-Tailed and Non-IID data with Feature Statistics. Zhuoxin Chen, Zhenyu Wu, Yang Ji
2024	Decoupling Spatio-Temporal Network for Fine-Grained Temporal Action Segmentation. Haifei Duan, Shenglan Liu, Chenwei Tan, Yuning Ding, Jirui Tian, Feilong Wang
2024	Deep Bi-directional Attention Network for Image Super-Resolution Quality Assessment. Yixiao Li, Xiaoyuan Yang, Jun Fu, Guanghui Yue, Wei Zhou
2024	Deep Self-paced Active Learning for Image Clustering. Helin Zhao, Wei Chen, Peng Zhou
2024	Deep Unfolding 3D Non-Local Transformer Network for Hyperspectral Snapshot Compressive Imaging. Zheng Zhou, Zongxin Liu, Yongyong Chen, Bingzhi Chen, Biqing Zeng, Yicong Zhou
2024	Defending Against Backdoor Attacks via Region Growing and Diffusion Model. Haoquan Wang, Shengbo Chen, Xijun Wang, Hong Rao, Yong Chen
2024	DeformingNet: Deforming Multiple Uniform 3D Priors for 3D Point Cloud Completion. Jingjing Lu, Yunchuan Qin, Fan Wu, Zhizhong Liu, Kenli Li, Ruihui Li
2024	Delve into Source and Target Collaboration in Semi-supervised Domain Adaptation for Semantic Segmentation. Yuan Gao, Zilei Wang, Yixin Zhang
2024	Dense Voxel Representation Network for Implicit Scene Completion. Fan Dai, Yun Zhu, Yaqi Shen, Jin Xie, Jianjun Qian
2024	Densely Connected Transformer with Frequency Awareness and Sam Guidance for Semi-Supervised Hyperspectral Image Classification. Yutao Rao, Liwei Sun, Junjie Zhang, Haoran Jiang, Jian Zhang, Dan Zeng
2024	DepthRefiner: Adapting RGB Trackers to RGBD Scenes via Depth-Fused Refinement. Simiao Lai, Dong Wang, Huchuan Lu
2024	Deviation Wing Loss for High-Performance 2D Pose Estimation. Ling Li, Junliang Xing, Xinchun Yu, Xiao-Ping Zhang
2024	Diff-IFL: Towards General Image Forgery Localization using Diffusion Probabilistic Model. Ping Xu, Jiangqun Ni, Jian Zhang, Yulin Zhang, Shiyuan Tang
2024	Diffimpute: Tabular Data Imputation with Denoising Diffusion Probabilistic Model. Yizhu Wen, Yiwei Wang, Kai Yi, Jing Ke, Yiqing Shen
2024	DiffuStra: A Diffusion Model for Dialog Strategy in Non-Collaborative Dialog Systems. Haixiang Zhu, Jing Ye, Jianbing Tang, Yiping Song
2024	Diffusion based Coarse-to-Fine Network for 3D Human Pose and Shape Estimation from monocular video. Chuqiao Wu, Haitao Huang, Wenming Yang
2024	Dirichlet-Based Coarse-to-Fine Example Selection For Open-Set Annotation. Ye-Wen Wang, Chen-Chen Zong, Ming-Kun Xie, Sheng-Jun Huang
2024	Discriminative Pedestrian Features and Gated Channel Attention for Clothes-Changing Person Re-Identification. Yongkang Ding, Rui Mao, Hanyue Zhu, Anqi Wang, Liyan Zhang
2024	Disentangling and Aggregating: A Data-Centric Training Framework for Cross-Domain Few-Shot Classification. Zhaochen Li, Kedian Mu
2024	Distillation Excluding Positives for Few-Shot Class-Incremental Learning. Duo Liu, Linglan Zhao, Zhongqiang Zhang, Fuhan Cai, Xiangzhong Fang
2024	Distinguishing Textual Prompt Importance: Image-Guided Text Weighting for CLIP-Based Few-shot Learning. Tianci Xun, Wei Chen, Yulin He, Di Wu, Yuanming Gao, Jiuyuan Zhu, Weiwei Zheng
2024	Distinguishing Visually Similar Images: Triplet Contrastive Learning Framework for Image-text Retrieval. Pengxiang Ouyang, Jianan Chen, Qing Ma, Zheng Wang, Cong Bai
2024	Diverse Embedding Modeling with Adaptive Noise Filter for Text-based Person Retrieval. Chen He, Shenshen Li, Zheng Wang, Fumin Shen, Yang Yang, Xing Xu
2024	Do Keypoints Contain Crucial Information? Mining Keypoint Information to Enhance Cross-View Geo-Localization. Yanchao Liang, Xiangqian Wu
2024	Document Image Dewarping Guided by 3D Geometry and Layout Priors. Qingfeng Wang, Lingyu Liang, Shuangping Huang
2024	Domain Adaptive Pose Estimation Via Multi-level Alignment. Yugan Chen, Lin Zhao, Yalong Xu, Honglei Zu, Xiaoqi An, Guangyu Li
2024	Domain Prompt Learning Framework for Real Image Dehazing. Kaihao Lin, Guoqing Wang, Yuhui Wu, Shuhang Gu, Xing Xu, Yang Yang
2024	DomainVoyager: Embracing The Unknown Domain by Prompting for Automatic Augmentation. Chuang Liu, Haogang Zhu, Xiu Su
2024	Don't Turn a Blind Eye to Localization Noise: Localization Pseudo-label Correction and Learning for Semi-Supervised Object Detection. Yulin He, Wei Chen, Zhengfa Liang, Ke Liang, Yusong Tan, Tianrui Liu, Yulan Guo
2024	DrivingGen: Efficient Safety-Critical Driving Video Generation with Latent Diffusion Models. Zipeng Guo, Yuchen Zhou, Chao Gou
2024	DuCoFPan: Dual-Condition Flow-based Network for Pan-sharpening. Mengjiao Zhao, Mengting Ma, Xiangdong Li, Xiaowen Ma, Xinyu Wang, Ao Gao, Wei Zhang
2024	Dual Guidance Enhancing Camouflaged Object Detection via Focusing Boundary and Localization Representation. Songlin Li, Xiuhong Li, Zhe Li, Hongbing Ma, Jiabao Sheng, Boyuan Li
2024	Dual Space Embedding Learning For Weakly Supervised Audio-Visual Violence Detection. Yiran Liu, Zhanjie Wu, Mengjingcheng Mo, Ji Gan, Jiaxu Leng, Xinbo Gao
2024	Dual-Domain Multi-Model GAN Fingerprint Restoration for Compressed Fake Face Attribution. Chengxiang Fan, Aohong Shen, Zhen Han, Cai Tong, Zhongyuan Wang, Dekang Yi
2024	Dual-View Multimodal Interaction in Multimodal Sentiment Analysis. Kang Zhu, Cunhang Fan, Jianhua Tao, Jun Xue, Heng Xie, Xuefei Liu, Yongwei Li, Zhengqi Wen, Zhao Lv
2024	DualCOS: Query-Efficient Data-Free Model Stealing with Dual Clone Networks and Optimal Samples. Yunfei Yang, Xiaojun Chen, Yuexin Xuan, Zhendong Zhao
2024	Dynamic Implicit Image Function for Efficient Arbitrary-Scale Super-Resolution. Zongyao He, Zhi Jin
2024	Dynamic Multi-Modal Representation Learning For Topic Modeling. Hongzhang Mu, Shuili Zhang, Quangang Li, Tingwen Liu, Hongbo Xu
2024	Dynamic Scene Graph Generation with Unified Temporal Modeling. Sisi You, Bing-Kun Bao
2024	DynamicTrack: Advancing Gigapixel Tracking in Crowded Scenes. Yunqi Zhao, Yuchen Guo, Zheng Cao, Kai Ni, Ruqi Huang, Lu Fang
2024	EGLA-Net: Edge Guided with Lesion Aware Network for Medical image segmentation. Ruixue Qi, Chen Pang, Mengyang Zhang, Lei Lyu
2024	ELiTe: Efficient Image-to-LiDAR Knowledge Transfer for Semantic Segmentation. Zhibo Zhang, Ximing Yang, Weizhong Zhang, Cheng Jin
2024	EMo Transformer: Transformer-Based Depression Detection via Eye Movements. Xin Li, Haizhuang Liu, Rongquan Wang, Bochao Zou, Yuxin Lin, Huimin Ma
2024	EPContrast: Effective Point-level Contrastive Learning for Large-scale Point Cloud Understanding. Zhiyi Pan, Guoqing Liu, Wei Gao, Thomas H. Li
2024	ESR-DDLN : Enhanced Single Image Super-Resolution Via Dual-Domain Learning Network. Zihao He, Shengchuan Zhang
2024	ESTME: Event-driven Spatio-temporal Motion Enhancement for Micro-Expression Recognition. Peilin Xiao, Yueyi Zhang, Dachun Kai, Yansong Peng, Zheyu Zhang, Xiaoyan Sun
2024	ETAU: Towards Emotional Talking Head Generation Via Facial Action Unit. Jiayi Lyu, Xing Lan, Guohong Hu, Hanyu Jiang, Wei Gan, Jian Xue
2024	EVAN: Evolutional Video Streaming Adaptation via Neural Representation. Mufan Liu, Le Yang, Yiling Xu, Ye-Kui Wang, Jenq-Neng Hwang
2024	Edge-Guided Detector-Free Network for Robust and Accurate Visible-Thermal Image Matching. Yanping Li, Zhaoshuai Qi, Xiuwei Zhang, Tao Zhuo, Yue Liang, Yanning Zhang
2024	Edge-Guided Mural Image Inpainting by Integrating Local and Global Information and Multiple Color Spaces. Guodong Li, Letu Qingge, Qingyi Pan, Pei Yang
2024	Effective and Efficient Few-shot Fine-tuning for Vision Transformers. Junjie Yang, Hao Wu, Ji Zhang, Lianli Gao, Jingkuan Song
2024	Efficient Dynamic-NeRF Based Volumetric Video Coding with Rate Distortion Optimization. Zhiyu Zhang, Guo Lu, Huanxiong Liang, Anni Tang, Qiang Hu, Li Song
2024	Efficient Guided Query Network for Human-Object Interaction Detection. Junkai Li, Huicheng Lai, Jun Ma, Tongguan Wang, Hutuo Quan, Dongji Chen
2024	Efficient Sampling and Volume Rendering Strategy for Neural Field SLAM. Meng Wang, Yue Qi
2024	Efficient Speech-to-Text Translation: Progressive Pruning for Accelerated Speech Pre-trained Model. Nan Chen, Yonghe Wang, Xiangdong Su, Feilong Bao
2024	Efficient U-Shape Invertible Neural Network for Image Steganography. Le Zhang, Tong Li, Yao Lu, Mixiao Hou, Guangming Lu
2024	Eliminating the Language Bias for Visual Question Answering with fine-grained Causal Intervention. Ying Liu, Ge Bai, Chenji Lu, Shilong Li, Zhang Zhang, Ruifang Liu, Wenbin Guo
2024	Enabling Practical and Pervasive Content Delivery from Emerging LEO Mega-Constellations. Songshi Dou, Xianhao Chen, Kwan L. Yeung
2024	Encoding Semantic Priors into the Weights of Implicit Neural Representation. Zhicheng Cai, Qiu Shen
2024	Enhanced Blind Watermarking Against Black-Box Noise: Leveraging CIN Framework. Rui Ma, Mengxi Guo, Peidong Jia, Chenxuan Li, Yi Hou, Yuan Li, Xiaodong Xie, Shanghang Zhang
2024	Enhanced Interpretability in Learned Image Compression via Convolutional Sparse Coding. Yiwen Tu, Wen Tan, Youneng Bao, Genhong Wang, Fanyang Meng, Yongsheng Liang
2024	Enhanced Speech Emotion Recognition Incorporating Speaker-Sensitive Interactions in Conversations. Jiachen Luo, Huy Phan, Lin Wang, Joshua D. Reiss
2024	Enhancing Adversarial Transferability on Vision Transformer by Permutation-Invariant Attacks. Haoyu Deng, Yanmei Fang, Fangjun Huang
2024	Enhancing Consistent Federated Learning Objectives Through Uniform Feature Distributions. Siqi Deng, Liu Yang
2024	Enhancing Few-Shot Classification without Forgetting Through Multi-level Contrastive Constraints. Bingzhi Chen, Haoming Zhou, Yishu Liu, Biqing Zeng, Jiahui Pan, Guangming Lu
2024	Enhancing Human Action Recognition with Fine-grained Body Movement Attention. Rui Zhang, Junxiao Xue, Feng Lin, Qing Zhang, Pavel Smirnov, Xiao Ma, Xiaoran Yan
2024	Enhancing Multimodal Sentiment Analysis via Learning from Large Language Model. Ning Pang, Wansen Wu, Yue Hu, Kai Xu, Quanjun Yin, Long Qin
2024	Enhancing Multimodal Sentiment Recognition Based on Cross-Modal Contrastive Learning. Lichao Cui, Shanliang Yang
2024	Enhancing Out-of-Distribution Generalization in VQA through Gini Impurity-guided Adaptive Margin Loss. Shuwen Yang, Tianyu Huai, Anran Wu, Xingjiao Wu, Wenxin Hu, Liang He
2024	Enhancing Sequential Recommendation Modeling Via Adversarial Training. Yabin Zhang, Xu Chen
2024	Enhancing Shape Perception and Segmentation Consistency for Industrial Image Inspection. Guoxuan Mao, Ting Cao, Ziyang Li, Yuan Dong
2024	Enhancing Vital Sign Monitoring with Reinforcement Learning and Wavelet Analysis in Sleep Disorders. Haoyu Wang, Zilong Yin, Hangling Sun, Xin Guo
2024	Enhancing Zero-shot 3D Photography via Mesh-represented Image Inpainting. Yuejian Fang, Xiaodong Wang
2024	Enhancing the Transferability of Adversarial Examples with Noise Injection Augmentation. Yiheng Duan, Yunjie Ge, Zixuan Wang, Jiayi Yu, Shenyi Zhang, Libing Wu
2024	EventTrojan: Manipulating Non-Intrusive Speech Quality Assessment via Imperceptible Events. Ying Ren, Kailai Shen, Zhe Ye, Diqun Yan
2024	ExpGest: Expressive Speaker Generation Using Diffusion Model and Hybrid Audio-Text Guidance. Yongkang Cheng, Mingjiang Liang, Shaoli Huang, Jifeng Ning, Wei Liu
2024	Expanding Crack Segmentation Dataset with Crack Growth Simulation and Feature Space Diversity. Qin Lei, Rui Yang, Jiang Zhong, Rongzhen Li, Muyang He, Mianxiong Dong, Kaoru Ota
2024	ExpertODE: Continuous Diagnosis Prediction with Expert Enhanced Neural Ordinary Differential Equations. Hengyu Zhang, Hang Lv, Yanchao Tan, Guofang Ma, Fan Wang, Carl Yang
2024	Explicit Correlation Learning for Generalizable Cross-Modal Deepfake Detection. Cai Yu, Shan Jia, Xiaomeng Fu, Jin Liu, Jiahe Tian, Jiao Dai, Xi Wang, Siwei Lyu, Jizhong Han
2024	Exploiting Self-Supervised Constraints in image Super-Resolution. Gang Wu, Junjun Jiang, Kui Jiang, Xianming Liu
2024	Exploiting Vision-Language Model for Visible-Infrared Person Re-identification via Textual Modality Alignment. Bingyu Duan, Wanqian Zhang, Dayan Wu, Zheng Lin, Jingzi Gu, Weiping Wang
2024	Exploring 3D-aware Lifespan Face Aging via Disentangled Shape-Texture Representations. Qianrui Teng, Rui Wang, Xing Cui, Peipei Li, Zhaofeng He
2024	Exploring Audio-Visual Information Fusion for Sound Event Localization and Detection In Low-Resource Realistic Scenarios. Ya Jiang, Qing Wang, Jun Du, Maocheng Hu, Pengfei Hu, Zeyan Liu, Shi Cheng, Zhaoxu Nian, Yuxuan Dong, Mingqi Cai, Xin Fang, Chin-Hui Lee
2024	Exploring Interactive Semantic Alignment for Efficient HOI Detection with Vision-language Model. Jihao Dong, Hua Yang, Renjie Pan
2024	Exploring Iterative Refinement with Diffusion Models for Video Grounding. Xiao Liang, Tao Shi, Yaoyuan Liang, Te Tao, Shao-Luo Huang
2024	Exploring Warping-Guided Features via Adaptive Latent Diffusion Model for Virtual try-on. Bo Gao, Junchi Ren, Fei Shen, Mengwan Wei, Zijun Huang
2024	Exposing Lip-syncing Deepfakes from Mouth Inconsistencies. Soumyya Kanti Datta, Shan Jia, Siwei Lyu
2024	EyebrowNet: High-Precision Eyebrow Reconstruction and Matting. Yufeng Wang, Wensen Feng, Haoqian Wang
2024	FE-VAD: High-Low Frequency Enhanced Weakly Supervised Video Anomaly Detection. Ruoyan Pi, Jinglin Xu, Yuxin Peng
2024	FENet: Focusing Enhanced Network for Lane Detection. Liman Wang, Hanyang Zhong
2024	FFnsr: Fast and Fine Neural Surface Reconstruction. Chuanfeng Yang, Kaiheng Li, Jiahui Chen, Qingqi Hong
2024	FIA-TE: Feature Inference Attack on Decision Tree Ensembles in Vertical Federated Learning. Xiaolin Chen, Daoguang Zan, Wei Li, Bei Guan, Yongji Wang
2024	FL-Clip: Bridging Plasticity and Stability in Pre-Trained Federated Class-Incremental Learning Models. Alysa Ziying Tan, Siwei Feng, Han Yu
2024	FNFORMER: A Transformer-Based Face Normal Estimator. Meng Wang, Xiaojie Guo, Jiawan Zhang
2024	FREQFORMER: Efficient Polyp Segmentation via Wavelet Transform. Xudong Zhou, Tianxiang Chen
2024	FT-CSR: Cascaded Frequency-Time Method for Coded Speech Restoration. Liang Wen, Lizhong Wang, Yuxing Zheng, Weijing Shi, Kwang Pyo Choi
2024	Facial Action Unit Detection with the Semantic Prompt. Chenyue Liang, Jiabei Zeng, Mingjie He, Dongmei Jiang, Shiguang Shan
2024	Facial Region-Based Ensembling for Unsupervised Temporal Deepfake Localization. Nesryne Mejri, Pavel Chernakov, Polina Kuleshova, Enjie Ghorbel, Djamila Aouada
2024	Fast Multi-view Clustering With Binary Anchor Graph. Wen Xue, Xingbo Liu, Xiao Kang, Xuening Zhang, Xiushan Nie, Shaohua Wang, Yilong Yin
2024	Fast Textile Pilling Classification Based on a Lightweight Network and 3D Point Clouds. Yu Lu, Yizhou Jin, Yuyu Chen, Gang Zhou, Zhenghui Hu, Qingjie Liu, Di Huang, Yunhong Wang
2024	Fast label prediction based on shrunk anchor graph for semi-supervised incomplete multiview classification. Guosheng Cui, Fusheng Hao, Dan Wu, Ye Li
2024	Feasibility Study of Multi-Layer VVC Coding Scheme for Hybrid Machine-Human Consumption. Jaakko Laitinen, Tero Partanen, Alexandre Mercat, Jarno Vanne, Miska M. Hannuksela, Honglei Zhang, Alireza Aminlou, Francesco Cricri
2024	FedCA: Federated learning based on classification layer alignment. Gang Liu, Jing Jia, Rui Mao, Yan Ji
2024	FedCL: Detecting Backdoor Attacks in Federated Learning with Confidence Levels. Jinhe Long, Zekai Chen, Fuyi Wang, Jianping Cai, Ximeng Liu
2024	FedDGP: Disentangling Global and Personal Models for Federated Learning. Zhenhu Zhang, Li Jin, Dan Song, Jiahua Dong, Ruofeng Tong
2024	FedFRR: Federated Forgetting-Resistant Representation Learning. Hui Wang, Jie Sun, Tianyu Wo, Xudong Liu
2024	FedGCA: Global Consistent Augmentation Based Single-Source Federated Domain Generalization. Yuan Liu, Shu Wang, Zhe Qu, Xingyu Li, Shichao Kan, Jianxin Wang
2024	FedMDC: Enabling Communication-Efficient Federated Learning over Packet Lossy Networks via Multiple Description Coding. Yixuan Guan, Xuefeng Liu, Tao Ren, Jianwei Niu
2024	FedMMR: Multi-Modal Federated Learning via Missing Modality Reconstruction. Shu Wang, Zhe Qu, Yuan Liu, Shichao Kan, Yixiong Liang, Jianxin Wang
2024	FedRMS: Privacy-Preserving Federated Knowledge Graph Embedding Through Randomization. Qianyu Li, Xiaoli Tang, Siyao Zhou, Han Yu, Hengjie Song, Lizhen Cui, Xiaoxiao Li
2024	FedStyle: Style-Based Federated Learning Crowdsourcing Framework for Art Commissions. Changjuan Ran, Yeting Guo, Fang Liu, Shenglan Cui, Yunfan Ye
2024	Fine-Grained Scene Image Classification with Modality-Agnostic Adapter. Yiqun Wang, Zhao Zhou, Xiangcheng Du, Xingjiao Wu, Yingbin Zheng, Cheng Jin
2024	Flexible Mixed Precision Quantization for Learne Image Compression. Md Adnan Faisal Hossain, Zhihao Duan, Fengqing Zhu
2024	Focal Stack Alignment Enhancement Network For Light Field Salient Object Detection. Ziyi Huang, Binbin Yan, Shuo Chen, Dongliang Wang, Lu Yang
2024	Focal-Guided Multi-Consistency for Unsupervised Partial-to-Partial Point Cloud Registration. Yucheng Shu, Longjin Cheng, Bin Xiao, Lihong Qiao, Weisheng Li, Xinbo Gao
2024	Focusing on All Refined Attention Regions for Noisy Label Facial Expression Recognition. Wenjing Wang, Si Li
2024	ForecasterFlexOBM: A Multi-View Audio-Visual Dataset for Flexible Object-Based Media Production. Davide Berghi, Craig Cieciura, Farshad Einabadi, Maxine Glancy, Oliver C. Camilleri, Philip Foster, Asmar Nadeem, Faegheh Sardari, Jinzheng Zhao, Marco Volino, Armin Mustafa, Philip J. B. Jackson, Adrian Hilton
2024	Fractional Order Spectrum in SAR Image Registration. Jianjun Sun, Yan Zhao, Xinbo Li, Shigang Wang, Jian Wei, Shibo Wang
2024	Fragile Model Watermark for integrity protection: leveraging boundary volatility and sensitive sample-pairing. Zhenzhe Gao, Zhenjun Tang, Zhaoxia Yin, Baoyuan Wu, Yue Lu
2024	Free-view Rendering of Dynamic Human from Monocular Video Via Modeling Temporal Information Globally and Locally among Adjacent Frames. Cheng Shang, Jidong Tian, Jiannan Ye, Xubo Yang
2024	Frequency Decomposition-Driven Network for JPEG Artifacts Removal. Ke Cao, Xuanhua He, Keyu Yan, Tao Hu, Rui Li, Chengjun Xie, Jie Zhang
2024	Frequency-Domain Enhanced Cross-modal Interaction Mechanism for Joint Video Moment Retrieval and Highlight Detection. Jiawei Feng, Ruomei Wang, Mingyang Liu, Yuanmao Luo, Fuwei Zhang
2024	Frequency-regularized Neural Representation Method for Sparse-view Tomographic Reconstruction. Jingmou Xian, Jian Zhu, Haolin Liao, Si Li
2024	From 3D to 4D: Fixing the Erroneous Coupling between IoU and Angle for Optimizing 3D Object Detection. Hengsheng Lun, Ke Lu, Liping Hou, Shuhua Wang, Jian Xue
2024	Full-Reference Motion Quality Assessment Based on Efficient Monocular Parametric 3D Human Body Reconstruction. Yuxin Huang, Yiwei Yuan, Xiangyu Zeng, Ling Xie, Yiyu Fu, Guanghui Yue, Baoquan Zhao
2024	Fusion of Short-term and Long-term Attention for Video Mirror Detection. Mingchen Xu, Jing Wu, Yu-Kun Lai, Ze Ji
2024	FusionDreamer: Consistent Images Generation from Sparse-view Images. Yige Wang, Risheng Huang, Haozhi Huang, Zongqing Lu
2024	Fuzzy Boundary-Guided Network for Camouflaged Object Detection. Qi Jia, Shuilian Yao, Youcan Xu, Yu Liu, Dehao Kong, Longin Jan Latecki
2024	G-MIMO: Empowering GNNs with Diverse Sub-Networks for Graph Classification. Qipeng Zhu, Jie Chen, Junping Zhang, Jian Pu
2024	GAN Inversion for Image Editing via Unsupervised Domain Adaptation. Siyu Xing, Chen Gong, Hewei Guo, Xiao-Yu Zhang, Xinwen Hou, Yu Liu
2024	GATrack: Group-Aware features for multiple object tracking. Xiaolong Wang, Ping Hu, Rongyao Hu, Xiaofeng Zhu
2024	GFAvatar: A High-Quality Facial Avatar Reconstruction Method. Shengjia Zhang, Suping Wu
2024	GIE : Gradient Inversion with Embeddings. Zenghao Guan, Yucan Zhou, Xiaoyan Gu, Bo Li
2024	GRPSNET: Multi-Class Part Parsing Based on Graph Reasoning. Njuod Alsudays, Jing Wu, Yu-Kun Lai, Ze Ji
2024	GaitMA: Pose-guided Multi-modal Feature Fusion for Gait Recognition. Fanxu Min, Shaoxiang Guo, Hao Fan, Junyu Dong
2024	Geo GCN: Geometric-based Graph CNN for Learning on Point Cloud. Hao Deng, Shengmei Chen, Cheng Liu, Bo Jiang, Lin Wang
2024	Ghost-in-Wave: How Speaker-Irrelative Features Interfere DeepFake Voice Detectors. Xuan Hai, Xin Liu, Zhaorun Chen, Yuan Tan, Song Li, Weina Niu, Gang Liu, Rui Zhou, Qingguo Zhou
2024	Gradient Saliency-aware CutMix for Semi-Supervised Medical Image Segmentation. Yuxuan Jiang, Guobin Zhu, Yi Ding, Zhen Qin, Minghui Pang
2024	Graph Attention Convolutional Network for 3D Human Pose and Shape Estimation from Point Clouds. Yung-Wei Fan, Sheng-Chun Huang, Shao-Yi Chien
2024	HARIS: Human-Like Attention for Reference Image Segmentation. Mengxi Zhang, Heqing Lian, Yiming Liu, Jie Chen
2024	HCF-Net: Hierarchical Context Fusion Network for Infrared Small Object Detection. Shibiao Xu, ShuChen Zheng, Wenhao Xu, Rongtao Xu, Changwei Wang, Jiguang Zhang, Xiaoqiang Teng, Ao Li, Li Guo
2024	HFF-Net: A High-Frequency Fidelity Model for Accelerated Parallel MRI Reconstruction. Zhenggang Yang, Faming Fang, Qiaosi Yi, Guixu Zhang, Fang Li
2024	HIDD: Human-perception-centric Incremental Deepfake Detection. Xiaorong Ma, Jiahe Tian, Yu Cai, Yesheng Chai, Zhaoxing Li, Jiao Dai, Liangjun Zang, Jizhong Han
2024	HMDST: A Hybrid Model-Data Driven Approach for Spatio-Temporally Consistent Video Inpainting. Li Fang, Kaijun Zou, Zhiye Chen, Long Ye
2024	HQ-Avatar: Towards High-Quality 3D Avatar Generation via Point-based Representation. Weitian Zhang, Sijing Wu, Yichao Yan, Ben Xue, Wenhan Zhu, Xiaokang Yang
2024	HQOD: Harmonious Quantization for Object Detection. Long Huang, Zhiwei Dong, Song-Lu Chen, Ruiyao Zhang, Shutong Ti, Feng Chen, Xu-Cheng Yin
2024	HSVFormer: Robust and Unsupervised HSV-based Transformer Framework for Low-Light Image Enhancement. Xiaogang Du, Meng Yang, Tao Lei, Xuejun Zhang, Yingbo Wang, Asoke K. Nandi
2024	HURDNet: Heterogeneous UNet Structure With Range-Null Space Decomposition for Hyperspectral Image Reconstruction. Yeheng Zhu, Zhijian Wu, Jun Li, Jianhua Xu
2024	Harmonic Frequency-Separable Transformer for Instrument-Agnostic Music Transcription. Yulun Wu, Weixing Wei, Dichucheng Li, Mengbo Li, Yi Yu, Yongwei Gao, Wei Li
2024	HctMAE: Hybrid Convolution-Transformer Meets Masked Autoencoder for Plant Recognition. Hongjing Su, Fuxiang Lu
2024	Heterogeneous Hypergraph Structure Learning for Multimedia Recommendation. Yanchao Tan, Zhenghong Lin, Sujie Pan, Siying Xu, Weiming Liu, Guofang Ma, Shiping Wang
2024	Heuristic Action-aware and Priority Communication for Multi-agent Path Finding. Dongming Zhou, Zhengbin Pang
2024	Hierarchical Attention Feature Fusion and Refinement Network for Point Cloud Upsampling. Yaori Zhang, Shujin Lin, Fan Zhou, Ruomei Wang
2024	Hierarchical Local Temporal Feature Enhancing for Transformer-Based 3D Human Pose Estimation. Xin Yan, Chi-Man Pun, Haolun Li, Mengqi Liu, Hao Gao
2024	Hierarchical Temporal Attention and Competent Teacher Network for Sound Event Detection. Yihang Zhang, Yun Liang, Shitong Weng, Hai Lin, Liping Chen, Shenlong Zheng
2024	Hierarchically Aggregated Identification Transformer Network for Camouflaged Object Detection. Thanh Hai Phung, Hung-Jen Chen, Hong-Han Shuai
2024	High-Fidelity Lake Extraction Via Two-Stage Prompt Enhancement: Establishing A Novel Baseline and Benchmark. Ben Chen, Xuechao Zou, Kai Li, Yu Zhang, Junliang Xing, Pin Tao
2024	High-Order Differential Regularizing Implicit Surface Representation of Point Cloud. Yuhang Cheng, Ziyang Fan, Hongyu Wu, Xiaogang Wang
2024	How Does Textual Information Selection Influence Time Series Forecasting? A Cross-modal Perspective on Financial Volatility Prediction. Hao Niu, Yun Xiong, Xiaosu Wang, Biao Yang, Yao Zhang
2024	HpEIS: Learning Hand Pose Embeddings for Multimedia Interactive Systems. Songpei Xu, Xuri Ge, Chaitanya Kaul, Roderick Murray-Smith
2024	HyPRE: Hybrid Proxy Re-Encryption for Secure Multimedia Data Sharing on Mobile Devices. Xinyu Feng, Cong Li, Qingni Shen, Jisheng Dong, Wenjun Qian, Yuejian Fang, Zhonghai Wu
2024	Hydraformer: One Encoder for All Subsampling Rates. Yaoxun Xu, Xingchen Song, Zhiyong Wu, Di Wu, Zhendong Peng, Binbin Zhang
2024	I Zeqi Wu, Yuefeng Ma
2024	I Peiming Lin, Sumei Li, Zilin Zhao, Huilin Zhang
2024	I-Matting: Improved Trimap-Free Image Matting. Zichuan Liu, Ke Wang, Mingyuan Wu, Lantao Yu, Klara Nahrstedt, Xin Lu
2024	ICF-Loc: An Infrared-Based Coarse-to-Fine Approach for UAV Visual Geolocation under GPS-Denied Environments. Zhen Wang, Dianxi Shi, Chunping Qiu, Songchang Jin, Tongyue Li, Yanyan Shi
2024	ICFRNet: Image Complexity Prior Guided Feature Refinement for Real-time Semantic Segmentation. Xin Zhang, Teodor Boyadzhiev, Jinglei Shi, Jufeng Yang
2024	ICR-Net: Semi-Supervised Medical Image Segmentation Guided By Intra-Sample Cross Reconstruction. Xianpeng Cao, Weixing Xie, Xianxing Cao, Qiqin Lin, Rongzhou Zhou, Junfeng Yao, Qingqi Hong
2024	IE-aware Consistency Losses for Detailed 3D Face Reconstruction from Multiple Images in the Wild. Weilong Peng, Yi Luo, Keke Tang, Kongyang Chen, Yangtao Wang, Ping Li, Meie Fang
2024	IEEE International Conference on Multimedia and Expo, ICME 2024, Niagara Falls, ON, Canada, July 15-19, 2024
2024	IIPC: Intra-Inter Patch Correlations for Garment Collision Handling. Ruisheng Yuan, Minzhe Tang, Dongliang Kou, Mingyang Sun, Dingkang Yang, Xiao Zhao, Lihua Zhang
2024	ITportrait: Image-Text Coupled 3D Portrait Domain Adaptation. Xiangwen Deng, Yufeng Wang, Yuanhao Cai, Jingxiang Sun, Yebin Liu, Haoqian Wang
2024	Illumination Enlightened Spatial-temporal Inconsistency for Deepfake Video Detection. Kaiyue Tian, Chen Chen, Yichao Zhou, Xiyuan Hu
2024	Imperceptible Text Steganography based on Group Chat. Fanxiao Li, Ping Wei, Tingchao Fu, Yu Lin, Wei Zhou
2024	Improving Drum Source Separation with Temporal-Frequency Statistical Descriptors. Si Li, Jiaxing Liu, Peilin Li, Dichucheng Li, Xinlu Liu, Yongwei Gao, Wei Li
2024	Improving Few-Shot Neural Radiance Field with Image Based Rendering. Qian Li, Cheng Wen, Rao Fu
2024	Improving Image Reconstruction and Synthesis by Balancing the Optimization from Frequency Perspective. Xuan Dang, Guolong Wang, Xun Wu, Zheng Qin
2024	Improving Transferability of Adversarial Examples with Adversaries Competition. Shuai Zhao, Tuo Li, Boyuan Zhang, Yang Zhai, Ziyi Liu, Yahong Han
2024	Improving the Sar Image Adversarial Transferability Through Dual-Loop Ensemble Gradient Attack. Xin Liu, Yue Xu, Kun He
2024	InFusionSurf: Refining Neural RGB-D Surface Reconstruction Using Per-Frame Intrinsic Refinement and TSDF Fusion Prior Learning. Seunghwan Lee, Gwanmo Park, Hyewon Son, Jiwon Ryu, Han Joo Chae
2024	Inferring the effectiveness of epidemic prevention measures based on spatial heterogeneity modeling. Mingyu Wu, Zhiyi Tan, Bing-Kun Bao
2024	Information Aggregate and Sentiment Enhance Network to Handle Missing Modalities for Multimodal Sentiment Analysis. Liang Shi, Fuyong Xu, Ru Wang, Yongqing Wei, Guangjin Wang, Bao Wang, Peiyu Liu
2024	InstructVid2Vid: Controllable Video Editing with Natural Language Instructions. Bosheng Qin, Juncheng Li, Siliang Tang, Tat-Seng Chua, Yueting Zhuang
2024	Integer or Floating Point? New Outlooks for Low-Bit Quantization on Large Language Models. Yijia Zhang, Lingran Zhao, Shijie Cao, Sicheng Zhang, Wenqiang Wang, Ting Cao, Fan Yang, Mao Yang, Shanghang Zhang, Ningyi Xu
2024	Intensity Confusion Matters: An Intensity-Distance Guided Loss For Bronchus Segmentation. Haifan Gong, Wenhao Huang, Huan Zhang, Yu Wang, Xiang Wan, Hong Shen, Guanbin Li, Haofeng Li
2024	Intermediate Domain Meets Natural Hazy Tracking. Yuwei Feng, Gang Zhou, Sen Yang, Jiang Zhang, Jing Ma, Zhenhong Jia
2024	Interpretable Function Embedding and Module in Convolutional Neural Networks. Wei Han, Zhili Qin, Junming Shao
2024	Inverse Optimization for Multi-View Multiple Clustering. Xiaolong Xiong, Jinhan Cui, Jiaxiong Liu, Shuzhan Guo, Jun Zhou
2024	Invisible Pedestrians: Synthesizing Adversarial Clothing Textures To Evade Industrial Camera-Based 3D Detection. Xinlong Ding, Hongwei Yu, Jiansheng Chen, Jinlong Wang, Jintai Du, Huimin Ma
2024	IterInv: Iterative Inversion for Pixel-Level T2I Models. Chuanming Tang, Kai Wang, Joost van de Weijer
2024	JIGSAW: Edge-based Streaming Perception over Spatially Overlapped Multi-Camera Deployments. Ila Gokarn, Yigong Hu, Tarek F. Abdelzaher, Archan Misra
2024	Joint Flow Estimation from Point Clouds and Event Streams. Hanlin Li, Yueyi Zhang, Guanting Dong, Shida Sun, Zhiwei Xiong
2024	Joint Language Prompt and Object Tracking. Zhimin Weng, Jinpu Zhang, Yuehuan Wang
2024	Joint Visual-Textual Reasoning and Visible-Infrared Modality Alignment for Person Re-Identification. Na Jiang, Yuxuan Qiu, Wei Song, Jiawei Liu, Zhiping Shi, Liyang Wang
2024	Joint edge detection learning for recurrent homography estimation. Qi Jia, Zikun Zhao, Xiaomei Feng, Jinyuan Liu, Yu Liu, Xinwei Xue
2024	Jointly Learn the Base Clustering and Ensemble for Deep Image Clustering. Chen Liang, Zhiqian Dong, Sheng Yang, Peng Zhou
2024	Jointly Recognizing Speech and Singing Voices Based on Multi-Task Audio Source Separation. Ye Bai, Chenxing Li, Hao Li, Yuanyuan Zhao, Xiaorui Wang
2024	K-Face Net: A Two-Stage Framework for Balanced Feature Space in Facial Expression Recognition. Zhongzhu Yang, Liang Luo, Yu Gu, Fuji Ren
2024	KDAS: Knowledge Distillation via Attention Supervision Framework for Polyp Segmentation. Quoc-Huy Trinh, Minh-Van Nguyen, Phuoc-Thao Vo Thi
2024	Knowledge-Enhanced Multi-perspective Incongruity Perception Network for Multimodal Sarcasm Detection. Zihan Niu, Zheyong Xie, Tong Xu, Xiangfeng Wang, Yao Hu, Ying Yu, Enhong Chen
2024	LAIP: Learning Local Alignment from Image-Phrase Modeling for Text-based Person Search. Yu Wu, Haiguang Wang, Mengxia Wu, Min Cao, Min Zhang
2024	LDNET: Semantic Segmentation Of High-Resolution Images Via Learnable Patch Proposal And Dynamic Refinement. Yuyang Ji, Lianlei Shan
2024	LMGSNet: A Lightweight Multi-scale Group Shift Fusion Network for Low-quality 3D Face Recognition. Yuting Hu, Yue Ming, Panzi Zhao, Boyang Lyu, Kai Hong
2024	LPTCGAN: Laplace Pyramid three-layer cyclic high definition image enhancement network. Chao Long, Mengning Yang, Kai Li, Zhifu Deng, Kunyuan Jian, Simin Wang
2024	LR-MAE: Locate while Reconstructing with Masked Autoencoders for Point Cloud Self-supervised Learning. Huizhen Ji, Yaohua Zha, Qingmin Liao
2024	Landmark-guided Diffusion Model for High-fidelity and Temporally Coherent Talking Head Generation. Jintao Tan, Xize Cheng, Lingyu Xiong, Lei Zhu, Xiandong Li, Xianjia Wu, Kai Gong, Minglei Li, Yi Cai
2024	Language-Guided Semantic Alignment for Co-saliency Detection. Chuang Ding, Yang Wu, Huihui Song, Kaihua Zhang, Xu Zhang, Zhenhua Guo
2024	Latent Distribution Alignment for Domain Generalizable Person Re-identification. Ren Nie, Jin Ding, Lingxiao He, Xue Zhou
2024	LayoutDM: Precision Multi-Scale Diffusion for Layout-to-Image. Mingzhe Yu, Lei Wu, Changshuo Wang, Lei Meng, Xiangxu Meng
2024	Learning Conditional Prompt for Compositional Zero-Shot Learning. Tian Zhang, Kongming Liang, Ke Zhang, Zhanyu Ma
2024	Learning Efficient Interaction Anchor for HOI Detection. Lirong Xue, Kang-Yang Huang, Rong Chao, Jhih-Ciang Wu, Hong-Han Shuai, Yung-Hui Li, Wen-Huang Cheng
2024	Learning Motion Priors with DETR for Visual Tracking. Qingmao Wei, Bi Zeng, Guotian Zeng
2024	Learning Multimodal Attention Mixed with Frequency Domain Information as Detector for Fake News Detection. Zihan Ma, Huan Liu, Zhi Zeng, Hao Guo, Xiang Zhao, Minnan Luo
2024	Learning Semantic-aware Retinex Network with Spatial-Frequency Interaction for Low-light Image Enhancement. Hao Li, Jinlong Wang, Hanxiang Yang, Xiongxin Tang, Fanjiang Xu
2024	Leveraging Hybrid Referring Expressions for Referring Video Object Segmentation. Yan Li, Qiong Wang
2024	Lightweight Camouflaged Object Detection Network Based on Feature Complementation and Enhancement. Kangwei Liu, Xiuhong Li, Boyuan Li, Yuye Zhang, Chao Che
2024	Lightweight Video Denoising Using a Classic Bayesian Backbone. Clement Bled, François Pitié
2024	Local-to-Global Perception Network for Point Cloud Segmentation. Haoxuan Wang, Ping Wei, Shuaijia Chen, Zhimin Liao, Jialu Qin
2024	Local-to-Global Self-Consistency Learning for Temporal Action Localization. Xinyu Xiao, Yun Hu, Eryun Liu
2024	Lottery Ticket Hypothesis for Attention Mechanism in Residual Convolutional Neural Network Zhongzhan Huang, Senwei Liang, Mingfu Liang, Wei He, Haizhao Yang, Liang Lin
2024	Low Bitrate Light Field Video Compression with Two-step Refinement Reconstruction. Huan Li, Xinpeng Huang, Ping An
2024	M Yifei Pu, Chi Wang, Xiaofeng Hou, Cheng Xu, Jiacheng Liu, Jing Wang, Minyi Guo, Chao Li
2024	M2Depth: A Novel Self-Supervised Multi-Camera Depth Estimation with Multi-Level Supervision. Ruihang Li, Shanding Ye, Zhe Yin, Tao Li, Zehua Zhang, Kaikai Xiao, Zhijie Pan
2024	MACFAN: A multi-channel fusion network for subjective aesthetic attributes with automated comments labeling pipeline. Li Keyao, Kai Liu, Min Peng, Bo Zhao, Li Jiangyuanhong, Jiahui Zhu
2024	MALIP: Improving Few-Shot Image Classification with Multimodal Fusion Enhancement. Kaifen Cai, Kaiyu Song, Yan Pan, Hanjiang Lai
2024	MC-PCGC: A Space-Channel Mixed Contextual Coding for Point Cloud Geometry Compression. Xueqiang Sun, Jin Wang, Jiade Chen, Yunhui Shi, Nam Ling, Baocai Yin
2024	MEMix: Improving HMER with Diverse Formula Structure Augmentation. Haoran Zhang, Xiangdong Su, Xingxiang Zhou, Guanglai Gao
2024	MFHCA: Enhancing Speech Emotion Recognition Via Multi-Spatial Fusion and Hierarchical Cooperative Attention. Xinxin Jiao, Liejun Wang, Yinfeng Yu
2024	MFITrack: Multi-Frame Integration Strategy for Enhanced Motion-Centric Single Object Tracking. Pochun Chen, Nan Zhang, Guoqing Liu, Ge Li
2024	MISTA: A Large-Scale Dataset for Multi-Modal Instruction Tuning on Aerial Images. Hao Wu, Ke Lu, Yuqiu Li, Junhao Huang, Jian Xue
2024	MPVNN: Multi-resolution Point-Voxel Non-parametric Network for 3D Point Cloud Processing. Keli Wen, Nan Zhang, Ge Li, Wei Gao
2024	MRFER: Multi-Channel Robust Feature Enhanced Fusion for Multi-Modal Emotion Recognition. Xiao Fu, Wei Xi, Zhao Yang, Rui Jiang, Dianwen Ng, Jie Yang, Jizhong Zhao
2024	MSFGNet: Multi-Scale Features Gathering Network for Change Detection of Remote Sensing Images. Junqing Huang, Xiaochen Yuan, Chan-Tong Lam, Wei Ke
2024	MTDM-MS: A Malicious Traffic Detection Model Based on Multi-Category Signals. Ziang Li, Chengxiang Si, Zhenyu Cheng, Shuyuan Zhao, Yong Ding
2024	MVTexGen: Synthesising 3D Textures Using Multi-View Diffusion. Jinyi Wang, Fei Ben, Huangjie Zheng, Jiangchao Yao, Ya Zhang, Yanfeng Wang
2024	MaFreeI2P: A Matching-Free Image-to-Point Cloud Registration Paradigm with Active Camera Pose Retrieval. Gongxin Yao, Xinyang Li, Yixin Xuan, Yu Pan
2024	Manga109Dialog: A Large-Scale Dialogue Dataset for Comics Speaker Detection. Yingxuan Li, Kiyoharu Aizawa, Yusuke Matsui
2024	Mask Matching Network for Self-supervised Few-shot Medical Image Segmentation. Zeyun Zhao, Rong Wang, Jianzhe Gao, Zhiming Luo, Shaozi Li
2024	Mask-guided Salient Feature Mining for Cloth-Changing Person Re-identification. Liman Jiang, Canlong Zhang, Lei Wu, Zhixin Li, Zhiwen Wang, Chunrong Wei
2024	Maths: Multimodal Transformer-Based Human-Readable Solver. Yicheng Pan, Zhenrong Zhang, Jiefeng Ma, Pengfei Hu, Jun Du, Qing Wang, Jianshu Zhang, Dan Liu, Si Wei
2024	Memory-Augmented Transformer for Efficient End-to-End Video Grounding. Yuanwu Xu, Mohan Chen, Yuejie Zhang, Rui Feng, Tao Zhang, Shang Gao
2024	Memory-guided Network with Uncertainty-based Feature Augmentation for Few-shot Semantic Segmentation. Xinyue Chen, Miaojing Shi
2024	MergeNet: Explicit Mesh Reconstruction from Sparse Point Clouds via Edge Prediction. Weimin Wang, Yingxu Deng, Zezeng Li, Yu Liu, Na Lei
2024	MeshStyle: Text-driven Efficient and High-Quality 3D Mesh Stylization via Hypergraph Convolution. Yu Cai, Shihao Gao, Songzhi Su, Xizhi Chen, Xi Wang
2024	Mining Similarity Relationships for Unsupervised Cross-Modal Hashing. You Wu, Zhixin Li
2024	Minutes to Seconds: Speeded-up DDPM-based Image Inpainting with Coarse-to-Fine Sampling. Lintao Zhang, Xiangcheng Du, LeoWu TomyEnrique, Yiqun Wang, Yingbin Zheng, Cheng Jin
2024	Mix background and foreground separately: Transformer-based Augmentation Strategies for Domain Generalization. Zhongqiang Zhang, Fuhan Cai, Duo Liu, Ge Liu, Xiangzhong Fang
2024	Mixed 3D Gaussian for Dynamic Scenes Representation and Rendering. Junyuan Guo, Teng Wang, Chao Wang
2024	MoCoSA: Momentum Contrast for Knowledge Graph Completion with Structure-Augmented Pre-trained Language Models. Jiabang He, Jia Liu, Lei Wang, Xiyao Li, Xing Xu
2024	Modality-Free Violence Detection via Cross-Modal Causal Attention and Feature Distillation. Jiaxu Leng, Zhanjie Wu, Mengjingcheng Mo, Mingpi Tan, Shuang Li, Xinbo Gao
2024	Modeling Scene-Agent Interaction for Pedestrian Trajectory Prediction. Pengfei Yao, Yinglong Zhu, Tianlu Mao, Hao Jiang, Zhaoqi Wang
2024	MuMoSNet: 3D MRI-based Brain Tumor Segmentation via Multi-modal and Multi-scale Feature Fusion. Zhiyuan Zhu, Zhiyuan Ning, Hui Cui, Junao Shen, Jiaheng Wang, Xinyu Wang, Tian Feng
2024	Multi-Attentional Distance for Zero-Shot Classification with Text-to-Image Diffusion Model. Kailai Feng, Minheng Ni, Jiaxiu Jiang, Zhilu Zhang, Wangmeng Zuo
2024	Multi-Attribute Consistency Driven Visual Language Framework for Surface Defect Detection. Bin Kang, Bin Chen, Junjie Wang, Weizhi Xian, Huifeng Chang
2024	Multi-Candidate Motion Modeling for 3D Human Pose and Shape Estimation from Monocular Video. Wen-Li Wei, Jen-Chun Lin
2024	Multi-Hop Distillation for Efficient Cross-Layer Knowledge Transfer. Fengshuo Zhang
2024	Multi-Modal Document Presentation Attack Detection with Forensics Trace Disentanglement. Changsheng Chen, Yongyi Deng, Liangwei Lin, Zitong Yu, Zhimao Lai
2024	Multi-Modal Fusion and Query Refinement Network for Video Moment Retrieval and Highlight Detection. Yifang Xu, Yunzhuo Sun, Benxiang Zhai, Zien Xie, Youyao Jia, Sidan Du
2024	Multi-Modal Gait Recognition with Unidirectional Cross-modal Alignment. Hengda Li, Yinglin Zheng, Qifeng Dai, Jintai Wang, Liang Song, Ming Zeng
2024	Multi-Scale Dense Description for Blind Image Quality Assessment. Yijie Wei, Bo Liu, Peng Luan, Yinchi Ma
2024	Multi-Scale Heterogeneity-Aware Hypergraph Representation for Histopathology Whole Slide Images. Minghao Han, Xukun Zhang, Dingkang Yang, Tao Liu, Haopeng Kuang, Jinghui Feng, Lihua Zhang
2024	Multi-Scale Position-Aware Cell Nucleus Mask Attention for Tumor Budding Detection. Wenwen Zhang, Jie Lian, Bingying Dong
2024	Multi-Scale and Multi-Patch Aggregation Network Based on Dual-Column Vision Fusion for Image Aesthetics Assessment. Sumei Li, Hangwei Liang, Mingxuan Xie, Xiaofei He
2024	Multi-Stage Fusion for Event-based Multimodal Tracker. Xinyu Zhang, Hefei Huang, Xu Jia, Wenyue Chen, Dong Wang, Shengming Li, Huchuan Lu
2024	Multi-Strategy Adversarial Learning for Robust Face Forgery Detection Under Heterogeneous and Composite Attacks. Xiyao Liu, Fengkai Dong, Xin Liao, Yuhan Guo, Jianbiao He, Jian Zhang, Gerald Schaefer, Hui Fang
2024	Multi-batch Nuclear-norm Adversarial Network for Unsupervised Domain Adaptation. Pei Wang, Yun Yang, Zhenyu Yu
2024	Multi-channel Spatio-Temporal Causal Representation Model for Cognitive Load Assessment in Physiological Signals. Laiming Jiang, Jiawei Liu, Shu Wang, Jun Liao, Qingsong Li, Zhengyang Li, Shen Chen, Li Liu
2024	Multi-contrast MRI Reconstruction with Deformable Attention and Invertible Network. Tiancheng Zhang, Xinyi Zhang
2024	Multi-domain Probability Estimation Network for Forgery Detection over Online Social Network Shared Images. Jiaxin Chen, Xin Liao, Zhenxing Qian, Zheng Qin
2024	Multi-feature and Multi-branch Action Segmentation Framework for Modeling Long-Short-Term Dependencies. Junkun Hong, Yitian Long, Yueyi Luo, Qianqian Qi, Jun Long
2024	Multi-granular Semantic Mining for Composed Image Retrieval. Xiaotong Chen, Shikui Wei, Gangjian Zhang, Yao Zhao
2024	Multi-granularity Correlation Refinement for Semantic Correspondence. Zhen Liang, Enyu Che, Guoqiang Xiao, Jingwei Qu
2024	Multi-head multi-scale pixel localization network for crowd counting with highly dense and small-scale samples. Hao-Yuan Ma, Li Zhang
2024	Multi-modal Intent Detection with LVAMoE: the Language-Visual-Audio Mixture of Experts. Tingyu Li, Junpeng Bao, Jiaqi Qin, Yuping Liang, Ruijiang Zhang, Jason Wang
2024	Multi-modal Learnable Queries for Image Aesthetics Assessment. Zhiwei Xiong, Yunfan Zhang, Zhiqi Shen, Peiran Ren, Han Yu
2024	Multi-scale Bottleneck Transformer for Weakly Supervised Multimodal Violence Detection. Shengyang Sun, Xiaojin Gong
2024	Multi-scale Transformer with Prompt Learning for Remote Sensing Image Dehazing. Jingru Wang, Xinguang Xiang
2024	Multi-source Knowledge Enhanced Graph Attention Networks for Multimodal Fact Verification. Han Cao, Lingwei Wei, Wei Zhou, Songlin Hu
2024	MultiQ: Multi-model Joint Learning via Synthetic Data for Data-Free Quantization. Chenyang Li, Xing Wei, Huazheng Zhao
2024	Multimedia Generative Modelling with High-Order Langevin Dynamics. Ziqiang Shi, Rujie Liu
2024	Multimodal Image-Text Representation Learning for Sketch-Less Facial Image Retrieval. Dawei Dai, Yingge Liu, Shiyu Fu, Guoyin Wang
2024	Multimodal Knowledge Graph Embeddings via Lorentz-based Contrastive Learning. Ruizhou Liu, Zongsheng Cao, Zhe Wu, Qianqian Xu, Qingming Huang
2024	Multimodal Semantic Fusion for Zero-Shot Learning. Yan Feng, Tian Jiang, Yunqi Liu, Zijian Huang, Xiaohui Cui
2024	Multiscale Binary-Pattern Dependency: A Novel Co-Occurrence Texture Descriptor for Fine-Grained Leaf Image Retrieval. Xin Chen, Bin Wang, Yongsheng Gao
2024	Multitrack Emotion-Based Music Generation Network Using Continuous Symbolic Features. Donghui Zhang, Xiaobing Li, Di Lu, Yun Tie, Yan Gao, Lin Qi
2024	Music Form Analysis: A Case Study of The Theme and Variations Form. Jing Zhao, KokSheik Wong, Vishnu Monn Baskaran, Kiki Adhinugraha, David Taniar
2024	Mutual Compromised Multi-feature Fusion Method for Cross-modal Hashing Retrieval. Kangnan Bai, Pengyi Gao, Kai Chen, Xin Nie, Shenghui Li, Bingqian Li
2024	Mutual Positive and Negative Learning for Weakly-supervised Point Cloud Semantic Segmentation. Haichuan Song, Zhihong Zheng, Zhizhong Zhang, Yuan Xie, Guchu Zou, Zhenyi Qi, Xin Tan
2024	MysticMask: Adversarial Mask for Impersonation Attack Against Face Recognition Systems. Chaoxiang He, Yimiao Zeng, Xiaojing Ma, Bin Benjamin Zhu, Zewei Li, Shixin Li, Hai Jin
2024	NID-SLAM: Neural Implicit Representation-based RGB-D SLAM In Dynamic Environments. Ziheng Xu, Jianwei Niu, Qingfeng Li, Tao Ren, Chen Chen
2024	NIR-VIS Image Translation for the Cross-Spectral and Cross-Distance Face Recognition. Da Ai, Kai Jia, Yunqiao Wang, Ying Liu
2024	NeRVA: Joint Implicit Neural Representations for Videos and Audios. Anustup Choudhury, Praneet Singh, Guan-Ming Su
2024	Neighborhood-Adaptive Context Enhancement Learning For Scene Graph Generation. Bowen Zhao, Licheng Zhang, Lei Zhang, Zhendong Mao
2024	Neural Dynamics Pruning for Energy-Efficient Spiking Neural Networks. Haoyu Huang, Linxuan He, Faqiang Liu, Rong Zhao, Luping Shi
2024	No-Reference MRI Quality Assessment via Contrastive Representation: Spatial and Frequency Domain Perspectives. Yiwei Lou, Jiayu Zhang, Dexuan Xu, Yongzhi Cao, Hanpin Wang, Yu Huang
2024	No-Reference Segmentation Annotation Quality Assessment. Zheng Lin, Zheng-Peng Duan, Xuying Zhang, Luojun Lin
2024	Noise Adaptive Fine-grained Speech Intelligibility Enhancement With Soft-label Guided Diffusion. Chenyi Zhu, Dengshi Li, Aolei Chen, Yu Gao, Wei Li, Xi Wang
2024	Noise Dimension of GAN: An Image Compression Perspective. Ziran Zhu, Tongda Xu, Ling Li, Yan Wang
2024	Noisy-Residual Continuous Diffusion Models for Real Image Denoising. Xuan Long, Meiqin Liu, Qi Tang, Chao Yao, Jian Jin, Yao Zhao
2024	ODNet: Orthogonal-Perception and Dense-dilation Enhanced Network for Segmenting Complex Tree Branch Structures. Xin Zhou, Tianyang Dong, Jing Fan, Wenyuan Ying, Hubin Kong
2024	OWR: Optimizing Watermark Robustness for Screen Recording. Zixuan Hu, Kun Hu, Zizhuo Wang, Ranran Pan, Xingjun Wang
2024	Offset-based Disentangled Representation for Efficient Human Pose Estimation. Zhenyu Li, Congju Du, Huijuan Zhao, Li Yu
2024	Omni Spatial-Angular Correlations Exploration for Light Field Image Super-Resolution. Wang xia, Yao Lu, Shunzhou Wang, Wenjing Wang, Ziqi Wang, Peiqi Xia
2024	Omni-Granularity Embedding Network for Text-to-Image Person Retrieval. Chengji Wang, Zhiming Luo, Shaozi Li
2024	On the Higher Moment Disparity of Backdoor Attacks. Ching-Chia Kao, Cheng-Yi Lee, Chun-Shien Lu, Chia-Mu Yu, Chu-Song Chen
2024	One-Class HEVC Double Compression Detection with Same Coding Parameters. Yulin Zhao, Xiangling Ding
2024	Open-set Hierarchical Semantic Segmentation for 3D Scene. Diwen Wan, Jiaxiang Tang, Jingbo Wang, Xiaokang Chen, Lingyun Gan, Gang Zeng
2024	Optimizing Projection-Based Point Cloud Quality Assessment with Human Preferred Viewpoints Selection. Zicheng Zhang, Yu Fan, Wei Sun, Xiongkuo Min, Xiaohong Liu, Chunyi Li, Haoning Wu, Weisi Lin, Ning Liu, Guangtao Zhai
2024	Orthogonal Hyper-category Guided Multi-interest Elicitation for Micro-video Matching. Beibei Li, Beihong Jin, Yisong Yu, Yiyuan Zheng, Jiageng Song, Wei Zhuo, Tao Xiang
2024	Out-of-Distribution Detection by Principal Component Correspondence. Xiaoyuan Guan, Zhiyong Gan, Ling Deng, Wei Shi, Jiankang Chen, Shenshen Bu, Chunliang Zhao, Jianfang Hu, Yuren Zhou, Wei-Shi Zheng, Ruixuan Wang
2024	Out-of-Distribution Generalization via Style and Spuriousness Eliminating. Kaiyu Jin, Chenwang Wu, Defu Lian
2024	Overcoming Language Priors for Visual Question Answering Based on Knowledge Distillation. Daowan Peng, Wei Wei
2024	PA-SAM: Prompt Adapter SAM for High-Quality Image Segmentation. Zhaozhi Xie, Bochen Guan, Weihao Jiang, Muyang Yi, Yue Ding, Hongtao Lu, Lei Zhang
2024	PGDM: Multimodal Panoramic Image Generation with Diffusion Models. Depei Liu, Hongjie Fan, Junfei Liu
2024	PSPU: Enhanced Positive and Unlabeled Learning by Leveraging Pseudo Supervision. Chengjie Wang, Chengming Xu, Zhenye Gan, Yuxi Li, Jianlong Hu, Wenbing Zhu, Lizhuang Ma
2024	PVRF: Single-Plane and Single-Vector for Memory-Efficient Radiance Fields. Chenqu Ren, Yeheng Shao, Haolei Qiu
2024	ParaSurRe: Parallel Surface Reconstruction with No Pose Prior. Wenyu Li, Zongxin Ye, Sidun Liu, Ziteng Zhang, Xi Wang, Peng Qiao, Yong Dou
2024	Parameter Efficient Fine-Tuning on Selective Parameters for Transformer-Based Pre-Trained Models. Qi Li
2024	Person Re-identification utilizing Text to Search Video. Shunkai Zhou, Canlong Zhang, Zhixin Li, Zhiwen Wang, Chunrong Wei
2024	Photorealistic image style transfer based on explicit affine transformation. Junjie Kang, Jinsong Wu, Shiqi Jiang
2024	PianoBART: Symbolic Piano Music Generation and Understanding with Large-Scale Pre-Training. Xiao Liang, Zijian Zhao, Weichao Zeng, Yutong He, Fupeng He, Yiyi Wang, Chengying Gao
2024	Picking watermarks from noise (PWFN): an improved robust watermarking model against intensive distortions. Sijing Xie, Chengxin Zhao, Nan Sun, Wei Li, Hefei Ling
2024	Point Cloud Compression via Constrained Optimal Transport. Zezeng Li, Weimin Wang, Ziliang Wang, Na Lei
2024	Point Cloud Reconstruction Optimization of Light Field Image based on Intra-class Distance. Xuechun Wang, Wentao Chao, Fuqing Duan
2024	PointELM: Fast Point Cloud Classification Using Deep Random Mapping Based Extreme Learning Machines. Zhuangzi Li, Shan Liu, Ge Li
2024	PortraitNeRF: A Single Neural Radiance Field for Complete and Coordinated Talking Portrait Generation. Pengfei Hu, Xiuzhe Wu, Yang Wu, Wenming Yang
2024	Positive Label Is All You Need for Multi-Label Classification. Zhixiang Yuan, Kaixin Zhang, Tao Huang
2024	Powerful Lossy Compression for Noisy Images. Shilv Cai, Xiaoguo Liang, Shuning Cao, Luxin Yan, Sheng Zhong, Liqun Chen, Xu Zou
2024	Privacy-Preserving Replay and Adaptive Relation Distillation for Camera Incremental Person Re-Identification. Zexian Yang, Dayan Wu, Wanqian Zhang, Jingzi Gu, Zheng Lin, Weiping Wang
2024	ProDub: Progressive Growing of Facial Dubbing Networks for Enhanced Lip Sync and Fidelity. Kangwei Liu, Xiaowei Yi, Xianfeng Zhao
2024	ProTA: Probabilistic Token Aggregation for Text-Video Retrieval. Han Fang, Xianghao Zang, Chao Ban, Zerun Feng, Lanxiang Zhou, Zhongjiang He, Yongxiang Li, Hao Sun
2024	Probablistic Restoration with Adaptive Noise Sampling for 3D Human Pose Estimation. Xianzhou Zeng, Hao Qin, Ming Kong, Luyuan Chen, Qiang Zhu
2024	Progressive Multi-Modality Learning for Inverse Protein Folding. Jiangbin Zheng, Stan Z. Li
2024	Prompt Fusion Interaction Transformer For Aspect-Based Multimodal Sentiment Analysis. Dan Yang, Xiuhong Li, Zhe Li, Chenyu Zhou, Xiaofan Wang, Fan Chen
2024	Prompt-Guided Generation of Structured Chest X-Ray Report Using a Pre-trained LLM. Hongzhao Li, Hongyu Wang, Xia Sun, Hua He, Jun Feng
2024	Proposal Feature Learning Using Proposal Relations for Weakly Supervised Object Detection. Zhaofei Wang, Weijia Zhang, Min-Ling Zhang
2024	Prototype-Guided Prior Enhancement and Rectification in Few-shot Semantic Segmentation. Yiming Tang, Yi Yu, Yan Qiu Chen
2024	Pseudolabel Distillation with Adversarial Contrastive Learning for Semisupervised Domain Adaptation. Yuwu Lu, Chunzhi Liu
2024	Public-Domain Locator for Boosting Attack Transferability on Videos. Songping Wang, Hanqing Liu, Haochen Zhao
2024	Q-Refine: A Perceptual Quality Refiner for AI-Generated Image. Chunyi Li, Haoning Wu, Zicheng Zhang, Hongkun Hao, Kaiwei Zhang, Lei Bai, Xiaohong Liu, Xiongkuo Min, Weisi Lin, Guangtao Zhai
2024	Quantitative Analysis of Eye-Tracking Data Based on Information-Theoretic Tools for Measuring Driver Drowsiness. Yueming Zhu, Qing Xu, Kai Zhen, Runlin Zhang, Shunbo Wang
2024	RACon: Retrieval-Augmented Simulated Character Locomotion Control. Yuxuan Mu, Shihao Zou, Kangning Yin, Zheng Tian, Li Cheng, Weinan Zhang, Jun Wang
2024	RC-Block: Refinement Coefficient for Rectifying Deformation Field. Suwei Zhang, Tai Ma, Ying Wen
2024	RISC: Boosting High-quality Referring Image Segmentation via Foundation Model CLIP. Zongyuan Jiang, Jiayu Chen, Chongyu Liu, Ning Zhang, Jun Huang, Xue Gao, Lianwen Jin
2024	RLVC: Robust and Lightweight Voice Conversion Using Cross-Adaptive Instance Normalization. Yewei Gu, Xianfeng Zhao, Xiaowei Yi
2024	RNG: Reducing Multi-level Noise and Multi-grained Semantic Gap for Joint Multimodal Aspect-Sentiment Analysis. Yaxin Liu, Yan Zhou, Ziming Li, Jinchuan Zhang, Yu Shang, Chenyang Zhang, Songlin Hu
2024	RRE: A Relevance Relation Extraction Framework for Cross-domain Recommender System at Alipay. Jiayang Gu, Xovee Xu, Yulu Tian, Yurun Hu, Jiadong Huang, Wenliang Zhong, Fan Zhou, Lianli Gao
2024	Radio Frequency Signal based Human Silhouette Segmentation: A Sequential Diffusion Approach. Penghui Wen, Kun Hu, Dong Yuan, Zhiyuan Ning, Changyang Li, Zhiyong Wang
2024	Re Lihong Qiao, Rui Wang, Yucheng Shu, Ximing Xu, Baobin Li, Weisheng Li, Xinbo Gao
2024	ReCo-CXR: A Self-Supervised Pre-Training Framework for Pulmonary Nodule Detection in X-Ray Images. Chenglin Liu, Binquan Wang, Ming Zhu
2024	Recognizing Cognitive Load by a Multi-instance Causal Learning Model from Multi-channel Physiological Data. Zhengyang Li, Shanshan Huang, Jiawei Liu, Laiming Jiang, Shen Chen, Yi Zhang, Jun Liao, Shu Wang, Li Liu
2024	Reconstructing Prototype From Contaminated Face With Variations Across Heterogeneous Domains. Meng Pang, Binghui Wang, Nanrun Zhou, Yintao Zhou, Wei Huang
2024	Reference Prompted Model Adaptation for Referring Camouflaged Object Detection. Xuewei Liu, Shaofei Huang, Ruipu Wu, Hengyuan Zhao, Duo Xu, Xiaoming Wei, Jizhong Han, Si Liu
2024	Reference-conditional Makeup-aware Discrimination for Face Image Beautification. Zhenping Li, Si Wu, Xindian Wei, Qianfen Jiao, Cheng Liu, Rui Li
2024	Region Attention Fine-tuning with CLIP for Few-shot Classification. Guangxing Wu, Junxi Chen, Qiu Li, Wentao Zhang, Wei-Shi Zheng, Ruixuan Wang
2024	Relating CNN-Transformer Fusion Network for Remote Sensing Change Detection. Yuhao Gao, Gensheng Pei, Mengmeng Sheng, Zeren Sun, Tao Chen, Yazhou Yao
2024	Representation Distillation for Efficient Self-Supervised Learning. Xin Liu, Yali Li, Shengjin Wang
2024	Reputation Defender: Local Black-Box Adversarial Attack against Image-Translation-Based DeepFake. Wang Yang, Lingchen Zhao, Dengpan Ye
2024	Research on Image Aesthetic Assessment based on Graph Convolutional Network. Yanyu Li, Jiangbo Xu, Ruoyu Zou
2024	Restoring Real-World Images Affected by Varied Degradations Using a Semi-Supervised Domain Adaptation Network. Yongheng Zhang, Yuanqiang Cai, Danfeng Yan
2024	Rethinking Adversarial Robustness Distillation VIA Strength-Dependent Adaptive Regularization. Bingzhi Chen, Shuobin Lin, Yishu Liu, Zheng Zhang, Guangming Lu, Lewei He
2024	Rethinking Image Deraining via Text-guided Detail Reconstruction. Chen Wu, Zhuoran Zheng, Pengwen Dai, Chenggang Shan, Xiuyi Jia
2024	Retinal Vessel Segmentation via Cross-attention Feature Fusion. Tian Feng, Jiaheng Wang, Junao Shen, Qiangguo Jin, Zhiyuan Zhu, Xinyu Wang
2024	RevNet: A Review Network with Group Aggregation Fusion for Singing Melody Extraction. Shuai Yu, Xiaoliang He, Yanting Zhang
2024	Revisiting Large Kernel Convolution for Light Field Image Angular Super-Resolution. Peiqi Xia, Yao Lu, Sijia Zhang, Shunzhou Wang, Ziqi Wang, Wang xia
2024	RoIRTC: Toward Region-of-Interest Reinforced Real-Time Video Communication. Shuoqian Wang, Mengbai Xiao, Yao Liu
2024	Robust 3D Face Alignment with Multi-Path Neural Architecture Search. Zhichao Jiang, Hongsong Wang, Xi Teng, Baopu Li
2024	Robust Knowledge Distillation and Self-Contrast Reasoning for Debiased Visual Question Answering. Ke Ning, Rongrong Shen, Zhixin Li
2024	Robust Principal Component Analysis via High-Order Self-Learning Transform Tensor Nuclear Norm. Honghui Xu, Yueqian Quan, Chuangjie Fang, Jianwei Zheng
2024	Robust VQA via Internal and External Interaction of Modal Information and Question Transformation. Dahe Peng, Rongrong Shen, Zhixin Li
2024	Robust Visual Question Answering With Contrastive-Adversarial Consistency Constraints. Jiawei Zhu, Meirong Ding, Yishu Liu, Biqing Zeng, Guangming Lu, Bingzhi Chen
2024	Rotation Exploration Transformer for Aerial Person Re-identification. Lei Wang, Quan Zhang, Junyang Qiu, Jianhuang Lai
2024	RotoGBML: Towards Out-of-distribution Generalization for Gradient-based Meta-learning. Min Zhang, Zifeng Zhuang, Zhitao Wang, Donglin Wang
2024	Rumor Detection Framework Based on Multi-source Knowledge Adaptation. Ning Xu, Jingqiu Li, Lanjun Wang, Anan Liu
2024	SADA: Self-Adaptive Domain Adaptation From Black-Box Predictors. Jiayang Liu, Kai Wang, Zheng Wang, Xing Xu
2024	SAMP: Adapting Segment Anything Model for Pose Estimation. Zhihang Zhu, Yunfeng Yan, Yi Chen, Haoyuan Jin, Xuesong Nie, Donglian Qi, Xi Chen
2024	SC-HVPPNet: Spatial and Channel Hybrid-Attention Video Post-Processing Network with CNN and Transformer. Tong Zhang, Wenxue Cui, Shaohui Liu, Feng Jiang
2024	SCD-NAS: Towards Zero-Cost Training in Melanoma Diagnosis. Hongyan Xu, Xiu Su, Arcot Sowmya, Ian Katz, Dadong Wang
2024	SCSim: A Realistic Spike Cameras Simulator. Liwen Hu, Lei Ma, Yijia Guo, Tiejun Huang
2024	SD4Privacy: Exploiting Stable Diffusion for Protecting Facial Privacy. Jinyang An, Wanqian Zhang, Dayan Wu, Zheng Lin, Jingzi Gu, Weiping Wang
2024	SDViT: Towards Efficient Visual Foundation Model via Unifying Sparse and Dense Representation Learning. Yin Tang, Guang Yang, Xili Wan
2024	SFDE-net: A Spatial-Frequency Domain Feature Enhancement Network for Cloud Detection. Baotong Su, Siyan Li, Wenguang Zheng, Yao Chen
2024	SIAM: A Simple Alternating Mixer for Video Prediction. Xin Zheng, Ziang Peng, Yuan Cao, Hongming Shan, Junping Zhang
2024	SID-NERF: Few-Shot Nerf Based on Scene Information Distribution. Yuchen Li, Fan Wan, Yang Long
2024	SMAE: A Split Masked Graph Autoencoder. Ruiting Wang, Enguang Zuo, Chen Chen, Cheng Chen, Junyi Yan, Jie Zhong, Ziwei Yan, Xiaoyi Lv
2024	SMPLX-Lite: A Realistic and Drivable Avatar Benchmark with Rich Geometry and Texture Annotations. Yujiao Jiang, Qingmin Liao, Zhaolong Wang, Xiangru Lin, Zongqing Lu, Yuxi Zhao, Hanqing Wei, Jingrui Ye, Yu Zhang, Zhijing Shao
2024	SPformer: Hybrid Sequential-Parallel Architectures for Automatic Speech Recognition. Mingdong Yu, Xiaofeng Jin, Guirong Wang, Bo Wang, Jiaqi Chen
2024	SSETPAN: Spatial-Spectral Enhanced Transformer based network for pansharpening. Huanting Zhang, Mengting Ma, Xinyu Wang, Jiawei Yang, Xiangdong Li, Wei Zhang
2024	SSHR: Leveraging Self-supervised Hierarchical Representations for Multilingual Automatic Speech Recognition. Hongfei Xue, Qijie Shao, Kaixun Huang, Peikun Chen, Jie Liu, Lei Xie
2024	SSyncOA: Self-synchronizing Object-aligned Watermarking to Resist Crop-paste Attacks. Chengxin Zhao, Hefei Ling, Sijing Xie, Han Fang, Yaokun Fang, Nan Sun
2024	STCMOT: Spatio-Temporal Cohesion Learning for UAV-Based Multiple Object Tracking. Jianbo Ma, Chuanming Tang, Fei Wu, Can Zhao, Jianlin Zhang, Zhiyong Xu
2024	STRA: A Simple Token Replacement Strategy Alleviating Exposure Bias in Text Generation. Shaoyao Huang, Luozheng Qin, Ziqiang Cao, Qian Qiao
2024	STUI-NET: Semi-Supervised Transformer for Underwater Information Enhancement. Zhenqiang Zhang, Chuantao Li, Jian Song, Jialiang Lv, Chunxiao Wang, Zhigang Zhao, Jidong Huo
2024	STformer: Advancing Video Deraining Network Integrating with Spatial Transformers and Multiscale Feature Extraction. Fengqi Li, Mengchao Guo, Fengqiang Xu, Renxuan Xiong, Xiaohong Yan, Qian Sun, Deguang Wang
2024	SVASTIN: Sparse Video Adversarial Attack via Spatio-Temporal Invertible Neural Networks. Yi Pan, Jun-Jie Huang, Zihan Chen, Wentao Zhao, Ziyue Wang
2024	SVT: Spectral Video Transformer for Video Restoration in Under-Display Camera. Xuanxi Chen, Ziqian Shao, Tong Lu
2024	Sal-Guide Diffusion: Saliency Maps Guide Emotional Image Generation through Adapter. Xiangru Lin, Shenghua Zhong, Yan Liu, Gong Chen
2024	Saliency Dataset and Predictive Model for Areas of Interest in VVC Perceptual Coding. Jorge Kessler-Martín, Pablo Fernández-Lagos, David García-Lucas, Gabriel Cebrián-Márquez, Belén Ríos-Sánchez, Guillermo Vigueras, Antonio Jesús Díaz-Honrubia
2024	Salient Part-Aligned and Keypoint Disentangling Transformer for Person Re-Identification in Aerial Imagery. Junyang Qiu, Zhanxiang Feng, Lei Wang, Jianhuang Lai
2024	ScribbleEditor: Guided Photo-realistic and Identity-preserving Image Editing with Interactive Scribble. Haotian Hu, Bin Jiang, Chao Yang, Xinjiao Zhou, Xiaofei Huo
2024	Second-Order Self-Supervised Learning for Breast Cancer Classification. Haitao Yao, Zhenwei Wang, Mingli Zhang, Wen Zhu, Lizhi Zhang, LiJun He, Jianxin Zhang
2024	Selective Cross-Correlation Consistency Loss for Out-of-Distribution Generalization. Zining Chen, Weiqiu Wang, Zhicheng Zhao, Fei Su, Aidong Men
2024	Self-Paced Co-Training and Foundation Model for Semi-Supervised Medical Image Segmentation. Bo Qian, Yang Wen, Bin Sheng
2024	Self-Supervised Federated Learning for Personalized Human Activity Recognition. Shizhuo Deng, Da Teng, Zhubao Guo, Jiaqi Chen, Dongyue Chen, Tong Jia, Hao Wang
2024	Self-Supervised Learning-Based General Fine-tuning Framework For Audio Classification and Event Detection. Yanjie Sun, Kele Xu, Yong Dou, Tian Gao
2024	Semantic Bridging and Feature Anchoring for Class Incremental Learning. Kanghui Wu, Dongyan Guo
2024	Semantic-Visual Graph Reasoning for Visual Dialog. Dongze Hao, Qunbo Wang, Jing Liu
2024	Sentiment Confidence Separation: A Trust-Optimized Framework for Multimodal Sentiment Classification. Zemin Tang, Min Shi, Zhibang Yang, Xu Zhou, Cen Chen, Joey Tianyi Zhou
2024	Shadow Constrained DEM Refinement Based on Differentiable Rendering. Fan Tian, Peichi Zhou, Chen Li, Changbo Wang
2024	Shapley Ensemble Adversarial Attack. Zheng Wang, Bowen Tang, Yi Bin, Lei Zhu, Guoqing Wang, Yang Yang
2024	Similarity Mining via Implicit Matching Pattern Learning for Kinship Verification. Xiaoke Zhu, Danyang Li, Xiaopan Chen, Fumin Qi, Fan Zhang, Xiao-Yuan Jing
2024	SingAvatar: High-fidelity Audio-driven Singing Avatar Synthesis. Wentao Ma, Anni Tang, Jun Ling, Han Xue, Huiheng Liao, Yunhui Zhu, Li Song
2024	Single Free-Hand Sketch Guided Free-Form Deformation For 3D Shape Generation. Fei Wang, Jianqiang Sheng, Kai Jiang, Zhineng Zhang, Juepeng Zheng, Baoquan Zhao
2024	Single RGBD to Multilayer 3D Display Pipeline. Laurie Van Bogaert, Armand Losfeld, Gauthier Lafruit, Mehrdad Teratani
2024	Single Stage Warped Cloth Learning and Semantic-Contextual Attention Feature Fusion for Virtual Tryon. Sanhita Pathak, Vinay Kaushik, Brejesh Lall
2024	Skipformer: A Skip-and-Recover Strategy for Efficient Speech Recognition. Wenjing Zhu, Sining Sun, Changhao Shan, Peng Fan, Qing Yang
2024	Sliced Maximal Information Coefficient: A Training-Free Approach for Image Quality Assessment Enhancement. Kang Xiao, Xu Wang, Yulin He, Baoliang Chen, Xuelin Shen
2024	Slow-Fast Adaptation for Source-Free Object Detection. Luojun Lin, Qipeng Liu, Xiangwei Zheng, Zheng Lin
2024	SmPhy: Generating smooth and physically plausible 3D garment animations. Jiazhe Miao, Tao Peng, Fei Fang, Xinrong Hu, Ping Zhu, Feng Yu, Minghua Jiang
2024	Smile: Spiking Multi-Modal Interactive Label-Guided Enhancement Network for Emotion Recognition. Ming Guo, Wenrui Li, Chao Wang, Yuxin Ge, Chongjun Wang
2024	Source-Free Domain Adaptation for Point Cloud Semantic Segmentation. Jianshe Duan, Yachao Zhang, Yanyun Qu
2024	Space-time Reinforcement Network for Video Object Segmentation. Yadang Chen, Wentao Zhu, Zhi-Xin Yang, Enhua Wu
2024	Spatial Dual Context Learning for Weakly-supervised Group Activity Recognition in Still-images. Zhao Wu, Dunbo Ning, Wenjing Chen, Hao Sun, Wei Xie, Ming Dong
2024	Speaker Recognition Based on Pre-Trained Model and Deep Clustering. Liang He, Zhida Song, Shuanghong Liu, Mengqi Niu, Ying Hu, Hao Huang
2024	Spike-NeRF: Neural Radiance Field Based On Spike Camera. Yijia Guo, Yuanxi Bai, Liwen Hu, Mianzhi Liu, Ziyi Guo, Lei Ma, Tiejun Huang
2024	Spot the Difference! Temporal Coarse to Fine to Finer Difference Spotting for Action Recognition in Videos. Yaoxin Li, Deepak Sridhar, Hanwen Liang, Alexander Wong
2024	Stega-Matting: Irregular Matting Protection via Steganography. Kun Hu, Zizhuo Wang, Zixuan Hu, Heng Gao, Xingjun Wang
2024	Structural Highlight Network for Camouflaged Object Detection. Zheng Wang, Junkun Zhao, Bifan Lai, XingHuai Zheng
2024	Structure-aware Residual-center Representation for Self-Supervised Open-set 3D Cross-modal Retrieval. Yang Xu, Yifan Feng, Yu Jiang
2024	Sttcnerf: Style Transfer of Neural Radiance Fields for 3d Scene Based on Texture Consistency Constraint. Wudi Chen, Chao Zhang, Cheng Han, Yanjie Ma, Yongqing Cai
2024	Style-ACAE: Adversarial Capsule Autoencoder with Styles. Xiufeng Liu, Zhongqiu Zhao, Chen Ding
2024	Symmetrical Two-Stream with Selective Sampling for Diversifying Video Captions. Jin Wang, Yahong Han
2024	Synthetic Data Augmentation for Infrared Small Target Detection via Exploring Frequency Components and Targets Prior. Yaoxin Wu, Hongwei Ding, Yunqi Liu, Zerui Wen, Xiaohui Cui
2024	TBU: A Large-scale Multi-mask Video Dataset for Teacher Behavior Understanding. Ting Cai, Yu Xiong, Chengyang He, Chao Wu, Song Zhou
2024	TD3D: Tensor-based Discrete Diffusion Process for 3D Shape Generation. Jinglin Zhao, Debin Liu, Laurence T. Yang, Ruonan Zhao, Zheng Wang, Zhe Li
2024	TEAdapter: Supply Vivid Guidance for Controllable Text-to-Music Generation. Jialing Zou, Jiahao Mei, Xudong Nan, Jinghua Li, Daoguo Dong, Liang He
2024	TGMAE: Self-supervised Micro-Expression Recognition with Temporal Gaussian Masked Autoencoder. Shifeng Liu, Xinglong Mao, Sirui Zhao, Chaoyou Fu, Ying Yu, Tong Xu, Enhong Chen
2024	TLVC: Temporal Bit-rate Allocation for Learned Video Compression. Yifan Zhang, Meiqin Liu, Chenming Xu, Qi Tang, Chao Yao, Yao Zhao
2024	TS-SAM: Fine-Tuning Segment-Anything Model for Downstream Tasks. Yang Yu, Chen Xu, Kai Wang
2024	TS-SAM: Two Small Steps for SAM, One Giant Leap for Abnormal detections. Dongyang Gao, Chen Chen, Yichao Zhou, Haotian Zhang, Xiyuan Hu
2024	Tackling Feature Skew in Heterogeneous Federated Learning with Semantic Enhancement. Qi Li, Yucan Zhou, Jiang Zhou, Xiaoyan Gu, Bo Li
2024	TailClip: Mitigating Tail Latency in Cloud Gaming via Smart Video Frame Generation. Qianyun Gong, Kunheng Jiang, Jingjing Wen, Xinjing Yuan, Jianxin Shi, Lingjun Pu
2024	Talking Portrait with Discrete Motion Priors in Neural Radiation Field. Daowu Yang, Ying Liu, Qiyun Yang, Ruihui Li
2024	Task-Aware Lipschitz Confidence Data Augmentation in Visual Reinforcement Learning From Images. Biao Wu, Haitao Wang, Hejun Wu
2024	Temporal Feature Aggregation for Efficient 2D Video Grounding. Mohan Chen, Yiren Zhang, Jueqi Wei, Yuejie Zhang, Rui Feng, Tao Zhang, Shang Gao
2024	Temporal Self-Paced Proposal Learning for Weakly-Supervised Video Moment Retrieval and Highlight Detection. Liqing Zhu, Xun Jiang, Fumin Shen, Guoqing Wang, Yang Yang, Xing Xu
2024	Temporal Sentence Grounding with Temporally Global Textual Knowledge. Chen Cai, Runzhong Zhang, Jianjun Gao, Kejun Wu, Kim-Hui Yap, Yi Wang
2024	Text and Edge Guided Thangka Image Inpainting with Diffusion Model. Tienyi Hsieh, Qijun Zhao, Fan Pan, Pubu Danzeng, Dingguo Gao, Dorji Gesang
2024	Text-Based Vector Sketch Editing with Image Editing Diffusion Prior. Haoran Mo, Xusheng Lin, Chengying Gao, Ruomei Wang
2024	The Balanced Multi-Modal Spiking Neural Networks with Online Loss Adjustment and Time Alignment. Jianing Han, Jiangrong Shen, Qi Xu, Jian K. Liu, Huajin Tang
2024	The Correlation Analysis Between Cybersickness and Postural Behavior in Immersive VR Experience. Ying Zhong, Ke-Ao Zhao, Leping Zhang, Fangming Zhao, Wentao Wei, Feilin Han
2024	The Prospect of Enhancing Large-Scale Heterogeneous Federated Learning with Foundation Models. Yulan Gao, Zhaoxiang Hou, Chengyi Yang, Zengxiang Li, Han Yu, Xiaoxiao Li
2024	The Root Element of Human Poses is Radian: MCPRL is All You Need. Ziming Cheng, Xiangning Ruan, Qixiang Yin, Zhicheng Zhao
2024	Theoretical Bound-Guided Hierarchical Vae For Neural Image Codecs. Yichi Zhang, Zhihao Duan, Yuning Huang, Fengqing Zhu
2024	Three-Stage Temporal Deformable Network for Blurry Video Frame Interpolation. Pengcheng Lei, Zaoming Yan, Tingting Wang, Faming Fang, Guixu Zhang
2024	Time-Frequency Jointed Imperceptible Adversarial Attack to Brainprint Recognition with Deep Learning Models. Hangjie Yi, Yuhang Ming, Dongjun Liu, Wanzeng Kong
2024	Tina: Think, Interaction, and Action Framework for Zero-Shot Vision Language Navigation. Dingbang Li, Wenzhou Chen, Xin Lin
2024	ToW3D: Consistency-aware Interactive Point-based Mesh Editing on GANs. Haixu Song, Fangfu Liu, Chenyu Zhang, Yueqi Duan
2024	Top-Down Guidance Based ViT-CNN Network Considering Theme Information for Image Aesthetic Assessment. Sumei Li, Xiaofei He, Hangwei Liang
2024	Towards Accurate 3D Face Alignment Under Extreme Scenarios Via Multi-Granularity Perturbation Relearning. Xinyu Li, Xing Wang, Xiaoxiao Yang, Suping Wu, Xiangzheng Li, Xitie Zhang, Zhiyuan Zhou, Xiang Zhang
2024	Towards Efficient Resume Understanding: A Multi-Granularity Multi-Modal Pre-Training Approach. Feihu Jiang, Chuan Qin, Jingshuai Zhang, Kaichun Yao, Xi Chen, Dazhong Shen, Chen Zhu, Hengshu Zhu, Hui Xiong
2024	Towards Low-resource License Plate Recognition via Feature Shuffling. Yuan-yuan Liu, Song-Lu Chen, Qi Liu, Feng Chen, Xu-Cheng Yin
2024	Towards Omni-supervised Referring Expression Segmentation. Minglang Huang, Yiyi Zhou, Gen Luo, Guannan Jiang, Weilin Zhuang, Xiaoshuai Sun
2024	Towards Query-Efficient Decision-Based Adversarial Attacks Through Frequency Domain. Jianhao Fu, Xiang Ling, Yaguan Qian, Changjiang Li, Tianyue Luo, Jingzheng Wu
2024	Towards Real-world Continuous Super-Resolution: Benchmark and Method. Xingbei Guo, Ziping Ma, Qing Wang, Pengxu Wei
2024	TrafficScene: A Multi-modal Dataset including Light Field for Semantic Segmentation of Traffic Scenes. Jie Luo, Xin Jin, Mingyu Liu, Yihui Fan
2024	Training-Free Robust Neural Network Search Via Pruning. Qiancheng Yang, Yong Luo, Bo Du
2024	Training-Free Semantic Video Composition via Pre-trained Diffusion Model. Jiaqi Guo, Sitong Su, Junchen Zhu, Lianli Gao, Jingkuan Song
2024	Training-free Neural Architectural Search on Transformer via Evaluating Expressivity and Trainability. Yi Fan, Yu-Bin Yang
2024	Training-free Neural Architecture Search on Hybrid Convolution-attention Networks. Yi Fan, Yu-Bin Yang
2024	TranBF: Deep Transformer Networks and Bayesian Filtering for Time Series Anomalous Signal Detection in Cyber-physical Systems. Shuo Zhang, Xiongpeng Hu, Jing Liu
2024	Transferable and high-quality adversarial example generation leveraging diffusion model. Kangze Xu, Ziqiang He, Xiangui Kang, Z. Jane Wang
2024	Trident Transformer for Light Field Image Super-Resolution. Ziqi Wang, Yao Lu, Shunzhou Wang, Wang xia, Peiqi Xia, Wenjing Wang
2024	Tutor Assisted Feature Distillation. Shenghao Chen, Zhe Liu, Jun Chen, Yuqing Song, Yi Liu, Qiaoying Teng
2024	Two-Stage Facial Expression Spotting with Spectrum-Based Post-Processing. Lei Wang, Tianfu Cai, Pinyi Huang, Xiyao Liu, Wangyang Cai
2024	Two-Stage Information Bottleneck For Temporal Language Grounding. Haoyu Tang, Shuaike Zhang, Ming Yan, Ji Zhang, Mingzhu Xu, Yupeng Hu, Liqiang Nie
2024	Two-Step Temporal Divisive Clustering for Unsupervised Action Segmentation. Yule Liu, Zhuben Dong, Shenglan Liu, Wujun Wen, Lin Feng
2024	Two-phase Parametric Registration for Retinal Images. Xinxin Zhang, Xiankai Lu, Jizhou Li, Yongshun Gong, Qiangchang Wang, Yilong Yin
2024	US-SAM: An Automatic Prompt Sam For Ultrasound Image. Yuteng Wang, Xing Wu, Zhongshi He, Peng Wang, Haidong Wang, Hongqian Wang
2024	Ultralight-weight Binary Neural Network with 1K Parameters for Image Super-Resolution. Zhijian Wu, Dingjiang Huang
2024	Unbiased Image Synthesis via Manifold Guidance in Diffusion Models. Xingzhe Su, Daixi Jia, Fengge Wu, Junsuo Zhao, Changwen Zheng, Wenwen Qiang
2024	Uncertainty-Debiased Multimodal Fusion: Learning Deterministic Joint Representation for Multimodal Sentiment Analysis. Zixian Gao, Xun Jiang, Hua Chen, Yujie Li, Yang Yang, Xing Xu
2024	Understanding Impacts of Electromagnetic Signal Injection Attacks on Object Detection. Youqian Zhang, Chunxi Yang, Eugene Yujun Fu, Qinhong Jiang, Chen Yan, Sze-Yiu Chau, Grace Ngai, Hong Va Leong, Xiapu Luo, Wenyuan Xu
2024	Unified Diffusion-Based Rigid and Non-Rigid Editing with Text and Image Guidance. Jiacheng Wang, Ping Liu, Wei Xu
2024	Unifying Generation and Compression: Ultra-low bitrate Image Coding Via Multi-stage Transformer. Naifu Xue, Qi Mao, Zijian Wang, Yuan Zhang, Siwei Ma
2024	Universal Organizer of Segment Anything Model for Unsupervised Semantic Segmentation. Tingting Li, Gensheng Pei, Xinhao Cai, Qiong Wang, Huafeng Liu, Yazhou Yao
2024	Unknown Instance Learning for Person Search. Lan Yan, Kenli Li
2024	Unpaired image despeckling based on adversarial speckle generation. Xu Wang, Yanxia Wu, Ye Yuan, Yan Fu, Xue Zhang
2024	Unsupervised Domain Adaptation Semantic Segmentation on Thyroid Ultrasound Images Based on Task-Oriented Feature Disentanglement. Zijian Zhang, Ruiguo Yu, Xi Wei, Jie Gao, Mei Yu, Xuewei Li, Zhiqiang Liu
2024	Unsupervised Monte Carlo Denoising via Learning Contrastive Disentanglement Representation. Xiao Liang, Siyuan Duan, Lijie Zheng, Yuqian Zeng
2024	Unsupervised Multi-Modal Medical Image Registration via query-selected attention and decoupled Contrastive Learning. Zhenrong Huang, Bin Chen
2024	Unsupervised Multi-Target Domain Adaptation Incremental Method Based on Contrastive Learning. Xing Wei, Zhaoxin Ji, Bin Wen, Fan Yang, Chong Zhao, Yang Lu
2024	Unsupervised Object Discovery Via Object-Centric Representation. Bingfei Fu, Xiangyang Xue
2024	Unsupervised Online Cross-modal Hashing With Multiple Association Exploitation. Xiao Kang, Xingbo Liu, Xuening Zhang, Wen Xue, Xiushan Nie, Shaohua Wang, Yilong Yin
2024	Unveiling the Significance of Width Dimension in Bird's-Eye View Segmentation. Yiru Wang, Qianqian Li, Xinyue Wang, Qiao Yang, Shunli Zhang
2024	VG-Annotator: Vision-Language Models as Query Annotators for Unsupervised Visual Grounding. Jiabo Ye, Junfeng Tian, Xiaoshan Yang, Zhenru Zhang, Anwen Hu, Ming Yan, Ji Zhang, Liang He, Xin Lin
2024	VIP-FSCIL: A More Robust Approach for FSCIL. Zhihang Wei, Jinxin Shi, Jing Yang, Jiabao Zhao
2024	VLUReID: Exploiting Vision-Language Knowledge for Unsupervised Person Re-Identification. Dongmei Zhang, Ray Zhang, Fan Yang, Yuan Li, Huizhu Jia, Xiaodong Xie, Shanghang Zhang
2024	VRHCF: Cross-Source Point Cloud Registration via Voxel Representation and Hierarchical Correspondence Filtering. Guiyu Zhao, Zewen Du, Zhentao Guo, Hongbin Ma
2024	VS3D: A Vote-Based Semi-Supervised 3D Object Detection Framework for Point Clouds. Shuhua Wang, Ke Lu, Yang Zhao, Hengsheng Lun, Zehai Niu, Jian Xue
2024	VTR: Bidirectional Video-Textual Transmission Rail for CLIP-based Video Recognition. Shaoqi Yu, Lili Chen, Xiaolin Zhang, Jiamao Li
2024	Video Anomaly Detection Via Self-Supervised Learning With Frame Interval and Rotation Prediction. Ke Jia, Yonghong Song, Xiaomeng Wu, You Su
2024	Video Object Segmentation with Dynamic Query Modulation. Hantao Zhou, Runze Hu, Xiu Li
2024	Video-Driven Sketch Animation Via Cyclic Reconstruction Mechanism. Zhuo Xie, Haoran Mo, Chengying Gao
2024	Visual Feature Disentanglement for Zero-Shot Learning. Qingzhi He, Rong Quan, Weifeng Yang, Jie Qin
2024	Visual-guided Query with Temporal Interaction for Video Object Segementation. Jiaxin Qiu, Guoyu Yang, Jie Lei, Zunlei Feng, Ronghua Liang
2024	Voice-to-Face Generation: Couple of Self-Supervised Representation Learning with Diffusion Model. Wuyang Chen, Kele Xu, Yong Dou, Tian Gao
2024	Weakly-Supervised Action Localization by Hierarchical Attention Mechanism with Multi-Scale Fusion Strategies. Yu Wang, Shengjie Zhao
2024	When Skeleton Meets Motion: Adaptive Multimodal Graph Representation Fusion for Action Recognition. Xiao Liu, Guan Yuan, Rui Bing, Zhuo Cai, Shengshen Fu, Yonghao Yu
2024	Why Some Audio Signal Short-Time Fourier Transform Coefficients Have Nonuniform Phase Distributions. Stephen D. Voran
2024	Wi-Fi based Gait Recognition using Spectrogram and Phase. Sheng Chen, Fei Yang, Aimin Pan, Zhewei Mei
2024	Winner Takes It All: An Efficient Overlap-Aware Hybrid Online Diarization with Partial Backtracking Mechanism. Ru Zhen, Xingtao Zhang, Chao Min, Biao Li
2024	WirePAuS: Auxiliary-free Single-shot Wireframe Parsing. Jinkang Ji, Junao Shen, Xinyu Wang, Tian Feng, Sensen Wu
2024	X-ReID: Cross-Instance Transformer for Identity-Level Person Re-Identification. Leqi Shen, Tao He, Sicheng Zhao, Zhelun Shen, Yuchen Guo, Tianshi Xu, Guiguang Ding
2024	iDAT: inverse Distillation Adapter-Tuning. Jiacheng Ruan, Jingsheng Gao, Mingye Xie, Daize Dong, Suncheng Xiang, Ting Liu, Yuzhuo Fu