EMNLP - RankMe

1809 papers

Year	Title / Authors
2025	"Feels Feminine to Me": Understanding Perceived Gendered Style through Human Annotations. Hongyu Chen, Neele Falk, Michael Roth, Agnieszka Falenska
2025	"I've Decided to Leak": Probing Internals Behind Prompt Leakage Intents. Jianshuo Dong, Yutong Zhang, Liu Yan, Zhenyu Zhong, Tao Wei, Ke Xu, Minlie Huang, Chao Zhang, Han Qiu
2025	"Mm, Wat?" Detecting Other-initiated Repair Requests in Dialogue. Anh Ngo, Nicolas Rollet, Catherine Pelachaud, Chloé Clavel
2025	'Rich Dad, Poor Lad': How do Large Language Models Contextualize Socioeconomic Factors in College Admission ? Huy Nghiem, Phuong-Anh Nguyen-Le, John Prindle, Rachel Rudinger, Hal Daumé III
2025	(Almost) Free Modality Stitching of Foundation Models. Jaisidh Singh, Diganta Misra, Boris Knyazev, Antonio Orvieto
2025	3DS: Medical Domain Adaptation of LLMs via Decomposed Difficulty-based Data Selection. Hongxin Ding, Yue Fang, Runchuan Zhu, Xinke Jiang, Jinyang Zhang, Yongxin Xu, Weibin Liao, Xu Chu, Junfeng Zhao, Yasha Wang
2025	3MDBench: Medical Multimodal Multi-agent Dialogue Benchmark. Ivan Sviridov, Amina Miftakhova, Artemiy Tereshchenko, Galina Zubkova, Pavel Blinov, Andrey V. Savchenko
2025	3R: Enhancing Sentence Representation Learning via Redundant Representation Reduction. Longxuan Ma, Xiao Wu, Yuxin Huang, Shengxiang Gao, Zhengtao Yu
2025	A Case Against Implicit Standards: Homophone Normalization in Machine Translation for Languages that use the Ge'ez Script. Hellina Hailu Nigatu, Atnafu Lambebo Tonja, Henok Biadglign Ademtew, Hizkiel Mitiku Alemayehu, Negasi Haile Abadi, Tadesse Destaw Belay, Seid Muhie Yimam
2025	A Causal Lens for Evaluating Faithfulness Metrics. Kerem Zaman, Shashank Srivastava
2025	A Comprehensive Framework to Operationalize Social Stereotypes for Responsible AI Evaluations. Aida Mostafazadeh Davani, Sunipa Dev, Héctor Pérez-Urbina, Vinodkumar Prabhakaran
2025	A Comprehensive Literary Chinese Reading Comprehension Dataset with an Evidence Curation Based Solution. Dongning Rao, Rongchu Zhou, Peng Chen, Zhihua Jiang
2025	A Computational Simulation of Language Production in First Language Acquisition. Yuan Gao, Weiwei Sun
2025	A Culturally-diverse Multilingual Multimodal Video Benchmark & Model. Bhuiyan Sanjid Shafique, Ashmal Vayani, Muhammad Maaz, Hanoona Abdul Rasheed, Dinura Dissanayake, Mohammed Irfan Kurpath, Yahya Hmaiti, Go Inoue, Jean Lahoud, Md. Safirur Rashid, Shadid Intisar Quasem, Maheen Fatima, Franco Vidal, Mykola Maslych, Ketan Pravin More, Sanoojan Baliah, Hasindri Watawana, Yuhao Li, Fabian Farestam, Leon Schaller, Roman Tymtsiv, Simon Weber, Hisham Cholakkal, Ivan Laptev, Shin'ichi Satoh, Michael Felsberg, Mubarak Shah, Salman H. Khan, Fahad Shahbaz Khan
2025	A Fully Probabilistic Perspective on Large Language Model Unlearning: Evaluation and Optimization. Anda Cheng, Wei Huang, Yinggui Wang
2025	A Generative Pre-Trained Language Model for Channel Prediction in Wireless Communications Systems. Bo Li, Huanming Zhang, Yuhua Jiang, Yucong Wang, Tengyu Zhang, Shaoqiang Yan, Hongyao Li, Yihong Liu, Feifei Gao
2025	A Good Plan is Hard to Find: Aligning Models with Preferences is Misaligned with What Helps Users. Nishant Balepur, Matthew Shu, Yoo Yeon Sung, Seraphina Goldfarb-Tarrant, Shi Feng, Fumeng Yang, Rachel Rudinger, Jordan Lee Boyd-Graber
2025	A Graph-Theoretical Framework for Analyzing the Behavior of Causal Language Models. Rashin Rahnamoun, Mehrnoush Shamsfard
2025	A Head to Predict and a Head to Question: Pre-trained Uncertainty Quantification Heads for Hallucination Detection in LLM Outputs. Artem Shelmanov, Ekaterina Fadeeva, Akim Tsvigun, Ivan Tsvigun, Zhuohan Xie, Igor Kiselev, Nico Daheim, Caiqi Zhang, Artem Vazhentsev, Mrinmaya Sachan, Preslav Nakov, Timothy Baldwin
2025	A Knowledge-driven Adaptive Collaboration of LLMs for Enhancing Medical Decision-making. Xiao Wu, Ting-Zhu Huang, Liang-Jian Deng, Yanyuan Qiao, Imran Razzak, Yutong Xie
2025	A Middle Path for On-Premises LLM Deployment: Preserving Privacy Without Sacrificing Model Confidentiality. Hanbo Huang, Yihan Li, Bowen Jiang, Bo Jiang, Lin Liu, Zhuotao Liu, Ruoyu Sun, Shiyu Liang
2025	A Multi-Agent Framework with Automated Decision Rule Optimization for Cross-Domain Misinformation Detection. Hui Li, Ante Wang, Kunquan Li, Zhihao Wang, Liang Zhang, Delai Qiu, Qingsong Liu, Jinsong Su
2025	A Multi-Level Benchmark for Causal Language Understanding in Social Media Discourse. Xiaohan Ding, Kaike Ping, Buse Çarik, Eugenia Ha Rim Rho
2025	A Multilingual, Culture-First Approach to Addressing Misgendering in LLM Applications. Sunayana Sitaram, Adrian de Wynter, Isobel McCrum, Qilong Gu, Si-Qing Chen
2025	A Necessary Step toward Faithfulness: Measuring and Improving Consistency in Free-Text Explanations. Lingjun Zhao, Hal Daumé III
2025	A Position Paper on the Automatic Generation of Machine Learning Leaderboards. Roelien C. Timmer, Yufang Hou, Stephen Wan
2025	A Probabilistic Inference Scaling Theory for LLM Self-Correction. Zhe Yang, Yichang Zhang, Yudong Wang, Ziyao Xu, Junyang Lin, Zhifang Sui
2025	A Rigorous Evaluation of LLM Data Generation Strategies for Low-Resource Languages. Tatiana Anikina, Ján Cegin, Jakub Simko, Simon Ostermann
2025	A Sequential Multi-Stage Approach for Code Vulnerability Detection via Confidence- and Collaboration-based Decision Making. Chung-Nan Tsai, Xin Wang, Cheng-Hsiung Lee, Ching-Sheng Lin
2025	A Simple Yet Effective Method for Non-Refusing Context Relevant Fine-grained Safety Steering in LLMs. Shaona Ghosh, Amrita Bhattacharjee, Yftah Ziser, Christopher Parisien
2025	A Survey of Link Prediction in N-ary Knowledge Graphs. Jiyao Wei, Saiping Guan, Da Li, Zhongni Hou, Miao Su, Yucan Guo, Xiaolong Jin, Jiafeng Guo, Xueqi Cheng
2025	A Symbolic Adversarial Learning Framework for Evolving Fake News Generation and Detection. Chong Tian, Qirong Ho, Xiuying Chen
2025	A Systematic Analysis of Base Model Choice for Reward Modeling. Kian Ahrabian, Pegah Jandaghi, Negar Mokhberian, Sai Praneeth Karimireddy, Jay Pujara
2025	A Systematic Survey of Automatic Prompt Optimization Techniques. Kiran Ramnath, Kang Zhou, Sheng Guan, Soumya Smruti Mishra, Xuan Qi, Zhengyuan Shen, Shuai Wang, Sangmin Woo, Sullam Jeoung, Yawei Wang, Haozhu Wang, Han Ding, Yuzhe Lu, Zhichao Xu, Yun Zhou, Balasubramaniam Srinivasan, Qiaojing Yan, Yueyan Chen, Haibo Ding, Panpan Xu, Lin Lee Cheong
2025	A Text-Based Recommender System that Leverages Explicit Affective State Preferences. Tonmoy Hasan, Razvan C. Bunescu
2025	A Training-Free Length Extrapolation Approach for LLMs: Greedy Attention Logit Interpolation. Yan Li, Tianyi Zhang, Zechuan Li, Caren Han
2025	ACING: Actor-Critic for Instruction Learning in Black-Box LLMs. Salma Kharrat, Fares Fourati, Marco Canini
2025	AFRIDOC-MT: Document-level MT Corpus for African Languages. Jesujoba Oluwadara Alabi, Israel Abebe Azime, Miaoran Zhang, Cristina España-Bonet, Rachel Bawden, Dawei Zhu, David Ifeoluwa Adelani, Clement Odoje, Idris Akinade, Iffat Maab, Davis David, Shamsuddeen Hassan Muhammad, Neo Putini, David O. Ademuyiwa, Andrew Caines, Dietrich Klakow
2025	AI Argues Differently: Distinct Argumentative and Linguistic Patterns of LLMs in Persuasive Contexts. Esra Dönmez, Maximilian Maurer, Gabriella Lapesa, Agnieszka Falenska
2025	AI Chatbots as Professional Service Agents: Developing a Professional Identity. Wenwen Li, Kangwei Shi, Yidong Chai
2025	AI Knows Where You Are: Exposure, Bias, and Inference in Multimodal Geolocation with KoreaGEO. Xiaonan Wang, Bo Shao, Hansaem Kim
2025	AI Sees Your Location - But With A Bias Toward The Wealthy World. Jingyuan Huang, Jen-tse Huang, Ziyi Liu, Xiaoyuan Liu, Wenxuan Wang, Jieyu Zhao
2025	AIMMerging: Adaptive Iterative Model Merging Using Training Trajectories for Language Model Continual Learning. Yujie Feng, Jian Li, Xiaoyu Dong, Pengfei Xu, Xiaohui Zhou, Yujia Zhang, Zexin Lu, Yasha Wang, Alan Zhao, Xu Chu, Xiao-Ming Wu
2025	AIP: Subverting Retrieval-Augmented Generation via Adversarial Instructional Prompt. Saket S. Chaturvedi, Gaurav Bagwe, Lan Zhang, Xiaoyong Yuan
2025	AIR: Complex Instruction Generation via Automatic Iterative Refinement. Wei Liu, Yancheng He, Yu Li, Hui Huang, Chengwei Hu, Jiaheng Liu, Shilong Li, Wenbo Su, Bo Zheng
2025	ALLabel: Three-stage Active Learning for LLM-based Entity Recognition using Demonstration Retrieval. Zihan Chen, Lei Shi, Weize Wu, Qiji Zhou, Yue Zhang
2025	AMACE: Automatic Multi-Agent Chart Evolution for Iteratively Tailored Chart Generation. Hyuk Namgoong, Jeesu Jung, Hyeonseok Kang, Yohan Lee, Sangkeun Jung
2025	AMQ: Enabling AutoML for Mixed-precision Weight-Only Quantization of Large Language Models. Sangjun Lee, Seung-taek Woo, Jungyu Jin, Changhun Lee, Eunhyeok Park
2025	APLOT: Robust Reward Modeling via Adaptive Preference Learning with Optimal Transport. Zhuo Li, Yuege Feng, Dandan Guo, Jinpeng Hu, Anningzhe Gao, Xiang Wan
2025	AQuilt: Weaving Logic and Self-Inspection into Low-Cost, High-Relevance Data Synthesis for Specialist LLMs. Xiaopeng Ke, Hexuan Deng, Xuebo Liu, Jun Rao, Zhenxi Song, Jun Yu, Min Zhang
2025	AROMA: Autonomous Rank-one Matrix Adaptation. Hao Nan Sheng, Zhi-Yong Wang, Hing Cheung So, Mingrui Yang
2025	ASTRA: A Negotiation Agent with Adaptive and Strategic Reasoning via Tool-integrated Action for Dynamic Offer Optimization. Deuksin Kwon, Jiwon Hae, Emma Clift, Daniel Shamsoddini, Jonathan Gratch, Gale M. Lucas
2025	AbsVis - Benchmarking How Humans and Vision-Language Models "See" Abstract Concepts in Images. Tarun Tater, Diego Frassinelli, Sabine Schulte im Walde
2025	AcT2I: Evaluating and Improving Action Depiction in Text-to-Image Models. Vatsal Malaviya, Agneet Chatterjee, Maitreya Patel, Yezhou Yang, Chitta Baral
2025	Accelerate Parallelizable Reasoning via Parallel Decoding within One Sequence. Yijiong Yu, Wei Wang, Ran Chen, Ji Pei
2025	Accelerated Test-Time Scaling with Model-Free Speculative Sampling. Woomin Song, Saket Dingliwal, Sai Muralidhar Jayanthi, Bhavana Ganesh, Jinwoo Shin, Aram Galstyan, Sravan Babu Bodapati
2025	AccessEval: Benchmarking Disability Bias in Large Language Models. Srikant Panda, Amit Agarwal, Hitesh Laxmichand Patel
2025	ActionStudio: A Lightweight Framework for Data and Training of Large Action Models. Jianguo Zhang, Thai Hoang, Ming Zhu, Zuxin Liu, Shiyu Wang, Tulika Awalgaonkar, Akshara Prabhakar, Haolin Chen, Weiran Yao, Zhiwei Liu, Juntao Tan, Juan Carlos Niebles, Shelby Heinecke, Huan Wang, Silvio Savarese, Caiming Xiong
2025	Active Layer-Contrastive Decoding Reduces Hallucination in Large Language Model Generation. Hongxiang Zhang, Hao Chen, Muhao Chen, Tianyi Zhang
2025	AdaRewriter: Unleashing the Power of Prompting-based Conversational Query Reformulation via Test-Time Adaptation. Yilong Lai, Jialong Wu, Zhenglin Wang, Deyu Zhou
2025	AdaSteer: Your Aligned LLM is Inherently an Adaptive Jailbreak Defender. Weixiang Zhao, Jiahe Guo, Yulin Hu, Yang Deng, An Zhang, Xingyu Sui, Xinyang Han, Yanyan Zhao, Bing Qin, Tat-Seng Chua, Ting Liu
2025	AdamS: Momentum Itself Can Be A Normalizer for LLM Pretraining and Post-training. Huishuai Zhang, Bohan Wang, Luoxin Chen
2025	AdaptThink: Reasoning Models Can Learn When to Think. Jiajie Zhang, Nianyi Lin, Lei Hou, Ling Feng, Juanzi Li
2025	Adapting Bias Evaluation to Domain Contexts using Generative Models. Tamara Quiroga, Felipe Bravo-Marquez, Valentin Barriere
2025	Adaptively profiling models with task elicitation. Davis Brown, Prithvi Balehannina, Helen Jin, Shreya Havaldar, Hamed Hassani, Eric Wong
2025	Add-One-In: Incremental Sample Selection for Large Language Models via a Choice-Based Greedy Paradigm. Zhuo Li, Yuhao Du, Xiaoqi Jiao, Steven Y. Guo, Yuege Feng, Xiang Wan, Anningzhe Gao, Jinpeng Hu
2025	Addressing Tokenization Inconsistency in Steganography and Watermarking Based on Large Language Models. Ruiyi Yan, Yugo Murawaki
2025	Advancing Arabic Diacritization: Improved Datasets, Benchmarking, and State-of-the-Art Models. Abubakr Mohamed, Hamdy Mubarak
2025	Advancing Fine-Grained Visual Understanding with Multi-Scale Alignment in Multi-Modal Models. Wei Wang, Zhaowei Li, Qi Xu, Linfeng Li, Yiqing Cai, Botian Jiang, Hang Song, Xingcan Hu, Pengyu Wang, Li Xiao
2025	Advancing Oversight Reasoning across Languages for Audit Sycophantic Behaviour via X-Agent. Giulia Pucci, Leonardo Ranaldi
2025	Adversarial Attacks Against Automated Fact-Checking: A Survey. Fanzhen Liu, Sharif Abuadbba, Kristen Moore, Surya Nepal, Cécile Paris, Jia Wu, Jian Yang, Quan Z. Sheng
2025	AesBiasBench: Evaluating Bias and Alignment in Multimodal Language Models for Personalized Image Aesthetic Assessment. Kun Li, Lai Man Po, Hongzheng Yang, Xuyuan Xu, Kangcheng Liu, Yuzhi Zhao
2025	Africa Health Check: Probing Cultural Bias in Medical LLMs. Charles Nimo, Shuheng Liu, Irfan Essa, Michael L. Best
2025	Agent-as-Judge for Factual Summarization of Long Narratives. Yeonseok Jeong, Minsoo Kim, Seung-won Hwang, Byung-Hak Kim
2025	Agent-to-Agent Theory of Mind: Testing Interlocutor Awareness among Large Language Models. Younwoo Choi, Changling Li, Yongjin Yang, Zhijing Jin
2025	AgentPro: Enhancing LLM Agents with Automated Process Supervision. Yuchen Deng, Shichen Fan, Naibo Wang, Xinkui Zhao, See-Kiong Ng
2025	Agentic-R1: Distilled Dual-Strategy Reasoning. Weihua Du, Pranjal Aggarwal, Sean Welleck, Yiming Yang
2025	AlignX: Advancing Multilingual Large Language Models with Multilingual Representation Alignment. Mengyu Bu, Shaolei Zhang, Zhongjun He, Hua Wu, Yang Feng
2025	Aligning Text/Speech Representations from Multimodal Models with MEG Brain Activity During Listening. Padakanti Srijith, Khushbu Pahwa, Radhika Mamidi, Bapi Raju Surampudi, Manish Gupta, Subba Reddy Oota
2025	Alignment Quality Index (AQI) : Beyond Refusals: AQI as an Intrinsic Alignment Diagnostic via Latent Geometry, Cluster Divergence, and Layer wise Pooled Representations. Abhilekh Borah, Chhavi Sharma, Danush Khanna, Utkarsh Bhatt, Gurpreet Singh, Hasnat Md Abdullah, Raghav Kaushik Ravi, Vinija Jain, Jyoti Patel, Shubham Singh, Vasu Sharma, Arpita Vats, Rahul Raja, Aman Chadha, Amitava Das
2025	Alignment for Efficient Tool Calling of Large Language Models. Hongshen Xu, Zihan Wang, Zichen Zhu, Lei Pan, Xingyu Chen, Shuai Fan, Lu Chen, Kai Yu
2025	Alignment with Fill-In-the-Middle for Enhancing Code Generation. Houxing Ren, Zimu Lu, Weikang Shi, Haotian Hou, Yunqiao Yang, Ke Wang, Aojun Zhou, Junting Pan, Mingjie Zhan, Hongsheng Li
2025	Alignment-Augmented Speculative Decoding with Alignment Sampling and Conditional Verification. Jikai Wang, Zhenxu Tian, Juntao Li, Qingrong Xia, Xinyu Duan, Zhe-Feng Wang, Baoxing Huai, Min Zhang
2025	All Roads Lead to Rome: Graph-Based Confidence Estimation for Large Language Model Reasoning. Caiqi Zhang, Chang Shu, Ehsan Shareghi, Nigel Collier
2025	All for One: LLMs Solve Mental Math at the Last Token With Information Transferred From Other Tokens. Siddarth Mamidanna, Daking Rai, Ziyu Yao, Yilun Zhou
2025	AlphaOne: Reasoning Models Thinking Slow and Fast at Test Time. Junyu Zhang, Runpei Dong, Han Wang, Xuying Ning, Haoran Geng, Peihao Li, Xialin He, Yutong Bai, Jitendra Malik, Saurabh Gupta, Huan Zhang
2025	Ambiguity Awareness Optimization: Towards Semantic Disambiguation for Direct Preference Optimization. Jian Li, Shenglin Yin, Yujia Zhang, Alan Zhao, Xi Chen, Xiaohui Zhou, Pengfei Xu
2025	AmpleHate: Amplifying the Attention for Versatile Implicit Hate Detection. Yejin Lee, Joonghyuk Hahn, Hyeseon Ahn, Yo-Sub Han
2025	Amulet: Putting Complex Multi-Turn Conversations on the Stand with LLM Juries. Sahana Ramnath, Anurag Mudgil, Brihi Joshi, Skyler Hallinan, Xiang Ren
2025	An Empirical Study of LLM Reasoning Ability Under Strict Output Length Constraint. Yi Sun, Han Wang, Jiaqiang Li, Jiacheng Liu, Xiangyu Li, Hao Wen, Yizhen Yuan, Huiwen Zheng, Yan Liang, Yuanchun Li, Yunxin Liu
2025	An Empirical Study on Strong-Weak Model Collaboration for Repo-level Code Generation. Shubham Gandhi, Atharva Naik, Yiqing Xie, Carolyn P. Rosé
2025	An Interdisciplinary Approach to Human-Centered Machine Translation. Marine Carpuat, Omri Asscher, Kalika Bali, Luisa Bentivogli, Frédéric Blain, Lynne Bowker, Monojit Choudhury, Hal Daumé III, Kevin Duh, Ge Gao, Alvin Grissom II, Marzena Karpinska, Elaine C. Khoong, William D. Lewis, André F. T. Martins, Mary Nurminen, Douglas W. Oard, Maja Popovic, Michel Simard, François Yvon
2025	An Orthogonal High-Rank Adaptation for Large Language Models. Xin Zhang, Guang-Ze Chen, Shuzhen Li, Zhulin Liu, C. L. Philip Chen, Tong Zhang
2025	Analysing Chain of Thought Dynamics: Active Guidance or Unfaithful Post-hoc Rationalisation? Samuel Lewis-Lim, Xingwei Tan, Zhixue Zhao, Nikolaos Aletras
2025	Analyzing Uncertainty of LLM-as-a-Judge: Interval Evaluations with Conformal Prediction. Huanxin Sheng, Xinyi Liu, Hangfeng He, Jieyu Zhao, Jian Kang
2025	Analyzing and Modeling LLM Response Lengths with Extreme Value Theory: Anchoring Effects and Hybrid Distributions. Liuxuan Jiao, Chen Gao, Yiqian Yang, Chenliang Zhou, Yixian Huang, Xinlei Chen, Yong Li
2025	Analyzing the Effects of Supervised Fine-Tuning on Model Knowledge from Token and Parameter Levels. Junjie Ye, Yuming Yang, Yang Nan, Shuo Li, Qi Zhang, Tao Gui, Xuanjing Huang, Peng Wang, Zhongchao Shi, Jianping Fan
2025	Analyzing values about gendered language reform in LLMs' revisions. Jules Watson, Xi Wang, Raymond Liu, Suzanne Stevenson, Barend Beekhuizen
2025	AnchorAttention: Difference-Aware Sparse Attention with Stripe Granularity. Yu Zhang, Dong Guo, Fang Wu, Guoliang Zhu, Dian Ding, Yiming Zhang
2025	Anchoring-Guidance Fine-Tuning (AnGFT): Elevating Professional Response Quality in Role-Playing Conversational Agents. Qibin Li, Zhen Xu, Shengyuan Bai, Nianmin Yao, Kaili Sun, Bowen Wu, Ying Li, Baoxun Wang
2025	Anecdoctoring: Automated Red-Teaming Across Language and Place. Alejandro Cuevas, Saloni Dash, Bharat Kumar Nayak, Dan Vann, Madeleine I. G. Daepp
2025	Annotating Training Data for Conditional Semantic Textual Similarity Measurement using Large Language Models. Gaifan Zhang, Yi Zhou, Danushka Bollegala
2025	Answer Convergence as a Signal for Early Stopping in Reasoning. Xin Liu, Lu Wang
2025	Answering Narrative-Driven Recommendation Queries via a Retrieve-Rank Paradigm and the OCG-Agent. Yunxiao Shi, Haoning Shang, Xing Zi, Wujiang Xu, Yue Feng, Min Xu
2025	AnyMAC: Cascading Flexible Multi-Agent Collaboration via Next-Agent Prediction. Song Wang, Zhen Tan, Zihan Chen, Shuang Zhou, Tianlong Chen, Jundong Li
2025	AraEval: An Arabic Multi-Task Evaluation Suite for Large Language Models. Alhanoof Althnian, Norah A. Alzahrani, Shaykhah Z. Alsubaie, Eman Albilali, Ahmed Abdelali, Nouf M. Alotaibi, M. Saiful Bari, Yazeed Alnumay, Abdulhamed Alothaimen, Maryam Saif, Shahad D. Alzaidi, Faisal Abdulrahman Mirza, Yousef Almushayqih, Mohammed Al Saleem, Ghadah Alabduljabbar, Abdulmohsen Al-Thubaity, Areeb Alowisheq, Nora Al-Twairesh
2025	Are Checklists Really Useful for Automatic Evaluation of Generative Tasks? Momoka Furuhashi, Kouta Nakayama, Takashi Kodama, Saku Sugawara
2025	Are Generative Models Underconfident? Better Quality Estimation with Boosted Model Probability. Tu Anh Dinh, Jan Niehues
2025	Are LLMs Better than Reported? Detecting Label Errors and Mitigating Their Effect on Model Performance. Omer Nahum, Nitay Calderon, Orgad Keller, Idan Szpektor, Roi Reichart
2025	Are Language Models Consequentialist or Deontological Moral Reasoners? Keenan Samway, Max Kleiman-Weiner, David Guzman Piedrahita, Rada Mihalcea, Bernhard Schölkopf, Zhijing Jin
2025	Are Large Language Models Chronically Online Surfers? A Dataset for Chinese Internet Meme Explanation. Yubo Xie, Chenkai Wang, Zongyang Ma, Fahui Miao
2025	Are Stereotypes Leading LLMs' Zero-Shot Stance Detection ? Anthony Dubreuil, Antoine Gourru, Christine Largeron, Amine Trabelsi
2025	Are Vision-Language Models Safe in the Wild? A Meme-Based Benchmark Study. Donggeon Lee, Joonwon Jang, Jihae Jeong, Hwanjo Yu
2025	Arena-lite: Efficient and Reliable Large Language Model Evaluation via Tournament-Based Direct Comparisons. Seonil Son, Ju-Min Oh, Heegon Jin, Cheolhun Jang, Jeongbeom Jeong, Kuntae Kim
2025	ArgCMV: An Argument Summarization Benchmark for the LLM-era. Omkar Gurjar, Agam Goyal, Eshwar Chandrasekharan
2025	Argument Summarization and its Evaluation in the Era of Large Language Models. Moritz Altemeyer, Steffen Eger, Johannes Daxenberger, Yanran Chen, Tim Altendorf, Philipp Cimiano, Benjamin Schiller
2025	Artificial Impressions: Evaluating Large Language Model Behavior Through the Lens of Trait Impressions. Nicholas Deas, Kathleen McKeown
2025	Ask Patients with Patience: Enabling LLMs for Human-Centric Medical Dialogue with Grounded Reasoning. Jiayuan Zhu, Jiazhen Pan, Yuyuan Liu, Fenglin Liu, Junde Wu
2025	AskToAct: Enhancing LLMs Tool Use via Self-Correcting Clarification. Xuan Zhang, Yongliang Shen, Zhe Zheng, Linjuan Wu, Wenqi Zhang, Yuchen Yan, Qiuying Peng, Jun Wang, Weiming Lu
2025	Aspect-Oriented Summarization for Psychiatric Short-Term Readmission Prediction. Wonjin Yoon, Boyu Ren, Spencer Thomas, Chanhwi Kim, Guergana Savova, Mei-Hua Hall, Tim Miller
2025	Assay2Mol: Large Language Model-based Drug Design Using BioAssay Context. Yifan Deng, Spencer S. Ericksen, Anthony Gitter
2025	Assessing French Readability for Adults with Low Literacy: A Global and Local Perspective. Wafa Aissa, Thibault Bañeras-Roux, Elodie Vanzeveren, Lingyun Gao, Rodrigo Wilkens, Thomas François
2025	Assessing effective de-escalation of crisis conversations using transformer-based models and trend statistics. Ignacio J. Tripodi, Greg Buda, Margaret Meagher, Elizabeth A. Olson
2025	AssoCiAm: A Benchmark for Evaluating Association Thinking while Circumventing Ambiguity. Yifan Liu, Wenkuan Zhao, Shanshan Zhong, Jinghui Qin, Mingfu Liang, Zhongzhan Huang, Wushao Wen
2025	Assumed Identities: Quantifying Gender Bias in Machine Translation of Gender-Ambiguous Occupational Terms. Orfeas Menis-Mastromichalakis, Giorgos Filandrianos, Maria Symeonaki, Giorgos Stamou
2025	Astra: Efficient Transformer Architecture and Contrastive Dynamics Learning for Embodied Instruction Following. Yueen Ma, Dafeng Chi, Shiguang Wu, Yuecheng Liu, Yuzheng Zhuang, Irwin King
2025	Attacking Misinformation Detection Using Adversarial Examples Generated by Language Models. Piotr Przybyla, Euan McGill, Horacio Saggion
2025	Attacks by Content: Automated Fact-checking is an AI Security Issue. Michael Sejr Schlichtkrull
2025	Attention Eclipse: Manipulating Attention to Bypass LLM Safety-Alignment. Pedram Zaree, Md Abdullah Al Mamun, Quazi Mishkatul Alam, Yue Dong, Ihsen Alouani, Nael B. Abu-Ghazaleh
2025	Attention-guided Self-reflection for Zero-shot Hallucination Detection in Large Language Models. Qiang Liu, Xinlong Chen, Yue Ding, Bowen Song, Weiqiang Wang, Shu Wu, Liang Wang
2025	Audio-Reasoner: Improving Reasoning Capability in Large Audio Language Models. Zhifei Xie, Mingbao Lin, Zihang Liu, Pengcheng Wu, Shuicheng Yan, Chunyan Miao
2025	Audio-centric Video Understanding Benchmark without Text Shortcut. Yudong Yang, Jimin Zhuang, Guangzhi Sun, Changli Tang, Yixuan Li, Peihan Li, Yifan Jiang, Wei Li, Zejun Ma, Chao Zhang
2025	Augmenting Multi-Agent Communication with State Delta Trajectory. Yichen Tang, Weihang Su, Yujia Zhou, Yiqun Liu, Min Zhang, Shaoping Ma, Qingyao Ai
2025	AutoCT: Automating Interpretable Clinical Trial Prediction with LLM Agents. Fengze Liu, Haoyu Wang, Joonhyuk Cho, Dan Roth, Andrew Lo
2025	AutoSDT: Scaling Data-Driven Discovery Tasks Toward Open Co-Scientists. Yifei Li, Hanane Nour Moussa, Ziru Chen, Shijie Chen, Botao Yu, Mingyi Xue, Benjamin Burns, Tzu-Yao Chiu, Vishal Dey, Zitong Lu, Chen Wei, Qianheng Zhang, Tianyu Zhang, Song Gao, Xuhui Huang, Xia Ning, Nesreen K. Ahmed, Ali Payani, Huan Sun
2025	Autoformalization in the Wild: Assessing LLMs on Real-World Mathematical Definitions. Lan Zhang, Marco Valentino, André Freitas
2025	Automated Knowledge Graph Construction using Large Language Models and Sentence Complexity Modelling. Sydney Anuyah, Mehedi Mahmud Kaushik, Sri Rama Krishna Reddy Dwarampudi, Rakesh Shiradkar, Arjan Durresi, Sunandan Chakraborty
2025	Automating Steering for Safe Multimodal Large Language Models. Lyucheng Wu, Mengru Wang, Ziwen Xu, Tri Cao, Nay Oo, Bryan Hooi, Shumin Deng
2025	Avoidance Decoding for Diverse Multi-Branch Story Generation. Kyeongman Park, Nakyeong Yang, Kyomin Jung
2025	BANMIME : Misogyny Detection with Metaphor Explanation on Bangla Memes. Md Ayon Mia, Akm Moshiur Rahman Mazumder, Khadiza Sultana Sayma, Md Fahim, Md. Tahmid Hasan Fuad, Muhammad Ibrahim Khan, AKMMahbubur Rahman
2025	BBScoreV2: Learning Time-Evolution and Latent Alignment from Stochastic Representation. Tianhao Zhang, Zhecheng Sheng, Zhexiao Lin, Chen Jiang, Dongyeop Kang
2025	BIRD: Bronze Inscription Restoration and Dating. Wenjie Hua, Hoang H. Nguyen, Gangyan Ge
2025	BOUQuET : dataset, Benchmark and Open initiative for Universal Quality Evaluation in Translation. Pierre Andrews, Mikel Artetxe, Mariano Coria Meglioli, Marta R. Costa-jussà, Joe Chuang, David Dale, Mark Duppenthaler, Nathanial Paul Ekberg, Cynthia Gao, Daniel Edward Licht, Jean Maillard, Alexandre Mourachko, Christophe Ropers, Safiyyah Saleem, Eduardo Sánchez, Ioannis Tsiamas, Arina Turkatenko, Albert Ventayol-Boada, Shireen Yates
2025	BRSpeech-DF: A Deep Fake Synthetic Speech Dataset for Portuguese Zero-Shot TTS. Alexandre Costa Ferro Filho, Rafaello Virgilli, Lucas Alcântara Souza, Frederico Santos de Oliveira, Marcelo Henrique Lopes Ferreira, Daniel Tunnermann, Gustavo dos Reis Oliveira, Anderson da Silva Soares, Arlindo Rodrigues Galvão Filho
2025	BSFA: Leveraging the Subspace Dichotomy to Accelerate Neural Network Training. Wenjie Zhou, Bohan Wang, Wei Chen, Xueqi Cheng
2025	BTC-SAM: Leveraging LLMs for Generation of Bias Test Cases for Sentiment Analysis Models. Zsolt T. Kardkovács, Lynda Djennane, Anna Field, Boualem Benatallah, Yacine Gaci, Fabio Casati, Walid Gaaloul
2025	BTS: Harmonizing Specialized Experts into a Generalist LLM. Qizhen Zhang, Prajjwal Bhargava, Chloe Bi, Chris X. Cai, Jakob Nicolaus Foerster, Jeremy Fu, Punit Singh Koura, Ruan Silva, Sheng Shen, Emily Dinan, Suchin Gururangan, Mike Lewis
2025	BYOKG-RAG: Multi-Strategy Graph Retrieval for Knowledge Graph Question Answering. Costas Mavromatis, Soji Adeshina, Vassilis N. Ioannidis, Zhen Han, Qi Zhu, Ian Robinson, Bryan Thompson, Huzefa Rangwala, George Karypis
2025	BabyLM's First Constructions: Causal interventions provide a signal of learning. Joshua Rozner, Leonie Weissweiler, Cory Shain
2025	Back Attention: Understanding and Enhancing Multi-Hop Reasoning in Large Language Models. Zeping Yu, Yonatan Belinkov, Sophia Ananiadou
2025	BacktrackAgent: Enhancing GUI Agent with Error Detection and Backtracking Mechanism. Qinzhuo Wu, Pengzhi Gao, Wei Liu, Jian Luan
2025	Balanced Multi-Factor In-Context Learning for Multilingual Large Language Models. Masahiro Kaneko, Alham Fikri Aji, Timothy Baldwin
2025	Balcony: A Lightweight Approach to Dynamic Inference of Generative Language Models. Benyamin Jamialahmadi, Parsa Kavehzadeh, Mehdi Rezagholizadeh, Parsa Farinneya, Hossein Rajabzadeh, Aref Jafari, Boxing Chen, Marzieh S. Tahaei
2025	BannerAgency: Advertising Banner Design with Multimodal LLM Agents. Heng Wang, Yotaro Shimose, Shingo Takamatsu
2025	Batched Self-Consistency Improves LLM Relevance Assessment and Ranking. Anton Korikov, Pan Du, Scott Sanner, Navid Rekabsaz
2025	BeSimulator: A Large Language Model Powered Text-based Behavior Simulator. Jianan Wang, Bin Li, Jingtao Qi, Xueying Wang, Fu Li, Lihanxun Li
2025	Benchmark Profiling: Mechanistic Diagnosis of LLM Benchmarks. Dongjun Kim, Gyuho Shim, Yongchan Chun, Minhyuk Kim, Chanjun Park, Heuiseok Lim
2025	Benchmarking Debiasing Methods for LLM-based Parameter Estimates. Nicolas Audinet de Pieuchon, Adel Daoud, Connor Thomas Jerzak, Moa Johansson, Richard Johansson
2025	Benchmarking LLMs for Translating Classical Chinese Poetry: Evaluating Adequacy, Fluency, and Elegance. Andong Chen, Lianzhang Lou, Kehai Chen, Xuefeng Bai, Yang Xiang, Muyun Yang, Tiejun Zhao, Min Zhang
2025	Benchmarking LLMs on Semantic Overlap Summarization. John Salvador, Naman Bansal, Mousumi Akter, Souvika Sarkar, Anupam Das, Shubhra Kanti Karmaker
2025	Benchmarking Large Language Models Under Data Contamination: A Survey from Static to Dynamic Evaluation. Simin Chen, Yiming Chen, Zexin Li, Yifan Jiang, Zhongwei Wan, Yixin He, Dezhi Ran, Tianle Gu, Haizhou Li, Tao Xie, Baishakhi Ray
2025	Benchmarking and Mitigating MCQA Selection Bias of Large Vision-Language Models. Md. Atabuzzaman, Ali Asgarov, Christopher Thomas
2025	Beyond A Single AI Cluster: A Survey of Decentralized LLM Training. Haotian Dong, Jingyan Jiang, Rongwei Lu, Jiajun Luo, Jiajun Song, Bowen Li, Ying Shen, Zhi Wang
2025	Beyond Averages: Learning with Annotator Disagreement in STS. Alejandro Benito-Santos, Adrián Ghajari
2025	Beyond Checkmate: Exploring the Creative Choke Points for AI Generated Texts. Nafis Irtiza Tripto, Saranya Venkatraman, Mahjabin Nahar, Dongwon Lee
2025	Beyond Correctness: Confidence-Aware Reward Modeling for Enhancing Large Language Model Reasoning. Qianxi He, Qingyu Ren, Shanzhe Lei, Xuhong Wang, Yingchun Wang
2025	Beyond Demographics: Enhancing Cultural Value Survey Simulation with Multi-Stage Personality-Driven Cognitive Reasoning. Haijiang Liu, Qiyuan Li, Chao Gao, Yong Cao, Xiangyu Xu, Xun Wu, Daniel Hershcovich, Jinguang Gu
2025	Beyond Demonstrations: Dynamic Vector Construction from Latent Representations. Wang Cai, Hsiu-Yuan Huang, Zhixiang Wang, Yunfang Wu
2025	Beyond Hate Speech: NLP's Challenges and Opportunities in Uncovering Dehumanizing Language. Hamidreza Saffari, Mohammadamin Shafiei, Hezhao Zhang, Lasana T. Harris, Nafise Sadat Moosavi
2025	Beyond Human Labels: A Multi-Linguistic Auto-Generated Benchmark for Evaluating Large Language Models on Resume Parsing. Zijian Ling, Han Zhang, Jiahao Cui, Zhequn Wu, Xu Sun, Guohao Li, Xiangjian He
2025	Beyond Input Activations: Identifying Influential Latents by Gradient Sparse Autoencoders. Dong Shu, Xuansheng Wu, Haiyan Zhao, Mengnan Du, Ninghao Liu
2025	Beyond Online Sampling: Bridging Offline-to-Online Alignment via Dynamic Data Transformation for LLMs. Zhang Zhang, Guhao Feng, Jian Guan, Di He, Wei Wu
2025	Beyond Outlining: Heterogeneous Recursive Planning for Adaptive Long-form Writing with Language Models. Ruibin Xiong, Yimeng Chen, Dmitrii Khizbullin, Mingchen Zhuge, Jürgen Schmidhuber
2025	Beyond Pairwise: Global Zero-shot Temporal Graph Generation. Alon Eirew, Kfir Bar, Ido Dagan
2025	Beyond Seen Data: Improving KBQA Generalization Through Schema-Guided Logical Form Generation. Shengxiang Gao, Jey Han Lau, Jianzhong Qi
2025	Beyond Static Testbeds: An Interaction-Centric Agent Simulation Platform for Dynamic Recommender Systems. Song Jin, Juntian Zhang, Yuhan Liu, Xun Zhang, Yufei Zhang, Guojun Yin, Fei Jiang, Wei Lin, Rui Yan
2025	Beyond Task-Oriented and Chitchat Dialogues: Proactive and Transition-Aware Conversational Agents. Yejin Yoon, Yuri Son, Namyoung So, Minseo Kim, Minsoo Cho, Chanhee Park, Seungshin Lee, Taeuk Kim
2025	Beyond Text: Unveiling Privacy Vulnerabilities in Multi-modal Retrieval-Augmented Generation. Jiankun Zhang, Shenglai Zeng, Jie Ren, Tianqi Zheng, Hui Liu, Xianfeng Tang, Yi Chang
2025	Beyond WER: Probing Whisper's Sub-token Decoder Across Diverse Language Resource Levels. Siyu Liang, Nicolas Ballier, Gina-Anne Levow, Richard A. Wright
2025	Beyond the Leaderboard: Understanding Performance Disparities in Large Language Models via Model Diffing. Sabri Boughorbel, Fahim Dalvi, Nadir Durrani, Majd Hawasly
2025	Beyond the Score: Uncertainty-Calibrated LLMs for Automated Essay Assessment. Ahmed Karim, Qiao Wang, Zheng Yuan
2025	Beyond the Surface: Measuring Self-Preference in LLM Judgments. Zhi-Yuan Chen, Hao Wang, Xinyu Zhang, Enrui Hu, Yankai Lin
2025	Bias Beware: The Impact of Cognitive Biases on LLM-Driven Product Recommendations. Giorgos Filandrianos, Angeliki Dimitriou, Maria Lymperaiou, Konstantinos Thomas, Giorgos Stamou
2025	Bias Mitigation or Cultural Commonsense? Evaluating LLMs with a Japanese Dataset. Taisei Yamamoto, Ryoma Kumon, Danushka Bollegala, Hitomi Yanaka
2025	Biased Tales: Cultural and Topic Bias in Generating Children's Stories. Donya Rooein, Vilém Zouhar, Debora Nozza, Dirk Hovy
2025	Bit-Flip Error Resilience in LLMs: A Comprehensive Analysis and Defense Framework. Yuhang Chen, Zhen Tan, Ajay Kumar Jaiswal, Huaizhi Qu, Xinyu Zhao, Qi Lin, Yu Cheng, Andrew Kwong, Zhichao Cao, Tianlong Chen
2025	Bitune: Leveraging Bidirectional Attention to Improve Decoder-Only LLMs. Dawid Jan Kopiczko, Tijmen Blankevoort, Yuki M. Asano
2025	Blind Men and the Elephant: Diverse Perspectives on Gender Stereotypes in Benchmark Datasets. Mahdi Zakizadeh, Mohammad Taher Pilehvar
2025	Boosting Data Utilization for Multilingual Dense Retrieval. Chao Huang, Fengran Mo, Yufeng Chen, Changhao Guan, Zhenrui Yue, Xinyu Wang, Jinan Xu, Kaiyu Huang
2025	Boosting Multi-modal Keyphrase Prediction with Dynamic Chain-of-Thought in Vision-Language Models. Qihang Ma, Shengyu Li, Jie Tang, Dingkang Yang, Chenshaodong, Yingyi Zhang, Chao Feng, Ran Jiao
2025	BrailleLLM: Braille Instruction Tuning with Large Language Models for Braille Domain Tasks. Tianyuan Huang, Zepeng Zhu, Hangdi Xing, Zirui Shao, Zhi Yu, Chaoxiong Yang, Jiaxian He, Xiaozhong Liu, Jiajun Bu
2025	Break the Checkbox: Challenging Closed-Style Evaluations of Cultural Alignment in LLMs. Mohsinul Kabir, Ajwad Abrar, Sophia Ananiadou
2025	Breaking Agents: Compromising Autonomous LLM Agents Through Malfunction Amplification. Boyang Zhang, Yicong Tan, Yun Shen, Ahmed Salem, Michael Backes, Savvas Zannettou, Yang Zhang
2025	Breaking Bad Tokens: Detoxification of LLMs Using Sparse Autoencoders. Agam Goyal, Vedant Rathi, William Yeh, Yian Wang, Yuen Chen, Hari Sundaram
2025	Breaking the Noise Barrier: LLM-Guided Semantic Filtering and Enhancement for Multi-Modal Entity Alignment. Chenglong Lu, Chenxiao Li, Jingwei Cheng, Yongquan Ji, Guoqing Chen, Fu Zhang
2025	Bridging External and Parametric Knowledge: Mitigating Hallucination of LLMs with Shared-Private Semantic Synergy in Dual-Stream Knowledge. Yi Sui, Chaozhuo Li, Chen Zhang, Dawei Song, Qiuchi Li
2025	Bridging the Gap Between Molecule and Textual Descriptions via Substructure-aware Alignment. Hyuntae Park, Yeachan Kim, SangKeun Lee
2025	Building Trust in Clinical LLMs: Bias Analysis and Dataset Transparency. Svetlana Maslenkova, Clément Christophe, Marco AF Pimentel, Tathagata Raha, Muhammad Umar Salman, Ahmed Al-Mahrooqi, Avani Gupta, Shadab Khan, Ronnie Rajan, Praveen K. Kanithi
2025	C3: A Bilingual Benchmark for Spoken Dialogue Models Exploring Challenges in Complex Conversations. Chengqian Ma, Wei Tao, Steven Y. Guo
2025	CAFE: Retrieval Head-based Coarse-to-Fine Information Seeking to Enhance Multi-Document QA Capability. Han Peng, Jinhao Jiang, Zican Dong, Wayne Xin Zhao, Lei Fang
2025	CAIR: Counterfactual-based Agent Influence Ranker for Agentic AI Workflows. Amit Giloni, Chiara Picardi, Roy Betser, Shamik Bose, Aishvariya Priya Rathina Sabapathy, Roman Vainshtein
2025	CARD: Cross-modal Agent Framework for Generative and Editable Residential Design. Pengyu Zeng, Jun Yin, Miao Zhang, Yuqin Dai, Jizhizi Li, ZhanXiang Jin, Shuai Lu
2025	CARE: A Disagreement Detection Framework with Concept Alignment and Reasoning Enhancement. Jiyuan Liu, Jielin Song, Yunhe Pang, Zhiyu Shen, Yanghui Rao
2025	CARE: Multilingual Human Preference Learning for Cultural Awareness. Geyang Guo, Tarek Naous, Hiromi Wakaki, Yukiko Nishimura, Yuki Mitsufuji, Alan Ritter, Wei Xu
2025	CARFT: Boosting LLM Reasoning via Contrastive Learning with Annotated Chain-of-Thought-based Reinforced Fine-Tuning. Wenqiao Zhu, Ji Liu, Rongjunchen Zhang, Haipang Wu, Yulun Zhang
2025	CARMA: Enhanced Compositionality in LLMs via Advanced Regularisation and Mutual Information Alignment. Nura Aljaafari, Danilo S. Carvalho, André Freitas
2025	CAT: Causal Attention Tuning For Injecting Fine-grained Causal Knowledge into Large Language Models. Kairong Han, Wenshuo Zhao, Ziyu Zhao, Ye Jun Jian, Lujia Pan, Kun Kuang
2025	CAVE : Detecting and Explaining Commonsense Anomalies in Visual Environments. Rishika Bhagwatkar, Syrielle Montariol, Angelika Romanou, Beatriz Borges, Irina Rish, Antoine Bosselut
2025	CBP-Tuning: Efficient Local Customization for Black-box Large Language Models. Jiaxuan Zhao, Naibin Gu, Yuchen Feng, Xiyu Liu, Peng Fu, Zheng Lin, Weiping Wang
2025	CCQA: Generating Question from Solution Can Improve Inference-Time Reasoning in SLMs. Jinyoung Kim, Ji Won Yoon
2025	CEMTM: Contextual Embedding-based Multimodal Topic Modeling. Amirhossein Abaskohi, Raymond Li, Chuyuan Li, Shafiq Joty, Giuseppe Carenini
2025	CHENGYU-BENCH: Benchmarking Large Language Models for Chinese Idiom Understanding and Use. Yicheng Fu, Zhemin Huang, Liuxin Yang, Yumeng Lu, Zhongdongming Dai
2025	CHURRO: Making History Readable with an Open-Weight Large Vision-Language Model for High-Accuracy, Low-Cost Historical Text Recognition. Sina J. Semnani, Han Zhang, Xinyan He, Merve Tekgurler, Monica Lam
2025	CIE: Controlling Language Model Text Generations Using Continuous Signals. Vinay Samuel, Harshita Diddee, Yiming Zhang, Daphne Ippolito
2025	CIFLEX: Contextual Instruction Flow for Sub-task Execution in Multi-Turn Interactions with a Single On-Device LLM. Juntae Lee, Jihwan Bang, Seunghan Yang, Simyung Chang
2025	CIKT: A Collaborative and Iterative Knowledge Tracing Framework with Large Language Models. Runze Li, Siyu Wu, Jun Wang, Wei Zhang
2025	CLIP-MoE: Towards Building Mixture of Experts for CLIP with Diversified Multiplet Upcycling. Jihai Zhang, Xiaoye Qu, Tong Zhu, Yu Cheng
2025	CLLMate: A Multimodal Benchmark for Weather and Climate Events Forecasting. Haobo Li, Zhaowei Wang, Jiachen Wang, Yueya Wang, Alexis Kai-Hon Lau, Huamin Qu
2025	CLMTracing: Black-box User-level Watermarking for Code Language Model Tracing. Boyu Zhang, Ping He, Tianyu Du, Xuhong Zhang, Lei Yun, Kingsum Chow, Jianwei Yin
2025	CMHG: A Dataset and Benchmark for Headline Generation of Minority Languages in China. Guixian Xu, Zeli Su, Ziyin Zhang, Jianing Liu, Xu Han, Ting Zhang, Yushuang Dong
2025	CMedCalc-Bench: A Fine-Grained Benchmark for Chinese Medical Calculations in LLM. Yunyan Zhang, Zhihong Zhu, Xian Wu
2025	COAS2W: A Chinese Older-Adults Spoken-to-Written Transformation Corpus with Context Awareness. Chun Kang, Zhigu Qian, Zhen Fu, Jiaojiao Fu, Yangfan Zhou
2025	COCO-Tree: Compositional Hierarchical Concept Trees for Enhanced Reasoning in Vision-Language Models. Sanchit Sinha, Guangzhi Xiong, Aidong Zhang
2025	CODI: Compressing Chain-of-Thought into Continuous Space via Self-Distillation. Zhenyi Shen, Hanqi Yan, Linhai Zhang, Zhanghao Hu, Yali Du, Yulan He
2025	COLA: Collaborative Multi-Agent Framework with Dynamic Task Scheduling for GUI Automation. Di Zhao, Longhui Ma, Siwei Wang, Miao Wang, Zhao Lv
2025	COM-BOM: Bayesian Exemplar Search for Efficiently Exploring the Accuracy-Calibration Pareto Frontier. Gaoxiang Luo, Aryan Deshwal
2025	COUNTDOWN: Contextually Sparse Activation Filtering Out Unnecessary Weights in Down Projection. Jaewon Cheon, Pilsung Kang
2025	CR4-NarrEmote: An Open Vocabulary Dataset of Narrative Emotions Derived Using Citizen Science. Andrew Piper, Robert Budac
2025	CREPE: Rapid Chest X-ray Report Evaluation by Predicting Multi-category Error Counts. Gihun Cho, Seunghyun Jang, Hanbin Ko, Inhyeok Baek, Chang Min Park
2025	CRITICTOOL: Evaluating Self-Critique Capabilities of Large Language Models in Tool-Calling Error Scenarios. Shiting Huang, Zhen Fang, Zehui Chen, Siyu Yuan, Junjie Ye, Yu Zeng, Lin Chen, Qi Mao, Feng Zhao
2025	CROP: Contextual Region-Oriented Visual Token Pruning. Jiawei Guo, Feifei Zhai, Pu Jian, Qianrun Wei, Yu Zhou
2025	CTCC: A Robust and Stealthy Fingerprinting Framework for Large Language Models via Cross-Turn Contextual Correlation Backdoor. Zhenhua Xu, Xixiang Zhao, Xubin Yue, Shengwei Tian, Changting Lin, Meng Han
2025	CYCLE-INSTRUCT: Fully Seed-Free Instruction Tuning via Dual Self-Training and Cycle Consistency. Zhanming Shen, Hao Chen, Yulei Tang, Shaolin Zhu, Wentao Ye, Xiaomeng Hu, Haobo Wang, Gang Chen, Junbo Zhao
2025	CaKE: Circuit-aware Editing Enables Generalizable Knowledge Learners. Yunzhi Yao, Jizhan Fang, Jia-Chen Gu, Ningyu Zhang, Shumin Deng, Huajun Chen, Nanyun Peng
2025	Cache-Efficient Posterior Sampling for Reinforcement Learning with LLM-Derived Priors Across Discrete and Continuous Domains. Ibne Farabi Shihab, Sanjeda Akter, Anuj Sharma
2025	Cache-of-Thought: Master-Apprentice Framework for Cost-Effective Vision Language Model Reasoning. Mingyuan Wu, Jize Jiang, Haozhen Zheng, Meitang Li, Zhaoheng Li, Beitong Tian, Bo Chen, Yongjoo Park, Minjia Zhang, ChengXiang Zhai, Klara Nahrstedt
2025	Cacheback: Speculative Decoding With Nothing But Cache. Zhiyao Ma, In Gim, Lin Zhong
2025	Calibrating LLM Confidence by Probing Perturbed Representation Stability. Reza Khanmohammadi, Erfan Miahi, Mehrsa Mardikoraem, Simerjot Kaur, Ivan Brugere, Charese Smiley, Kundan Thind, Mohammad M. Ghassemi
2025	Calibrating LLMs for Text-to-SQL Parsing by Leveraging Sub-clause Frequencies. Terrance Liu, Shuyi Wang, Daniel Preotiuc-Pietro, Yash Chandarana, Chirag Gupta
2025	Calibrating Pseudo-Labeling with Class Distribution for Semi-supervised Text Classification. Weiyi Yang, Richong Zhang, Junfan Chen, Jiawei Sheng
2025	Calibrating Verbal Uncertainty as a Linear Feature to Reduce Hallucinations. Ziwei Ji, Lei Yu, Yeskendir Koishekenov, Yejin Bang, Anthony Hartshorn, Alan Schelten, Cheng Zhang, Pascale Fung, Nicola Cancedda
2025	Calibration Across Layers: Understanding Calibration Evolution in LLMs. Abhinav Joshi, Areeb Ahmad, Ashutosh Modi
2025	CalligraphicOCR for Chinese Calligraphy Recognition. Xiaoyi Bao, Zhongqing Wang, Jinghang Gu, Chu-Ren Huang
2025	Can GRPO Boost Complex Multimodal Table Understanding? Xiaoqiang Kang, Shengen Wu, Zimu Wang, Yilin Liu, Xiaobo Jin, Kaizhu Huang, Wei Wang, Yutao Yue, Xiaowei Huang, Qiufeng Wang
2025	Can LLM Agents Maintain a Persona in Discourse? Pranav Bhandari, Nicolas Fay, Michael J. Wise, Amitava Datta, Stephanie Meek, Usman Naseem, Mehwish Nasim
2025	Can LLMs Explain Themselves Counterfactually? Zahra Dehghanighobadi, Asja Fischer, Muhammad Bilal Zafar
2025	Can LLMs Extract Frame-Semantic Arguments? Jacob Daniel Devasier, Rishabh Mediratta, Chengkai Li
2025	Can LLMs Generate and Solve Linguistic Olympiad Puzzles? Neh Majmudar, Elena Filatova
2025	Can LLMs Help You at Work? A Sandbox for Evaluating LLM Agents in Enterprise Environments. Harsh Vishwakarma, Ankush Agarwal, Ojas Patil, Chaitanya Devaguptapu, Mahesh Chandran
2025	Can LLMs Reason Abstractly Over Math Word Problems Without CoT? Disentangling Abstract Formulation From Arithmetic Computation. Ziling Cheng, Meng Cao, Leila Pishdad, Yanshuai Cao, Jackie CK Cheung
2025	Can LLMs be Good Graph Judge for Knowledge Graph Construction? Haoyu Huang, Chong Chen, Zeang Sheng, Yang Li, Wentao Zhang
2025	Can LLMs be Literary Companions?: Analysing LLMs on Bengali Figures of Speech Identification. Sourav Das, Kripabandhu Ghosh
2025	Can LLMs simulate the same correct solutions to free-response math problems as real students? Yuya Asano, Diane J. Litman, Erin Walker
2025	Can Large Language Models Act as Ensembler for Multi-GNNs? Hanqi Duan, Yao Cheng, Jianxiang Yu, Yao Liu, Xiang Li
2025	Can Large Language Models Be Good Language Teachers? Liqing Xu, Qiwei Li, Tianshuo Peng, Zuchao Li, Hai Zhao, Ping Wang
2025	Can Large Language Models Outperform Non-Experts in Poetry Evaluation? A Comparative Study Using the Consensual Assessment Technique. Piotr Sawicki, Marek Grzes, Dan Brown, Fabrício Góes
2025	Can Large Language Models Tackle Graph Partitioning? Yiheng Wu, Ningchao Ge, Yanmin Li, Liwei Qian, Mengna Zhu, Haoyu Yang, Haiwen Chen, Jibing Wu
2025	Can Large Language Models Translate Spoken-Only Languages through International Phonetic Transcription? JiaLe Chen, Xuelian Dong, Qihao Yang, Wenxiu Xie, Tianyong Hao
2025	Can Large Language Models Translate Unseen Languages in Underrepresented Scripts? Dianqing Lin, Aruukhan, Hongxu Hou, Shuo Sun, Wei Chen, Yichen Yang, Guodong Shi
2025	Can Large Language Models Unlock Novel Scientific Research Ideas? Sandeep Kumar, Tirthankar Ghosal, Vinayak Goyal, Asif Ekbal
2025	Can Large Language Models Win the International Mathematical Games? Alessio Cocchieri, Luca Ragazzi, Giuseppe Tagliavini, Lorenzo Tordi, Antonella Carbonaro, Gianluca Moro
2025	Can Large Language Models be Effective Online Opinion Miners? Ryang Heo, Yongsik Seo, Junseong Lee, Dongha Lee
2025	Can Prompts Rewind Time for LLMs? Evaluating the Effectiveness of Prompted Knowledge Cutoffs. Xin Gao, Ruiyi Zhang, Daniel Du, Saurabh Mahindre, Sai Ashish Somayajula, Pengtao Xie
2025	Can Vision-Language Models Solve Visual Math Equations? Monjoy Narayan Choudhury, Junling Wang, Yifan Hou, Mrinmaya Sachan
2025	Can an Individual Manipulate the Collective Decisions of Multi-Agents? Fengyuan Liu, Rui Zhao, Shuo Chen, Guohao Li, Philip Torr, Lei Han, Jindong Gu
2025	Cardiverse: Harnessing LLMs for Novel Card Game Prototyping. Danrui Li, Sen Zhang, Samuel S. Sohn, Kaidong Hu, Muhammad Usman, Mubbasir Kapadia
2025	Case-Based Decision-Theoretic Decoding with Quality Memories. Hiroyuki Deguchi, Masaaki Nagata
2025	Castle: Causal Cascade Updates in Relational Databases with Large Language Models. Yongye Su, Yucheng Zhang, Zeru Shi, Bruno Ribeiro, Elisa Bertino
2025	Causal Interventions Reveal Shared Structure Across English Filler-Gap Constructions. Sasha Boguraev, Christopher Potts, Kyle Mahowald
2025	Causal Representation Learning from Multimodal Clinical Records under Non-Random Modality Missingness. Zihan Liang, Ziwen Pan, Ruoxuan Xiong
2025	Causal Tree Extraction from Medical Case Reports: A Novel Task for Experts-like Text Comprehension. Sakiko Yahata, Zhen Wan, Fei Cheng, Sadao Kurohashi, Hisahiko Sato, Ryozo Nagai
2025	CausalVLBench: Benchmarking Visual Causal Reasoning in Large Vision-Language Models. Aneesh Komanduri, Karuna Bhaila, Xintao Wu
2025	Certainty in Uncertainty: Reasoning over Uncertain Knowledge Graphs with Statistical Guarantees. Yuqicheng Zhu, Jingcheng Wu, Yizhen Wang, Hongkuan Zhou, Jiaoyan Chen, Evgeny Kharlamov, Steffen Staab
2025	Certified Mitigation of Worst-Case LLM Copyright Infringement. Jingyu Zhang, Jiacan Yu, Marc Marone, Benjamin Van Durme, Daniel Khashabi
2025	Chain-of-Talkers (CoTalk): Fast Human Annotation of Dense Image Captions. Yijun Shen, Delong Chen, Fan Liu, Xingyu Wang, Chuanyi Zhang, Liang Yao, Yuhui Zheng
2025	Chameleon LLMs: User Personas Influence Chatbot Personality Shifts. Jane Xing, Tianyi Niu, Shashank Srivastava
2025	Chart2Code53: A Large-Scale Diverse and Complex Dataset for Enhancing Chart-to-Code Generation. Tianhao Niu, Yiming Cui, Baoxin Wang, Xiao Xu, Xin Yao, Qingfu Zhu, Dayong Wu, Shijin Wang, Wanxiang Che
2025	ChartGaze: Enhancing Chart Understanding in LVLMs with Eye-Tracking Guided Attention Refinement. Ali Salamatian, Amirhossein Abaskohi, Wan-Cyuan Fan, Mir Rayat Imtiaz Hossain, Leonid Sigal, Giuseppe Carenini
2025	ChartMind: A Comprehensive Benchmark for Complex Real-world Multimodal Chart Question Answering. Jingxuan Wei, Nan Xu, Junnan Zhu, Haoyanni, Gaowei Wu, Qi Chen, Bihui Yu, Lei Wang
2025	Charting the Landscape of African NLP: Mapping Progress and Shaping the Road Ahead. Jesujoba Oluwadara Alabi, Michael A. Hedderich, David Ifeoluwa Adelani, Dietrich Klakow
2025	Chat-Driven Text Generation and Interaction for Person Retrieval. Zequn Xie, Chuxin Wang, Yeqiang Wang, Sihang Cai, Shulei Wang, Tao Jin
2025	ChatVLA: Unified Multimodal Understanding and Robot Control with Vision-Language-Action Model. Zhongyi Zhou, Yichen Zhu, Minjie Zhu, Junjie Wen, Ning Liu, Zhiyuan Xu, Weibin Meng, Yaxin Peng, Chaomin Shen, Feifei Feng, Yi Xu
2025	CheckEval: A reliable LLM-as-a-Judge framework for evaluating text generation using checklists. Yukyung Lee, Joonghoon Kim, Jaehee Kim, Hyowon Cho, Jaewook Kang, Pilsung Kang, Najoung Kim
2025	Child-Directed Language Does Not Consistently Boost Syntax Learning in Language Models. Francesca Padovani, Jaap Jumelet, Yevgen Matusevych, Arianna Bisazza
2025	Chinese Toxic Language Mitigation via Sentiment Polarity Consistent Rewrites. Xintong Wang, Yixiao Liu, Jingheng Pan, Liang Ding, Longyue Wang, Chris Biemann
2025	Circuit Complexity Bounds for RoPE-based Transformer Architecture. Bo Chen, Xiaoyu Li, Yingyu Liang, Jiangxuan Long, Zhenmei Shi, Zhao Song, Jiahao Zhang
2025	CiteBART: Learning to Generate Citations for Local Citation Recommendation. Ege Yigit Çelik, Selma Tekir
2025	CityEQA: A Hierarchical LLM Agent on Embodied Question Answering Benchmark in City Space. Yong Zhao, Kai Xu, Zhengqiu Zhu, Yue Hu, Zhiheng Zheng, Yingfeng Chen, Yatai Ji, Chen Gao, Yong Li, Jincai Huang
2025	ClimateViz: A Benchmark for Statistical Reasoning and Fact Verification on Scientific Charts. Ruiran Su, Jiasheng Si, Zhijiang Guo, Janet B. Pierrehumbert
2025	Co-Eval: Augmenting LLM-based Evaluation with Machine Metrics. Ling-I Wu, Weijie Wu, Minyu Chen, Jianxin Xue, Guoqiang Li
2025	Co-Evolving LLMs and Embedding Models via Density-Guided Preference Optimization for Text Clustering. Zetong Li, Qinliang Su, Minhua Huang, Yin Yang
2025	CoBA: Counterbias Text Augmentation for Mitigating Various Spurious Correlations via Semantic Triples. Kyohoon Jin, Juhwan Choi, Jungmin Yun, Junho Lee, Soojin Jang, YoungBin Kim
2025	CoBia: Constructed Conversations Can Trigger Otherwise Concealed Societal Biases in LLMs. Nafiseh Nikeghbal, Amir Hossein Kargaran, Jana Diesner
2025	CoCoA: Confidence- and Context-Aware Adaptive Decoding for Resolving Knowledge Conflicts in Large Language Models. Anant Khandelwal, Manish Gupta, Puneet Agrawal
2025	CoEvo: Coevolution of LLM and Retrieval Model for Domain-Specific Information Retrieval. Ang Li, Yiquan Wu, Yinghao Hu, Lizhi Qing, Shihang Wang, Chengyuan Liu, Tao Wu, Adam Jatowt, Ming Cai, Fei Wu, Kun Kuang
2025	CoLA: Compute-Efficient Pre-Training of LLMs via Low-Rank Activation. Ziyue Liu, Ruijie Zhang, Zhengyang Wang, Mingsong Yan, Zi Yang, Paul D. Hovland, Bogdan Nicolae, Franck Cappello, Sui Tang, Zheng Zhang
2025	CoMAT: Chain of Mathematically Annotated Thought Improves Mathematical Reasoning. Joshua Ong Jun Leang, Aryo Pradipta Gema, Shay B. Cohen
2025	CoMMIT: Coordinated Multimodal Instruction Tuning. Xintong Li, Junda Wu, Tong Yu, Rui Wang, Yu Wang, Xiang Chen, Jiuxiang Gu, Lina Yao, Julian J. McAuley, Jingbo Shang
2025	CoPL: Collaborative Preference Learning for Personalizing LLMs. Youngbin Choi, Seunghyuk Cho, Minjong Lee, MoonJeong Park, Yesong Ko, Jungseul Ok, Dongwoo Kim
2025	CoVoGER: A Multilingual Multitask Benchmark for Speech-to-text Generative Error Correction with Large Language Models. Zhengdong Yang, Zhen Wan, Sheng Li, Chao-Han Huck Yang, Chenhui Chu
2025	Coarse-to-Fine Grounded Memory for LLM Agent Planning. Wei Yang, Jinwei Xiao, Hongming Zhang, Qingyang Zhang, Yanna Wang, Bo Xu
2025	Code Execution as Grounded Supervision for LLM Reasoning. Dongwon Jung, Wenxuan Zhou, Muhao Chen
2025	Code to Think, Think to Code: A Survey on Code-Enhanced Reasoning and Reasoning-Driven Code Intelligence in LLMs. Dayu Yang, Tianyang Liu, Daoan Zhang, Antoine Simoulin, Xiaoyi Liu, Yuwei Cao, Zhaopu Teng, Xin Qian, Grey Yang, Jiebo Luo, Julian J. McAuley
2025	CodeArena: Evaluating and Aligning CodeLLMs on Human Preference. Jian Yang, Jiaxi Yang, Wei Zhang, Ke Jin, Yibo Miao, Lei Zhang, Liqun Yang, Zeyu Cui, Yichang Zhang, Zhoujun Li, Binyuan Hui, Junyang Lin
2025	CodeMixBench: Evaluating Code-Mixing Capabilities of LLMs Across 18 Languages. Yilun Yang, Yekun Chai
2025	CodeRAG: Finding Relevant and Necessary Knowledge for Retrieval-Augmented Repository-Level Code Completion. Sheng Zhang, Yifan Ding, Shuquan Lian, Shun Song, Hui Li
2025	CodeSSM: Towards State Space Models for Code Understanding. Shweta Verma, Abhinav Anand, Mira Mezini
2025	CogDual: Enhancing Dual Cognition of LLMs via Reinforcement Learning with Implicit Rule-Based Rewards. Cheng Liu, Yifei Lu, Fanghua Ye, Jian Li, Xingyu Chen, Feiliang Ren, Zhaopeng Tu, Xiaolong Li
2025	Cognitive Linguistic Identity Fusion Score (CLIFS): A Scalable Cognition-Informed Approach to Quantifying Identity Fusion from Text. Devin R. Wright, Jisun An, Yong-Yeol Ahn
2025	Collab-Overcooked: Benchmarking and Evaluating Large Language Models as Collaborative Agents. Haochen Sun, Shuwen Zhang, Lujie Niu, Lei Ren, Hao Xu, Hao Fu, Fangkun Zhao, Caixia Yuan, Xiaojie Wang
2025	Collaborative Beam Search: Enhancing LLM Reasoning via Collective Consensus. Yangyifan Xu, Shuo Ren, Jiajun Zhang
2025	Collaborative Rational Speech Act: Pragmatic Reasoning for Multi-Turn Dialog. Lautaro Estienne, Gabriel Ben Zenou, Nona Naderi, Jackie CK Cheung, Pablo Piantanida
2025	Combining Constrained and Unconstrained Decoding via Boosting: BoostCD and Its Application to Information Extraction. Marija Sakota, Robert West
2025	ComicScene154: A Scene Dataset for Comic Analysis. Sandro Paval, Pascal Meißner, Ivan P. Yamshchikov
2025	CompKBQA: Component-wise Task Decomposition for Knowledge Base Question Answering. Yuhang Tian, Dandan Song, Zhijing Wu, Pan Yang, Changzhi Zhou, Jun Yang, Hao Wang, Huipeng Ma, Chenhao Li, Luan Zhang
2025	Comparing Specialised Small and General Large Language Models on Text Classification: 100 Labelled Samples to Achieve Break-Even Performance. Branislav Pecher, Ivan Srba, Mária Bieliková
2025	Comparing human and LLM politeness strategies in free production. Haoran Zhao, Robert D. Hawkins
2025	CompassVerifier: A Unified and Robust Verifier for LLMs Evaluation and Outcome Reward. Shudong Liu, Hongwei Liu, Junnan Liu, Linchen Xiao, Songyang Gao, Chengqi Lyu, Yuzhe Gu, Wenwei Zhang, Derek F. Wong, Songyang Zhang, Kai Chen
2025	Complex Numerical Reasoning with Numerical Semantic Pre-training Framework. Jun Zhang, Haihong E, Tianyi Hu, Yifan Zhu, Meina Song, Haoran Luo
2025	ComplexTempQA: A 100m Dataset for Complex Temporal Question Answering. Raphael Gruber, Abdelrahman Abdallah, Michael Färber, Adam Jatowt
2025	Composable Cross-prompt Essay Scoring by Merging Models. Sanwoo Lee, Kun Liang, Yunfang Wu
2025	Compositional Generalisation for Explainable Hate Speech Detection. Agostina Calabrese, Tom Sherborne, Björn Ross, Mirella Lapata
2025	Compound AI Systems Optimization: A Survey of Methods, Challenges, and Future Directions. Yu-Ang Lee, Guan-Ting Yi, Mei-Yi Liu, Jui-Chao Lu, Guan-Bo Yang, Yun-Nung Chen
2025	Comprehensive and Efficient Distillation for Lightweight Sentiment Analysis Models. Guangyu Xie, Yice Zhang, Jianzhu Bao, Qianlong Wang, Yang Sun, Bingbing Wang, Ruifeng Xu
2025	Computational Analysis of Character Development in Holocaust Testimonies. Esther Shizgal, Eitan Wagner, Renana Keydar, Omri Abend
2025	Computational Analysis of Conversation Dynamics through Participant Responsivity. Margaret A. Hughes, Brandon Roy, Elinor Poole-Dayan, Deb Roy, Jad Kabbara
2025	ConCISE: Confidence-guided Compression in Step-by-step Efficient Reasoning. Ziqing Qiao, Yongheng Deng, Jiali Zeng, Dong Wang, Lai Wei, Guanbo Wang, Fandong Meng, Jie Zhou, Ju Ren, Yaoxue Zhang
2025	Conan-Embedding-v2: Training an LLM from Scratch for Text Embeddings. Shiyu Li, Yang Tang, Ruijie Liu, Shi-Zhe Chen, Xi Chen
2025	Concept-pedia: a Wide-coverage Semantically-annotated Multimodal Dataset. Karim Ghonim, Andrei Stefan Bejgu, Alberte Fernández-Castro, Roberto Navigli
2025	CondAmbigQA: A Benchmark and Dataset for Conditional Ambiguous Question Answering. Zongxi Li, Yang Li, Haoran Xie, S. Joe Qin
2025	CondenseLM: LLMs-driven Text Dataset Condensation via Reward Matching. Cheng Shen, Yew-Soon Ong, Joey Tianyi Zhou
2025	Conditional [MASK] Discrete Diffusion Language Model. Hyukhun Koh, Minha Jhang, Dohyung Kim, Sangmook Lee, Kyomin Jung
2025	Confidence-guided Refinement Reasoning for Zero-shot Question Answering. Youwon Jang, Woo Suk Choi, Minjoon Jung, Minsu Lee, Byoung-Tak Zhang
2025	Conflict-Aware Soft Prompting for Retrieval-Augmented Generation. Eunseong Choi, June Park, Hyeri Lee, Jongwuk Lee
2025	Conflicting Needles in a Haystack: How LLMs behave when faced with contradictory information. Murathan Kurfali, Robert Östling
2025	Confounding Factors in Relating Model Performance to Morphology. Wessel Poelman, Thomas Bauwens, Miryam de Lhoneux
2025	Connecting the Knowledge Dots: Retrieval-augmented Knowledge Connection for Commonsense Reasoning. Junho Kim, Soyeon Bak, Mingyu Lee, Minju Hong, Songha Kim, Tae-Eui Kam, SangKeun Lee
2025	ConsistentChat: Building Skeleton-Guided Consistent Multi-Turn Dialogues for Large Language Models from Scratch. Jiawei Chen, Xinyan Guan, Qianhao Yuan, Guozhao Mo, Weixiang Zhou, Yaojie Lu, Hongyu Lin, Ben He, Le Sun, Xianpei Han
2025	Constrained Non-negative Matrix Factorization for Guided Topic Modeling of Minority Topics. Seyedeh Fatemeh Ebrahimi, Jaakko Peltonen
2025	ConstraintLLM: A Neuro-Symbolic Framework for Industrial-Level Constraint Programming. Weichun Shi, Minghao Liu, Wanting Zhang, Langchen Shi, Fuqi Jia, Feifei Ma, Jian Zhang
2025	Constructions are Revealed in Word Distributions. Joshua Rozner, Leonie Weissweiler, Kyle Mahowald, Cory Shain
2025	Context Reasoner: Incentivizing Reasoning Capability for Contextualized Privacy and Safety Compliance via Reinforcement Learning. Wenbin Hu, Haoran Li, Huihao Jing, Qi Hu, Ziqian Zeng, Sirui Han, Heli Xu, Tianshu Chu, Peizhao Hu, Yangqiu Song
2025	Context and POS in Action: A Comparative Study of Chinese Homonym Disambiguation in Human and Language Models. Chenwei Xie, Matthew King-Hang Ma, Wenbo Wang, William Shi-Yuan Wang
2025	Context is Gold to find the Gold Passage: Evaluating and Training Contextual Document Embeddings. Max Conti, Manuel Faysse, Gautier Viaud, Antoine Bosselut, Céline Hudelot, Pierre Colombo
2025	Context-Aware Hierarchical Taxonomy Generation for Scientific Papers via LLM-Guided Multi-Aspect Clustering. Kun Zhu, Lizi Liao, Yuxuan Gu, Lei Huang, Xiaocheng Feng, Bing Qin
2025	Context-Aware Membership Inference Attacks against Pre-trained Large Language Models. Hongyan Chang, Ali Shahin Shamsabadi, Kleomenis Katevas, Hamed Haddadi, Reza Shokri
2025	Context-aware Biases for Length Extrapolation. Ali Veisi, Hamidreza Amirzadeh, Amir Mansourian
2025	Continuous-Time Attention: PDE-Guided Mechanisms for Long-Sequence Transformers. Yukun Zhang, Xueqing Zhou
2025	Continuously Steering LLMs Sensitivity to Contextual Knowledge with Proxy Models. Yilin Wang, Heng Wang, Yuyang Bai, Minnan Luo
2025	Contra4: Evaluating Contrastive Cross-Modal Reasoning in Audio, Video, Image, and 3D. Artemis Panagopoulou, Le Xue, Honglu Zhou, Silvio Savarese, Ran Xu, Caiming Xiong, Chris Callison-Burch, Mark Yatskar, Juan Carlos Niebles
2025	Controllable Memorization in LLMs via Weight Pruning. Chenjie Ni, Zhepeng Wang, Runxue Bao, Shangqian Gao, Yanfu Zhang
2025	Controlled Generation for Private Synthetic Text. Zihao Zhao, Anjalie Field
2025	ConvSearch-R1: Enhancing Query Reformulation for Conversational Search with Reasoning via Reinforcement Learning. Changtai Zhu, Siyin Wang, Ruijun Feng, Kai Song, Xipeng Qiu
2025	Convergence and Divergence of Language Models under Different Random Seeds. Finlay Fehlauer, Kyle Mahowald, Tiago Pimentel
2025	CopySpec: Accelerating LLMs with Speculative Copy-and-Paste. Razvan-Gabriel Dumitru, Minglai Yang, Vikas Yadav, Mihai Surdeanu
2025	Correct-Detect: Balancing Performance and Ambiguity Through the Lens of Coreference Resolution in LLMs. Amber Shore, Russell Scheinberg, Ameeta Agrawal, So Young Lee
2025	Correlation-Aware Example Selection for In-Context Learning with Nonsymmetric Determinantal Point Processes. Qiunan Du, Zhiliang Tian, Zhen Huang, Kailun Bian, Tianlun Liu, Zhaoning Zhang, Xinwang Liu, Feng Liu, Dong Sheng Li
2025	Corrupted but Not Broken: Understanding and Mitigating the Negative Impacts of Corrupted Data in Visual Instruction Tuning. Yunhao Gou, Hansi Yang, Zhili Liu, Kai Chen, Yihan Zeng, Lanqing Hong, Zhenguo Li, Qun Liu, Bo Han, James Kwok, Yu Zhang
2025	Cost-Optimal Grouped-Query Attention for Long-Context Modeling. Yingfa Chen, Yutong Wu, Chenyang Song, Zhen Leng Thai, Xingyu Shen, Xu Han, Zhiyuan Liu, Maosong Sun
2025	CourtReasoner: Can LLM Agents Reason Like Judges? Sophia Simeng Han, Yoshiki Takashima, Shannon Zejiang Shen, Chen Liu, Yixin Liu, Roque K. Thuo, Sonia Knowlton, Ruzica Piskac, Scott J. Shapiro, Arman Cohan
2025	Creativity in LLM-based Multi-Agent Systems: A Survey. Yi-Cheng Lin, Kang-Chieh Chen, Zhe-Yan Li, Tzu-Heng Wu, Tzu-Hsuan Wu, Kuan-Yu Chen, Hung-yi Lee, Yun-Nung Chen
2025	Crisp: Cognitive Restructuring of Negative Thoughts through Multi-turn Supportive Dialogues. Jinfeng Zhou, Yuxuan Chen, Jianing Yin, Yongkang Huang, Yihan Shi, Xikun Zhang, Libiao Peng, Rongsheng Zhang, Tangjie Lv, Zhipeng Hu, Hongning Wang, Minlie Huang
2025	Cross-Document Cross-Lingual NLI via RST-Enhanced Graph Fusion and Interpretability Prediction. Mengying Yuan, Wenhao Wang, Zixuan Wang, Yujie Huang, Kangli Wei, Fei Li, Chong Teng, Donghong Ji
2025	Cross-MoE: An Efficient Temporal Prediction Framework Integrating Textual Modality. Ruizheng Huang, Zhicheng Zhang, Yong Wang
2025	Cross-domain Rumor Detection via Test-Time Adaptation and Large Language Models. Yuxia Gong, Shuguo Hu, Huaiwen Zhang
2025	CrystalICL: Enabling In-Context Learning for Crystal Generation. Ruobing Wang, Qiaoyu Tan, Yili Wang, Ying Wang, Xin Wang
2025	Culture Cartography: Mapping the Landscape of Cultural Knowledge. Caleb Ziems, William Barr Held, Jane Yu, Amir Goldberg, David Grusky, Diyi Yang
2025	Current Semantic-change Quantification Methods Struggle with Discovery in the Wild. Khonzoda Umarova, Lillian Lee, Laerdon Kim
2025	D-CoDe: Scaling Image-Pretrained VLMs to Video via Dynamic Compression and Question Decomposition. Yiyang Huang, Yizhou Wang, Yun Fu
2025	D-RAG: Differentiable Retrieval-Augmented Generation for Knowledge Graph Question Answering. Guangze Gao, Zixuan Li, Chunfeng Yuan, Jiawei Li, Wu Jianzhuo, Yuehao Zhang, Xiaolong Jin, Bing Li, Weiming Hu
2025	DA-Pred: Performance Prediction for Text Summarization under Domain-Shift and Instruct-Tuning. Anum Afzal, Florian Matthes, Alexander R. Fabbri
2025	DAMON: A Dialogue-Aware MCTS Framework for Jailbreaking Large Language Models. Xu Zhang, Xunjian Yin, Dinghao Jing, Huixuan Zhang, Xinyu Hu, Xiaojun Wan
2025	DART: Distilling Autoregressive Reasoning to Silent Thought. Nan Jiang, Ziming Wu, De-Chuan Zhan, Fuming Lai, Shaobing Lian
2025	DASA-Trans-STM: Adaptive Efficient Transformer for Short Text Matching using Data Augmentation and Semantic Awareness. Jiguo Liu, Chao Liu, Meimei Li, Nan Li, Shihao Gao, Dali Zhu
2025	DCIS: Efficient Length Extrapolation of LLMs via Divide-and-Conquer Scaling Factor Search. Lei Yang, Shaoyang Xu, Jianxiang Peng, Shaolin Zhu, Deyi Xiong
2025	DCP: Dual-Cue Pruning for Efficient Large Vision-Language Models. Lei Jiang, Zixun Zhang, Yuting Zeng, Chunzhao Xie, Tongxuan Liu, Zhen Li, Lechao Cheng, Xiaohua Xu
2025	DCR: Quantifying Data Contamination in LLMs Evaluation. Cheng Xu, Nan Yan, Shuhao Guan, Changhong Jin, Yuke Mei, Yibing Guo, M. Tahar Kechadi
2025	DDO: Dual-Decision Optimization for LLM-Based Medical Consultation via Multi-Agent Collaboration. Zhihao Jia, Mingyi Jia, Junwen Duan, Jian-xin Wang
2025	DEBATE, TRAIN, EVOLVE: Self-Evolution of Language Model Reasoning. Gaurav Srivastava, Zhenyu Bi, Meng Lu, Xuan Wang
2025	DEL-ToM: Inference-Time Scaling for Theory-of-Mind Reasoning via Dynamic Epistemic Logic. Yuheng Wu, Jianwen Xie, Denghui Zhang, Zhaozhuo Xu
2025	DELOC: Document Element Localizer. Hammad A. Ayyubi, Puneet Mathur, Md. Mehrab Tanjim, Vlad I. Morariu
2025	DICE: Structured Reasoning in LLMs through SLM-Guided Chain-of-Thought Correction. Yiqi Li, Yusheng Liao, Zhe Chen, Yanfeng Wang, Yu Wang
2025	DIDS: Domain Impact-aware Data Sampling for Large Language Model Training. Weijie Shi, Jipeng Zhang, Yaguang Wu, Jingzhi Fang, Shibo Zhang, Yao Zhao, Hao Chen, Ruiyuan Zhang, Yue Cui, Jia Zhu, Sirui Han, Jiajie Xu, Xiaofang Zhou
2025	DINT Transformer. Yueyang Cang, Yuhang Liu, Xiaoteng Zhang, Erlu Zhao, Li Shi
2025	DIWALI - Diversity and Inclusivity aWare cuLture specific Items for India: Dataset and Assessment of LLMs for Cultural Text Adaptation in Indian Context. Pramit Sahoo, Maharaj Brahma, Maunendra Sankar Desarkar
2025	DMDTEval: An Evaluation and Analysis of LLMs on Disambiguation in Multi-domain Translation. Zhibo Man, Yuanmeng Chen, Yujie Zhang, Jinan Xu
2025	DPED: Multi-Layer Noise Distillation for Privacy-Preserving Text Embeddings. Shuya Feng, Yuan Hong
2025	DRES: Fake news detection by dynamic representation and ensemble selection. Faramarz Farhangian, Leandro Augusto Ensina, George D. C. Cavalcanti, Rafael M. O. Cruz
2025	DRISHTIKON: A Multimodal Multilingual Benchmark for Testing Language Models' Understanding on Indian Culture. Arijit Maji, Raghvendra Kumar, Akash Ghosh, Anushka, Nemil Shah, Abhilekh Borah, Vanshika Shah, Nishant Mishra, Sriparna Saha
2025	DSCD: Large Language Model Detoxification with Self-Constrained Decoding. Ming Dong, Jinkui Zhang, Bolong Zheng, Xinhui Tu, Po Hu, Tingting He
2025	DSG-MCTS: A Dynamic Strategy-Guided Monte Carlo Tree Search for Diversified Reasoning in Large Language Models. Rui Ha, Chaozhuo Li, Rui Pu, Litian Zhang, Xi Zhang, Sen Su
2025	DSMoE: Matrix-Partitioned Experts with Dynamic Routing for Computation-Efficient Dense LLMs. Minxuan Lv, Zhenpeng Su, Leiyu Pan, Yizhe Xiong, Zijia Lin, Hui Chen, Wei Zhou, Jungong Han, Guiguang Ding, Wenwu Ou, Di Zhang, Kun Gai, Songlin Hu
2025	DSVD: Dynamic Self-Verify Decoding for Faithful Generation in Large Language Models. YiQiu Guo, Yuchen Yang, Zhe Chen, Pingjie Wang, Yusheng Liao, Ya Zhang, Yanfeng Wang, Yu Wang
2025	Data Descriptions from Large Language Models with Influence Estimation. Chaeri Kim, Jaeyeon Bae, Taehwan Kim
2025	Data Drives Unstable Hierarchical Generalization in LMs. Tian Qin, Naomi Saphra, David Alvarez-Melis
2025	Data to Defense: The Role of Curation in Aligning Large Language Models Against Safety Compromise. Xiaoqun Liu, Jiacheng Liang, Luoxi Tang, Muchao Ye, Weicheng Ma, Zhaohan Xi
2025	Data-Efficient Hate Speech Detection via Cross-Lingual Nearest Neighbor Retrieval with Limited Labeled Data. Faeze Ghorbanpour, Daryna Dementieva, Alexander Fraser
2025	Data-Efficient Selection via Grammatical Complexity in Continual Pre-training of Domain-Specific LLMs. Yizhou Ying, Geng Zhang, Cui Danxin, Chengyu Du, Guanglei Yue, Sihang Jiang, Jiaqing Liang, Yifei Fu, Hailin Hu, Yanghua Xiao
2025	Database-Augmented Query Representation for Information Retrieval. Soyeong Jeong, Jinheon Baek, Sukmin Cho, Sung Ju Hwang, Jong C. Park
2025	DatawiseAgent: A Notebook-Centric LLM Agent Framework for Adaptive and Robust Data Science Automation. Ziming You, Yumiao Zhang, Dexuan Xu, Yiwei Lou, Yandong Yan, Wei Wang, Huamin Zhang, Yu Huang
2025	Date Fragments: A Hidden Bottleneck of Tokenization for Temporal Reasoning. Gagan Bhatia, Maxime Peyrard, Wei Zhao
2025	Debatable Intelligence: Benchmarking LLM Judges via Debate Speech Evaluation. Noy Sternlicht, Ariel Gera, Roy Bar-Haim, Tom Hope, Noam Slonim
2025	Debate-to-Detect: Reformulating Misinformation Detection as a Real-World Debate with Large Language Models. Chen Han, Wenzhen Zheng, Xijin Tang
2025	Debiasing Multilingual LLMs in Cross-lingual Latent Space. Qiwei Peng, Guimin Hu, Yekun Chai, Anders Søgaard
2025	Decoding Dense Embeddings: Sparse Autoencoders for Interpreting and Discretizing Dense Retrieval. Seongwan Park, Taeklim Kim, Youngjoong Ko
2025	Decoding the Rule Book: Extracting Hidden Moderation Criteria from Reddit Communities. Youngwoo Kim, Himanshu Beniwal, Steven L. Johnson, Thomas Hartvigsen
2025	DecoupleSearch: Decouple Planning and Search via Hierarchical Reward Modeling. Hao Sun, Zile Qiao, Bo Wang, Guoxin Chen, Yingyan Hou, Yong Jiang, Pengjun Xie, Fei Huang, Yan Zhang
2025	Deep Associations, High Creativity: A Simple yet Effective Metric for Evaluating Large Language Models. Ziliang Qiu, Renfen Hu
2025	DeepResearcher: Scaling Deep Research via Reinforcement Learning in Real-world Environments. Yuxiang Zheng, Dayuan Fu, Xiangkun Hu, Xiaojie Cai, Lyumanshan Ye, Pengrui Lu, Pengfei Liu
2025	DeepResonance: Enhancing Multimodal Music Understanding via Music-centric Multi-way Instruction Tuning. Zhuoyuan Mao, Mengjie Zhao, Qiyu Wu, Hiromi Wakaki, Yuki Mitsufuji
2025	DeepWell-Adol: A Scalable Expert-Based Dialogue Corpus for Adolescent Positive Mental Health and Wellbeing Promotion. Wenyu Qiu, Yuxiong Wang, Jiajun Tan, Hanchao Hou, Qinda Liu, Wei Yao, Shiguang Ni
2025	Definition Generation for Word Meaning Modeling: Monolingual, Multilingual, and Cross-Lingual Perspectives. Francesco Periti, Roksana Goworek, Haim Dubossarsky, Nina Tahmasebi
2025	Demystifying Domain-adaptive Post-training for Financial LLMs. Zixuan Ke, Yifei Ming, Xuan-Phi Nguyen, Caiming Xiong, Shafiq Joty
2025	Demystifying Synthetic Data in LLM Pre-training: A Systematic Study of Scaling Laws, Benefits, and Pitfalls. Feiyang Kang, Newsha Ardalani, Michael Kuchnik, Youssef Emad, Mostafa Elhoushi, Shubhabrata Sengupta, Shang-wen Li, Ramya Raghavendra, Ruoxi Jia, Carole-Jean Wu
2025	Demystifying optimized prompts in language models. Rimon Melamed, Lucas H. McCabe, H. Howie Huang
2025	Deriving Strategic Market Insights with Large Language Models: A Benchmark for Forward Counterfactual Generation. Keane Ong, Rui Mao, Deeksha Varshney, Paul Pu Liang, Erik Cambria, Gianmarco Mengaldo
2025	Detecting Corpus-Level Knowledge Inconsistencies in Wikipedia with Large Language Models. Sina J. Semnani, Jirayu Burapacheep, Arpandeep Khatua, Thanawan Atchariyachanvanit, Zheng Wang, Monica S. Lam
2025	Detecting Knowledge Boundary of Vision Large Language Models by Sampling-Based Inference. Zhuo Chen, Xinyu Wang, Yong Jiang, Zhen Zhang, Xinyu Geng, Pengjun Xie, Fei Huang, Kewei Tu
2025	Detecting LLM Hallucination Through Layer-wise Information Deficiency: Analysis of Ambiguous Prompts and Unanswerable Questions. Hazel Kim, Tom A. Lamb, Adel Bibi, Philip Torr, Yarin Gal
2025	Detecting Legal Citations in United Kingdom Court Judgments. Holli Sargeant, Andreas Östling, Måns Magnusson
2025	Detoxifying Large Language Models via the Diversity of Toxic Samples. Ying Zhao, Yuanzhao Guo, Xuemeng Weng, Yuan Tian, Wei Wang, Yi Chang
2025	DiCoRe: Enhancing Zero-shot Event Detection via Divergent-Convergent LLM Reasoning. Tanmay Parekh, Kartik Mehta, Ninareh Mehrabi, Kai-Wei Chang, Nanyun Peng
2025	DiMo-GUI: Advancing Test-time Scaling in GUI Grounding via Modality-Aware Visual Reasoning. Hang Wu, Hongkai Chen, Yujun Cai, Chang Liu, Qingwen Ye, Ming-Hsuan Yang, Yiwei Wang
2025	DiNaM: Disinformation Narrative Mining with Large Language Models. Witold Sosnowski, Arkadiusz Modzelewski, Kinga Skorupska, Adam Wierzbicki
2025	Diagnosing Memorization in Chain-of-Thought Reasoning, One Token at a Time. Huihan Li, You Chen, Siyuan Wang, Yixin He, Ninareh Mehrabi, Rahul Gupta, Xiang Ren
2025	Diagram-Driven Course Questions Generation. Xinyu Zhang, Lingling Zhang, Yanrui Wu, Muye Huang, Wenjun Wu, Bo Li, Shaowei Wang, Basura Fernando, Jun Liu
2025	Dial-In LLM: Human-Aligned LLM-in-the-loop Intent Clustering for Customer Service Dialogues. Mengze Hong, Wailing Ng, Chen Jason Zhang, Yuanfeng Song, Di Jiang
2025	Dialect-SQL: An Adaptive Framework for Bridging the Dialect Gap in Text-to-SQL. Jie Shi, Xi Cao, Bo Xu, Jiaqing Liang, Yanghua Xiao, Jia Chen, Peng Wang, Wei Wang
2025	Diffusion vs. Autoregressive Language Models: A Text Embedding Perspective. Siyue Zhang, Yilun Zhao, Liyuan Geng, Arman Cohan, Anh Tuan Luu, Chen Zhao
2025	DiffusionAttacker: Diffusion-Driven Prompt Manipulation for LLM Jailbreak. Hao Wang, Hao Li, Junda Zhu, Xinyuan Wang, Chengwei Pan, Minlie Huang, Lei Sha
2025	DiplomacyAgent: Do LLMs Balance Interests and Ethical Principles in International Events? Jianxiang Peng, Ling Shi, Xinwei Wu, Hanwen Zhang, Fujiang Liu, Haocheng Lyu, Deyi Xiong
2025	Dipper: Diversity in Prompts for Producing Large Language Model Ensembles in Reasoning Tasks. Wenyang Hu, Gregory Kang Ruey Lau, Diwen Liu, Jizhuo Chen, See-Kiong Ng, Bryan Kian Hsiang Low
2025	Direct Judgement Preference Optimization. Peifeng Wang, Austin Xu, Yilun Zhou, Caiming Xiong, Shafiq Joty
2025	Direct Value Optimization: Improving Chain-of-Thought Reasoning in LLMs with Refined Values. Hongbo Zhang, Han Cui, Guangsheng Bao, Linyi Yang, Jun Wang, Yue Zhang
2025	DisLoRA: Task-specific Low-Rank Adaptation via Orthogonal Basis from Singular Value Decomposition. She Yifei, Xinhao Wei, Yulong Wang
2025	Disambiguation in Conversational Question Answering in the Era of LLMs and Agents: A Survey. Md. Mehrab Tanjim, Yeonjun In, Xiang Chen, Victor S. Bursztyn, Ryan A. Rossi, Sungchul Kim, Guang-Jie Ren, Vaishnavi Muppala, Shun Jiang, Yongsung Kim, Chanyoung Park
2025	DischargeSim: A Simulation Benchmark for Educational Doctor-Patient Communication at Discharge. Zonghai Yao, Michael Sun, Won Seok Jang, Sunjae Kwon, Soie Kwon, Hong Yu
2025	DiscoSG: Towards Discourse-Level Text Scene Graph Parsing through Iterative Graph Refinement. Shaoqing Lin, Chong Teng, Fei Li, Donghong Ji, Lizhen Qu, Zhuang Li
2025	Discourse-Driven Code-Switching: Analyzing the Role of Content and Communicative Function in Spanish-English Bilingual Speech. Debasmita Bhattacharya, Juan Junco, Divya Tadimeti, Julia Hirschberg
2025	Discrepancy Detection at the Data Level: Toward Consistent Multilingual Question Answering. Lorena Calvo-Bartolomé, Valérie Aldana, Karla Cantarero, Alonso Madroñal de Mesa, Jerónimo Arenas-García, Jordan Lee Boyd-Graber
2025	Discriminating Form and Meaning in Multilingual Models with Minimal-Pair ABX Tasks. Maureen de Seyssel, Jie Chi, Skyler Seto, Maartje ter Hoeve, Masha Fedzechkina, Natalie Schluter
2025	Discursive Circuits: How Do Language Models Understand Discourse Relations? Yisong Miao, Min-Yen Kan
2025	Disentangled Information Bottleneck for Adversarial Text Defense. Yidan Xu, Xinghao Yang, Wei Liu, Bao-Di Liu, Weifeng Liu
2025	Disentangling Subjectivity and Uncertainty for Hate Speech Annotation and Modeling using Gaze. Özge Alaçam, Sanne Hoeken, Andreas Säuberli, Hannes Gröner, Diego Frassinelli, Sina Zarrieß, Barbara Plank
2025	Distribution Prompting: Understanding the Expressivity of Language Models Through the Next-Token Distributions They Can Produce. Haojin Wang, Zining Zhu, Freda Shi
2025	DivScore: Zero-Shot Detection of LLM-Generated Text in Specialized Domains. Zhihui Chen, Kai He, Yucheng Huang, Yunxiao Zhu, Mengling Feng
2025	Diverse, not Short: A Length-Controlled Data Selection Strategy for Improving Response Diversity of Language Models. Vijeta Deshpande, Debasmita Ghose, John D. Patterson, Roger E. Beaty, Anna Rumshisky
2025	DnDScore: Decontextualization and Decomposition for Factuality Verification in Long-Form Text Generation. Miriam Wanner, Benjamin Van Durme, Mark Dredze
2025	Do All Autoregressive Transformers Remember Facts the Same Way? A Cross-Architecture Analysis of Recall Mechanisms. Minyeong Choe, Haehyun Cho, Changho Seo, Hyunil Kim
2025	Do LLMs Adhere to Label Definitions? Examining Their Receptivity to External Label Definitions. Seyedali Mohammadi, Bhaskara Hanuma Vedula, Hemank Lamba, Edward Raff, Ponnurangam Kumaraguru, Francis Ferraro, Manas Gaur
2025	Do LLMs Behave as Claimed? Investigating How LLMs Follow Their Own Claims using Counterfactual Questions. Haochen Shi, Shaobo Li, Guoqing Chao, Xiaoliang Shi, Wentao Chen, Zhenzhou Ji
2025	Do LLMs Encode Frame Semantics? Evidence from Frame Identification. Jayanth Krishna Chundru, Rudrashis Poddar, Jie Cao, Tianyu Jiang
2025	Do Large Language Models Truly Grasp Addition? A Rule-Focused Diagnostic Using Two-Integer Arithmetic. Yang Yan, Yu Lu, Renjun Xu, Zhenzhong Lan
2025	Do Large Language Models Understand Word Senses? Domenico Meconi, Simone Stirpe, Federico Martelli, Leonardo Lavalle, Roberto Navigli
2025	Do Large Language Models excel in Complex Logical Reasoning with Formal Language? Jin Jiang, Jianing Wang, Yuchen Yan, Yang Liu, Jianhua Zhu, Mengdi Zhang, Liangcai Gao
2025	Do RAG Systems Really Suffer From Positional Bias? Florin Cuconasu, Simone Filice, Guy Horowitz, Yoelle Maarek, Fabrizio Silvestri
2025	Do Slides Help? Multi-modal Context for Automatic Transcription of Conference Talks. Supriti Sinhamahapatra, Jan Niehues
2025	Do You Know About My Nation? Investigating Multilingual Language Models' Cultural Literacy Through Factual Knowledge. Eshaan Tanwar, Anwoy Chatterjee, Michael Saxon, Alon Albalak, William Yang Wang, Tanmoy Chakraborty
2025	Doc2Chart: Intent-Driven Zero-Shot Chart Generation from Documents. Akriti Jain, Pritika Ramu, Aparna Garimella, Apoorv Saxena
2025	DocAgent: An Agentic Framework for Multi-Modal Long-Context Document Understanding. Li Sun, Liu He, Shuyue Jia, Yangfan He, Chenyu You
2025	DocReRank: Single-Page Hard Negative Query Generation for Training Multi-Modal RAG Rerankers. Navve Wasserman, Oliver Heinimann, Yuval Golbari, Tal Zimbalist, Eli Schwartz, Michal Irani
2025	Does Acceleration Cause Hidden Instability in Vision Language Models? Uncovering Instance-Level Divergence Through a Large-Scale Empirical Study. Yizheng Sun, Hao Li, Chang Xu, Hongpeng Zhou, Chenghua Lin, Riza Batista-Navarro, Jingyuan Sun
2025	Does Context Matter? A Prosodic Comparison of English and Spanish in Monolingual and Multilingual Discourse Settings. Debasmita Bhattacharya, David Sasu, Michela Marchini, Natalie Schluter, Julia Hirschberg
2025	Does Localization Inform Unlearning? A Rigorous Examination of Local Parameter Attribution for Knowledge Unlearning in Language Models. Hwiyeong Lee, Uiji Hwang, Hyelim Lim, Taeuk Kim
2025	Does quantization affect models' performance on long-context tasks? Anmol Mekala, Anirudh Atmakuru, Yixiao Song, Marzena Karpinska, Mohit Iyyer
2025	Don't Sweat the Small Stuff: Segment-Level Meta-Evaluation Based on Pairwise Difference Correlation. Colten DiIanni, Daniel Deutsch
2025	Doubling Your Data in Minutes: Ultra-fast Tabular Data Generation via LLM-Induced Dependency Graphs. Shuo Yang, Zheyu Zhang, Bardh Prenkaj, Gjergji Kasneci
2025	Dovetail: A CPU/GPU Heterogeneous Speculative Decoding for LLM inference. Libo Zhang, Zhaoning Zhang, Xubaizhou, Rui Li, Zhiliang Tian, Songzhu Mei, Dongsheng Li
2025	DrDiff: Dynamic Routing Diffusion with Hierarchical Attention for Breaking the Efficiency-Quality Trade-off. Jusheng Zhang, Yijia Fan, Kaitong Cai, Zimeng Huang, Xiaofei Sun, Jian Wang, Chengpei Tang, Keze Wang
2025	DrFrattn: Directly Learn Adaptive Policy from Attention for Simultaneous Machine Translation. Libo Zhao, Jing Li, Ziqian Zeng
2025	Draft Model Knows When to Stop: Self-Verification Speculative Decoding for Long-Form Generation. Ziyin Zhang, Jiahao Xu, Tian Liang, Xingyu Chen, Zhiwei He, Rui Wang, Zhaopeng Tu
2025	Drift-Adapter: A Practical Approach to Near Zero-Downtime Embedding Model Upgrades in Vector Databases. Harshil Vejendla
2025	Drivel-ology: Challenging LLMs with Interpreting Nonsense with Depth. Yang Wang, Chenghao Xiao, Chia-Yi Hsiao, Zi Yan Chang, Chi-Li Chen, Tyler Loakman, Chenghua Lin
2025	Droid: A Resource Suite for AI-Generated Code Detection. Daniil Orel, Indraneil Paul, Iryna Gurevych, Preslav Nakov
2025	Dual-Path Counterfactual Integration for Multimodal Aspect-Based Sentiment Classification. Rui Liu, Jiahao Cao, Jiaqian Ren, Xu Bai, Yanan Cao
2025	Dual-Path Dynamic Fusion with Learnable Query for Multimodal Sentiment Analysis. Miao Zhou, Lina Yang, Thomas Wu, Dongnan Yang, Xinru Zhang
2025	DyePack: Provably Flagging Test Set Contamination in LLMs Using Backdoors. Yize Cheng, Wenxiao Wang, Mazda Moayeri, Soheil Feizi
2025	Dynamic Collaboration of Multi-Language Models based on Minimal Complete Semantic Units. Chao Hao, Zezheng Wang, Yanhua Huang, Ruiwen Xu, Wenzhe Niu, Xin Liu, Zitong Yu
2025	Dynamic Energy-Based Contrastive Learning with Multi-Stage Knowledge Verification for Event Causality Identification. Ya Su, Hu Zhang, Yue Fan, Guangjun Zhang, Yujie Wang, Ru Li, Hongye Tan
2025	Dynamic Expert Specialization: Towards Catastrophic Forgetting-Free Multi-Domain MoE Adaptation. Junzhuo Li, Bo Wang, Xiuze Zhou, Xuming Hu
2025	Dynamic Jointly Batch Selection for Data Efficient Machine Translation Fine-Tuning. Mohammad Amin Ghanizadeh, Mohammad Javad Dousti
2025	Dynamic Model-Bank Test-Time Adaptation for Automatic Speech Recognition. Yanshuo Wang, Yanghao Zhou, Yukang Lin, Haoxing Chen, Jin Zhang, Wentao Zhu, Jie Hong, Xuesong Li
2025	Dynamic Retriever for In-Context Knowledge Editing via Policy Optimization. Mahmud Wasif Nafee, Maiqi Jiang, Haipeng Chen, Yanfu Zhang
2025	DynamicNER: A Dynamic, Multilingual, and Fine-Grained Dataset for LLM-based Named Entity Recognition. Hanjun Luo, Yingbin Jin, Yiran Wang, Xinfeng Li, Tong Shang, Xuecheng Liu, Ruizhe Chen, Kun Wang, Hanan Salam, Qingsong Wen, Zuozhu Liu
2025	Dyve: Thinking Fast and Slow for Dynamic Process Verification. Jianyuan Zhong, Zeju Li, Zhijian Xu, Xiangyu Wen, Qiang Xu
2025	E2LLM: Encoder Elongated Large Language Models for Long-Context Understanding and Reasoning. Zihan Liao, Jun Wang, Hang Yu, Lingxiao Wei, Jianguo Li, Wei Zhang
2025	ECC: An Emotion-Cause Conversation Dataset for Empathy Response. Yuanyuan He, Yongsen Pan, Wei Li, Jiali You, Jiawen Deng, Fuji Ren
2025	ECO Decoding: Entropy-Based Control for Controllability and Fluency in Controllable Dialogue Generation. Seungmin Shin, Dooyoung Kim, Youngjoong Ko
2025	EGOILLUSION: Benchmarking Hallucinations in Egocentric Video Understanding. Ashish Seth, Utkarsh Tyagi, Ramaneswaran Selvakumar, Nishit Anand, Sonal Kumar, Sreyan Ghosh, Ramani Duraiswami, Chirag Agarwal, Dinesh Manocha
2025	EIFBENCH: Extremely Complex Instruction Following Benchmark for Large Language Models. Tao Zou, Xinghua Zhang, Haiyang Yu, Minzheng Wang, Fei Huang, Yongbin Li
2025	EMNLP: Educator-role Moral and Normative Large Language Models Profiling. Yilin Jiang, Mingzi Zhang, Sheng Jin, Zengyi Yu, Xiangjie Kong, Binghao Tu
2025	EMO: Embedding Model Distillation via Intra-Model Relation and Optimal Transport Alignments. Minh-Phuc Truong, Hai An Vu, Tu Vu, Nguyen Thi Ngoc Diep, Linh Van Ngo, Thien Huu Nguyen, Trung Le
2025	EQA-RM: A Generative Embodied Reward Model with Test-time Scaling. Yuhang Chen, Zhen Tan, Tianlong Chen
2025	ESC-Judge: A Framework for Comparing Emotional Support Conversational Agents. Navid Madani, Rohini K. Srihari
2025	ESGenius: Benchmarking LLMs on Environmental, Social, and Governance (ESG) and Sustainability Knowledge. Chaoyue He, Xin Zhou, Yi Wu, Xinjia Yu, Yan Zhang, Lei Zhang, Di Wang, Shengfei Lyu, Hong Xu, Xiaoqiao Wang, Wei Liu, Chunyan Miao
2025	Easy as PIE? Identifying Multi-Word Expressions with LLMs. Kai Golan Hashiloni, Ofri Hefetz, Kfir Bar
2025	EasyRec: Simple yet Effective Language Models for Recommendation. Xubin Ren, Chao Huang
2025	EcoLoRA: Communication-Efficient Federated Fine-Tuning of Large Language Models. Han Liu, Ruoyao Wen, Srijith Nair, Jia Liu, Wenjing Lou, Chongjie Zhang, William Yeoh, Yevgeniy Vorobeychik, Ning Zhang
2025	EcoTune: Token-Efficient Multi-Fidelity Hyperparameter Optimization for Large Language Model Inference. Yuebin Xu, Zhiyi Chen, Zeyi Wen
2025	Editing Across Languages: A Survey of Multilingual Knowledge Editing. Nadir Durrani, Basel Mousi, Fahim Dalvi
2025	EduAdapt: A Question Answer Benchmark Dataset for Evaluating Grade-Level Adaptability in LLMs. Numaan Naeem, Abdellah El Mekki, Muhammad Abdul-Mageed
2025	EduVidQA: Generating and Evaluating Long-form Answers to Student Questions based on Lecture Videos. Sourjyadip Ray, Shubham Sharma, Somak Aditya, Pawan Goyal
2025	Effective Red-Teaming of Policy-Adherent Agents. Itay Nakash, George Kour, Koren Lazar, Matan Vetzler, Guy Uziel, Ateret Anaby-Tavor
2025	Efficient Beam Search for Large Language Models Using Trie-Based Decoding. Brian J. Chan, Mao Xun Huang, Jui-Hung Cheng, Chao-Ting Chen, Hen-Hsen Huang
2025	Efficient Compositional Multi-tasking for On-device Large Language Models. Ondrej Bohdal, Mete Ozay, Jijoong Moon, Kyeng-Hun Lee, Hyeonmok Ko, Umberto Michieli
2025	Efficient Context Selection for Long-Context QA: No Tuning, No Iteration, Just Adaptive-k. Chihiro Taguchi, Seiji Maekawa, Nikita Bhutani
2025	Efficient Model Development through Fine-tuning Transfer. Pin-Jie Lin, Rishab Balasubramanian, Fengyuan Liu, Nikhil Kandpal, Tu Vu
2025	Efficient Real-time Refinement of Language Model Text Generation. Joonho Ko, Jinheon Baek, Sung Ju Hwang
2025	Efficient Unstructured Pruning of Mamba State-Space Models for Resource-Constrained Environments. Ibne Farabi Shihab, Sanjeda Akter, Anuj Sharma
2025	Eliciting Implicit Acoustic Styles from Open-domain Instructions to Facilitate Fine-grained Controllable Generation of Speech. Jianxing Yu, Zihao Gou, Chen Li, Zhisheng Wang, Peiji Yang, Wenqing Chen, Jian Yin
2025	Embedding Domain Knowledge for Large Language Models via Reinforcement Learning from Augmented Generation. Chaojun Nie, Jun Zhou, Guanxiang Wang, Shisong Wu, Zichen Wang
2025	Emergent morpho-phonological representations in self-supervised speech models. Jon Gauthier, Canaan Breiss, Matthew K. Leonard, Edward F. Chang
2025	EmoAgent: Assessing and Safeguarding Human-AI Interaction for Mental Health Safety. Jiahao Qiu, Yinghui He, Xinzhe Juan, Yimin Wang, Yuhan Liu, Zixin Yao, Yue Wu, Xun Jiang, Ling Yang, Mengdi Wang
2025	Emotion Transfer with Enhanced Prototype for Unseen Emotion Recognition in Conversation. Kun Peng, Cong Cao, Hao Peng, Guanlin Wu, Zhifeng Hao, Lei Jiang, Yanbing Liu, Philip S. Yu
2025	Empowering GraphRAG with Knowledge Filtering and Integration. Kai Guo, Harry Shomer, Shenglai Zeng, Haoyu Han, Yu Wang, Jiliang Tang
2025	Empowering Math Problem Generation and Reasoning for Large Language Model via Synthetic Data based Continual Learning Framework. Qian Wan, Wangzi Shi, Jintian Feng, Shengyingjie Liu, Luona Wei, Zhicheng Dai, Jianwen Sun
2025	EnAnchored-X2X: English-Anchored Optimization for Many-to-Many Translation. Sen Yang, Yu Bao, Yu Lu, Jiajun Chen, Shujian Huang, Shanbo Cheng
2025	End-to-End Learnable Psychiatric Scale Guided Risky Post Screening for Depression Detection on Social Media. Bichen Wang, Yuzhe Zi, Yixin Sun, Hao Yang, Yanyan Zhao, Bing Qin
2025	Enhanced Noun-Noun Compound Interpretation through Textual Enrichment. Bingyang Ye, Jingxuan Tu, James Pustejovsky
2025	Enhancing Chain-of-Thought Reasoning via Neuron Activation Differential Analysis. Yiru Tang, Kun Zhou, Yingqian Min, Wayne Xin Zhao, Jing Sha, Zhichao Sheng, Shijin Wang
2025	Enhancing Chinese Offensive Language Detection with Homophonic Perturbation. Junqi Wu, Shujie Ji, Kang Zhong, Huiling Peng, Zhendongxiao, Xiongding Liu, Wu Wei
2025	Enhancing Efficiency and Exploration in Reinforcement Learning for LLMs. Mengqi Liao, Xiangyu Xi, Ruinian Chen, Jia Leng, Yangen Hu, Ke Zeng, Shuai Liu, Huaiyu Wan
2025	Enhancing LLM Language Adaption through Cross-lingual In-Context Pre-training. Linjuan Wu, Haoran Wei, Huan Lin, Tianhao Li, Baosong Yang, Fei Huang, Weiming Lu
2025	Enhancing LLM Text Detection with Retrieved Contexts and Logits Distribution Consistency. Zhaoheng Huang, Yutao Zhu, Ji-Rong Wen, Zhicheng Dou
2025	Enhancing LLM-Based Social Bot via an Adversarial Learning Framework. Fanqi Kong, Xiaoyuan Zhang, Xinyu Chen, Yaodong Yang, Song-Chun Zhu, Xue Feng
2025	Enhancing Large Language Model for Knowledge Graph Completion via Structure-Aware Alignment-Tuning. Yu Liu, Yanan Cao, Xixun Lin, Yanmin Shang, Shi Wang, Shirui Pan
2025	Enhancing Large Vision-Language Models with Ultra-Detailed Image Caption Generation. Yu Zeng, Yukun Qi, Yiming Zhao, Xikun Bao, Lin Chen, Zehui Chen, Shiting Huang, Jie Zhao, Feng Zhao
2025	Enhancing Logical Reasoning in Language Models via Symbolically-Guided Monte Carlo Process Supervision. Xingwei Tan, Marco Valentino, Mahmud Elahi Akhter, Maria Liakata, Nikolaos Aletras
2025	Enhancing RLHF with Human Gaze Modeling. Karim Galliamov, Ivan Titov, Ilya Pershin
2025	Enhancing Reasoning Abilities of Small LLMs with Cognitive Alignment. Wenrui Cai, Chengyu Wang, Junbing Yan, Jun Huang, Xiangzhong Fang
2025	Enhancing Speech Large Language Models with Prompt-Aware Mixture of Audio Encoders. Weiqiao Shan, Yuang Li, Yuhao Zhang, Yingfeng Luo, Chen Xu, Xiaofeng Zhao, Long Meng, Yunfei Lu, Min Zhang, Hao Yang, Tong Xiao, Jingbo Zhu
2025	Enhancing Study-Level Inference from Clinical Trial Papers via Reinforcement Learning-Based Numeric Reasoning. Massimiliano Pronesti, Michela Lorandi, Paul Flanagan, Oisin Redmond, Anya Belz, Yufang Hou
2025	Enrich-on-Graph: Query-Graph Alignment for Complex Reasoning with LLM Enriching. Songze Li, Zhiqiang Liu, Zhengke Gui, Huajun Chen, Wen Zhang
2025	Ensembling Prompting Strategies for Zero-Shot Hierarchical Text Classification with Large Language Models. Mingxuan Xia, Zhijie Jiang, Haobo Wang, Junbo Zhao, Tianlei Hu, Gang Chen
2025	EquiBench: Benchmarking Large Language Models' Reasoning about Program Semantics via Equivalence Checking. Anjiang Wei, Jiannan Cao, Ran Li, Hongyu Chen, Yuhui Zhang, Ziheng Wang, Yuan Liu, Thiago S. F. X. Teixeira, Diyi Yang, Ke Wang, Alex Aiken
2025	Estimating LLM Consistency: A User Baseline vs Surrogate Metrics. Xiaoyuan Wu, Weiran Lin, Omer Akgul, Lujo Bauer
2025	EuroGEST: Investigating gender stereotypes in multilingual language models. Jacqueline Rowe, Mateusz Klimaszewski, Liane Guillou, Shannon Vallor, Alexandra Birch
2025	Evaluating Behavioral Alignment in Conflict Dialogue: A Multi-Dimensional Comparison of LLM Agents and Humans. Deuksin Kwon, Kaleen Shrestha, Bin Han, Elena Hayoung Lee, Gale M. Lucas
2025	Evaluating Cognitive-Behavioral Fixation via Multimodal User Viewing Patterns on Social Media. Yujie Wang, Yunwei Zhao, Jing Yang, Han Han, Shiguang Shan, Jie Zhang
2025	Evaluating LLM-Generated Diagrams as Graphs. Chumeng Liang, Jiaxuan You
2025	Evaluating Language Translation Models by Playing Telephone. Syeda Jannatus Saba, Steven Skiena
2025	Evaluating Large Language Models for Detecting Antisemitism. Jay Patel, Hrudayangam Mehta, Jeremy Blackburn
2025	Evaluating Robustness of Large Audio Language Models to Audio Injection: An Empirical Study. Guanyu Hou, Jiaming He, Yinhang Zhou, Ji Guo, Yitong Qiao, Rui Zhang, Wenbo Jiang
2025	Evaluating Spatiotemporal Consistency in Automatically Generated Sewing Instructions. Luisa Geiger, Mareike Hartmann, Michael Sullivan, Alexander Koller
2025	Evaluating Taxonomy Free Character Role Labeling (TF-CRL) in News Stories using Large Language Models. David G. Hobson, Derek Ruths, Andrew Piper
2025	Evaluating and Aligning Human Economic Risk Preferences in LLMs. Jiaxin Liu, Yixuan Tang, Yi Yang, Kar Yan Tam
2025	Evaluating the Effectiveness and Scalability of LLM-Based Data Augmentation for Retrieval. Pranjal A. Chitale, Bishal Santra, Yashoteja Prabhu, Amit Sharma
2025	Evaluating the Evaluators: Are readability metrics good measures of readability? Isabel Cachola, Daniel Khashabi, Mark Dredze
2025	Evaluation and Facilitation of Online Discussions in the LLM Era: A Survey. Katerina Korre, Dimitris Tsirmpas, Nikos Gkoumas, Emma Cabalé, Danai Myrtzani, Theodoros Evgeniou, Ion Androutsopoulos, John Pavlopoulos
2025	EverTracer: Hunting Stolen Large Language Models via Stealthy and Robust Probabilistic Fingerprint. Zhenhua Xu, Meng Han, Wenpeng Xing
2025	EvolveSearch: An Iterative Self-Evolving Search Agent. Dingchu Zhang, Yida Zhao, Jialong Wu, Liwen Zhang, Baixuan Li, Wenbiao Yin, Yong Jiang, Yu-Feng Li, Kewei Tu, Pengjun Xie, Fei Huang
2025	Evolving Chinese Spelling Correction with Corrector-Verifier Collaboration. Linfeng Liu, Hongqiu Wu, Hai Zhao
2025	Examining False Positives under Inference Scaling for Mathematical Reasoning. Yu Wang, Nan Yang, Liang Wang, Furu Wei, Fuli Feng
2025	ExeCoder: Empowering Large Language Models with Executability Representation for Code Translation. Minghua He, Yue Chen, Fangkai Yang, Pu Zhao, Wenjie Yin, Yu Kang, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang
2025	ExpandR: Teaching Dense Retrievers Beyond Queries with LLM Guidance. Sijia Yao, Pengcheng Huang, Zhenghao Liu, Yu Gu, Yukun Yan, Shi Yu, Ge Yu
2025	Expanding before Inferring: Enhancing Factuality in Large Language Models through Premature Layers Interpolation. Dingwei Chen, Ziqiang Liu, Feiteng Fang, Chak Tou Leong, Shiwen Ni, Ahmadreza Argha, Hamid Alinejad-Rokny, Min Yang, Chengming Li
2025	Expectation Preference Optimization: Reliable Preference Estimation for Improving the Reasoning Capability of Large Language Models. Zelin Li, Dawei Song
2025	Explainability and Interpretability of Multilingual Large Language Models: A Survey. Lucas Resck, Isabelle Augenstein, Anna Korhonen
2025	Explaining Differences Between Model Pairs in Natural Language through Sample Learning. Advaith Malladi, Rakesh R. Menon, Yuvraj Jain, Shashank Srivastava
2025	Explicit Learning and the LLM in Machine Translation. Malik Marmonier, Rachel Bawden, Benoît Sagot
2025	Exploring Artificial Image Generation for Stance Detection. Zhengkang Zhang, Zhongqing Wang, Guodong Zhou
2025	Exploring Chain-of-Thought Reasoning for Steerable Pluralistic Alignment. Yunfan Zhang, Kathleen McKeown, Smaranda Muresan
2025	Exploring Changes in Nation Perception with Nationality-Assigned Personas in LLMs. Mahammed Kamruzzaman, Gene Louis Kim
2025	Exploring Large Language Models for Detecting Mental Disorders. Gleb Kuzmin, Petr Strepetov, Maksim Stankevich, Natalya V. Chudova, Artem Shelmanov, Ivan V. Smirnov
2025	Exploring Quality and Diversity in Synthetic Data Generation for Argument Mining. Jianzhu Bao, Yuqi Huang, Yang Sun, Wenya Wang, Yice Zhang, Bojun Jin, Ruifeng Xu
2025	Exploring Response Uncertainty in MLLMs: An Empirical Evaluation under Misleading Scenarios. Yunkai Dang, Mengxi Gao, Yibo Yan, Xin Zou, Yanggan Gu, Jungang Li, Jingyu Wang, Peijie Jiang, Aiwei Liu, Jia Liu, Xuming Hu
2025	Exploring morphology-aware tokenization: A case study on Spanish language modeling. Alba Táboas García, Piotr Przybyla, Leo Wanner
2025	Exploring the Hidden Capacity of LLMs for One-Step Text Generation. Gleb Mezentsev, Ivan V. Oseledets
2025	Exploring the Impact of Personality Traits on LLM Bias and Toxicity. Shuo Wang, Renhao Li, Xi Chen, Yulin Yuan, Min Yang, Derek F. Wong
2025	Exploring the Limitations of Mamba in COPY and CoT Reasoning. Ruifeng Ren, Zhicong Li, Yong Liu
2025	Extending Automatic Machine Translation Evaluation to Book-Length Documents. Kuang-Da Wang, Shuoyang Ding, Chao-Han Huck Yang, Ping-Chun Hsieh, Wen-Chih Peng, Vitaly Lavrukhin, Boris Ginsburg
2025	Extracting Linguistic Information from Large Language Models: Syntactic Relations and Derivational Knowledge. Tsedeniya Kinfe Temesgen, Marion Di Marco, Alexander Fraser
2025	Extracting and Combining Abilities For Building Multi-lingual Ability-enhanced Large Language Models. Zhipeng Chen, Kun Zhou, Liang Song, Wayne Xin Zhao, Bingning Wang, Weipeng Chen, Ji-Rong Wen
2025	Extractive Fact Decomposition for Interpretable Natural Language Inference in one Forward Pass. Nicholas Popovic, Michael Färber
2025	F2TEval: Human-Aligned Multi-Dimensional Evaluation for Figure-to-Text Task. Tan Yue, Rui Mao, Zilong Song, Zonghai Hu, Dongyan Zhao
2025	FANS: Formal Answer Selection for LLM Natural Language Math Reasoning Using Lean4. Jiarui Yao, Ruida Wang, Tong Zhang
2025	FB-Bench: A Fine-Grained Multi-Task Benchmark for Evaluating LLMs' Responsiveness to Human Feedback. Youquan Li, Miao Zheng, Fan Yang, Guosheng Dong, Bin Cui, Weipeng Chen, Zenan Zhou, Wentao Zhang
2025	FIRE: Flexible Integration of Data Quality Ratings for Effective Pretraining. Liangyu Xu, Xuemiao Zhang, Feiyu Duan, Sirui Wang, Rongxiang Weng, Jingang Wang, Xunliang Cai
2025	FISTAPruner: Layer-wise Post-training Pruning for Large Language Models. Pengxiang Zhao, Hanyu Hu, Ping Li, Yi Zheng, Zhefeng Wang, Xiaoming Yuan
2025	FLARE: Faithful Logic-Aided Reasoning and Exploration. Erik Arakelyan, Pasquale Minervini, Patrick S. H. Lewis, Pat Verga, Isabelle Augenstein
2025	FLRC: Fine-grained Low-Rank Compressor for Efficient LLM Inference. Yu-Chen Lu, Chong-Yan Chen, Chi-Chih Chang, Yu-Fang Hu, Kai-Chiang Wu
2025	FLUID QA: A Multilingual Benchmark for Figurative Language Usage in Dialogue across English, Chinese, and Korean. Seoyoon Park, Hyeji Choi, Minseon Kim, Subin An, Xiaonan Wang, Gyuri Choi, Hansaem Kim
2025	FaST: Feature-aware Sampling and Tuning for Personalized Preference Alignment with Limited Data. Thibaut Thonet, Germán Kruszewski, Jos Rozen, Pierre Erbacher, Marc Dymetman
2025	FacLens: Transferable Probe for Foreseeing Non-Factuality in Fact-Seeking Question Answering of Large Language Models. Yanling Wang, Haoyang Li, Hao Zou, Jing Zhang, Xinlei He, Qi Li, Ke Xu
2025	Facilitating Cognitive Accessibility with LLMs: A Multi-Task Approach to Easy-to-Read Text Generation. François Ledoyen, Gaël Dias, Jérémie Pantin, Alexis Lechervy, Fabrice Maurel, Youssef Chahir
2025	Facilitating Long Context Understanding via Supervised Chain-of-Thought Reasoning. Jingyang Lin, Andy Wong, Tian Xia, Shenghua He, Hui Wei, Mei Han, Jiebo Luo
2025	Fair or Framed? Political Bias in News Articles Generated by LLMs. Junho Yoo, Youhyun Shin
2025	FairGen: Controlling Sensitive Attributes for Fair Generations in Diffusion Models via Adaptive Latent Guidance. Mintong Kang, Vinayshekhar Bannihatti Kumar, Shamik Roy, Abhishek Kumar, Sopan Khosla, Balakrishnan Narayanaswamy, Rashmi Gangadharaiah
2025	FaithUn: Toward Faithful Forgetting in Language Models by Investigating the Interconnectedness of Knowledge. Nakyeong Yang, Minsung Kim, Seunghyun Yoon, Joongbo Shin, Kyomin Jung
2025	Fann or Flop: A Multigenre, Multiera Benchmark for Arabic Poetry Understanding in LLMs. Wafa Al Ghallabi, Ritesh Thawkar, Sara Ghaboura, Ketan Pravin More, Omkar Thawakar, Hisham Cholakkal, Salman Khan, Rao Muhammad Anwer
2025	Faster In-Context Learning for LLMs via N-Gram Trie Speculative Decoding. Jinglin Chen, Qiwei Li, Zuchao Li, Baoyuan Qi, Guoming Liu, Haojun Ai, Hai Zhao, Ping Wang
2025	Feature Extraction and Steering for Enhanced Chain-of-Thought Reasoning in Language Models. Zihao Li, Xu Wang, Yuzhe Yang, Ziyu Yao, Haoyi Xiong, Mengnan Du
2025	FedMABench: Benchmarking Mobile GUI Agents on Decentralized Heterogeneous User Data. Wenhao Wang, Zijie Yu, Rui Ye, Jianqing Zhang, Guangyi Liu, Liang Liu, Siheng Chen, Yanfeng Wang
2025	Few-Shot Learning Translation from New Languages. Carlos Mullov, Alexander Waibel
2025	Few-Shot Open-Set Classification via Reasoning-Aware Decomposition. Avyav Kumar Singh, Helen Yannakoudakis
2025	FilBench: Can LLMs Understand and Generate Filipino? Lester James Validad Miranda, Elyanah Aco, Conner G. Manuel, Jan Christian Blaise Cruz, Joseph Marvin Imperial
2025	FillerSpeech: Towards Human-Like Text-to-Speech Synthesis with Filler Insertion and Filler Style Control. Seung-Bin Kim, Junhyeok Cha, Hyung-Seok Oh, Heejin Choi, Seong-Whan Lee
2025	FinMTEB: Finance Massive Text Embedding Benchmark. Yixuan Tang, Yi Yang
2025	FinRAGBench-V: A Benchmark for Multimodal RAG with Visual Citation in the Financial Domain. Suifeng Zhao, Zhuoran Jin, Sujian Li, Jun Gao
2025	FinTrust: A Comprehensive Benchmark of Trustworthiness Evaluation in Finance Domain. Tiansheng Hu, Tongyan Hu, Liuyang Bai, Yilun Zhao, Arman Cohan, Chen Zhao
2025	Financial Risk Relation Identification through Dual-view Adaptation. Wei-Ning Chiu, Yu-Hsiang Wang, Andy Hsiao, Yu-Shiang Huang, Chuan-Ju Wang
2025	Finding your MUSE: Mining Unexpected Solutions Engine. Nir Sweed, Hanit Hakim, Ben Wolfson, Hila Lifshitz, Dafna Shahaf
2025	Finetuning LLMs for Human Behavior Prediction in Social Science Experiments. Akaash Kolluri, Shengguang Wu, Joon Sung Park, Michael S. Bernstein
2025	Fingerprinting LLMs through Survey Item Factor Correlation: A Case Study on Humor Style Questionnaire. Simon Münker
2025	Firewall Routing: Blocking Leads to Better Hybrid Inference for LLMs. Runyu Peng, Yunhua Zhou, Kai Lv, Yang Gao, Qipeng Guo, Xipeng Qiu
2025	FlashAdventure: A Benchmark for GUI Agents Solving Full Story Arcs in Diverse Adventure Games. Jaewoo Ahn, Junseo Kim, Heeseung Yun, Jaehyeon Son, Dongmin Park, Jaewoong Cho, Gunhee Kim
2025	Flaw or Artifact? Rethinking Prompt Sensitivity in Evaluating LLMs. Andong Hua, Kenan Tang, Chenhe Gu, Jindong Gu, Eric Wong, Yao Qin
2025	Flexible-length Text Infilling for Discrete Diffusion Models. Andrew Zhang, Anushka Sivakumar, Chia-Wei Tang, Chris Thomas
2025	Flexibly Utilize Memory for Long-Term Conversation via a Fragment-then-Compose Framework. Cai Ke, Yiming Du, Bin Liang, Yifan Xiang, Lin Gui, Zhongyang Li, Baojun Wang, Yue Yu, Hui Wang, Kam-Fai Wong, Ruifeng Xu
2025	FlightGPT: Towards Generalizable and Interpretable UAV Vision-and-Language Navigation with Vision-Language Models. Hengxing Cai, Jinhan Dong, Jingjun Tan, Jingcheng Deng, Sihang Li, Zhifeng Gao, Haidong Wang, Zicheng Su, Agachai Sumalee, Renxin Zhong
2025	FoREST: Frame of Reference Evaluation in Spatial Reasoning Tasks. Tanawan Premsri, Parisa Kordjamshidi
2025	Follow the Flow: Fine-grained Flowchart Attribution with Neurosymbolic Agents. Manan Suri, Puneet Mathur, Nedim Lipka, Franck Dernoncourt, Ryan A. Rossi, Vivek Gupta, Dinesh Manocha
2025	Following Length Constraints in Instructions. Weizhe Yuan, Ilia Kulikov, Ping Yu, Kyunghyun Cho, Sainbayar Sukhbaatar, Jason E. Weston, Jing Xu
2025	Following the Autoregressive Nature of LLM Embeddings via Compression and Alignment. Jingcheng Deng, Zhongtao Jiang, Liang Pang, Zihao Wei, Liwei Chen, Kun Xu, Yang Song, Huawei Shen, Xueqi Cheng
2025	Fooling the LVLM Judges: Visual Biases in LVLM-Based Evaluation. Yerin Hwang, Dongryeol Lee, Kyungmin Min, Taegwan Kang, Yongil Kim, Kyomin Jung
2025	Foot-In-The-Door: A Multi-turn Jailbreak for LLMs. Zixuan Weng, Xiaolong Jin, Jinyuan Jia, Xiangyu Zhang
2025	Forget What You Know about LLMs Evaluations - LLMs are Like a Chameleon. Nurit Cohen-Inger, Yehonatan Elisha, Bracha Shapira, Lior Rokach, Seffi Cohen
2025	Formalizing Style in Personal Narratives. Gustave Cortal, Alain Finkel
2025	Frame First, Then Extract: A Frame-Semantic Reasoning Pipeline for Zero-Shot Relation Triplet Extraction. Zehan Li, Fu Zhang, Wenqing Zhang, Jiawei Li, Zhou Li, Jingwei Cheng, Tianyue Peng
2025	Frequency & Compositionality in Emergent Communication. Jean-Baptiste Sevestre, Emmanuel Dupoux
2025	Friend or Foe? A Computational Investigation of Semantic False Friends across Romance Languages. Ana Sabina Uban, Liviu P. Dinu, Ioan-Bogdan Iordache, Simona Georgescu, Claudia Vlad
2025	From A and B to A+B: Can Large Language Models Solve Compositional Math Problems? Xisheng Xiao, Hanlin Zhao
2025	From Automation to Autonomy: A Survey on Large Language Models in Scientific Discovery. Tianshi Zheng, Zheye Deng, Hong Ting Tsang, Weiqi Wang, Jiaxin Bai, Zihao Wang, Yangqiu Song
2025	From Capabilities to Performance: Evaluating Key Functional Properties of LLM Architectures in Penetration Testing. Lanxiao Huang, Daksh Dave, Tyler Cody, Peter A. Beling, Ming Jin
2025	From Charts to Fair Narratives: Uncovering and Mitigating Geo-Economic Biases in Chart-to-Text. Ridwan Mahbub, Mohammed Saidul Islam, Mir Tafseer Nayeem, Md. Tahmid Rahman Laskar, Mizanur Rahman, Shafiq Joty, Enamul Hoque
2025	From Chat Logs to Collective Insights: Aggregative Question Answering. Wentao Zhang, Woojeong Kim, Yuntian Deng
2025	From General Reward to Targeted Reward: Improving Open-ended Long-context Generation Models. Zhihan Guo, Jiele Wu, Wenqian Cui, Yifei Zhang, Minda Hu, Yufei Wang, Irwin King
2025	From Generation to Judgment: Opportunities and Challenges of LLM-as-a-judge. Dawei Li, Bohan Jiang, Liangjie Huang, Alimohammad Beigi, Chengshuai Zhao, Zhen Tan, Amrita Bhattacharjee, Yuxuan Jiang, Canyu Chen, Tianhao Wu, Kai Shu, Lu Cheng, Huan Liu
2025	From Input Perception to Predictive Insight: Modeling Model Blind Spots Before They Become Errors. Maggie Mi, Aline Villavicencio, Nafise Sadat Moosavi
2025	From Language to Cognition: How LLMs Outgrow the Human Language Network. Badr AlKhamissi, Greta Tuckute, Yingtian Tang, Taha Osama A Binhuraib, Antoine Bosselut, Martin Schrimpf
2025	From Long to Lean: Performance-aware and Adaptive Chain-of-Thought Compression via Multi-round Refinement. Jianzhi Yan, Le Liu, Youcheng Pan, Shiwei Chen, Zike Yuan, Yang Xiang, Buzhou Tang
2025	From Parameters to Performance: A Data-Driven Study on LLM Structure and Development. Suqing Wang, Zuchao Li, Luohe Shi, Bo Du, Hai Zhao, Yun Li, Qianren Wang
2025	From Personas to Talks: Revisiting the Impact of Personas on LLM-Synthesized Emotional Support Conversations. Shenghan Wu, Yimo Zhu, Wynne Hsu, Mong-Li Lee, Yang Deng
2025	From Problem-Solving to Teaching Problem-Solving: Aligning LLMs with Pedagogy using Reinforcement Learning. David Dinucu-Jianu, Jakub Macina, Nico Daheim, Ido Hakimi, Iryna Gurevych, Mrinmaya Sachan
2025	From Reasoning to Answer: Empirical, Attention-Based and Mechanistic Insights into Distilled DeepSeek R1 Models. Jue Zhang, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang
2025	From Schema to State: Zero-Shot Scheme-Only Dialogue State Tracking via Diverse Synthetic Dialogue and Step-by-Step Distillation. Huan Xu, Zequn Li, Wen Tang, Jian Jun Zhang
2025	From Scores to Steps: Diagnosing and Improving LLM Performance in Evidence-Based Medical Calculations. Benlu Wang, Iris Xia, Yifan Zhang, Junda Wang, Feiyun Ouyang, Shuo Han, Arman Cohan, Hong Yu, Zonghai Yao
2025	From Shortcuts to Balance: Attribution Analysis of Speech-Text Feature Utilization in Distinguishing Original from Machine-Translated Texts. Yongjian Chen, Antonio Toral
2025	From Surveys to Narratives: Rethinking Cultural Value Adaptation in LLMs. Muhammad Farid Adilazuarda, Chen Cecilia Liu, Iryna Gurevych, Alham Fikri Aji
2025	From Tens of Hours to Tens of Thousands: Scaling Back-Translation for Speech Recognition. Tianduo Wang, Lu Xu, Wei Lu, Shanbo Cheng
2025	From Unaligned to Aligned: Scaling Multilingual LLMs with Multi-Way Parallel Corpora. Yingli Shen, Wen Lai, Shuo Wang, Ge Gao, Kangyang Luo, Alexander Fraser, Maosong Sun
2025	From Understanding to Generation: An Efficient Shortcut for Evaluating Language Models. Viktor Hangya, Fabian Küch, Darina Gold
2025	From Word to World: Evaluate and Mitigate Culture Bias in LLMs via Word Association Test. Xunlian Dai, Li Zhou, Benyou Wang, Haizhou Li
2025	From perception to production: how acoustic invariance facilitates articulatory learning in a self-supervised vocal imitation model. Marvin Lavechin, Thomas Hueber
2025	FuseChat: Knowledge Fusion of Chat Models. Fanqi Wan, Longguang Zhong, Ziyi Yang, Ruijun Chen, Xiaojun Quan
2025	F²Bench: An Open-ended Fairness Evaluation Benchmark for LLMs with Factuality Considerations. Tian Lan, Jiang Li, Yemin Wang, Xu Liu, Xiangdong Su, Guanglai Gao
2025	G2: Guided Generation for Enhanced Output Diversity in LLMs. Zhiwen Ruan, Yixia Li, Yefeng Liu, Yun Chen, Weihua Luo, Peng Li, Yang Liu, Guanhua Chen
2025	GAP: a Global Adaptive Pruning Method for Large Language Models. Zhihua Ban, Haotian Ma, Siheng Zhang, Shengyu Liu, Xichen Chen, Ming Yang
2025	GATEAU: Selecting Influential Samples for Long Context Alignment. Shuzheng Si, Haozhe Zhao, Gang Chen, Yunshui Li, Kangyang Luo, Chuancheng Lv, Kaikai An, Fanchao Qi, Baobao Chang, Maosong Sun
2025	GCML: Gradient Coherence Guided Meta-Learning for Cross-Domain Emerging Topic Rumor Detection. Zejiang He, Jingyuan Huang, Menglong Lu, Zhen Huang, Shanshan Liu, Zhiliang Tian, Dong Sheng Li
2025	GER-LLM: Efficient and Effective Geospatial Entity Resolution with Large Language Model. Haojia Zhu, Zhicheng Li, Jiahui Jin
2025	GLIMPSE: Do Large Vision-Language Models Truly Think With Videos or Just Glimpse at Them? Yiyang Zhou, Linjie Li, Shi Qiu, Zhengyuan Yang, Yuyang Zhao, Siwei Han, Yangfan He, Kangqi Li, Haonian Ji, Zihao Zhao, Haibo Tong, Lijuan Wang, Huaxiu Yao
2025	GRADA: Graph-based Reranking against Adversarial Documents Attack. Jingjie Zheng, Aryo Pradipta Gema, Giwon Hong, Xuanli He, Pasquale Minervini, Youcheng Sun, Qiongkai Xu
2025	GRAID: Synthetic Data Generation with Geometric Constraints and Multi-Agentic Reflection for Harmful Content Detection. Melissa Kazemi Rad, Alberto Purpura, Himanshu Kumar, Emily Chen, Mohammad Shahed Sorower
2025	GRASP: Replace Redundant Layers with Adaptive Singular Parameters for Efficient Model Compression. Kainan Liu, Yong Zhang, Ning Cheng, Zhitao Li, Shaojun Wang, Jing Xiao
2025	GRIT: Guided Relational Integration for Efficient Multi-Table Understanding. Yujin Kang, Park Seong Woo, Yoon-Sik Cho
2025	GRPO-LEAD: A Difficulty-Aware Reinforcement Learning Approach for Concise Mathematical Reasoning in Language Models. Jixiao Zhang, Chunsheng Zuo
2025	GUI-Bee: Align GUI Action Grounding to Novel Environments via Autonomous Exploration. Yue Fan, Handong Zhao, Ruiyi Zhang, Yu Shen, Xin Eric Wang, Gang Wu
2025	Gamma-Guard: Lightweight Residual Adapters for Robust Guardrails in Large Language Models. Lijia Lv, Yuanshu Zhao, Guan Wang, Xuehai Tang, Jie Wen, Jizhong Han, Songlin Hu
2025	GenLink: Generation-Driven Schema-Linking via Multi-Model Learning for Text-to-SQL. Zhifeng Hao, Junqi Huang, Shaobin Shi, Ruichu Cai, Boyan Xu
2025	Generative Annotation for ASR Named Entity Correction. Yuanchang Luo, Daimeng Wei, Shaojun Li, Hengchao Shang, Jiaxin Guo, Zongyao Li, Zhanglin Wu, Xiaoyu Chen, Zhiqiang Rao, Jinlong Yang, Hao Yang
2025	Generative or Discriminative? Revisiting Text Classification in the Era of Transformers. Siva Rajesh Kasa, Karan Gupta, Sumegh Roychowdhury, Ashutosh Kumar, Yaswanth Biruduraju, Santhosh Kumar Kasa, Nikhil Priyatam Pattisapu, Arindam Bhattacharya, Shailendra Agarwal, Vijay Huddar
2025	Generator-Assistant Stepwise Rollback Framework for Large Language Model Agent. Xingzuo Li, Kehai Chen, Yunfei Long, Xuefeng Bai, Yong Xu, Min Zhang
2025	Genre Matters: How Text Types Interact with Decoding Strategies and Lexical Predictors in Shaping Reading Behavior. Lena Sophia Bolliger, Lena Ann Jäger
2025	GeoEdit: Geometric Knowledge Editing for Large Language Models. Yujie Feng, Li-Ming Zhan, Zexin Lu, Yongxin Xu, Xu Chu, Yasha Wang, Jiannong Cao, Philip S. Yu, Xiao-Ming Wu
2025	Glider: Global and Local Instruction-Driven Expert Router. Pingzhi Li, Prateek Yadav, Jaehong Yoon, Jie Peng, Yi-Lin Sung, Mohit Bansal, Tianlong Chen
2025	Good Intentions Beyond ACL: Who Does NLP for Social Good, and Where? Grace LeFevre, Qingcheng Zeng, Adam Leif, Jason Jewell, Denis Peskoff, Rob Voigt
2025	Governance in Motion: Co-evolution of Constitutions and AI models for Scalable Safety. Chenhao Huang, Ziyu Shen, Yicong Ren, Huiyuan Zheng, Jiazheng Zhang, Mingxu Chai, Ming Zhang, Shihan Dou, Fan Mo, Jie Shi, Tao Gui, Qi Zhang, Xuanjing Huang
2025	GraDaSE: Graph-Based Dataset Search with Examples. Jing He, Mingyang Lv, Qing Shi, Gong Cheng
2025	Graceful Forgetting in Generative Language Models. Chunyang Jiang, Chi-Min Chan, Yiyang Cai, Yulong Liu, Wei Xue, Yike Guo
2025	Graders Should Cheat: Privileged Information Enables Expert-Level Automated Evaluations. Jin Peng Zhou, Sébastien M. R. Arnold, Nan Ding, Kilian Q. Weinberger, Nan Hua, Fei Sha
2025	Gradient-Attention Guided Dual-Masking Synergetic Framework for Robust Text-based Person Retrieval. Tianlu Zheng, Yifan Zhang, Xiang An, Ziyong Feng, Kaicheng Yang, Qichuan Ding
2025	Grammar Pruning: Enabling Low-Latency Zero-Shot Task-Oriented Language Models for Edge AI. Octavian Alexandru Trifan, Jason Lee Weber, Marc Titus Trifan, Alexandru Nicolau, Alexander V. Veidenbaum
2025	Graph-Based Multi-Trait Essay Scoring. Shengjie Li, Vincent Ng
2025	Graph-Guided Textual Explanation Generation Framework. Shuzhou Yuan, Jingyi Sun, Ran Zhang, Michael Färber, Steffen Eger, Pepa Atanasova, Isabelle Augenstein
2025	Graph-R1: Incentivizing the Zero-Shot Graph Learning Capability in LLMs via Explicit Reasoning. Yicong Wu, Guangyue Lu, Yuan Zuo, Huarong Zhang, Junjie Wu
2025	GraphAgent: Agentic Graph Language Assistant. Yuhao Yang, Jiabin Tang, Lianghao Xia, Xingchen Zou, Yuxuan Liang, Chao Huang
2025	GraphKV: Breaking the Static Selection Paradigm with Graph-Based KV Cache Eviction. Xuelin Li, Xiangqi Jin, Linfeng Zhang
2025	Grounded Semantic Role Labelling from Synthetic Multimodal Data for Situated Robot Commands. Claudiu Daniel Hromei, Antonio Scaiella, Danilo Croce, Roberto Basili
2025	Grounding Multilingual Multimodal LLMs With Cultural Knowledge. Jean de Dieu Nyandwi, Yueqi Song, Simran Khanuja, Graham Neubig
2025	Group-Aware Reinforcement Learning for Output Diversity in Large Language Models. Oron Anschel, Alon Shoshan, Adam Botach, Shunit Haviv Hakimi, Asaf Gendler, Emanuel Ben Baruch, Nadav Bhonker, Igor Kviatkovsky, Manoj Aggarwal, Gérard G. Medioni
2025	Group-SAE: Efficient Training of Sparse Autoencoders for Large Language Models via Layer Groups. Davide Ghilardi, Federico Belotti, Marco Molinari, Tao Ma, Matteo Palmonari
2025	Grouping Entities with Shared Properties using Multi-Facet Prompting and Property Embeddings. Amit Gajbhiye, Thomas Bailleux, Zied Bouraoui, Luis Espinosa Anke, Steven Schockaert
2025	GuessingGame: Measuring the Informativeness of Open-Ended Questions in Large Language Models. Dylan Hutson, Daniel Vennemeyer, Aneesh Deshmukh, Justin Zhan, Tianyu Jiang
2025	HD-PiSSA: High-Rank Distributed Orthogonal Adaptation. Yiding Wang, Fanxu Meng, Xuefeng Zhang, Fan Jiang, Pingzhi Tang, Muhan Zhang
2025	HELENE: Hessian Layer-wise Clipping and Gradient Annealing for Accelerating Fine-tuning LLM with Zeroth-order Optimization. Huaqin Zhao, Jiaxi Li, Yi Pan, Shizhe Liang, Xiaofeng Yang, Fei Dou, Tianming Liu, Jin Lu
2025	HESEIA: A community-based dataset for evaluating social biases in large language models, co-designed in real school settings in Latin America. Guido Ivetta, Marcos J. Gomez, Sofía Martinelli, Pietro Palombini, Maria Emilia Echeveste, Nair Carolina Mazzeo, Beatriz Busaniche, Luciana Benotti
2025	HICode: Hierarchical Inductive Coding with LLMs. Mian Zhong, Pristina Wang, Anjalie Field
2025	HMoE: Heterogeneous Mixture of Experts for Language Modeling. An Wang, Xingwu Sun, Ruobing Xie, Shuaipeng Li, Jiaqi Zhu, Zhen Yang, Pinxue Zhao, Weidong Han, Zhanhui Kang, Di Wang, Naoaki Okazaki, Cheng-Zhong Xu
2025	HS-STaR: Hierarchical Sampling for Self-Taught Reasoners via Difficulty Estimation and Budget Reallocation. Feng Xiong, Hongling Xu, Yifei Wang, Runxi Cheng, Yong Wang, Xiangxiang Chu
2025	HVGuard: Utilizing Multimodal Large Language Models for Hateful Video Detection. Yiheng Jing, Mingming Zhang, Yong Zhuang, Jiacheng Guo, Juan Wang, Xiaoyang Xu, Wenzhe Yi, Keyan Guo, Hongxin Hu
2025	HYDRA: A Multi-Head Encoder-only Architecture for Hierarchical Text Classification. Fabian Karl, Ansgar Scherp
2025	Hallucination Detection in LLMs Using Spectral Features of Attention Maps. Jakub Binkowski, Denis Janiak, Albert Sawczyn, Bogdan Gabrys, Tomasz Kajdanowicz
2025	Hanfu-Bench: A Multimodal Benchmark on Cross-Temporal Cultural Understanding and Transcreation. Li Zhou, Lutong Yu, Dongchu Xie, Shaohuan Cheng, Wenyan Li, Haizhou Li
2025	Harmful Prompt Laundering: Jailbreaking LLMs with Abductive Styles and Symbolic Encoding. Seongho Joo, Hyukhun Koh, Kyomin Jung
2025	HealthCards: Exploring Text-to-Image Generation as Visual Aids for Healthcare Knowledge Democratizing and Education. Qian Wu, Zheyao Gao, Longfei Gou, Yifan Hou, Ann Sin Nga Lau, Qi Dou
2025	Hidden in Plain Sight: Reasoning in Underspecified and Misspecified Scenarios for Multimodal LLMs. Qianqi Yan, Hongquan Li, Shan Jiang, Yang Zhao, Xinze Guan, Ching-Chen Kuo, Xin Eric Wang
2025	Hierarchical Bracketing Encodings Work for Dependency Graphs. Ana Ezquerro, Carlos Gómez-Rodríguez, David Vilares
2025	HookMoE: A learnable performance compensation strategy of Mixture-of-Experts for LLM inference acceleration. Longkai Cheng, Along He, Mulin Li, Xueshuo Xie, Tao Li
2025	Hope vs. Hate: Understanding User Interactions with LGBTQ+ News Content in Mainstream US News Media through the Lens of Hope Speech. Jonathan Pofcher, Christopher M. Homan, Randall Sell, Ashiqur R. KhudaBukhsh
2025	How Do Large Vision-Language Models See Text in Image? Unveiling the Distinctive Role of OCR Heads. Ingeol Baek, Hwan Chang, Sunghyun Ryu, Hwanhee Lee
2025	How Do Social Bots Participate in Misinformation Spread? A Comprehensive Dataset and Analysis. Herun Wan, Minnan Luo, Zihan Ma, Guang Dai, Xiang Zhao
2025	How Does DPO Reduce Toxicity? A Mechanistic Neuron-Level Analysis. Yushi Yang, Filip Sondej, Harry Mayne, Andrew Lee, Adam Mahdi
2025	How Far Can LLMs Improve from Experience? Measuring Test-Time Learning Ability in LLMs with Human Comparison. Jiayin Wang, Zhiqiang Guo, Weizhi Ma, Min Zhang
2025	How Is LLM Reasoning Distracted by Irrelevant Context? An Analysis Using a Controlled Benchmark. Minglai Yang, Ethan Huang, Liang Zhang, Mihai Surdeanu, William Yang Wang, Liangming Pan
2025	How Much Do LLMs Hallucinate across Languages? On Realistic Multilingual Estimation of LLM Hallucination. Saad Obaid ul Islam, Anne Lauscher, Goran Glavas
2025	How Persuasive Is Your Context? Tu Nguyen, Kevin Du, Alexander Miserlis Hoyle, Ryan Cotterell
2025	How Private are Language Models in Abstractive Summarization? Anthony Hughes, Nikolaos Aletras, Ning Ma
2025	How Sememic Components Can Benefit Link Prediction for Lexico-Semantic Knowledge Graphs? Hansi Wang, Yue Wang, Qiliang Liang, Yang Liu
2025	How do Language Models Reshape Entity Alignment? A Survey of LM-Driven EA Methods: Advances, Benchmarks, and Future. Zerui Chen, Huiming Fan, Qianyu Wang, Tao He, Ming Liu, Heng Chang, Weijiang Yu, Ze Li, Bing Qin
2025	How do autoregressive transformers solve full addition? Wang Peixu, Chen Yu, Yu Ming, Cheng Xiang
2025	How to Make Large Language Models Generate 100% Valid Molecules? Wen Tao, Jing Tang, Alvin Chan, Bryan Hooi, Baolong Bi, Nanyun Peng, Yuansheng Liu, Yiwei Wang
2025	How to Protect Yourself from 5G Radiation? Investigating LLM Responses to Implicit Misinformation. Ruohao Guo, Wei Xu, Alan Ritter
2025	How to inject knowledge efficiently? Knowledge Infusion Scaling Law for Pre-training Large Language Models. Kangtao Lv, Haibin Chen, Yujin Yuan, Langming Liu, Shilei Liu, Yongwei Wang, Wenbo Su, Bo Zheng
2025	Humanizing Machines: Rethinking LLM Anthropomorphism Through a Multi-Level Framework of Design. Yunze Xiao, Lynnette Hui Xian Ng, Jiarui Liu, Mona T. Diab
2025	Humans Hallucinate Too: Language Models Identify and Correct Subjective Annotation Errors With Label-in-a-Haystack Prompts. Georgios Chochlakis, Peter Wu, Arjun Bedi, Marcus Ma, Kristina Lerman, Shrikanth Narayanan
2025	HydraOpt: Navigating the Efficiency-Performance Trade-off of Adapter Merging. Taha Ceritli, Ondrej Bohdal, Mete Ozay, Jijoong Moon, Kyeng-Hun Lee, Hyeonmok Ko, Umberto Michieli
2025	HydraRAG: Structured Cross-Source Enhanced Large Language Model Reasoning. Xingyu Tan, Xiaoyang Wang, Qing Liu, Xiwei Xu, Xin Yuan, Liming Zhu, Wenjie Zhang
2025	HypER: Literature-grounded Hypothesis Generation and Distillation with Provenance. Rosni Vasu, Chandrayee Basu, Bhavana Dalvi Mishra, Cristina Sarasua, Peter Clark, Abraham Bernstein
2025	HyperKGR: Knowledge Graph Reasoning in Hyperbolic Space with Graph Neural Network Encoding Symbolic Path. Lihui Liu
2025	ICG: Improving Cover Image Generation via MLLM-based Prompting and Personalized Preference Alignment. Zhipeng Bian, Jieming Zhu, Qijiong Liu, Wang Lin, Guohao Cai, Zhaocheng Du, Jiacheng Sun, Zhou Zhao, Zhenhua Dong
2025	ICL CIPHERS: Quantifying "Learning" in In-Context Learning via Substitution Ciphers. Zhouxiang Fang, Aayush Mishra, Muhan Gao, Anqi Liu, Daniel Khashabi
2025	ICR: Iterative Clarification and Rewriting for Conversational Search. Zhiyu Cao, Peifeng Li, Qiaoming Zhu
2025	IG-Pruning: Input-Guided Block Pruning for Large Language Models. Kangyu Qiao, Shaolei Zhang, Yang Feng
2025	IIET: Efficient Numerical Transformer via Implicit Iterative Euler Method. Xinyu Liu, Bei Li, Jiahao Liu, Junhao Ruan, Kechen Jiao, Hongyin Tang, Jingang Wang, Tong Xiao, Jingbo Zhu
2025	IL-PCSR: Legal Corpus for Prior Case and Statute Retrieval. Shounak Paul, Dhananjay Ghumare, Pawan Goyal, Saptarshi Ghosh, Ashutosh Modi
2025	IPIGuard: A Novel Tool Dependency Graph-Based Defense Against Indirect Prompt Injection in LLM Agents. Hengyu An, Jinghuai Zhang, Tianyu Du, Chunyi Zhou, Qingming Li, Tao Lin, Shouling Ji
2025	Icon Qiyuan Chen, Hongsen Huang, Qian Shao, Jiahe Chen, Jintai Chen, Hongxia Xu, Renjie Hua, Ren Chuan, Jian Wu
2025	Identification of Multiple Logical Interpretations in Counter-Arguments. Wenzhi Wang, Paul Reisert, Shoichi Naito, Naoya Inoue, Machi Shimmei, Surawat Pothong, Jungmin Choi, Kentaro Inui
2025	Identifying & Interactively Refining Ambiguous User Goals for Data Visualization Code Generation. Mert Inan, Anthony Sicilia, Alex Xie, Saujas Vaduguru, Daniel Fried, Malihe Alikhani
2025	Identifying Pre-training Data in LLMs: A Neuron Activation-Based Detection Framework. Hongyi Tang, Zhihao Zhu, Yi Yang
2025	Identifying Unlearned Data in LLMs via Membership Inference Attacks. Advit Deepak, Megan Mou, Jing Huang, Diyi Yang
2025	Identifying and Answering Questions with False Assumptions: An Interpretable Approach. Zijie Wang, Eduardo Blanco
2025	Idiosyncratic Versus Normative Modeling of Atypical Speech Recognition: Dysarthric Case Studies. Vishnu Raja, Adithya V. Ganesan, Anand Syamkumar, Ritwik Banerjee, H. Andrew Schwartz
2025	Igniting Creative Writing in Small Language Models: LLM-as-a-Judge versus Multi-Agent Refined Rewards. Xiaolong Wei, Bo Lu, Xingyu Zhang, Zhejun Zhao, Dongdong Shen, Long Xia, Dawei Yin
2025	Image Difference Captioning via Adversarial Preference Optimization. Zihan Huang, Junda Wu, Rohan Surana, Tong Yu, David Arbour, Ritwik Sinha, Julian J. McAuley
2025	Image Embedding Sampling Method for Diverse Captioning. Sania Waheed, Na Min An
2025	ImpliRet: Benchmarking the Implicit Fact Retrieval Challenge. Zeinab Sadat Taghavi, Ali Modarressi, Yunpu Ma, Hinrich Schütze
2025	Implicit Behavioral Alignment of Language Agents in High-Stakes Crowd Simulations. Yunzhe Wang, Gale M. Lucas, Burcin Becerik-Gerber, Volkan Ustun
2025	Implicit Values Embedded in How Humans and LLMs Complete Subjective Everyday Tasks. Arjun Arunasalam, Madison Pickering, Z. Berkay Celik, Blase Ur
2025	Improbable Bigrams Expose Vulnerabilities of Incomplete Tokens in Byte-Level Tokenizers. Eugene Jang, Kimin Lee, Jin-Woo Chung, Keuntae Park, Seungwon Shin
2025	Improve LLM-as-a-Judge Ability as a General Ability. Jiachen Yu, Shaoning Sun, Xiaohui Hu, Jiaxu Yan, Kaidong Yu, Xuelong Li
2025	Improving Chemical Understanding of LLMs via SMILES Parsing. Yunhui Jang, Jaehyung Kim, Sungsoo Ahn
2025	Improving Clustering with Positive Pairs Generated from LLM-Driven Labels. Xiaotong Zhang, Ying Li
2025	Improving Context Fidelity via Native Retrieval-Augmented Reasoning. Suyuchen Wang, Jinlin Wang, Xinyu Wang, Shiqi Li, Xiangru Tang, Sirui Hong, Xiao-Wen Chang, Chenglin Wu, Bang Liu
2025	Improving Cross Lingual Transfer by Pretraining with Active Forgetting. Divyanshu Aggarwal, Ashutosh Sathe, Sunayana Sitaram
2025	Improving Handshape Representations for Sign Language Processing: A Graph Neural Network Approach. Alessa Carbo, Eric T. Nalisnick
2025	Improving Informally Romanized Language Identification. Adrian Benton, Alexander Gutkin, Christo Kirov, Brian Roark
2025	Improving Instruct Models for Free: A Study on Partial Adaptation. Ozan Irsoy, Pengxiang Cheng, Jennifer L. Chen, Daniel Preotiuc-Pietro, Shiyue Zhang, Duccio Pappadopulo
2025	Improving Large Language Model Safety with Contrastive Representation Learning. Samuel Simko, Mrinmaya Sachan, Bernhard Schölkopf, Zhijing Jin
2025	Improving Large Language Models Function Calling and Interpretability via Guided-Structured Templates. Hy Dang, Tianyi Liu, Zhuofeng Wu, Jingfeng Yang, Haoming Jiang, Tao Yang, Pei Chen, Zhengyang Wang, Helen Wang, Huasheng Li, Bing Yin, Meng Jiang
2025	Improving Low-Resource Sequence Labeling with Knowledge Fusion and Contextual Label Explanations. Peichao Lai, Jiaxin Gan, Feiyang Ye, Wentao Zhang, Fangcheng Fu, Yilei Wang, Bin Cui
2025	Improving Multilingual Retrieval-Augmented Language Models through Dialectic Reasoning Argumentations. Leonardo Ranaldi, Federico Ranaldi, Fabio Massimo Zanzotto, Barry Haddow, Alexandra Birch
2025	Improving Neutral Point-of-View Generation with Data- and Parameter-Efficient RL. Jessica Hoffmann, Christiane Ahlheim, Zac Yu, Aria Walfrand, Jarvis Jin, Marie Tano, Ahmad Beirami, Erin MacMurray van Liemt, Nithum Thain, Hakim Sidahmed, Lucas Dixon
2025	Improving Online Job Advertisement Analysis via Compositional Entity Extraction. Kai Krüger, Johanna Binnewitt, Kathrin Ehmann, Stefan Winnige, Alan Akbik
2025	Improving Reasoning Capabilities in Small Models through Mixture-of-layers Distillation with Stepwise Attention on Key Information. Yao Chen, Jiawei Sheng, Wenyuan Zhang, Tingwen Liu
2025	Improving Rule-based Reasoning in LLMs using Neurosymbolic Representations. Varun Dhanraj, Chris Eliasmith
2025	Improving Task Diversity in Label Efficient Supervised Finetuning of LLMs. Abhinav Arabelly, Jagrut Nemade, Robert D. Nowak, Jifan Zhang
2025	Improving Zero-shot Sentence Decontextualisation with Content Selection and Planning. Zhenyun Deng, Yulong Chen, Andreas Vlachos
2025	Improving the Quality of Web-mined Parallel Corpora of Low-Resource Languages using Debiasing Heuristics. Aloka Fernando, Nisansa de Silva, Menan Velayuthan, Charitha Rathnayake, Surangika Ranathunga
2025	In Benchmarks We Trust ... Or Not? Ine Gevers, Victor De Marez, Jens Van Nooten, Jens Lemmens, Andriy Kosar, Ehsan Lotfi, Nikolay Banar, Pieter Fivez, Luna De Bruyne, Walter Daelemans
2025	In-Context Learning Boosts Speech Recognition via Human-like Adaptation to Speakers and Language Varieties. Nathan Roll, Calbert Graham, Yuka Tatsumi, Kim Tien Nguyen, Meghan Sumner, Dan Jurafsky
2025	InMind: Evaluating LLMs in Capturing and Applying Individual Human Reasoning Styles. Zizhen Li, Chuanhao Li, Yibin Wang, Qi Chen, Diping Song, Yukang Feng, Jianwen Sun, Jiaxin Ai, Fanrui Zhang, Mingzhu Sun, Kaipeng Zhang
2025	Inceptive Transformers: Enhancing Contextual Representations through Multi-Scale Feature Learning Across Domains and Languages. Asif Shahriar, Rifat Shahriyar, M. Saifur Rahman
2025	Incorporating Diverse Perspectives in Cultural Alignment: Survey of Evaluation Benchmarks Through A Three-Dimensional Framework. Meng-Chen Wu, Si-Chi Chin, Tess Wood, Ayush Goyal, Narayanan Sadagopan
2025	IndiGEC: Multilingual Grammar Error Correction for Low-Resource Indian Languages. Ujjwal Sharma, Pushpak Bhattacharyya
2025	IndoSafety: Culturally Grounded Safety for LLMs in Indonesian Languages. Muhammad Falensi Azmi, Muhammad Dehan Al Kautsar, Alfan Farizki Wicaksono, Fajri Koto
2025	Infini-gram mini: Exact n-gram Search at the Internet Scale with FM-Index. Hao Xu, Jiacheng Liu, Yejin Choi, Noah A. Smith, Hannaneh Hajishirzi
2025	InfiniBench: A Benchmark for Large Multi-Modal Models in Long-Form Movies and TV Shows. Kirolos Ataallah, Eslam Mohamed Bakr, Mahmoud Ahmed, Chenhui Gou, Khushbu Pahwa, Jian Ding, Mohamed Elhoseiny
2025	InfoGain-RAG: Boosting Retrieval-Augmented Generation through Document Information Gain-based Reranking and Filtering. Zihan Wang, Zihan Liang, Zhou Shao, Yufei Ma, Huangyu Dai, Ben Chen, Lingtao Mao, Chenyi Lei, Yuqing Ding, Han Li
2025	Information Integration in Large Language Models is Gated by Linguistic Structural Markers. Wei Liu, Nai Ding
2025	Instructing Large Language Models for Low-Resource Languages: A Systematic Study for Basque. Oscar Sainz, Naiara Pérez, Julen Etxaniz, Joseba Fernandez de Landa, Itziar Aldabe, Iker García-Ferrero, Aimar Zabala, Ekhi Azurmendi, German Rigau, Eneko Agirre, Mikel Artetxe, Aitor Soroa
2025	Integral Transformer: Denoising Attention, Not Too Much Not Too Little. Ivan Kobyzev, Abbas Ghaddar, Dingtao Hu, Boxing Chen
2025	IntentionFrame: A Semi-Structured, Multi-Aspect Framework for Fine-Grained Conversational Intention Understanding. Jinggui Liang, Dung Vo, Lizi Liao
2025	Inter-sentence Context Modeling and Structure-aware Representation Enhancement for Conversational Sentiment Quadruple Extraction. Yu Zhang, Zhaoman Zhong, Huihui Lv
2025	InterIDEAS: Philosophical Intertextuality via LLMs. Yue Yang, Yinzhi Xu, Chenghao Huang, JohnMichael Jurgensen, Han Hu, Hao Wang
2025	Interdisciplinary Research in Conversation: A Case Study in Computational Morphology for Language Documentation. Enora Rice, Katharina von der Wense, Alexis Palmer
2025	Internal Chain-of-Thought: Empirical Evidence for Layer-wise Subtask Scheduling in LLMs. Zhipeng Yang, Junzhuo Li, Siyu Xia, Xuming Hu
2025	Interpretability Analysis of Arithmetic In-Context Learning in Large Language Models. Gregory Polyakov, Christian Hepting, Carsten Eickhoff, Seyed Ali Bahrainian
2025	Interpretable Mnemonic Generation for Kanji Learning via Expectation-Maximization. Jaewook Lee, Alexander Scarlatos, Andrew Lan
2025	Interpretable Text Embeddings and Text Similarity Explanation: A Survey. Juri Opitz, Lucas Möller, Andrianos Michail, Sebastian Padó, Simon Clematide
2025	Interpretation Meets Safety: A Survey on Interpretation Methods and Tools for Improving LLM Safety. Seongmin Lee, Aeree Cho, Grace C. Kim, Shengyun Peng, Mansi Phute, Duen Horng Chau
2025	Intrinsic Test of Unlearning Using Parametric Knowledge Traces. Yihuai Hong, Lei Yu, Haiqin Yang, Shauli Ravfogel, Mor Geva
2025	Introducing Spotlight: A Novel Approach for Generating Captivating Key Information from Documents. Ankan Mullick, Sombit Bose, Rounak Saha, Ayan Kumar Bhowmick, Aditya Vempaty, Prasenjit Dey, Ravi Kokku, Pawan Goyal, Niloy Ganguly
2025	Investigating How Pre-training Data Leakage Affects Models' Reproduction and Detection Capabilities. Masahiro Kaneko, Timothy Baldwin
2025	Investigating Neurons and Heads in Transformer-based LLMs for Typographical Errors. Kohei Tsuji, Tatsuya Hiraoka, Yuchang Cheng, Eiji Aramaki, Tomoya Iwakura
2025	Investigating Pedagogical Teacher and Student LLM Agents: Genetic Adaptation Meets Retrieval-Augmented Generation Across Learning Styles. Debdeep Sanyal, Agniva Maiti, Umakanta Maharana, Dhruv Kumar, Ankur Mali, C. Lee Giles, Murari Mandal
2025	Investigating Value-Reasoning Reliability in Small Large Language Models. Xia Du, Shuhan Sun, Pengyuan Liu, Dong Yu
2025	Investigating the interaction of linguistic and mathematical reasoning in language models using multilingual number puzzles. Antara Raaghavi Bhattacharya, Isabel Papadimitriou, Kathryn Davidson, David Alvarez-Melis
2025	Invisible Entropy: Towards Safe and Efficient Low-Entropy LLM Watermarking. Tianle Gu, Zongqi Wang, Kexin Huang, Yuanqi Yao, Xiangliang Zhang, Yujiu Yang, Xiuying Chen
2025	Is Cognition Consistent with Perception? Assessing and Mitigating Multimodal Knowledge Conflicts in Document Understanding. Zirui Shao, Feiyu Gao, Zhaoqing Zhu, Chuwei Luo, Hangdi Xing, Zhi Yu, Qi Zheng, Ming Yan, Jiajun Bu
2025	Is the Top Still Spinning? Evaluating Subjectivity in Narrative Understanding. Melanie Subbiah, Akankshya Mishra, Grace Kim, Liyan Tang, Greg Durrett, Kathleen McKeown
2025	It's All About In-Context Learning! Teaching Extremely Low-Resource Languages to LLMs. Yue Li, Zhixue Zhao, Carolina Scarton
2025	Iterative Multilingual Spectral Attribute Erasure. Shun Shao, Yftah Ziser, Zheng Zhao, Yifu Qiu, Shay B. Cohen, Anna Korhonen
2025	Iterative Prompt Refinement for Safer Text-to-Image Generation. Jinwoo Jeon, JunHyeok Oh, Hayeong Lee, Byung-Jun Lee
2025	JI Jingyu Wei, Bo Liu, Tianjiao Wan, Baoyun Peng, Xingkong Ma, Mengmeng Guo
2025	JOLT-SQL: Joint Loss Tuning of Text-to-SQL with Confusion-aware Noisy Schema Sampling. Jinwang Song, Hongying Zan, Kunli Zhang, Lingling Mu, Yingjie Han, Haobo Hua, Min Peng
2025	JUDGEBERT: Assessing Legal Meaning Preservation Between Sentences. David Beauchemin, Michelle Albert-Rochette, Richard Khoury, Pierre-Luc Déziel
2025	JUREX-4E: Juridical Expert-Annotated Four-Element Knowledge Base for Legal Reasoning. Huanghai Liu, Quzhe Huang, Qingjing Chen, Yiran Hu, Jiayu Ma, Yun Liu, Weixing Shen, Yansong Feng
2025	Jailbreak LLMs through Internal Stance Manipulation. Shuangjie Fu, Du Su, Beining Huang, Fei Sun, Jingang Wang, Wei Chen, Huawei Shen, Xueqi Cheng
2025	Jailbreak-Tuning: Models Efficiently Learn Jailbreak Susceptibility. Brendan Murphy, Dillon Bowen, Shahrad Mohammadzadeh, Tom Tseng, Julius Broomfield, Adam Gleave, Kellin Pelrine
2025	Jigsaw-Puzzles: From Seeing to Understanding to Reasoning in Vision-Language Models. Zesen Lyu, Dandan Zhang, Wei Ye, Fangdi Li, Zhihang Jiang, Yao Yang
2025	Job Unfair: An Investigation of Gender and Occupational Bias in Free-Form Text Completions by LLMs. Camilla Casula, Sebastiano Vecellio Salto, Elisa Leonardelli, Sara Tonelli
2025	Joint Modeling of Entities and Discourse Relations for Coherence Assessment. Wei Liu, Michael Strube
2025	Journalism-Guided Agentic In-context Learning for News Stance Detection. Dahyun Lee, Jonghyeon Choi, Jiyoung Han, Kunwoo Park
2025	Judge and Improve: Towards a Better Reasoning of Knowledge Graphs with Large Language Models. Mo Zhiqiang, Yang Hua, Jiahui Li, Yuan Liu, Shawn Wong, Jianmin Huang
2025	Judging Quality Across Languages: A Multilingual Approach to Pretraining Data Filtering with Language Models. Mehdi Ali, Manuel Brack, Max Lübbering, Elias Wendt, Abbas Goher Khan, Richard Rutmann, Alex Jude, Maurice Kraus, Alexander Arno Weber, Felix Stollenwerk, David Kaczér, Florian Mai, Lucie Flek, Rafet Sifa, Nicolas Flores-Herr, Joachim Köhler, Patrick Schramowski, Michael Fromm, Kristian Kersting
2025	KCS: Diversify Multi-hop Question Generation with Knowledge Composition Sampling. Yangfan Wang, Jie Liu, Chen Tang, Lian Yan, Jingchi Jiang
2025	KG-CQR: Leveraging Structured Relation Representations in Knowledge Graphs for Contextual Query Retrieval. Chi Minh Bui, Ngoc Mai Thieu, Van Vinh Nguyen, Jason J. Jung, Khac-Hoai Nam Bui
2025	KG-RAG: Enhancing GUI Agent Decision-Making via Knowledge Graph-Driven Retrieval-Augmented Generation. Ziyi Guan, Jason Chun Lok Li, Zhijian Hou, Pingping Zhang, Donglai Xu, Yuzhi Zhao, Mengyang Wu, Jinpeng Chen, Thanh-Toan Nguyen, Pengfei Xian, Wenao Ma, Shengchao Qin, Graziano Chesi, Ngai Wong
2025	KGE Calibrator: An Efficient Probability Calibration Method of Knowledge Graph Embedding Models for Trustworthy Link Prediction. Yang Yang, Mohan Timilsina, Edward Curry
2025	KLAAD: Refining Attention Mechanisms to Reduce Societal Bias in Generative Language Models. Seorin Kim, Dongyoung Lee, Jaejin Lee
2025	KRETA: A Benchmark for Korean Reading and Reasoning in Text-Rich VQA Attuned to Diverse Visual Contexts. Taebaek Hwang, Minseo Kim, Gisang Lee, Seonuk Kim, Hyunjun Eun
2025	Keep Security! Benchmarking Security Policy Preservation in Large Language Model Contexts Against Indirect Attacks in Question Answering. Hwan Chang, Yumin Kim, Yonghyun Jun, Hwanhee Lee
2025	Knowledge Editing through Chain-of-Thought. Changyue Wang, Weihang Su, Qingyao Ai, Yichen Tang, Yiqun Liu
2025	Knowledge-Aware Co-Reasoning for Multidisciplinary Collaboration. Xurui Li, Wanghaijiao, Kaisong Song, Rui Zhu, Haixu Tang
2025	KoBLEX: Open Legal Question Answering with Multi-hop Reasoning. Jihyung Lee, Daehui Kim, Seonjeong Hwang, Hyounghun Kim, Gary Lee
2025	Koel-TTS: Enhancing LLM based Speech Generation with Preference Alignment and Classifier Free Guidance. Shehzeen Samarah Hussain, Paarth Neekhara, Xuesong Yang, Edresson Casanova, Subhankar Ghosh, Roy Fejgin, Mikyas T. Desta, Rafael Valle, Jason Li
2025	LASER: An LLM-based ASR Scoring and Evaluation Rubric. Amruta Parulekar, Preethi Jyothi
2025	LATTE: Learning to Think with Vision Specialists. Zixian Ma, Jianguo Zhang, Zhiwei Liu, Jieyu Zhang, Juntao Tan, Manli Shu, Juan Carlos Niebles, Shelby Heinecke, Huan Wang, Caiming Xiong, Ranjay Krishna, Silvio Savarese
2025	LCES: Zero-shot Automated Essay Scoring via Pairwise Comparisons Using Large Language Models. Takumi Shibata, Yuichi Miyamura
2025	LEO-MINI: An Efficient Multimodal Large Language Model using Conditional Token Reduction and Mixture of Multi-Modal Experts. Yimu Wang, Mozhgan Nasr Azadani, Sean Sedwards, Krzysztof Czarnecki
2025	LGA: LLM-GNN Aggregation for Temporal Evolution Attribute Graph Prediction. Feng Zhao, Ruoyu Chai, Kangzheng Liu, Xianggan Liu
2025	LIDDIA: Language-based Intelligent Drug Discovery Agent. Reza Averly, Frazier N. Baker, Ian A. Watson, Xia Ning
2025	LILaC: Late Interacting in Layered Component Graph for Open-domain Multimodal Multihop Retrieval. Joohyung Yun, Doyup Lee, Wook-Shin Han
2025	LLM Bias Detection and Mitigation through the Lens of Desired Distributions. Ingroj Shrestha, Padmini Srinivasan
2025	LLM-Driven Completeness and Consistency Evaluation for Cultural Heritage Data Augmentation in Cross-Modal Retrieval. Jian Zhang, Junyi Guo, Junyi Yuan, Huanda Lu, Yanlin Zhou, Fangyu Wu, Qiufeng Wang, Dongming Lu
2025	LLM-Driven Implicit Target Augmentation and Fine-Grained Contextual Modeling for Zero-Shot and Few-Shot Stance Detection. Yanxu Ji, Jinzhong Ning, Yi-Jia Zhang, Zhi Liu, Hongfei Lin
2025	LLM-Guided Co-Training for Text Classification. Md Mezbaur Rahman, Cornelia Caragea
2025	LLM-Guided Semantic Relational Reasoning for Multimodal Intent Recognition. Qianrui Zhou, Hua Xu, Yifan Wang, Xinzhi Dong, Hanlei Zhang
2025	LLM-Independent Adaptive RAG: Let the Question Speak for Itself. Maria Marina, Nikolay Ivanov, Sergey Pletenev, Mikhail Salnikov, Daria Galimzianova, Nikita Krayko, Vasily Konovalov, Alexander Panchenko, Viktor Moskvoretskii
2025	LLM-OREF: An Open Relation Extraction Framework Based on Large Language Models. Hongyao Tu, Liang Zhang, Yujie Lin, Xin Lin, Haibo Zhang, Long Zhang, Jinsong Su
2025	LLMs Behind the Scenes: Enabling Narrative Scene Illustration. Melissa Roemmele, John Joon Young Chung, Taewook Kim, Yuqian Sun, Alex Calderwood, Max Kreminski
2025	LLMs Don't Know Their Own Decision Boundaries: The Unreliability of Self-Generated Counterfactual Explanations. Harry Mayne, Ryan Othniel Kearns, Yushi Yang, Andrew M. Bean, Eoin D. Delaney, Chris Russell, Adam Mahdi
2025	LLMs are Better Than You Think: Label-Guided In-Context Learning for Named Entity Recognition. Fan Bai, Hamid Hassanzadeh, Ardavan Saeedi, Mark Dredze
2025	LLMs as World Models: Data-Driven and Human-Centered Pre-Event Simulation for Disaster Impact Assessment. Lingyao Li, Dawei Li, Zhenhui Ou, Xiaoran Xu, Jingxiao Liu, Zihui Ma, Runlong Yu, Min Deng
2025	LLMs cannot spot math errors, even when allowed to peek into the solution. KV Aditya Srivatsa, Kaushal Kumar Maurya, Ekaterina Kochmar
2025	LLaMP: Large Language Model Made Powerful for High-fidelity Materials Knowledge Retrieval. Yuan Chiang, Elvis Hsieh, Chia-Hong Chou, Janosh Riebesell
2025	LM-Searcher: Cross-domain Neural Architecture Search with LLMs via Unified Numerical Encoding. Yuxuan Hu, Jihao Liu, Ke Wang, Jinliang Zheng, Weikang Shi, Manyuan Zhang, Qi Dou, Rui Liu, Aojun Zhou, Hongsheng Li
2025	LMR-BENCH: Evaluating LLM Agent's Ability on Reproducing Language Modeling Research. Shuo Yan, Ruochen Li, Ziming Luo, Zimu Wang, Daoyang Li, Liqiang Jing, Kaiyu He, Peilin Wu, Juntong Ni, George Michalopoulos, Yue Zhang, Ziyang Zhang, Mian Zhang, Zhiyu Chen, Xinya Du
2025	LORAXBENCH: A Multitask, Multilingual Benchmark Suite for 20 Indonesian Languages. Alham Fikri Aji, Trevor Cohn
2025	LVLMs are Bad at Overhearing Human Referential Communication. Zhengxiang Wang, Weiling Li, Panagiotis Kaliosis, Owen Rambow, Susan Brennan
2025	LaMDAgent: An Autonomous Framework for Post-Training Pipeline Optimization via LLM Agents. Taro Yano, Yoichi Ishibashi, Masafumi Oyamada
2025	LaMP-QA: A Benchmark for Personalized Long-form Question Answering. Alireza Salemi, Hamed Zamani
2025	Label Set Optimization via Activation Distribution Kurtosis for Zero-Shot Classification with Generative Models. Yue Li, Zhixue Zhao, Carolina Scarton
2025	Language Mixing in Reasoning Language Models: Patterns, Impact, and Internal Causes. Mingyang Wang, Lukas Lange, Heike Adel, Yunpu Ma, Jannik Strötgen, Hinrich Schütze
2025	Language Model Based Text-to-Audio Generation: Anti-Causally Aligned Collaborative Residual Transformers. Juncheng Wang, Chao Xu, Cheng Yu, Zhe Hu, Haoyu Xie, Guoqi Yu, Lei Shang, Shujun Wang
2025	Language Models Can be Efficiently Steered via Minimal Embedding Layer Transformations. Diogo Tavares, David Semedo, Alexander Rudnicky, João Magalhães
2025	Language Models Identify Ambiguities and Exploit Loopholes. Jio Choi, Mohit Bansal, Elias Stengel-Eskin
2025	Language Models as Causal Effect Generators. Lucius E. J. Bynum, Kyunghyun Cho
2025	Language Models as Continuous Self-Evolving Data Engineers. Peidong Wang, Ming Wang, Zhiming Ma, Xiaocui Yang, Shi Feng, Daling Wang, Yifei Zhang, Kaisong Song
2025	Language models can learn implicit multi-hop reasoning, but only if they have lots of training data. Yuekun Yao, Yupei Du, Dawei Zhu, Michael Hahn, Alexander Koller
2025	Language-Guided Temporal Token Pruning for Efficient VideoLLM Processing. Yogesh Kumar
2025	Language-to-Space Programming for Training-Free 3D Visual Grounding. Boyu Mi, Hanqing Wang, Tai Wang, Yilun Chen, Jiangmiao Pang
2025	Languages Still Left Behind: Toward a Better Multilingual Machine Translation Benchmark. Chihiro Taguchi, Seng Mai, Keita Kurabe, Yusuke Sakai, Georgina Agyei, Soudabeh Eslami, David Chiang
2025	Large Language Models Badly Generalize across Option Length, Problem Types, and Irrelevant Noun Replacements. Guangxiang Zhao, Saier Hu, Xiaoqi Jian, Jinzhu Wu, Yuhan Wu, Lin Sun, Xiangzheng Zhang
2025	Large Language Models Discriminate Against Speakers of German Dialects. Minh Duc Bui, Carolin Holtermann, Valentin Hofmann, Anne Lauscher, Katharina von der Wense
2025	Large Language Models Do Multi-Label Classification Differently. Marcus Ma, Georgios Chochlakis, Niyantha Maruthu Pandiyan, Jesse Thomason, Shrikanth Narayanan
2025	Large Language Models Have Intrinsic Meta-Cognition, but Need a Good Lens. Ziyang Ma, Qingyue Yuan, Zhenglin Wang, Deyu Zhou
2025	Large Language Models Meet Knowledge Graphs for Question Answering: Synthesis and Opportunities. Chuangtao Ma, Yongrui Chen, Tianxing Wu, Arijit Khan, Haofen Wang
2025	Large Language Models Threaten Language's Epistemic and Communicative Foundations. Shashank Srivastava
2025	Large Language Models as Realistic Microservice Trace Generators. Donghyun Kim, Sriram Ravula, Taemin Ha, Alex Dimakis, Daehyeok Kim, Aditya Akella
2025	Large Language Models for Automated Literature Review: An Evaluation of Reference Generation, Abstract Writing, and Review Composition. Xuemei Tang, Xufeng Duan, Zhenguang G. Cai
2025	Latent Inter-User Difference Modeling for LLM Personalization. Yilun Qiu, Tianhao Shi, Xiaoyan Zhao, Fengbin Zhu, Yang Zhang, Fuli Feng
2025	Layer-Aware Representation Filtering: Purifying Finetuning Data to Preserve LLM Safety Alignment. Hao Li, Lijun Li, Zhenghao Lu, Xianyi Wei, Rui Li, Jing Shao, Lei Sha
2025	Layer-wise Minimal Pair Probing Reveals Contextual Grammatical-Conceptual Hierarchy in Speech Representations. Linyang He, Qiaolin Wang, Xilin Jiang, Nima Mesgarani
2025	Layered Insights: Generalizable Analysis of Human Authorial Style by Leveraging All Transformer Layers. Milad Alshomary, Nikhil Reddy Varimalla, Vishal Anand, Smaranda Muresan, Kathleen McKeown
2025	LeTS: Learning to Think-and-Search via Process-and-Outcome Reward Hybridization. Qi Zhang, Shouqing Yang, Lirong Gao, Hao Chen, Xiaomeng Hu, Jinglei Chen, Jiexiang Wang, Sheng Guo, Bo Zheng, Haobo Wang, Junbo Zhao
2025	Leaky Thoughts: Large Reasoning Models Are Not Private Thinkers. Tommaso Green, Martin Gubri, Haritz Puerto, Sangdoo Yun, Seong Joon Oh
2025	LeanK: Learnable K Cache Channel Pruning for Efficient Decoding. Yike Zhang, Zhiyuan He, Huiqiang Jiang, Chengruidong Zhang, Yuqing Yang, Jianyong Wang, Lili Qiu
2025	Learn and Unlearn: Addressing Misinformation in Multilingual LLMs. Taiming Lu, Philipp Koehn
2025	Learning Contextual Retrieval for Robust Conversational Search. Seunghan Yang, Juntae Lee, Jihwan Bang, Kyuhong Shim, Minsoo Kim, Simyung Chang
2025	Learning Like Humans: Advancing LLM Reasoning Capabilities via Adaptive Difficulty Curriculum Learning and Expert-Guided Self-Reformulation. Enci Zhang, Xingang Yan, Wei Lin, Tianxiang Zhang, Qianchun Lu
2025	Learning Subjective Label Distributions via Sociocultural Descriptors. Mohammed Fayiz Parappan, Ricardo Henao
2025	Learning from Diverse Reasoning Paths with Routing and Collaboration. Zhenyu Lei, Zhen Tan, Song Wang, Yaochen Zhu, Zihan Chen, Yushun Dong, Jundong Li
2025	Learning from Few Samples: A Novel Approach for High-Quality Malcode Generation. Haijian Ma, Daizong Liu, Xiaowen Cai, Pan Zhou, Yulai Xie
2025	Learning to Ask: When LLM Agents Meet Unclear Instruction. Wenxuan Wang, Juluan Shi, Zixuan Ling, Yuk-Kit Chan, Chaozheng Wang, Cheryl Lee, Youliang Yuan, Jen-tse Huang, Wenxiang Jiao, Michael R. Lyu
2025	Learning to See through Sound: From VggCaps to Multi2Cap for Richer Automated Audio Captioning. Sangyeon Cho, Mingi Kim, Jinkwon Hwang, Jaehoon Go, Minuk Ma, Sunjae Yoon, Junyeong Kim
2025	Legal Fact Prediction: The Missing Piece in Legal Judgment Prediction. Junkai Liu, Yujie Tong, Hui Huang, Bowen Zheng, Yiran Hu, Peicheng Wu, Chuan Xiao, Makoto Onizuka, Muyun Yang, Shuyuan Zheng
2025	LegalSearchLM: Rethinking Legal Case Retrieval as Legal Elements Generation. Chaeeun Kim, Jinu Lee, Wonseok Hwang
2025	Lemmatization as a Classification Task: Results from Arabic across Multiple Genres. Mostafa Saeed, Nizar Habash
2025	Lemmatization of Polish Multi-word Expressions. Magdalena Król, Aleksander Smywinski-Pohl, Zbigniew Kaleta, Pawel Lewkowicz
2025	Less Is More? Examining Fairness in Pruned Large Language Models for Summarising Opinions. Nannan Huang, Haytham M. Fayek, Xiuzhen Zhang
2025	Less Is MuRE: Revisiting Shallow Knowledge Graph Embeddings. Victor Charpenay, Steven Schockaert
2025	Less is More: The Effectiveness of Compact Typological Language Representations. York Hay Ng, Phuong Hanh Hoang, En-Shiun Annie Lee
2025	Let's Play Across Cultures: A Large Multilingual, Multicultural Benchmark for Assessing Language Models' Understanding of Sports. Punit Kumar Singh, Nishant Kumar, Akash Ghosh, Kunal Pasad, Khushi Soni, Manisha Jaishwal, Sriparna Saha, Syukron Abu Ishaq Alfarozi, Asres Temam Abagissa, Kitsuchart Pasupa, Haiqin Yang, José G. Moreno
2025	Let's Reason Formally: Natural-Formal Hybrid Reasoning Enhances LLM's Math Capability. Ruida Wang, Yuxin Li, Yi R. Fung, Tong Zhang
2025	Leveraging Cognitive Complexity of Texts for Contextualization in Dense Retrieval. Effrosyni Sokli, Georgios Peikos, Pranav Kasela, Gabriella Pasi
2025	Leveraging Knowledge Graph-Enhanced LLMs for Context-Aware Medical Consultation. Su-Hyeong Park, Ho-Beom Kim, Seong-Jin Park, Dinara Aliyeva, Kang-Min Kim
2025	Leveraging Large Models to Evaluate Novel Content: A Case Study on Advertisement Creativity. Zhaoyi Joey Hou, Adriana Kovashka, Xiang Lorraine Li
2025	Leveraging Loanword Constraints for Improving Machine Translation in a Low-Resource Multilingual Context. Felermino D. M. A. Ali, Henrique Lopes Cardoso, Rui Sousa-Silva
2025	Leveraging Multilingual Training for Authorship Representation: Enhancing Generalization across Languages and Domains. Junghwan Kim, Haotian Zhang, David Jurgens
2025	Leveraging Semantic Triples for Private Document Generation with Local Differential Privacy Guarantees. Stephen Meisenbacher, Maulik Chevli, Florian Matthes
2025	Leveraging Text-to-Text Transformers as Classifier Chain for Few-Shot Multi-Label Classification. Quang Anh Nguyen, Nadi Tomeh, Mustapha Lebbah, Thierry Charnois, Hanane Azzag
2025	Leveraging What's Overfixed: Post-Correction via LLM Grammatical Error Overcorrection. Taehee Park, Heejin Do, Gary Lee
2025	LiTEx: A Linguistic Taxonomy of Explanations for Understanding Within-Label Variation in Natural Language Inference. Pingjun Hong, Beiduo Chen, Siyao Peng, Marie-Catherine de Marneffe, Barbara Plank
2025	LiTransProQA: An LLM-based Literary Translation Evaluation Metric with Professional Question Answering. Ran Zhang, Wei Zhao, Lieve Macken, Steffen Eger
2025	Liaozhai through the Looking-Glass: On Paratextual Explicitation of Culture-Bound Terms in Machine Translation. Sherrie Shen, Weixuan Wang, Alexandra Birch
2025	LightThinker: Thinking Step-by-Step Compression. Jintian Zhang, Yuqi Zhu, Mengshu Sun, Yujie Luo, Shuofei Qiao, Lun Du, Da Zheng, Huajun Chen, Ningyu Zhang
2025	LimRank: Less is More for Reasoning-Intensive Information Reranking. Tingyu Song, Yilun Zhao, Siyue Zhang, Chen Zhao, Arman Cohan
2025	Linear-Time Demonstration Selection for In-Context Learning via Gradient Estimation. Ziniu Zhang, Zhenshuo Zhang, Dongyue Li, Lu Wang, Jennifer G. Dy, Hongyang R. Zhang
2025	LingGym: How Far Are LLMs from Thinking Like Field Linguists? Changbing Yang, Franklin Ma, Freda Shi, Jian Zhu
2025	LinguaLens: Towards Interpreting Linguistic Mechanisms of Large Language Models via Sparse Auto-Encoder. Yi Jing, Zijun Yao, Hongzhu Guo, Lingxu Ran, Xiaozhi Wang, Lei Hou, Juanzi Li
2025	Linguistic Neuron Overlap Patterns to Facilitate Cross-lingual Transfer on Low-resource Languages. Yuemei Xu, Kexin Xu, Jian Zhou, Ling Hu, Lin Gui
2025	Linguistic and Embedding-Based Profiling of Texts Generated by Humans and Large Language Models. Sergio E. Zanotto, Segun Aroyehun
2025	LinkAlign: Scalable Schema Linking for Real-World Large-Scale Multi-Database Text-to-SQL. Yihan Wang, Peiyu Liu, Xin Yang
2025	LiteASR: Efficient Automatic Speech Recognition with Low-Rank Approximation. Keisuke Kamahori, Jungo Kasai, Noriyuki Kojima, Baris Kasikci
2025	LiteraryQA: Towards Effective Evaluation of Long-document Narrative QA. Tommaso Bonomo, Luca Gioffré, Roberto Navigli
2025	LoCt-Instruct: An Automatic Pipeline for Constructing Datasets of Logical Continuous Instructions. Hongyu Sun, Yusuke Sakai, Haruki Sakajo, Shintaro Ozaki, Kazuki Hayashi, Hidetaka Kamigaito, Taro Watanabe
2025	LoRACoE: Improving Large Language Model via Composition-based LoRA Expert. Guanyu Li, Zhiheng Xi, Zhihao Zhang, Boyang Hong, Tao Gui, Qi Zhang, Xuanjing Huang
2025	LoSiA: Efficient High-Rank Fine-Tuning via Subnet Localization and Optimization. Xujia Wang, Yunjia Qi, Bin Xu
2025	LogiCoL: Logically-Informed Contrastive Learning for Set-based Dense Retrieval. Yanzhen Shen, Sihao Chen, Xueqiang Xu, Yunyi Zhang, Chaitanya Malaviya, Dan Roth
2025	LogiDynamics: Unraveling the Dynamics of Inductive, Abductive and Deductive Logical Inferences in LLM Reasoning. Tianshi Zheng, Cheng Jiayang, Chunyang Li, Haochen Shi, Zihao Wang, Jiaxin Bai, Yangqiu Song, Ginny Y. Wong, Simon See
2025	LogicTree: Structured Proof Exploration for Coherent and Rigorous Logical Reasoning with Large Language Models. Kang He, Kaushik Roy
2025	Logical Reasoning with Outcome Reward Models for Test-Time Scaling. Ramya Keerthy Thatikonda, Wray L. Buntine, Ehsan Shareghi
2025	Logit Space Constrained Fine-Tuning for Mitigating Hallucinations in LLM-Based Recommender Systems. Jianfeng Deng, Qingfeng Chen, Debo Cheng, Jiuyong Li, Lin Liu
2025	Logits-Based Finetuning. Jingyao Li, Senqiao Yang, Sitong Wu, Han Shi, Chuanyang Zheng, Hong Xu, Jiaya Jia
2025	Logos as a Well-Tempered Pre-train for Sign Language Recognition. Ilya Ovodov, Petr Surovtsev, Karina Kvanchiani, Alexander Kapitanov, Alexander Nagaev
2025	Long Chain-of-Thought Fine-tuning via Understanding-to-Reasoning Transition. Chenxin An, Zhihui Xie, Xiaonan Li, Ming Zhong, Shansan Gong, Lei Li, Jun Zhang, Jingjing Xu, Lingpeng Kong
2025	Long-Form Information Alignment Evaluation Beyond Atomic Facts. Danna Zheng, Mirella Lapata, Jeff Z. Pan
2025	Look Again, Think Slowly: Enhancing Visual Reflection in Vision-Language Models. Pu Jian, Junhong Wu, Wei Sun, Chen Wang, Shuo Ren, Jiajun Zhang
2025	Look Beyond Feeling: Unveiling Latent Needs from Implicit Expressions for Proactive Emotional Support. Xing Fu, Haozhen Li, Bichen Wang, Hao Yang, Yanyan Zhao, Bing Qin
2025	Lookahead Q-Cache: Achieving More Consistent KV Cache Eviction via Pseudo Query. Yixuan Wang, Shiyu Ji, Yijun Liu, Yuzhuang Xu, Yang Xu, Qingfu Zhu, Wanxiang Che
2025	Looking Beyond Text: Reducing Language Bias in Large Vision-Language Models via Multimodal Dual-Attention and Soft-Image Guidance. Haozhe Zhao, Shuzheng Si, Liang Chen, Yichi Zhang, Maosong Sun, Baobao Chang, Minjia Zhang
2025	LyapLock: Bounded Knowledge Preservation in Sequential Large Language Model Editing. Peng Wang, Biyu Zhou, Xuehai Tang, Jizhong Han, Songlin Hu
2025	M-ABSA: A Multilingual Dataset for Aspect-Based Sentiment Analysis. Chengyan Wu, Bolei Ma, Yihong Liu, Zheyu Zhang, Ningyuan Deng, Yanshu Li, Baolan Chen, Yi Zhang, Yun Xue, Barbara Plank
2025	M-BRe: Discovering Training Samples for Relation Extraction from Unlabeled Texts with Large Language Models. Zexuan Li, Hongliang Dai, Piji Li
2025	M-LongDoc: A Benchmark For Multimodal Super-Long Document Understanding And A Retrieval-Aware Tuning Framework. Yew Ken Chia, Liying Cheng, Hou Pong Chan, Maojia Song, Chaoqun Liu, Mahani Aljunied, Soujanya Poria, Lidong Bing
2025	M-Wanda: Improving One-Shot Pruning for Multilingual LLMs. Rochelle Choenni, Ivan Titov
2025	M2Edit: Locate and Edit Multi-Granularity Knowledge in Multimodal Large Language Model. Yang Zhou, Pengfei Cao, Yubo Chen, Qingbin Liu, Dianbo Sui, Xi Chen, Kang Liu, Jun Zhao
2025	M3Retrieve: Benchmarking Multimodal Retrieval for Medicine. Arkadeep Acharya, Akash Ghosh, Pradeepika Verma, Kitsuchart Pasupa, Sriparna Saha, Priti Singh
2025	MA-DPR: Manifold-aware Distance Metrics for Dense Passage Retrieval. Yifan Liu, Qianfeng Wen, Mark Zhao, Jiazhou Liang, Scott Sanner
2025	MA-GTS: A Multi-Agent Framework for Solving Complex Graph Problems in Real-World Applications. Zike Yuan, Ming Liu, Hui Wang, Bing Qin
2025	MAC-Tuning: LLM Multi-Compositional Problem Reasoning with Enhanced Knowledge Boundary Awareness. Junsheng Huang, Zhitao He, Yuchen Huang, Sandeep Polisetty, Qingyun Wang, Yi R. Fung
2025	MADAWSD: Multi-Agent Debate Framework for Adversarial Word Sense Disambiguation. Kaiyuan Zhang, Qian Liu, Luyang Zhang, Chaoqun Zheng, Shuaimin Li, Bing Xu, Muyun Yang, Xinxiao Qiao, Wenpeng Lu
2025	MAIN: Mutual Alignment Is Necessary for instruction tuning. Fanyi Yang, Jianfeng Liu, Xin Zhang, Haoyu Liu, Xixin Cao, Yuefeng Zhan, Hao Sun, Weiwei Deng, Feng Sun, Qi Zhang
2025	MAKAR: a Multi-Agent framework based Knowledge-Augmented Reasoning for Grounded Multimodal Named Entity Recognition. Xinkui Lin, Yuhui Zhang, Yongxiu Xu, Kun Huang, Hongzhang Mu, Yubin Wang, Gaopeng Gou, Li Qian, Li Peng, Wei Liu, Jian Luan, Hongbo Xu
2025	MAVL: A Multilingual Audio-Video Lyrics Dataset for Animated Song Translation. Woohyun Cho, Youngmin Kim, Sunghyun Lee, Youngjae Yu
2025	MAgICoRe: Multi-Agent, Iterative, Coarse-to-Fine Refinement for Reasoning. Justin Chih-Yao Chen, Archiki Prasad, Swarnadeep Saha, Elias Stengel-Eskin, Mohit Bansal
2025	MAviS: A Multimodal Conversational Assistant For Avian Species. Yevheniia Kryklyvets, Mohammed Irfan Kurpath, Sahal Shaji Mullappilly, Jinxing Zhou, Fahad Shahbaz Khan, Rao Muhammad Anwer, Salman Khan, Hisham Cholakkal
2025	MCIP: Protecting MCP Safety via Model Contextual Integrity Protocol. Huihao Jing, Haoran Li, Wenbin Hu, Qi Hu, Heli Xu, Tianshu Chu, Peizhao Hu, Yangqiu Song
2025	MEBench: Benchmarking Large Language Models for Cross-Document Multi-Entity Question Answering. Teng Lin, Yuyu Luo, Honglin Zhang, Jicheng Zhang, Chunlin Liu, Kaishun Wu, Nan Tang
2025	MEPT: Mixture of Expert Prompt Tuning as a Manifold Mapper. Runjia Zeng, Guangyan Sun, Qifan Wang, Tong Geng, Sohail A. Dianat, Xiaotian Han, Raghuveer Rao, Xueling Zhang, Cheng Han, Lifu Huang, Dongfang Liu
2025	MERMAID: Multi-perspective Self-reflective Agents with Generative Augmentation for Emotion Recognition. Zhongyu Yang, Junhao Song, Siyang Song, Wei Pang, Yingfang Yuan
2025	METok: Multi-Stage Event-based Token Compression for Efficient Long Video Understanding. Mengyue Wang, Shuo Chen, Kristian Kersting, Volker Tresp, Yunpu Ma
2025	MIO: A Foundation Model on Multimodal Tokens. Zekun Moore Wang, King Zhu, Chunpu Xu, Wangchunshu Zhou, Jiaheng Liu, Yibo Zhang, Jessie Jiashuo Wang, Ning Shi, Siyu Li, Yizhi Li, Haoran Que, Zhaoxiang Zhang, Yuanxing Zhang, Ge Zhang, Ke Xu, Jie Fu, Wenhao Huang
2025	MIRROR: Multimodal Cognitive Reframing Therapy for Rolling with Resistance. Subin Kim, Hoonrae Kim, Jihyun Lee, Yejin Jeon, Gary Lee
2025	ML-Promise: A Multilingual Dataset for Corporate Promise Verification. Yohei Seki, Hakusen Shu, Anaïs Lhuissier, Hanwool Lee, Juyeon Kang, Min-Yuh Day, Chung-Chi Chen
2025	MLWQ: Efficient Small Language Model Deployment via Multi-Level Weight Quantization. Chun Hu, Junhui He, Shangyu Wu, Yuxin He, Chun Jason Xue, Qingan Li
2025	MMAG: Multimodal Learning for Mucus Anomaly Grading in Nasal Endoscopy via Semantic Attribute Prompting. Xinpan Yuan, Mingzhu Huang, Liujie Hua, Jianuo Ju, Xu Zhang
2025	MMAPG: A Training-Free Framework for Multimodal Multi-hop Question Answering via Adaptive Planning Graphs. Yiheng Hu, Xiaoyang Wang, Qing Liu, Xiwei Xu, Qian Fu, Wenjie Zhang, Liming Zhu
2025	MMDocIR: Benchmarking Multimodal Retrieval for Long Documents. Kuicai Dong, Yujing Chang, Derrick-Goh-Xin Deik, Dexun Li, Ruiming Tang, Yong Liu
2025	MMLU-ProX: A Multilingual Benchmark for Advanced Large Language Model Evaluation. Weihao Xuan, Rui Yang, Heli Qi, Qingcheng Zeng, Yunze Xiao, Aosong Feng, Dairui Liu, Yun Xing, Junjue Wang, Fan Gao, Jinghui Lu, Yuang Jiang, Huitao Li, Xin Li, Kunyu Yu, Ruihai Dong, Shangding Gu, Yuekang Li, Xiaofei Xie, Felix Juefei-Xu, Foutse Khomh, Osamu Yoshie, Qingyu Chen, Douglas Teodoro, Nan Liu, Randy Goebel, Lei Ma, Edison Marrese-Taylor, Shijian Lu, Yusuke Iwasawa, Yutaka Matsuo, Irene Li
2025	MOSAIC: Modeling Social AI for Content Dissemination and Regulation in Multi-Agent Simulations. Genglin Liu, Vivian T. Le, Salman Rahman, Elisa Kreiss, Marzyeh Ghassemi, Saadia Gabriel
2025	MPCG: Multi-Round Persona-Conditioned Generation for Modeling the Evolution of Misinformation with LLMs. Jun Rong Brian Chong, Yixuan Tang, Anthony Kum Hoe Tung
2025	MPRF: Interpretable Stance Detection through Multi-Path Reasoning Framework. Zhaodan Zhang, Jin Zhang, Hui Xu, Jiafeng Guo, Xueqi Cheng
2025	MR. Judge: Multimodal Reasoner as a Judge. Renjie Pi, Haoping Bai, Qibin Chen, Xiaoming Simon Wang, Jiulong Shan, Xiaojiang Liu, Meng Cao
2025	MS-RAG: Simple and Effective Multi-Semantic Retrieval-Augmented Generation. Xiaozhou You, Yahui Luo, Lihong Gu
2025	MUCAR: Benchmarking Multilingual Cross-Modal Ambiguity Resolution for Multimodal Large Language Models. Xiaolong Wang, Zhaolu Kang, Wangyuxuan Zhai, Xinyue Lou, Yunghwei Lai, Ziyue Wang, Yawen Wang, Kaiyu Huang, Yile Wang, Peng Li, Yang Liu
2025	MULTIGUARD: An Efficient Approach for AI Safety Moderation Across Languages and Modalities. Sahil Verma, Keegan Hines, Jeff A. Bilmes, Charlotte Siska, Luke Zettlemoyer, Hila Gonen, Chandan Singh
2025	MULTIVOX: A Benchmark for Evaluating Voice Assistants for Multimodal Interactions. Ramaneswaran Selvakumar, Ashish Seth, Nishit Anand, Utkarsh Tyagi, Sonal Kumar, Sreyan Ghosh, Dinesh Manocha
2025	MUSE: MCTS-Driven Red Teaming Framework for Enhanced Multi-Turn Dialogue Safety in Large Language Models. Siyu Yan, Long Zeng, Xuecheng Wu, Chengcheng Han, Kongcheng Zhang, Chong Peng, Xuezhi Cao, Xunliang Cai, Chenjuan Guo
2025	MUZO: Leveraging Multiple Queries and Momentum for Zeroth-Order Fine-Tuning of Large Language Models. Yuezhang Peng, Yuxin Liu, Fei Wen, Xie Chen
2025	MaZO: Masked Zeroth-Order Optimization for Multi-Task Fine-Tuning of Large Language Models. Zhen Zhang, Yifan Yang, Kai Zhen, Nathan Susanj, Athanasios Mouchtaris, Siegfried Kunzmann, Zheng Zhang
2025	Machine-generated text detection prevents language model collapse. George Drayson, Emine Yilmaz, Vasileios Lampos
2025	Mahānāma: A Unique Testbed for Literary Entity Discovery and Linking. Sujoy Sarkar, Gourav Sarkar, Manoj Balaji Jagadeeshan, Jivnesh Sandhan, Amrith Krishna, Pawan Goyal
2025	Making VLMs More Robot-Friendly: Self-Critical Distillation of Low-Level Procedural Reasoning. Chan Young Park, Jillian Fisher, Marius Memmel, Dipika Khullar, Seoho Yun, Abhishek Gupta, Yejin Choi
2025	Mapping Toxic Comments Across Demographics: A Dataset from German Public Broadcasting. Jan Fillies, Michael Peter Hoffmann, Rebecca Reichel, Roman Salzwedel, Sven Bodemer, Adrian Paschke
2025	Mapping semantic networks to Dutch word embeddings as a diagnostic tool for cognitive decline. Maithe van Noort, Michal Korenar, Jelke Bloem
2025	Mapping the Minds of LLMs: A Graph-Based Analysis of Reasoning LLMs. Zhen Xiong, Yujun Cai, Zhecheng Li, Yiwei Wang
2025	Massive Supervised Fine-tuning Experiments Reveal How Data, Layer, and Training Factors Shape LLM Alignment Quality. Yuto Harada, Yusuke Yamauchi, Yusuke Oda, Yohei Oseki, Yusuke Miyao, Yu Takagi
2025	MathTutorBench: A Benchmark for Measuring Open-ended Pedagogical Capabilities of LLM Tutors. Jakub Macina, Nico Daheim, Ido Hakimi, Manu Kapur, Iryna Gurevych, Mrinmaya Sachan
2025	Matter-of-Fact: A Benchmark for Verifying the Feasibility of Literature-Supported Claims in Materials Science. Peter A. Jansen, Samiah Hassan, Ruoyao Wang
2025	Measuring Bias or Measuring the Task: Understanding the Brittle Nature of LLM Gender Biases. Bufan Gao, Elisa Kreiss
2025	Measuring Chain of Thought Faithfulness by Unlearning Reasoning Steps. Martin Tutek, Fateme Hashemi Chaleshtori, Ana Marasovic, Yonatan Belinkov
2025	Measuring Risk of Bias in Biomedical Reports: The RoBBR Benchmark. Jianyou Wang, Weili Cao, Longtian Bao, Youze Zheng, Gil Pasternak, Kaicheng Wang, Xiaoyue Wang, Ramamohan Paturi, Leon Bergen
2025	Measuring and Mitigating Media Outlet Name Bias in Large Language Models. Seong-Jin Park, Kang-Min Kim
2025	Measuring scalar constructs in social science with LLMs. Hauke Licht, Rupak Sarkar, Patrick Y. Wu, Pranav Goel, Niklas Stoehr, Elliott Ash, Alexander Miserlis Hoyle
2025	Measuring the Effect of Disfluency in Multilingual Knowledge Probing Benchmarks. Kirill Semenov, Rico Sennrich
2025	Mechanisms vs. Outcomes: Probing for Syntax Fails to Explain Performance on Targeted Syntactic Evaluations. Ananth Agarwal, Jasper Jian, Christopher D. Manning, Shikhar Murty
2025	Med-PRM: Medical Reasoning Models with Stepwise, Guideline-verified Process Rewards. Jaehoon Yun, Jiwoong Sohn, Jungwoo Park, Hyunjae Kim, Xiangru Tang, Daniel Shao, Yonghoe Koo, Minhyeok Ko, Qingyu Chen, Mark Gerstein, Michael Moor, Jaewoo Kang
2025	Med-VRAgent: A Framework for Medical Visual Reasoning-Enhanced Agents. Guangfu Guo, Xiaoqian Lu, Yue Feng
2025	MedFact: A Large-scale Chinese Dataset for Evidence-based Medical Fact-checking of LLM Responses. Tong Chen, Zimu Wang, Yiyi Miao, Haoran Luo, Yuanfei Sun, Wei Wang, Zhengyong Jiang, Procheta Sen, Jionglong Su
2025	MedHallu: A Comprehensive Benchmark for Detecting Medical Hallucinations in Large Language Models. Shrey Pandit, Jiawei Xu, Junyuan Hong, Zhangyang Wang, Tianlong Chen, Kaidi Xu, Ying Ding
2025	MedLinkDE - MedDRA Entity Linking for German with Guided Chain of Thought Reasoning. Roman Christof, Farnaz Zeidi, Manuela Messelhäußer, Dirk Mentzer, Renate König, Liam Harold Childs, Alexander Mehler
2025	Media Source Matters More Than Content: Unveiling Political Bias in LLM-Generated Citations. Sunhao Dai, Zhanshuo Cao, Wenjie Wang, Liang Pang, Jun Xu, See-Kiong Ng, Tat-Seng Chua
2025	MemInsight: Autonomous Memory Augmentation for LLM Agents. Rana Salama, Jason Cai, Michelle Yuan, Anna Currey, Monica Sunkara, Yi Zhang, Yassine Benajiba
2025	Membership and Memorization in LLM Knowledge Distillation. Ziqi Zhang, Ali Shahin Shamsabadi, Hanxiao Lu, Yifeng Cai, Hamed Haddadi
2025	MemeArena: Automating Context-Aware Unbiased Evaluation of Harmfulness Understanding for Multimodal Large Language Models. Zixin Chen, Hongzhan Lin, Kaixin Li, Ziyang Luo, Yayue Deng, Jing Ma
2025	MemeIntel: Explainable Detection of Propagandistic and Hateful Memes. Mohamed Bayan Kmainasi, Abul Hasnat, Md. Arid Hasan, Ali Ezzat Shahroor, Firoj Alam
2025	MemeReaCon: Probing Contextual Meme Understanding in Large Vision-Language Models. Zhengyi Zhao, Shubo Zhang, Yuxi Zhang, Yanxi Zhao, Yifan Zhang, Zezhong Wang, Huimin Wang, Yutian Zhao, Bin Liang, Yefeng Zheng, Binyang Li, Kam-Fai Wong, Xian Wu
2025	Memorization or Reasoning? Exploring the Idiom Understanding of LLMs. Jisu Kim, Youngwoo Shin, Uiji Hwang, Jihun Choi, Richeng Xuan, Taeuk Kim
2025	Memorization ≠ Understanding: Do Large Language Models Have the Ability of Scenario Cognition? Boxiang Ma, Ru Li, Yuanlong Wang, Hongye Tan, Xiaoli Li
2025	Memory OS of AI Agent. Jiazheng Kang, Mingming Ji, Zhe Zhao, Ting Bai
2025	Memory-QA: Answering Recall Questions Based on Multimodal Memories. Hongda Jiang, Xinyuan Zhang, Siddhant Garg, Rishab Arora, Shiunzu Kuo, Jiayang Xu, Aaron Colak, Xin Luna Dong
2025	MentalGLM Series: Explainable Large Language Models for Mental Health Analysis on Chinese Social Media. Wei Zhai, Nan Bai, Qing Zhao, Jianqiang Li, Fan Wang, Hongzhi Qi, Meng Jiang, Xiaoqin Wang, Bing Xiang Yang, Guanghui Fu
2025	Merge then Realign: Simple and Effective Modality-Incremental Continual Learning for Multimodal LLMs. Dingkun Zhang, Shuhan Qi, Xinyu Xiao, Kehai Chen, Xuan Wang
2025	Merger-as-a-Stealer: Stealing Targeted PII from Aligned LLMs with Model Merging. Lin Lu, Zhigang Zuo, Ziji Sheng, Pan Zhou
2025	MessIRve: A Large-Scale Spanish Information Retrieval Dataset. Francisco Valentini, Viviana Cotik, Damián Ariel Furman, Ivan Bercovich, Edgar Altszyler, Juan Manuel Pérez
2025	Meta-Rewarding Language Models: Self-Improving Alignment with LLM-as-a-Meta-Judge. Tianhao Wu, Weizhe Yuan, Olga Golovneva, Jing Xu, Yuandong Tian, Jiantao Jiao, Jason E. Weston, Sainbayar Sukhbaatar
2025	Meta-Semantics Augmented Few-Shot Relational Learning. Han Wu, Jie Yin
2025	MetaFaith: Faithful Natural Language Uncertainty Expression in LLMs. Gabrielle Kaili-May Liu, Gal Yona, Avi Caciularu, Idan Szpektor, Tim G. J. Rudner, Arman Cohan
2025	Metric Calculating Benchmark: Code-Verifiable Complicate Instruction Following Benchmark for Large Language Models. Hyeonseok Moon, Seongtae Hong, Jaehyung Seo, Heuiseok Lim
2025	MiCRo: Mixture Modeling and Context-aware Routing for Personalized Preference Learning. Jingyan Shen, Jiarui Yao, Rui Yang, Yifan Sun, Feng Luo, Rui Pan, Tong Zhang, Han Zhao
2025	MiLQ: Benchmarking IR Models for Bilingual Web Search with Mixed Language Queries. Jonghwi Kim, Deokhyung Kang, Seonjeong Hwang, Yunsu Kim, Jungseul Ok, Gary Lee
2025	MicroEdit: Neuron-level Knowledge Disentanglement and Localization in Lifelong Model Editing. Shiqi Wang, Qi Wang, Runliang Niu, He Kong, Yi Chang
2025	Middo: Model-Informed Dynamic Data Optimization for Enhanced LLM Fine-Tuning via Closed-Loop Learning. Zinan Tang, Xin Gao, Qizhi Pei, Zhuoshi Pan, Mengzhang Cai, Jiang Wu, Conghui He, Lijun Wu
2025	Mind the Blind Spots: A Focus-Level Evaluation Framework for LLM Reviews. Hyungyu Shin, Jingyu Tang, Yoonjoo Lee, Nayoung Kim, Hyunseung Lim, Ji Yong Cho, Hwajung Hong, Moontae Lee, Juho Kim
2025	Mind the Gap: A Closer Look at Tokenization for Multiple-Choice Question Answering with LLMs. Mario Sanz-Guerrero, Minh Duc Bui, Katharina von der Wense
2025	Mind the Gap: How BabyLMs Learn Filler-Gap Dependencies. Chi-Yun Chang, Xueyang Huang, Humaira Nasir, Shane Storks, Olawale Akingbade, Huteng Dai
2025	Mind the Inclusivity Gap: Multilingual Gender-Neutral Translation Evaluation with mGeNTE. Beatrice Savoldi, Giuseppe Attanasio, Eleonora Cupin, Eleni Gkovedarou, Janiça Hackenbuchner, Anne Lauscher, Matteo Negri, Andrea Piergentili, Manjinder Thind, Luisa Bentivogli
2025	Mind the Value-Action Gap: Do LLMs Act in Alignment with Their Values? Hua Shen, Nicholas Clark, Tanu Mitra
2025	Minimal, Local, and Robust: Embedding-Only Edits for Implicit Bias in T2I Models. Feng He, Chao Zhang, Zhixue Zhao
2025	Mining the Past with Dual Criteria: Integrating Three types of Historical Information for Context-aware Event Forecasting. Rong Ma, Lei Wang, Yating Yang, Bo Ma, Rui Dong, Fengyi Yang, Ahtamjan Ahmat, Kaiwen Lu, Xinyue Wang
2025	Mitigating Biases in Language Models via Bias Unlearning. Dianqing Liu, Yi Liu, Guoqing Jin, Zhendong Mao
2025	Mitigating Catastrophic Forgetting in Large Language Models with Forgetting-aware Pruning. Wei Huang, Anda Cheng, Yinggui Wang
2025	Mitigating Hallucinations in LM-Based TTS Models via Distribution Alignment Using GFlowNets. Chenlin Liu, Minghui Fang, Patrick Zhang, Wei Zhou, Jie Gao, Jiqing Han
2025	Mitigating Hallucinations in Large Vision-Language Models via Entity-Centric Multimodal Preference Optimization. Jiulong Wu, Zhengliang Shi, Shuaiqiang Wang, Jizhou Huang, Dawei Yin, Lingyong Yan, Min Cao, Min Zhang
2025	Mitigating Hallucinations in Vision-Language Models through Image-Guided Head Suppression. Sreetama Sarkar, Yue Che, Alex Gavin, Peter Anthony Beerel, Souvik Kundu
2025	Mitigating the Privacy Issues in Retrieval-Augmented Generation (RAG) via Pure Synthetic Data. Shenglai Zeng, Jiankun Zhang, Pengfei He, Jie Ren, Tianqi Zheng, Hanqing Lu, Han Xu, Hui Liu, Yue Xing, Jiliang Tang
2025	MixLoRA-DSI: Dynamically Expandable Mixture-of-LoRA Experts for Rehearsal-Free Generative Retrieval over Dynamic Corpora. Tuan-Luc Huynh, Thuy-Trang Vu, Weiqing Wang, Trung Le, Dragan Gasevic, Yuan-Fang Li, Thanh-Toan Do
2025	Mixing Inference-time Experts for Enhancing LLM Reasoning. Soumya Sanyal, Tianyi Xiao, Xiang Ren
2025	Mixture of Languages: Improved Multilingual Encoders Through Language Grouping. João Maria Janeiro, Belen Alastruey, Francisco Massa, Maha Elbayad, Benjamin Piwowarski, Patrick Gallinari, Loïc Barrault
2025	Mixture of Length and Pruning Experts for Knowledge Graphs Reasoning. Enjun Du, Siyi Liu, Yongqi Zhang
2025	Mixture of Weight-shared Heterogeneous Group Attention Experts for Dynamic Token-wise KV Optimization. Guanghui Song, Dongping Liao, Yiren Zhao, Kejiang Ye, Chengzhong Xu, Xitong Gao
2025	Mixture-of-Clustered-Experts: Advancing Expert Specialization and Generalization in Instruction Tuning. Sugyeong Eo, Jung Jun Lee, Chanjun Park, Heuiseok Lim
2025	MoLoRAG: Bootstrapping Document Understanding via Multi-modal Logic-aware Retrieval. Xixi Wu, Yanchao Tan, Nan Hou, Ruiyang Zhang, Hong Cheng
2025	MoMoE: Mixture of Moderation Experts Framework for AI-Assisted Online Governance. Agam Goyal, Xianyang Zhan, Yilun Chen, Koustuv Saha, Eshwar Chandrasekharan
2025	MoR: Better Handling Diverse Queries with a Mixture of Sparse, Dense, and Human Retrievers. Jushaan Singh Kalra, Xinran Zhao, To Eun Kim, Fengyu Cai, Fernando Diaz, Tongshuang Wu
2025	MoSEs: Uncertainty-Aware AI-Generated Text Detection via Mixture of Stylistics Experts with Conditional Thresholds. Junxi Wu, Jinpeng Wang, Zheng Liu, Bin Chen, Dongjian Hu, Hao Wu, Shu-Tao Xia
2025	MoVa: Towards Generalizable Classification of Human Morals and Values. Ziyu Chen, Junfei Sun, Chenxi Li, Tuan Dung Nguyen, Jing Yao, Xiaoyuan Yi, Xing Xie, Chenhao Tan, Lexing Xie
2025	MobiZO: Enabling Efficient LLM Fine-Tuning at the Edge via Inference Engines. Lei Gao, Amir Ziashahabi, Yue Niu, Salman Avestimehr, Murali Annavaram
2025	ModRWKV: Transformer Multimodality in Linear Time. Jiale Kang, Ziyin Yue, Qingyu Yin, Rui Jiang, Weile Li, Zening Lu, Zhouran Ji
2025	ModalPrompt: Towards Efficient Multimodal Continual Instruction Tuning with Dual-Modality Guided Prompt. Fanhu Zeng, Fei Zhu, Haiyang Guo, Xu-Yao Zhang, Cheng-Lin Liu
2025	Model Consistency as a Cheap yet Predictive Proxy for LLM Elo Scores. Ashwin Ramaswamy, Nestor Demeure, Ermal Rrapaj
2025	Model Unlearning via Sparse Autoencoder Subspace Guided Projections. Xu Wang, Zihao Li, Benyou Wang, Yan Hu, Difan Zou
2025	Model-Based Ranking of Source Languages for Zero-Shot Cross-Lingual Transfer. Abteen Ebrahimi, Adam Wiemerslage, Katharina von der Wense
2025	Model-based Large Language Model Customization as Service. Zhaomin Wu, Jizhou Guo, Junyi Hou, Bingsheng He, Lixin Fan, Qiang Yang
2025	ModelCitizens: Representing Community Voices in Online Safety. Ashima Suvarna, Christina Chance, Karolina Naranjo, Hamid Palangi, Sophie Hao, Thomas Hartvigsen, Saadia Gabriel
2025	Modeling Bottom-up Information Quality during Language Processing. Cui Ding, Yanning Yin, Lena Ann Jäger, Ethan Wilcox
2025	MolErr2Fix: Benchmarking LLM Trustworthiness in Chemistry via Modular Error Detection, Localization, Explanation, and Correction. Yuyang Wu, Jinhui Ye, Shuhao Zhang, Lu Dai, Yonatan Bisk, Olexandr Isayev
2025	Molecular String Representation Preferences in Pretrained LLMs: A Comparative Study in Zero- & Few-Shot Molecular Property Prediction. George Arthur Baker, Mario Sanz-Guerrero, Katharina von der Wense
2025	Mondrian: A Framework for Logical Abstract (Re)Structuring. Elizabeth Orwig, Shinwoo Park, Hyundong Jin, Yo-Sub Han
2025	Morables: A Benchmark for Assessing Abstract Moral Reasoning in LLMs with Fables. Matteo Marcuzzo, Alessandro Zangari, Andrea Albarelli, José Camacho-Collados, Mohammad Taher Pilehvar
2025	Moral Framing in Politics (MFiP): A new resource and models for moral framing. Ines Rehbein, Ines Reinig, Simone Paolo Ponzetto
2025	Morpheme Induction for Emergent Language. Brendon Boldt, David R. Mortensen
2025	MovieCORE: COgnitive REasoning in Movies. Gueter Josmy Faure, Min-Hung Chen, Jia-Fong Yeh, Ying Cheng, Hung-Ting Su, Yung-Hao Tang, Shang-Hong Lai, Winston H. Hsu
2025	MrGuard: A Multilingual Reasoning Guardrail for Universal LLM Safety. Yahan Yang, Soham Dan, Shuo Li, Dan Roth, Insup Lee
2025	MuCAL: Contrastive Alignment for Preference-Driven KG-to-Text Generation. Yifei Song, Claire Gardent
2025	MuTIS: Enhancing Reasoning Efficiency through Multi Turn Intervention Sampling in Reinforcement Learning. Wenshuo Zhao, Haoxing Zhai, Xinyu Qiu, Zhenting Qi, Shuhe Li, Linchao Zhu
2025	Multi-Document Event Extraction Using Large and Small Language Models. Qingkai Min, Zitian Qu, Qipeng Guo, Xiangkun Hu, Zheng Zhang, Yue Zhang
2025	Multi-Domain Explainability of Preferences. Nitay Calderon, Liat Ein-Dor, Roi Reichart
2025	Multi-Frequency Contrastive Decoding: Alleviating Hallucinations for Large Vision-Language Models. Bingqian Liu, Fu Zhang, Guoqing Chen, Jingwei Cheng
2025	Multi-LMentry: Can Multilingual LLMs Solve Elementary Tasks Across Languages? Luca Moroni, Javier Aula-Blasco, Simone Conia, Irene Baucells, Naiara Pérez, Silvia Paniagua Suárez, Anna Salles, Malte Ostendorff, Júlia Falcão, Guijin Son, Aitor Gonzalez-Agirre, Roberto Navigli, Marta Villegas
2025	Multi-Modal Framing Analysis of News. Arnav Arora, Srishti Yadav, Maria Antoniak, Serge J. Belongie, Isabelle Augenstein
2025	Multi-perspective Analysis of Large Language Model Domain Specialization: An Experiment in Accounting Audit Procedures Generation. Yusuke Noro
2025	Multi-view-guided Passage Reranking with Large Language Models. Jeongwoo Na, Jun Kwon, Eunseong Choi, Jongwuk Lee
2025	MultiAgentESC: A LLM-based Multi-Agent Collaboration Framework for Emotional Support Conversation. Yangyang Xu, Jinpeng Hu, Zhuoer Zhao, Zhangling Duan, Xiao Sun, Xun Yang
2025	MultiDocFusion : Hierarchical and Multimodal Chunking Pipeline for Enhanced RAG on Long Industrial Documents. Joongmin Shin, Chanjun Park, Jeongbae Park, Jaehyung Seo, Heuiseok Lim
2025	MultiLogicNMR(er): A Benchmark and Neural-Symbolic Framework for Non-monotonic Reasoning with Multiple Extensions. Yeliang Xiu, Yongmei Liu
2025	MultiMatch: Multihead Consistency Regularization Matching for Semi-Supervised Text Classification. Iustin Sirbu, Robert-Adrian Popovici, Cornelia Caragea, Stefan Trausan-Matu, Traian Rebedea
2025	MultiMed-ST: Large-scale Many-to-many Multilingual Medical Speech Translation. Khai Le-Duc, Tuyen Tran, Bach Phan Tat, Nguyen Kim Hai Bui, Quan Dang Anh, Hung-Phong Tran, Thanh Thuy Nguyen, Ly Nguyen, Tuan-Minh Phan, Thi Thu Phuong Tran, Chris Ngo, Nguyen X. Khanh, Thanh Nguyen-Tang
2025	Multilingual Dialogue Generation and Localization with Dialogue Act Scripting. Justin Vasselli, Eunike Andriani Kardinata, Yusuke Sakai, Taro Watanabe
2025	Multilingual Federated Low-Rank Adaptation for Collaborative Content Anomaly Detection across Multilingual Social Media Participants. Jiaxin Li, Geng Zhao, Xiaoci Zhang
2025	Multilingual Language Model Pretraining using Machine-translated Data. Jiayi Wang, Yao Lu, Maurice Weber, Max Ryabinin, David Ifeoluwa Adelani, Yihong Chen, Raphael Tang, Pontus Stenetorp
2025	Multilingual Pretraining for Pixel Language Models. Ilker Kesen, Jonas F. Lotz, Ingo Ziegler, Phillip Rust, Desmond Elliott
2025	Multilingual Prompting for Improving LLM Generation Diversity. Qihan Wang, Shidong Pan, Tal Linzen, Emily Black
2025	Multilingual vs Crosslingual Retrieval of Fact-Checked Claims: A Tale of Two Approaches. Alan Ramponi, Marco Rovera, Róbert Móro, Sara Tonelli
2025	Multilinguality Does not Make Sense: Investigating Factors Behind Zero-Shot Cross-Lingual Transfer in Sense-Aware Tasks. Roksana Goworek, Haim Dubossarsky
2025	Multimedia Event Extraction with LLM Knowledge Editing. Jiaao Yu, Yijing Lin, Zhipeng Gao, Xuesong Qiu, Lanlan Rui
2025	Multimodal Fine-grained Context Interaction Graph Modeling for Conversational Speech Synthesis. Zhenqi Jia, Rui Liu, Berrak Sisman, Haizhou Li
2025	Multimodal Language Models See Better When They Look Shallower. Haoran Chen, Junyan Lin, Xinghao Chen, Yue Fan, Jianfeng Dong, Xin Jin, Hui Su, Jinlan Fu, Xiaoyu Shen
2025	Multimodal Neural Machine Translation: A Survey of the State of the Art. Yi Feng, Chuanyi Li, Jiatong He, Zhenyu Hou, Vincent Ng
2025	MusKGC: A Flexible Multi-source Knowledge Enhancement Framework for Open-World Knowledge Graph Completion. Xin Song, Haiyan Liu, Haiyang Wang, Ye Wang, Kai Chen, Bin Zhou
2025	MuseScorer: Idea Originality Scoring At Scale. Ali Sarosh Bangash, Krish Veera, Ishfat Abrar Islam, Raiyan Abdul Baten
2025	MythTriage: Scalable Detection of Opioid Use Disorder Myths on a Video-Sharing Platform. Hayoung Jung, Shravika Mittal, Ananya Aatreya, Navreet Kaur, Munmun De Choudhury, Tanushree Mitra
2025	N-CORE: N-View Consistency Regularization for Disentangled Representation Learning in Nonverbal Vocalizations. Siddhant Bikram Shah, Kristina T. Johnson
2025	NESTFUL: A Benchmark for Evaluating LLMs on Nested Sequences of API Calls. Kinjal Basu, Ibrahim Abdelaziz, Kiran Kate, Mayank Agarwal, Maxwell Crouse, Yara Rizk, Kelsey Bradford, Asim Munawar, Sadhana Kumaravel, Saurabh Goyal, Xin Wang, Luis A. Lastras, Pavan Kapanipathi
2025	NEXUS: Network Exploration for eXploiting Unsafe Sequences in Multi-Turn LLM Jailbreaks. Javad Rafiei Asl, Sidhant Narula, Mohammad GhasemiGol, Eduardo Blanco, Daniel Takabi
2025	NILE: Internal Consistency Alignment in Large Language Models. Minda Hu, Qiyuan Zhang, Yufei Wang, Bowei He, Hongru Wang, Jingyan Zhou, Liangyou Li, Yasheng Wang, Chen Ma, Irwin King
2025	NL-Debugging: Exploiting Natural Language as an Intermediate Representation for Code Debugging. Weiming Zhang, Qingyao Li, Xinyi Dai, Jizheng Chen, Kounianhua Du, Weiwen Liu, Yasheng Wang, Ruiming Tang, Yong Yu, Weinan Zhang
2025	NL2Lean: Translating Natural Language into Lean 4 through Multi-Aspect Reinforcement Learning. Yue Fang, Shaohan Huang, Xin Yu, Haizhen Huang, Zihan Zhang, Weiwei Deng, Furu Wei, Feng Sun, Qi Zhang, Zhi Jin
2025	NOVA-63: Native Omni-lingual Versatile Assessments of 63 Disciplines. Jinyang Zhang, Kexin Yang, Yu Wan, Muyang Ye, Baosong Yang, Fei Huang, Junyang Lin, Dayiheng Liu
2025	NOVER: Incentive Training for Language Models via Verifier-Free Reinforcement Learning. Wei Liu, Siya Qi, Xinyu Wang, Chen Qian, Yali Du, Yulan He
2025	NUTMEG: Separating Signal From Noise in Annotator Disagreement. Jonathan Ivey, Susan Gauch, David Jurgens
2025	Neural Topic Modeling via Contextual and Graph Information Fusion. Jiyuan Liu, Jiaxing Yan, Chunjiang Zhu, Xingyu Liu, Li Qing, Yanghui Rao
2025	NeuroAda: Activating Each Neuron's Potential for Parameter-Efficient Fine-Tuning. Zhi Zhang, Yixian Shen, Congfeng Cao, Ekaterina Shutova
2025	Neuron-Level Differentiation of Memorization and Generalization in Large Language Models. Ko-Wei Huang, Yi-Fu Fu, Ching-Yu Tsai, Yu-Chieh Tu, Tzu-Ling Cheng, Cheng-Yu Lin, Yi-Ting Yang, Heng-Yi Liu, Keng-Te Liao, Da-Cheng Juan, Shou-De Lin
2025	NileChat: Towards Linguistically Diverse and Culturally Aware LLMs for Local Communities. Abdellah El Mekki, Houdaifa Atou, Omer Nacar, Shady Shehata, Muhammad Abdul-Mageed
2025	NitiBench: Benchmarking LLM Frameworks on Thai Legal Question Answering Capabilities. Pawitsapak Akarajaradwong, Pirat Pothavorn, Chompakorn Chaksangchaichot, Panuthep Tasawong, Thitiwat Nopparatbundit, Keerakiat Pratai, Sarana Nutanong
2025	No Need for Explanations: LLMs can implicitly learn from mistakes in-context. Lisa Alazraki, Maximilian Mozes, Jon Ander Campos, Yi Chern Tan, Marek Rei, Max Bartolo
2025	Noise, Adaptation, and Strategy: Assessing LLM Fidelity in Decision-Making. Yuanjun Feng, Vivek Choudhary, Yash Raj Shrestha
2025	Non-Existent Relationship: Fact-Aware Multi-Level Machine-Generated Text Detection. Yang Wu, Ruijia Wang, Jie Wu
2025	NormGenesis: Multicultural Dialogue Generation via Exemplar-Guided Social Norm Modeling and Violation Recovery. Minki Hong, Jangho Choi, Jihie Kim
2025	NormXLogit: The Head-on-Top Never Lies. Sina Abbasi, Mohammad Reza Modarres, Mohammad Taher Pilehvar
2025	Not All Parameters Are Created Equal: Smart Isolation Boosts Fine-Tuning Performance. Yao Wang, Di Liang, Minlong Peng
2025	Not What the Doctor Ordered: Surveying LLM-based De-identification and Quantifying Clinical Information Loss. Kiana Aghakasiri, Noopur Zambare, JoAnn Thai, Carrie Ye, Mayur Mehta, J. Ross Mitchell, Mohamed Abdalla
2025	Not Your Typical Government Tipline: LLM-Assisted Routing of Environmental Protection Agency Citizen Tips. Sharanya Majumder, Zehua Li, Derek Ouyang, Kit T. Rodolfa, Elena Eneva, Julian Nyarko, Daniel E. Ho
2025	Not-Just-Scaling Laws: Towards a Better Understanding of the Downstream Impact of Language Model Design Decisions. Emmy Liu, Amanda Bertsch, Lintang Sutawika, Lindia Tjuatja, Patrick Fernandes, Lara Marinov, Michael Chen, Shreya Singhal, Carolin Lawrence, Aditi Raghunathan, Kiril Gashteovski, Graham Neubig
2025	NovelHopQA: Diagnosing Multi-Hop Reasoning Failures in Long Narrative Contexts. Abhay Gupta, Kevin Zhu, Vasu Sharma, Sean O'Brien, Michael Lu
2025	Nullspace Disentanglement for Red Teaming Language Models. Yi Han, Yuanxing Liu, Weinan Zhang, Ting Liu
2025	OBLIVIATE: Robust and Practical Machine Unlearning for Large Language Models. Xiaoyu Xu, Minxin Du, Qingqing Ye, Haibo Hu
2025	OG-RAG: Ontology-grounded retrieval-augmented generation for large language models. Kartik Sharma, Peeyush Kumar, Yunqing Li
2025	OMS: On-the-fly, Multi-Objective, Self-Reflective Ad Keyword Generation via LLM Agent. Bowen Chen, Zhao Wang, Shingo Takamatsu
2025	ORPP: Self-Optimizing Role-playing Prompts to Enhance Language Model Capabilities. Yifan Duan, Yihong Tang, Kehai Chen, Liqiang Nie, Min Zhang
2025	OWL: Probing Cross-Lingual Recall of Memorized Texts via World Literature. Alisha Srivastava, Emir Korukluoglu, Minh Nhat Le, Duyen Tran, Chau Minh Pham, Marzena Karpinska, Mohit Iyyer
2025	OmniEval: An Omnidirectional and Automatic RAG Evaluation Benchmark in Financial Domain. Shuting Wang, Jiejun Tan, Zhicheng Dou, Ji-Rong Wen
2025	OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking. Zekun Xi, Wenbiao Yin, Jizhan Fang, Jialong Wu, Runnan Fang, Yong Jiang, Pengjun Xie, Fei Huang, Huajun Chen, Ningyu Zhang
2025	On LLM-Based Scientific Inductive Reasoning Beyond Equations. Brian S. Lin, Jiaxin Yuan, Zihan Zhou, Shouli Wang, Shuo Wang, Cunliang Kong, Qi Shi, Yuxuan Li, Liner Yang, Zhiyuan Liu, Maosong Sun
2025	On Pruning State-Space LLMs. Tamer Ghattas, Michael Hassid, Roy Schwartz
2025	On Relation-Specific Neurons in Large Language Models. Yihong Liu, Runsheng Chen, Lea Hirlimann, Ahmad Dawar Hakimi, Mingyang Wang, Amir Hossein Kargaran, Sascha Rothe, François Yvon, Hinrich Schütze
2025	On the Role of Model Prior in Real-World Inductive Reasoning. Zhuo Liu, Ding Yu, Hangfeng He
2025	On the Same Wavelength? Evaluating Pragmatic Reasoning in Language Models across Broad Concepts. Linlu Qiu, Cedegao E. Zhang, Joshua B. Tenenbaum, Yoon Kim, Roger P. Levy
2025	One Planner To Guide Them All ! Learning Adaptive Conversational Planners for Goal-oriented Dialogues. Huy Quang Dao, Lizi Liao
2025	OntologyRAG-Q: Resource Development and Benchmarking for Retrieval-Augmented Question Answering in Qur'anic Tafsir. Sadam Al-Azani, Maad Alowaifeer, Alhanoof Alhunief, Ahmed Abdelali
2025	OpenNER 1.0: Standardized Open-Access Named Entity Recognition Datasets in 50+ Languages. Chester Palen-Michel, Maxwell Pickering, Maya Kruse, Jonne Sälevä, Constantine Lignos
2025	OpenTuringBench: An Open-Model-based Benchmark and Framework for Machine-Generated Text Detection and Attribution. Lucio La Cava, Andrea Tagarelli
2025	Orchestrating Audio: Multi-Agent Framework for Long-Video Audio Synthesis. Yehang Zhang, Xinli Xu, Xiaojie Xu, Doudou Zhang, Li Liu, Ying-Cong Chen
2025	Order Doesn't Matter, But Reasoning Does: Training LLMs with Order-Centric Augmentation. Qianxi He, Qianyu He, Jiaqing Liang, Weikang Zhou, Zeye Sun, Fei Yu, Yanghua Xiao
2025	Orthogonal Finetuning Made Scalable. Zeju Qiu, Weiyang Liu, Adrian Weller, Bernhard Schölkopf
2025	Out of Sight, Not Out of Context? Egocentric Spatial Reasoning in VLMs Across Disjoint Frames. Sahithya Ravi, Gabriel Herbert Sarch, Vibhav Vineet, Andrew D. Wilson, Balasaravanan Thoravi Kumaravel
2025	P-MMEval: A Parallel Multilingual Multitask Benchmark for Consistent Evaluation of LLMs. Yidan Zhang, Yu Wan, Boyi Deng, Baosong Yang, Haoran Wei, Fei Huang, Bowen Yu, Dayiheng Liu, Junyang Lin, Fei Huang, Jingren Zhou
2025	PACHAT: Persona-Aware Speech Assistant for Multi-party Dialogue. Dongjie Fu, Xize Cheng, Linjun Li, Xiaoda Yang, Lujia Yang, Tao Jin
2025	PAFT: Prompt-Agnostic Fine-Tuning. Chenxing Wei, Mingwen Ou, Ying He, Yao Shu, Fei Yu
2025	PAKTON: A Multi-Agent Framework for Question Answering in Long Legal Agreements. Petros Raptopoulos, Giorgos Filandrianos, Maria Lymperaiou, Giorgos Stamou
2025	PBI-Attack: Prior-Guided Bimodal Interactive Black-Box Jailbreak Attack for Toxicity Maximization. Ruoxi Cheng, Yizhong Ding, Shuirong Cao, Ranjie Duan, Xiaoshuang Jia, Shaowei Yuan, Simeng Qin, Zhiqiang Wang, Xiaojun Jia
2025	PERSEVAL: A Framework for Perspectivist Classification Evaluation. Soda Marem Lo, Silvia Casola, Erhan Sezerer, Valerio Basile, Franco Sansonetti, Antonio Uva, Davide Bernardi
2025	PIIvot: A Lightweight NLP Anonymization Framework for Question-Anchored Tutoring Dialogues. Matthew Zent, Digory Smith, Simon Woodhead
2025	PLAN-TUNING: Post-Training Language Models to Learn Step-by-Step Planning for Complex Problem Solving. Mihir Parmar, Palash Goyal, Xin Liu, Yiwen Song, Mingyang Ling, Chitta Baral, Hamid Palangi, Tomas Pfister
2025	PLLuM-Align: Polish Preference Dataset for Large Language Model Alignment. Karolina Seweryn, Anna Kolos, Agnieszka Karlinska, Katarzyna Lorenc, Katarzyna Dziewulska, Maciej Chrabaszcz, Aleksandra Krasnodebska, Paula Betscher, Zofia Cieslinska, Katarzyna Kowol, Julia Moska, Dawid Motyka, Pawel Walkowiak, Bartosz Zuk, Arkadiusz Janz
2025	POINTS-Reader: Distillation-Free Adaptation of Vision-Language Models for Document Conversion. Yuan Liu, Zhongyin Zhao, Le Tian, Haicheng Wang, Xubing Ye, Yangxiu You, Zilin Yu, Chuhan Wu, Zhou Xiao, Yang Yu, Jie Zhou
2025	PORTS: Preference-Optimized Retrievers for Tool Selection with Large Language Models. Lorenzo Molfetta, Giacomo Frisoni, Nicolò Monaldini, Gianluca Moro
2025	POSITION BIAS MITIGATES POSITION BIAS: Mitigate Position Bias Through Inter-Position Knowledge Distillation. Yifei Wang, Feng Xiong, Yong Wang, Linjing Li, Xiangxiang Chu, Daniel Dajun Zeng
2025	PPC-GPT: Federated Task-Specific Compression of Large Language Models via Pruning and Chain-of-Thought Distillation. Tao Fan, Guoqiang Ma, Yuanfeng Song, Lixin Fan, Qiang Yang
2025	PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides. Hao Zheng, Xinyan Guan, Hao Kong, Wenkai Zhang, Jia Zheng, Weixiang Zhou, Hongyu Lin, Yaojie Lu, Xianpei Han, Le Sun
2025	PRIM: Towards Practical In-Image Multilingual Machine Translation. Yanzhi Tian, Zeming Liu, Zhengyang Liu, Chong Feng, Xin Li, Heyan Huang, Yuhang Guo
2025	PRIME: Large Language Model Personalization with Cognitive Dual-Memory and Personalized Thought Process. Xinliang Frederick Zhang, Nicholas Beauchamp, Lu Wang
2025	PRISM: Efficient Long-Range Reasoning With Short-Context LLMs. Dulhan Jayalath, James Bradley Wendt, Nicholas Monath, Sandeep Tata, Beliz Gunel
2025	PSET: a Phonetics-Semantics Evaluation Testbed. Gianluca Sperduti, Dong Nguyen
2025	Paired by the Teacher: Turning Unpaired Data into High-Fidelity Pairs for Low-Resource Text Generation. Yen-Ju Lu, Thomas Thebaud, Laureano Moro-Velázquez, Najim Dehak, Jesús Villalba
2025	PakBBQ: A Culturally Adapted Bias Benchmark for QA. Abdullah Hashmat, Muhammad Arham Mirza, Agha Ali Raza
2025	PanicToCalm: A Proactive Counseling Agent for Panic Attacks. Jihyun Lee, Yejin Min, San Kim, Yejin Jeon, SungJun Yang, Hyounghun Kim, Gary Lee
2025	Parallel Continuous Chain-of-Thought with Jacobi Iteration. Haoyi Wu, Zhihao Teng, Kewei Tu
2025	Parrot: A Training Pipeline Enhances Both Program CoT and Natural Language CoT for Reasoning. Senjie Jin, Lu Chen, Zhiheng Xi, Yuhui Wang, Sirui Song, Yuhao Zhou, Xinbo Zhang, Peng Sun, Hong Lu, Tao Gui, Qi Zhang, Xuanjing Huang
2025	PatentScore: Multi-dimensional Evaluation of LLM-Generated Patent Claims. Yongmin Yoo, Qiongkai Xu, Longbing Cao
2025	Path Drift in Large Reasoning Models: How First-Person Commitments Override Safety. Yuyi Huang, Runzhe Zhan, Lidia S. Chao, Ailin Tao, Derek F. Wong
2025	Paths Not Taken: Understanding and Mending the Multilingual Factual Recall Pipeline. Meng Lu, Ruochen Zhang, Carsten Eickhoff, Ellie Pavlick
2025	Pathway to Relevance: How Cross-Encoders Implement a Semantic Variant of BM25. Meng Lu, Catherine Chen, Carsten Eickhoff
2025	PathwiseRAG: Multi-Dimensional Exploration and Integration Framework. Hengrui Zhang, Pin-Siang Huang, Zhen Zhang, Peican Lin, Yao-Ching Yu, Bo Hu, Yulu Du
2025	Permutative Preference Alignment from Listwise Ranking of Human Judgments. Yang Zhao, Yixin Wang, Mingzhang Yin
2025	Persona-Augmented Benchmarking: Evaluating LLMs Across Diverse Writing Styles. Kimberly Le Truong, Riccardo Fogliato, Hoda Heidari, Steven Wu
2025	Personality Matters: User Traits Predict LLM Preferences in Multi-Turn Collaborative Tasks. Sarfaroz Yunusov, Kaige Chen, Kazi Nishat Anwar, Ali Emami
2025	Personality Vector: Modulating Personality of Large Language Models by Model Merging. Seungjong Sun, Seo Yeon Baek, Jang Hyun Kim
2025	Personalization up to a Point: Why Personalized Content Moderation Needs Boundaries, and How We Can Enforce Them. Emanuele Moscato, Tiancheng Hu, Matthias Orlikowski, Paul Röttger, Debora Nozza
2025	Personalized LLM Decoding via Contrasting Personal Preference. Hyungjune Bu, Chanjoo Jung, Minjae Kang, Jaehyung Kim
2025	Personalized Language Models via Privacy-Preserving Evolutionary Model Merging. Kyuyoung Kim, Jinwoo Shin, Jaehyung Kim
2025	PerspectiveMod: A Perspectivist Resource for Deliberative Moderation. Eva Maria Vecchi, Neele Falk, Carlotta Quensel, Iman Jundi, Gabriella Lapesa
2025	Persuasion Dynamics in LLMs: Investigating Robustness and Adaptability in Knowledge and Safety with DuET-PD. Bryan Chen Zhengyu Tan, Daniel Wai Kit Chin, Zhengyuan Liu, Nancy F. Chen, Roy Ka-Wei Lee
2025	Phi: Preference Hijacking in Multi-modal Large Language Models at Inference Time. Yifan Lan, Yuanpu Cao, Weitong Zhang, Lu Lin, Jinghui Chen
2025	PhoniTale: Phonologically Grounded Mnemonic Generation for Typologically Distant Language Pairs. Sana Kang, Myeongseok Gwon, Su Young Kwon, Jaewook Lee, Andrew Lan, Bhiksha Raj, Rita Singh
2025	PhonoThink: Improving Large Language Models' Reasoning on Chinese Phonological Ambiguities. Jianfei Ma, Zhaoxin Feng, Emmanuele Chersoni, Huacheng Song, Ziqi Zhang
2025	Pierce the Mists, Greet the Sky: Decipher Knowledge Overshadowing via Knowledge Circuit Analysis. Haoming Huang, Yibo Yan, Jiahao Huo, Xin Zou, Xinfeng Li, Kun Wang, Xuming Hu
2025	Pixels Versus Priors: Controlling Knowledge Priors in Vision-Language Models through Visual Counterfacts. Michal Golovanevsky, William Rudman, Michael A. Lepori, Amir Bar, Ritambhara Singh, Carsten Eickhoff
2025	Plan Dynamically, Express Rhetorically: A Debate-Driven Rhetorical Framework for Argumentative Writing. Xueguan Zhao, Wenpeng Lu, Chaoqun Zheng, Weiyu Zhang, Jiasheng Si, Deyu Zhou
2025	PlanGEN: A Multi-Agent Framework for Generating Planning and Reasoning Trajectories for Complex Problem Solving. Mihir Parmar, Xin Liu, Palash Goyal, Yanfei Chen, Long T. Le, Swaroop Mishra, Hossein Mobahi, Jindong Gu, Zifeng Wang, Hootan Nakhost, Chitta Baral, Chen-Yu Lee, Tomas Pfister, Hamid Palangi
2025	Planning-Aware Code Infilling via Horizon-Length Prediction. Yifeng Ding, Hantian Ding, Shiqi Wang, Qing Sun, Varun Kumar, Zijian Wang
2025	Playpen: An Environment for Exploring Learning From Dialogue Game Feedback. Nicola Horst, Davide Mazzaccara, Antonia Schmidt, Michael Sullivan, Filippo Momentè, Luca Franceschetti, Philipp Sadler, Sherzod Hakimov, Alberto Testoni, Raffaella Bernardi, Raquel Fernández, Alexander Koller, Oliver Lemon, David Schlangen, Mario Giulianelli, Alessandro Suglia
2025	Please Translate Again: Two Simple Experiments on Whether Human-Like Reasoning Helps Translation. Di Wu, Seth Aycock, Christof Monz
2025	Pluralistic Alignment for Healthcare: A Role-Driven Framework. Jiayou Zhong, Anudeex Shetty, Chao Jia, Xuanrui Lin, Usman Naseem
2025	Plutus: Benchmarking Large Language Models in Low-Resource Greek Finance. Xueqing Peng, Triantafillos Papadopoulos, Efstathia Soufleri, Polydoros Giannouris, Ruoyu Xiang, Yan Wang, Lingfei Qian, Jimin Huang, Qianqian Xie, Sophia Ananiadou
2025	PoSum-Bench: Benchmarking Position Bias in LLM-based Conversational Summarization. Xu Sun, Lionel Delphin-Poulat, Christèle Tarnec, Anastasia Shimorina
2025	Pointing to a Llama and Call it a Camel: On the Sycophancy of Multimodal Large Language Models. Renjie Pi, Kehao Miao, Li Peihang, Runtao Liu, Jiahui Gao, Jipeng Zhang, Xiaofang Zhou
2025	Polysemantic Dropout: Conformal OOD Detection for Specialized LLMs. Ayush Gupta, Ramneet Kaur, Anirban Roy, Adam D. Cobb, Rama Chellappa, Susmit Jha
2025	PoseStitch-SLT: Linguistically Inspired Pose-Stitching for End-to-End Sign Language Translation. Abhinav Joshi, Vaibhav Sharma, Sanjeet Singh, Ashutosh Modi
2025	Position: LLMs Can be Good Tutors in English Education. Jingheng Ye, Shen Wang, Deqing Zou, Yibo Yan, Kun Wang, Hai-Tao Zheng, Ruitong Liu, Zenglin Xu, Irwin King, Philip S. Yu, Qingsong Wen
2025	Power doesn't reside in size: A Low Parameter Hybrid Language Model (HLM) for Sentiment Analysis in Code-mixed data. Pavan Sai Balaga, Nagasamudram Karthik, Challa Vishwanath, Raksha Sharma, Rudra Murthy, Ashish R. Mittal
2025	Pragmatic Inference Chain (PIC) Improving LLMs' Reasoning of Authentic Implicit Toxic Language. Xi Chen, Shuo Wang
2025	Pre-trained Language Models Learn Remarkably Accurate Representations of Numbers. Marek Kadlcík, Michal Stefánik, Timothee Mickus, Josef Kuchar, Michal Spiegel
2025	Pre-trained Models Perform the Best When Token Distributions Follow Zipf's Law. Yanjin He, Qingkai Zeng, Meng Jiang
2025	Pre-training CLIP against Data Poisoning with Optimal Transport-based Matching and Alignment. Tong Zhang, Kuofeng Gao, Jiawang Bai, Leo Yu Zhang, Xin Yin, Zonghui Wang, Shouling Ji, Wenzhi Chen
2025	Precise In-Parameter Concept Erasure in Large Language Models. Yoav Gur-Arieh, Clara Suslik, Yihuai Hong, Fazl Barez, Mor Geva
2025	Predicate-Guided Generation for Mathematical Reasoning. Jiajun Chen, Yik-Cheung Tam
2025	Predicting Prosodic Boundaries for Children's Texts. Mansi Dhamne, Sneha Raman, Preeti Rao
2025	Preemptive Detection and Correction of Misaligned Actions in LLM Agents. Haishuo Fang, Xiaodan Zhu, Iryna Gurevych
2025	PricingLogic: Evaluating LLMs Reasoning on Complex Tourism Pricing Tasks. Yunuo Liu, Dawei Zhu, Zena Al-Khalili, Dai Cheng, Yanjun Chen, Dietrich Klakow, Wei Zhang, Xiaoyu Shen
2025	PrimeX: A Dataset of Worldview, Opinion, and Explanation. Rik Koncel-Kedziorski, Brihi Joshi, Tim Paek
2025	Primus: A Pioneering Collection of Open-Source Datasets for Cybersecurity LLM Training. Yao-Ching Yu, Tsun-Han Chiang, Cheng-Wei Tsai, Chien-Ming Huang, Wen-Kwang Tsao
2025	Principled Personas: Defining and Measuring the Intended Effects of Persona Prompting on Task Performance. Pedro Henrique Luz de Araujo, Paul Röttger, Dirk Hovy, Benjamin Roth
2025	Prior Prompt Engineering for Reinforcement Fine-Tuning. Pittawat Taveekitworachai, Potsawee Manakul, Sarana Nutanong, Kunat Pipatanakul
2025	Priority on High-Quality: Selecting Instruction Data via Consistency Verification of Noise Injection. Hong Zhang, Feng Zhao, Ruilin Zhao, Cheng Yan, Kangzheng Liu
2025	ProLongVid: A Simple but Strong Baseline for Long-context Video Instruction Tuning. Rui Wang, Bohao Li, Xiyang Dai, Jianwei Yang, Yi-ling Chen, Zhen Xing, Yifan Yang, Dongdong Chen, Xipeng Qiu, Zuxuan Wu, Yu-Gang Jiang
2025	ProReason: Multi-Modal Proactive Reasoning with Decoupled Eyesight and Wisdom. Jingqi Zhou, Sheng Wang, Jingwei Dong, Kai Liu, Lei Li, Jiahui Gao, Jiyue Jiang, Lingpeng Kong, Chuan Wu
2025	Proactive Assistant Dialogue Generation from Streaming Egocentric Videos. Yichi Zhang, Xin Luna Dong, Zhaojiang Lin, Andrea Madotto, Anuj Kumar, Babak Damavandi, Joyce Chai, Seungwhan Moon
2025	Proactive Hearing Assistants that Isolate Egocentric Conversations. Guilin Hu, Malek Itani, Tuochao Chen, Shyamnath Gollakota
2025	Probabilistic Soundness Guarantees in LLM Reasoning Chains. Weiqiu You, Anton Xue, Shreya Havaldar, Delip Rao, Helen Jin, Chris Callison-Burch, Eric Wong
2025	Probability Distribution Collapse: A Critical Bottleneck to Compact Unsupervised Neural Grammar Induction. Jinwook Park, Kangil Kim
2025	Probing LLM World Models: Enhancing Guesstimation with Wisdom of Crowds Decoding. Yun-Shiuan Chuang, Sameer Narendran, Nikunj Harlalka, Alexander Cheung, Sizhe Gao, Siddharth Suresh, Junjie Hu, Timothy T. Rogers
2025	Probing Logical Reasoning of MLLMs in Scientific Diagrams. Yufei Wang, Adriana Kovashka
2025	Probing Narrative Morals: A New Character-Focused MFT Framework for Use with Large Language Models. Luca Mitran, Sophie Wu, Andrew Piper
2025	Probing and Boosting Large Language Models Capabilities via Attention Heads. Dezhi Zhao, Xin Liu, Xiaocheng Feng, Hui Wang, Bing Qin
2025	Probing for Arithmetic Errors in Language Models. Yucheng Sun, Alessandro Stolfo, Mrinmaya Sachan
2025	ProcWorld: Benchmarking Large Model Planning in Reachability-Constrained Environments. Dong Wang, Xinghang Li, Zhengshen Zhang, Jirong Liu, Xiao Ma, Hanbo Zhang, Tao Kong, Huaping Liu
2025	Procedural Environment Generation for Tool-Use Agents. Michael Sullivan, Mareike Hartmann, Alexander Koller
2025	Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing, EMNLP 2025, Suzhou, China, November 4-9, 2025 Christos Christodoulopoulos, Tanmoy Chakraborty, Carolyn Rose, Violet Peng
2025	Process-Supervised Reinforcement Learning for Code Generation. Yufan Ye, Ting Zhang, Wenbin Jiang, Hua Huang
2025	Process-Supervised Reward Models for Verifying Clinical Note Generation: A Scalable Approach Guided by Domain Expertise. Hanyin Wang, Chufan Gao, Qiping Xu, Bolun Liu, Guleid Hussein, Hariprasad Reddy Korsapati, Mohamad El Labban, Kingsley Iheasirim, Mohamed Hassan, Gokhan Anil, Brian Bartlett, Jimeng Sun
2025	Profiler: Black-box AI-generated Text Origin Detection via Context-aware Inference Pattern Analysis. Hanxi Guo, Siyuan Cheng, Xiaolong Jin, Zhuo Zhang, Guangyu Shen, Kaiyuan Zhang, Shengwei An, Guanhong Tao, Xiangyu Zhang
2025	Program of Thoughts for Financial Reasoning: Leveraging Dynamic In-Context Examples and Generative Retrieval. Subhendu Khatuya, Shashwat Naidu, Pawan Goyal, Niloy Ganguly
2025	Promote, Suppress, Iterate: How Language Models Answer One-to-Many Factual Queries. Tianyi Lorena Yan, Robin Jia
2025	PropRAG: Guiding Retrieval with Beam Search over Proposition Paths. Jingjin Wang, Jiawei Han
2025	ProtoVQA: An Adaptable Prototypical Framework for Explainable Fine-Grained Visual Question Answering. Xingjian Diao, Weiyi Wu, Keyi Kong, Peijun Qing, Xinwen Xu, Ming Cheng, Soroush Vosoughi, Jiang Gui
2025	Prototypical Human-AI Collaboration Behaviors from LLM-Assisted Writing in the Wild. Sheshera Mysore, Debarati Das, Hancheng Cao, Bahareh Sarrafzadeh
2025	PruneCD: Contrasting Pruned Self Model to Improve Decoding Factuality. Byeongho Yu, Changhun Lee, Jungyu Jin, Eunhyeok Park
2025	Pruning the Paradox: How CLIP's Most Informative Heads Enhance Performance While Amplifying Bias. Avinash Madasu, Vasudev Lal, Phillip Howard
2025	Pun Unintended: LLMs and the Illusion of Humor Understanding. Alessandro Zangari, Matteo Marcuzzo, Andrea Albarelli, Mohammad Taher Pilehvar, José Camacho-Collados
2025	PunMemeCN: A Benchmark to Explore Vision-Language Models' Understanding of Chinese Pun Memes. Zhijun Xu, Siyu Yuan, Yiqiao Zhang, Jingyu Sun, Tong Zheng, Deqing Yang
2025	Puzzled by Puzzles: When Vision-Language Models Can't Take a Hint. Heekyung Lee, Jiaxin Ge, Tsung-Han Wu, Minwoo Kang, Trevor Darrell, David M. Chan
2025	PychoAgent: Psychology-driven LLM Agents for Explainable Panic Prediction on Social Media during Sudden Disaster Events. Mengzhu Liu, Zhengqiu Zhu, Chuan Ai, Chen Gao, Xinghong Li, Lingnan He, Kaisheng Lai, Yingfeng Chen, Xin Lu, Yong Li, Quanjun Yin
2025	QCRD: Quality-guided Contrastive Rationale Distillation for Large Language Models. Wei Wang, Zhaowei Li, Qi Xu, Yiqing Cai, Hang Song, Qi Qi, Ran Zhou, Zhida Huang, Tao Wang, Li Xiao
2025	QFrCoLA: a Quebec-French Corpus of Linguistic Acceptability Judgments. David Beauchemin, Richard Khoury
2025	QG-CoC: Question-Guided Chain-of-Captions for Large Multimodal Models. Kuei-Chun Kao, Hsu Tzu-Yin, Yunqi Hong, Ruochen Wang, Cho-Jui Hsieh
2025	QSpec: Speculative Decoding with Complementary Quantization Schemes. Juntao Zhao, Wenhao Lu, Sheng Wang, Lingpeng Kong, Chuan Wu
2025	QUIDS: Query Intent Description for Exploratory Search via Dual Space Modeling. Yumeng Wang, Xiuying Chen, Suzan Verberne
2025	QuZO: Quantized Zeroth-Order Fine-Tuning for Large Language Models. Jiajun Zhou, Yifan Yang, Kai Zhen, Ziyue Liu, Yequan Zhao, Ershad Banijamali, Athanasios Mouchtaris, Ngai Wong, Zheng Zhang
2025	QualBench: Benchmarking Chinese LLMs with Localized Professional Qualifications for Vertical Domain Evaluation. Mengze Hong, Wailing Ng, Chen Jason Zhang, Di Jiang
2025	Quantifying Language Disparities in Multilingual Large Language Models. Songbo Hu, Ivan Vulic, Anna Korhonen
2025	Quantifying Logical Consistency in Transformers via Query-Key Alignment. Eduard Tulchinskii, Laida Kushnareva, Anastasia Voznyuk, Andrei Andriiainen, Irina Piontkovskaya, Evgeny Burnaev, Serguei Barannikov
2025	Quantized but Deceptive? A Multi-Dimensional Truthfulness Evaluation of Quantized LLMs. Yao Fu, Xianxuan Long, Runchao Li, Haotian Yu, Mu Sheng, Xiaotian Han, Yu Yin, Pan Li
2025	Query-Focused Retrieval Heads Improve Long-Context Reasoning and Re-ranking. Wuwei Zhang, Fangcong Yin, Howard Yen, Danqi Chen, Xi Ye
2025	R-BPE: Improving BPE-Tokenizers with Token Reuse. Nancy Hamdan, Osama Rakan Al Mraikhat, Fadi A. Zaraket
2025	R-Bind: Unified Enhancement of Attribute and Relation Binding in Text-to-Image Diffusion Models. Huixuan Zhang, Xiaojun Wan
2025	R-CHAR: A Metacognition-Driven Framework for Role-Playing in Large Language Models. Haiming Qin, Jiwei Zhang, Wei Zhang, Kezhong Lu, Mingyang Zhou, Hao Liao, Rui Mao
2025	R-PRM: Reasoning-Driven Process Reward Modeling. Shuaijie She, Junxiao Liu, Yifeng Liu, Jiajun Chen, Xin Huang, Shujian Huang
2025	R-TOFU: Unlearning in Large Reasoning Models. Sangyeon Yoon, Wonje Jeung, Albert No
2025	R2I-Bench: Benchmarking Reasoning-Driven Text-to-Image Generation. Kaijie Chen, Zihao Lin, Zhiyang Xu, Ying Shen, Yuguang Yao, Joy Rimchala, Jiaxin Zhang, Lifu Huang
2025	RACCooN: Versatile Instructional Video Editing with Auto-Generated Narratives. Jaehong Yoon, Shoubin Yu, Mohit Bansal
2025	RAED: Retrieval-Augmented Entity Description Generation for Emerging Entity Linking and Disambiguation. Karim Ghonim, Pere-Lluís Huguet Cabot, Riccardo Orlando, Roberto Navigli
2025	RAG+: Enhancing Retrieval-Augmented Generation with Application-Aware Reasoning. Yu Wang, Shiwan Zhao, Zhihu Wang, Ming Fan, Xicheng Zhang, Yubo Zhang, Zhengfan Wang, Heyuan Huang, Ting Liu
2025	RAG-Instruct: Boosting LLMs with Diverse Retrieval-Augmented Instructions. Wanlong Liu, Junying Chen, Ke Ji, Li Zhou, Wenyu Chen, Benyou Wang
2025	RAG-Zeval: Enhancing RAG Responses Evaluator through End-to-End Reasoning and Ranking-Based Reinforcement Learning. Kun Li, Yunxiang Li, Tianhua Zhang, Hongyin Luo, Xixin Wu, James R. Glass, Helen M. Meng
2025	RAGferee: Building Contextual Reward Models for Retrieval-Augmented Generation. Andrei Catalin Coman, Ionut-Teodor Sorodoc, Leonardo F. R. Ribeiro, Bill Byrne, James Henderson, Adrià de Gispert
2025	RALS: Resources and Baselines for Romanian Automatic Lexical Simplification. Fabian Anghel, Cristea Petru-Theodor, Claudiu Creanga, Sergiu Nisioi
2025	RAV: Retrieval-Augmented Voting for Tactile Descriptions Without Training. Jinlin Wang, Yulong Ji, Hongyu Yang
2025	RAVEN: Query-Guided Representation Alignment for Question Answering over Audio, Video, Embedded Sensors, and Natural Language. Subrata Biswas, Mohammad Nur Hossain Khan, Bashima Islam
2025	RAcQUEt: Unveiling the Dangers of Overlooked Referential Ambiguity in Visual LLMs. Alberto Testoni, Barbara Plank, Raquel Fernández
2025	RBPtool: A Deep Language Model Framework for Multi-Resolution RBP-RNA Binding Prediction and RNA Molecule Design. Jiyue Jiang, Yitao Xu, Zikang Wang, Yihan Ye, Yanruisheng Shao, Yuheng Shan, Jiuming Wang, Xiaodan Fan, Jiao Yuan, Yu Li
2025	RCScore: Quantifying Response Consistency in Large Language Models. Dongjun Jang, Youngchae Ahn, Hyopil Shin
2025	RD-MCSA: A Multi-Class Sentiment Analysis Approach Integrating In-Context Classification Rationales and Demonstrations. Haihua Xie, Yinzhu Cheng, Yaqing Wang, Miao He, Mingming Sun
2025	REACT: Representation Extraction And Controllable Tuning to Overcome Overfitting in LLM Knowledge Editing. Haitian Zhong, Yuhuan Liu, Ziyang Xu, Guofan Liu, Qiang Liu, Shu Wu, Zhe Zhao, Liang Wang, Tieniu Tan
2025	REALM: Recursive Relevance Modeling for LLM-based Document Re-Ranking. Pinhuan Wang, Zhiqiu Xia, Chunhua Liao, Feiyi Wang, Hang Liu
2025	REARANK: Reasoning Re-ranking Agent via Reinforcement Learning. Le Zhang, Bo Wang, Xipeng Qiu, Siva Reddy, Aishwarya Agrawal
2025	RECALL: REpresentation-aligned Catastrophic-forgetting ALLeviation via Hierarchical Model Merging. Bowen Wang, Haiyuan Wan, Liwen Shi, Chen Yang, Peng He, Yue Ma, Haochen Han, Wenhao Li, Tiao Tan, Yongjian Li, Fangming Liu, Yifan Gong, Sheng Zhang
2025	RED: Unleashing Token-Level Rewards from Holistic Feedback via Reward Redistribution. Jiahui Li, Lin Li, Tai-Wei Chang, Kun Kuang, Long Chen, Jun Zhou, Cheng Yang
2025	RESF: Regularized-Entropy-Sensitive Fingerprinting for Black-Box Tamper Detection of Large Language Models. Pingyi Hu, Xiaofan Bai, Xiaojing Ma, Chaoxiang He, Dongmei Zhang, Bin Benjamin Zhu
2025	RETAIL: Towards Real-world Travel Planning for Large Language Models. Bin Deng, Yizhe Feng, Zeming Liu, Qing Wei, Xiangrong Zhu, Shuai Chen, Yuanfang Guo, Yunhong Wang
2025	REVIVING YOUR MNEME: Predicting The Side Effects of LLM Unlearning and Fine-Tuning via Sparse Model Diffing. Aly M. Kassem, Zhuan Shi, Negar Rostamzadeh, Golnoosh Farnadi
2025	RICO: Improving Accuracy and Completeness in Image Recaptioning via Visual Reconstruction. Yuchi Wang, Yishuo Cai, Shuhuai Ren, Sihan Yang, Linli Yao, Yuanxin Liu, Yuanxing Zhang, Pengfei Wan, Xu Sun
2025	RJE: A Retrieval-Judgment-Exploration Framework for Efficient Knowledge Graph Question Answering with LLMs. Can Lin, Zhengwang Jiang, Ling Zheng, Qi Zhao, Yuhang Zhang, Qi Song, Wangqiu Zhou
2025	RLAE: Reinforcement Learning-Assisted Ensemble for LLMs. Yuqian Fu, Yuanheng Zhu, Jiajun Chai, Guojun Yin, Wei Lin, Qichao Zhang, Dongbin Zhao
2025	RPDR: A Round-trip Prediction-Based Data Augmentation Framework for Long-Tail Question Answering. Yiming Zhang, Siyue Zhang, Junbo Zhao, Chen Zhao
2025	RRInf: Efficient Influence Function Estimation via Ridge Regression for Large Language Models and Text-to-Image Diffusion Models. Zhuozhuo Tu, Cheng Chen, Yuxuan Du
2025	RTE-GMoE: A Model-agnostic Approach for Relation Triplet Extraction via Graph-based Mixture-of-Expert Mutual Learning. Aziguli Wulamu, Kaiyuan Gong, Lyu Zhengyu, Yu Han, Zhihong Zhu, Bowen Xing
2025	RTQA : Recursive Thinking for Complex Temporal Knowledge Graph Question Answering with Large Language Models. Zhaoyan Gong, Juan Li, Zhiqiang Liu, Lei Liang, Huajun Chen, Wen Zhang
2025	RaDeR: Reasoning-aware Dense Retrieval Models. Debrup Das, Seán Ó Nualláin, Razieh Rahimi
2025	Randomized Smoothing Meets Vision-Language Models. Emmanouil Seferis, Changshun Wu, Stefanos Kollias, Saddek Bensalem, Chih-Hong Cheng
2025	Randomly Removing 50% of Dimensions in Text Embeddings has Minimal Impact on Retrieval and Classification Tasks. Sotaro Takeshita, Yurina Takeshita, Daniel Ruffinelli, Simone Paolo Ponzetto
2025	Rank-Awareness and Angular Constraints: A New Perspective on Learning Sentence Embeddings from NLI Data. Zicheng Zhou, Min Huang, Qinghai Miao
2025	Rapid Word Learning Through Meta In-Context Learning. Wentao Wang, Guangyuan Jiang, Tal Linzen, Brenden M. Lake
2025	RareSyn: Health Record Synthesis for Rare Disease Diagnosis. Huimin Wang, Yutian Zhao, Yefeng Zheng, Xian Wu
2025	Re-Align: Aligning Vision Language Models via Retrieval-Augmented Direct Preference Optimization. Shuo Xing, Peiran Li, Yuping Wang, Ruizheng Bai, Yueqi Wang, Chan-Wei Hu, Chengxuan Qian, Huaxiu Yao, Zhengzhong Tu
2025	ReAgent: Reversible Multi-Agent Reasoning for Knowledge-Enhanced Multi-Hop QA. Xinjie Zhao, Fan Gao, Xingyu Song, Yingjian Chen, Rui Yang, Yanran Fu, Yuyang Wang, Yusuke Iwasawa, Yutaka Matsuo, Irene Li
2025	ReDepress: A Cognitive Framework for Detecting Depression Relapse from Social Media. Aakash Kumar Agarwal, Saprativa Bhattacharjee, Mauli Rastogi, Jemima Jacob, Biplab Banerjee, Rashmi Gupta, Pushpak Bhattacharyya
2025	ReEvalMed: Rethinking Medical Report Evaluation by Aligning Metrics with Real-World Clinical Judgment. Ruochen Li, Jun Li, Bailiang Jian, Kun Yuan, Youxiang Zhu
2025	ReMedy: Learning Machine Translation Evaluation from Human Preferences with Reward Modeling. Shaomu Tan, Christof Monz
2025	ReSURE: Regularizing Supervision Unreliability for Multi-turn Dialogue Fine-tuning. Yiming Du, Yifan Xiang, Bin Liang, Dahua Lin, Kam-Fai Wong, Fei Tan
2025	ReSeeding Latent States for Sequential Language Understanding. Stéphane Aroca-Ouellette, Katharina von der Wense, Alessandro Roncone
2025	ReSo: A Reward-driven Self-organizing LLM-based Multi-Agent System for Reasoning Tasks. Heng Zhou, Hejia Geng, Xiangyuan Xue, Li Kang, Yiran Qin, Zhiyong Wang, Zhenfei Yin, Lei Bai
2025	Read to Hear: A Zero-Shot Pronunciation Assessment Using Textual Descriptions and LLMs. Yu-Wen Chen, Melody Ma, Julia Hirschberg
2025	Reading Between the Prompts: How Stereotypes Shape LLM's Implicit Personalization. Vera Neplenbroek, Arianna Bisazza, Raquel Fernández
2025	Real-time Ad Retrieval via LLM-generative Commercial Intention for Sponsored Search Advertising. Tongtong Liu, Zhaohui Wang, Meiyue Qin, Zenghui Lu, Xudong Chen, Yuekui Yang, Peng Shu
2025	Realistic Training Data Generation and Rule Enhanced Decoding in LLM for NameGuess. Yikuan Xia, Jiazun Chen, Sujian Li, Jun Gao
2025	Reason to Rote: Rethinking Memorization in Reasoning. Yupei Du, Philipp Mondorf, Silvia Casola, Yuekun Yao, Robert Litschko, Barbara Plank
2025	ReasonMed: A 370K Multi-Agent Generated Dataset for Advancing Medical Reasoning. Yu Sun, Xingyu Qian, Weiwen Xu, Hao Zhang, Chenghao Xiao, Long Li, Deli Zhao, Wenbing Huang, Tingyang Xu, Qifeng Bai, Yu Rong
2025	Reasoning Model Unlearning: Forgetting Traces, Not Just Answers, While Preserving Reasoning Skills. Changsheng Wang, Chongyu Fan, Yihua Zhang, Jinghan Jia, Dennis Wei, Parikshit Ram, Nathalie Baracaldo, Sijia Liu
2025	Reasoning under Uncertainty: Efficient LLM Inference via Unsupervised Confidence Dilution and Convergent Adaptive Sampling. Zhenning Shi, Yijia Zhu, Yi Xie, Junhan Shi, Guorui Xie, Haotian Zhang, Yong Jiang, Congcong Miao, Qing Li
2025	Reasoning-to-Defend: Safety-Aware Reasoning Can Defend Large Language Models from Jailbreaking. Junda Zhu, Lingyong Yan, Shuaiqiang Wang, Dawei Yin, Lei Sha
2025	RecBase: Generative Foundation Model Pretraining for Zero-Shot Recommendation. Sashuai Zhou, Weinan Gan, Qijiong Liu, Ke Lei, Jieming Zhu, Hai Huang, Yan Xia, Ruiming Tang, Zhenhua Dong, Zhou Zhao
2025	RecGPT: A Foundation Model for Sequential Recommendation. Yangqin Jiang, Xubin Ren, Lianghao Xia, Da Luo, Kangyi Lin, Chao Huang
2025	Recall with Reasoning: Chain-of-Thought Distillation for Mamba's Long-Context Memory and Extrapolation. Jun-Yu Ma, Tianqing Fang, Zhisong Zhang, Hongming Zhang, Haitao Mi, Dong Yu
2025	Recontextualizing Revitalization: A Mixed Media Approach to Reviving the Nüshu Language. Ivory Yang, Xiaobo Guo, Yuxin Wang, Hefan Zhang, Yaning Jia, William Dinauer, Soroush Vosoughi
2025	Recursive Training Loops in LLMs: How training data properties modulate distribution shift in generated data? Grgur Kovac, Jérémy Perez, Rémy Portelas, Peter Ford Dominey, Pierre-Yves Oudeyer
2025	RedHerring Attack: Testing the Reliability of Attack Detection. Jonathan Rusert
2025	Refining Attention for Explainable and Noise-Robust Fact-Checking with Transformers. Jean-Flavien Bussotti, Paolo Papotti
2025	Refining Text Generation for Realistic Conversational Recommendation via Direct Preference Optimization. Manato Tajiri, Michimasa Inaba
2025	ReflAct: World-Grounded Decision Making in LLM Agents via Goal-State Reflection. Jeonghye Kim, Sojeong Rhee, Minbeom Kim, Dohyung Kim, Sangmook Lee, Youngchul Sung, Kyomin Jung
2025	Reflective Agreement: Combining Self-Mixture of Agents with a Sequence Tagger for Robust Event Extraction. Fatemeh Haji, Mazal Bethany, Cho-Yu Jason Chiang, Anthony Rios, Peyman Najafirad
2025	Reframe Your Life Story: Interactive Narrative Therapist and Innovative Moment Assessment with Large Language Models. Yi Feng, Jiaqi Wang, Wenxuan Zhang, Zhuang Chen, Yutong Shen, Xiyao Xiao, Minlie Huang, Liping Jing, Jian Yu
2025	Refusal-Aware Red Teaming: Exposing Inconsistency in Safety Evaluations. Yongkang Chen, Xiaohu Du, Xiaotian Zou, Chongyang Zhao, Huan Deng, Hu Li, Xiaohui Kuang
2025	Reimagining Safety Alignment with An Image. Yifan Xia, Guorui Chen, Wenqian Yu, Zhijiang Li, Philip Torr, Jindong Gu
2025	Reinforced Query Reasoners for Reasoning-intensive Retrieval Tasks. Xubo Qin, Jun Bai, Jiaqi Li, Zixia Jia, Zilong Zheng
2025	Reinforcement Learning for Large Language Models via Group Preference Reward Shaping. Huaisheng Zhu, Siyuan Xu, Hangfan Zhang, Teng Xiao, Zhimeng Guo, Shijie Zhou, Shuyue Hu, Vasant G. Honavar
2025	Reliable Evaluation and Benchmarks for Statement Autoformalization. Auguste Poiroux, Gail Weiss, Viktor Kuncak, Antoine Bosselut
2025	Reliable and Cost-Effective Exploratory Data Analysis via Graph-Guided RAG. Mossad Helali, Yutai Luo, Tae Jun Ham, Jim Plotts, Ashwin Chaugule, Jichuan Chang, Parthasarathy Ranganathan, Essam Mansour
2025	Representation Potentials of Foundation Models for Multimodal Alignment: A Survey. Jianglin Lu, Hailing Wang, Yi Xu, Yizhou Wang, Kuo Yang, Yun Fu
2025	ResFormer: All-Time Reservoir Memory for Long Sequence Classification. Hongbo Liu, Jia Xu
2025	Rescorla-Wagner Steering of LLMs for Undesired Behaviors over Disproportionate Inappropriate Context. Rushi Wang, Jiateng Liu, Cheng Qian, Yifan Shen, Yanzhou Pan, Zhaozhuo Xu, Ahmed Abbasi, Heng Ji, Denghui Zhang
2025	Reshaping Representation Space to Balance the Safety and Over-rejection in Large Audio Language Models. Hao Yang, Lizhen Qu, Ehsan Shareghi, Gholamreza Haffari
2025	Resource-Rational Noisy-Channel Language Processing: Testing the Effect of Algorithmic Constraints on Inferences. Thomas Hikaru Clark, Jacob Hoover Vigly, Edward Gibson, Roger P. Levy
2025	RethinkMCTS: Refining Erroneous Thoughts in Monte Carlo Tree Search for Code Generation. Qingyao Li, Wei Xia, Xinyi Dai, Kounianhua Du, Weiwen Liu, Yasheng Wang, Ruiming Tang, Yong Yu, Weinan Zhang
2025	Rethinking Backdoor Detection Evaluation for Language Models. Jun Yan, Wenjie Jacky Mo, Xiang Ren, Robin Jia
2025	Rethinking Cross-Subject Data Splitting for Brain-to-Text Decoding. Congchi Yin, Qian Yu, Zhiwei Fang, Changping Peng, Piji Li
2025	Rethinking Text-based Protein Understanding: Retrieval or LLM? Juntong Wu, Zijing Liu, He Cao, Li Hao, Bin Feng, Zishan Shu, Ke Yu, Li Yuan, Yu Li
2025	Retracing the Past: LLMs Emit Training Data When They Get Lost. Myeongseob Ko, Nikhil Reddy Billa, Adam Nguyen, Charles Fleming, Ming Jin, Ruoxi Jia
2025	Retrieval Enhanced Feedback via In-context Neural Error-book. Jongyeop Hyun, Bumsoo Kim
2025	Retrieval over Classification: Integrating Relation Semantics for Multimodal Relation Extraction. Lei Hei, Tingjing Liao, Peiyingxin, Yiyang Qi, Jiaqi Wang, Ruiting Li, Feiliang Ren
2025	Retrieval-Augmented Generation with Estimation of Source Reliability. Jeongyeon Hwang, Junyoung Park, Hyejin Park, Dongwoo Kim, Sangdon Park, Jungseul Ok
2025	Retrieval-augmented GUI Agents with Generative Guidelines. Ran Xu, Kaixin Ma, Wenhao Yu, Hongming Zhang, Joyce C. Ho, Carl Yang, Dong Yu
2025	Retrieving Support to Rank Answers in Open-Domain Question Answering. Zeyu Zhang, Alessandro Moschitti, Thuy Vu
2025	Revealing and Mitigating the Challenge of Detecting Character Knowledge Errors in LLM Role-Playing. Wenyuan Zhang, Shuaiyi Nie, Jiawei Sheng, Zefeng Zhang, Xinghua Zhang, Yongquan He, Tingwen Liu
2025	Reverse Prompt Engineering: A Zero-Shot, Genetic Algorithm Approach to Language Model Inversion. Hanqing Li, Diego Klabjan
2025	ReviewRL: Towards Automated Scientific Review with RL. Sihang Zeng, Kai Tian, Kaiyan Zhang, Yuru wang, Junqi Gao, Runze Liu, Sa Yang, Jingxuan Li, Xinwei Long, Jiaheng Ma, Biqing Qi, Bowen Zhou
2025	Revisiting LLM Value Probing Strategies: Are They Robust and Expressive? Siqi Shen, Mehar Singh, Lajanugen Logeswaran, Moontae Lee, Honglak Lee, Rada Mihalcea
2025	Reward Model Perspectives: Whose Opinions Do Reward Models Reward? Elle
2025	Reward-Shifted Speculative Sampling Is An Efficient Test-Time Weak-to-Strong Aligner. Bolian Li, Yanran Wu, Xinyu Luo, Ruqi Zhang
2025	Reward-Weighted Sampling: Enhancing Non-Autoregressive Characteristics in Masked Diffusion LLMs. Daehoon Gwak, Minseo Jung, Junwoo Park, Minho Park, ChaeHun Park, Junha Hyung, Jaegul Choo
2025	RewardDS: Privacy-Preserving Fine-Tuning for Large Language Models via Reward Driven Data Synthesis. Jianwei Wang, Chengming Shi, Junyao Yang, Haoran Li, Qianli Ma, Huiping Zhuang, Cen Chen, Ziqian Zeng
2025	Rewarding the Unlikely: Lifting GRPO Beyond Distribution Sharpening. Andre Wang He, Daniel Fried, Sean Welleck
2025	RiTTA: Modeling Event Relations in Text-to-Audio Generation. Yuhang He, Yash Jain, Xubo Liu, Andrew Markham, Vibhav Vineet
2025	RoDEval: A Robust Word Sense Disambiguation Evaluation Framework for Large Language Models. Luyang Zhang, Shuaimin Li, Yishuo Li, Kunpeng Kang, Kaiyuan Zhang, Cong Wang, Wenpeng Lu
2025	RoT: Enhancing Table Reasoning with Iterative Row-Wise Traversals. Xuanliang Zhang, Dingzirui Wang, Keyan Xu, Qingfu Zhu, Wanxiang Che
2025	Robust Adaptation of Large Multimodal Models for Retrieval Augmented Hateful Meme Detection. Jingbiao Mei, Jinghong Chen, Guangyu Yang, Weizhe Lin, Bill Byrne
2025	Robust Native Language Identification through Agentic Decomposition. Ahmet Yavuz Uluslu, Tannon Kew, Tilia Ellendorff, Gerold Schneider, Rico Sennrich
2025	Route Sparse Autoencoder to Interpret Large Language Models. Wei Shi, Sihang Li, Tao Liang, Mingyang Wan, Guojun Ma, Xiang Wang, Xiangnan He
2025	Router-Tuning: A Simple and Effective Approach for Dynamic Depth. Shwai He, Tao Ge, Guoheng Sun, Bowei Tian, Xiaoyang Wang, Dong Yu
2025	RuCCoD: Towards Automated ICD Coding in Russian. Alexandr Nesterov, Andrey Sakhovskiy, Ivan Sviridov, Airat Valiev, Vladimir Makharev, Petr Anokhin, Galina Zubkova, Elena Tutubalina
2025	Rule Discovery for Natural Language Inference Data Generation Using Out-of-Distribution Detection. Juyoung Han, Hyunsun Hwang, Changki Lee
2025	SABER: Uncovering Vulnerabilities in Safety Alignment via Cross-Layer Residual Connection. Maithili Joshi, Palash Nandi, Tanmoy Chakraborty
2025	SAE-SSV: Supervised Steering in Sparse Representation Spaces for Reliable Control of Language Models. Zirui He, Mingyu Jin, Bo Shen, Ali Payani, Yongfeng Zhang, Mengnan Du
2025	SAEs Are Good for Steering - If You Select the Right Features. Dana Arad, Aaron Mueller, Yonatan Belinkov
2025	SAFE-SQL: Self-Augmented In-Context Learning with Fine-grained Example Selection for Text-to-SQL. Jimin Lee, Ingeol Baek, Byeongjeong Kim, Hyunkyung Bae, Hwanhee Lee
2025	SAFE: Schema-Driven Approximate Distance Join for Efficient Knowledge Graph Querying. Sangoh Lee, Sungho Park, Wook-Shin Han
2025	SAFENUDGE: Safeguarding Large Language Models in Real-time with Tunable Safety-Performance Trade-offs. João Fonseca, Andrew Bell, Julia Stoyanovich
2025	SAKI-RAG: Mitigating Context Fragmentation in Long-Document RAG via Sentence-level Attention Knowledge Integration. Wenyu Tao, Xiaofen Xing, Zeliang Li, Xiangmin Xu
2025	SAMULE: Self-Learning Agents Enhanced by Multi-level Reflection. Yubin Ge, Salvatore Romeo, Jason Cai, Monica Sunkara, Yi Zhang
2025	SAND: Boosting LLM Agents with Self-Taught Action Deliberation. Yu Xia, Yiran Shen, Junda Wu, Tong Yu, Sungchul Kim, Ryan A. Rossi, Lina Yao, Julian J. McAuley
2025	SATBench: Benchmarking LLMs' Logical Reasoning via Automated Puzzle Generation from SAT Formulas. Anjiang Wei, Yuheng Wu, Yingjia Wan, Tarun Suresh, Huanmi Tan, Zhanke Zhou, Sanmi Koyejo, Ke Wang, Alex Aiken
2025	SATER: A Self-Aware and Token-Efficient Approach to Routing and Cascading. Yuanzhe Shen, Yide Liu, Zisu Huang, Ruicheng Yin, Xiaoqing Zheng, Xuanjing Huang
2025	SCRIBE: Structured Chain Reasoning for Interactive Behaviour Explanations using Tool Calling. Fares Fawzi, Vinitra Swamy, Dominik Glandorf, Tanya Nazaretsky, Tanja Käser
2025	SDGO: Self-Discrimination-Guided Optimization for Consistent Safety in Large Language Models. Peng Ding, Wen Sun, Dailin Li, Wei Zou, Jiaming Wang, Jiajun Chen, Shujian Huang
2025	SEA: Supervised Embedding Alignment for Token-Level Visual-Textual Integration in MLLMs. Yuanyang Yin, Yaqi Zhao, Yajie Zhang, Yuanxing Zhang, Ke Lin, Jiahao Wang, Xin Tao, Pengfei Wan, Wentao Zhang, Feng Zhao
2025	SEAL: Structure and Element Aware Learning Improves Long Structured Document Retrieval. Xinhao Huang, Zhibo Ren, Yipeng Yu, Ying Zhou, Zulong Chen, Zeyi Wen
2025	SEMMA: A Semantic Aware Knowledge Graph Foundation Model. Arvindh Arun, Sumit Kumar, Mojtaba Nayyeri, Bo Xiong, Ponnurangam Kumaraguru, Antonio Vergari, Steffen Staab
2025	SEPS: A Separability Measure for Robust Unlearning in LLMs. Wonje Jeung, Sangyeon Yoon, Albert No
2025	SERVAL: Surprisingly Effective Zero-Shot Visual Document Retrieval Powered by Large Vision and Language Models. Thong Nguyen, Yibin Lei, Jia-Huei Ju, Andrew Yates
2025	SHARP: Steering Hallucination in LVLMs via Representation Engineering. Junfei Wu, Yue Ding, Guofan Liu, Tianze Xia, Ziyue Huang, Dianbo Sui, Qiang Liu, Shu Wu, Liang Wang, Tieniu Tan
2025	SHIFT: Selected Helpful Informative Frame for Video-guided Machine Translation. Boyu Guan, Chuang Han, Yining Zhang, Yupu Liang, Zhiyang Zhang, Yang Zhao, Chengqing Zong
2025	SLlama: Parameter-Efficient Language Model Architecture for Enhanced Linguistic Competence Under Strict Data Constraints. Victor Adelakun Omolaoye, Babajide Alamu Owoyele, Gerard de Melo
2025	SLoW: Select Low-frequency Words! Automatic Dictionary Selection for Translation on Large Language Models. Hongyuan Lu, Zixuan Li, Zefan Zhang, Wai Lam
2025	SMART: Simulated Students Aligned with Item Response Theory for Question Difficulty Prediction. Alexander Scarlatos, Nigel Fernandez, Christopher Ormerod, Susan Lottridge, Andrew S. Lan
2025	SMEC:Rethinking Matryoshka Representation Learning for Retrieval Embedding Compression. Biao Zhang, Lixin Chen, Tong Liu, Bo Zheng
2025	SNaRe: Domain-aware Data Generation for Low-Resource Event Detection. Tanmay Parekh, Yuxuan Dong, Lucas Bandarkar, Artin Kim, I-Hung Hsu, Kai-Wei Chang, Nanyun Peng
2025	SOCIAL SCAFFOLDS: A Generalization Framework for Social Understanding Tasks. Ritam Dutt, Carolyn P. Rosé, Maarten Sap
2025	SOLAR: Towards Characterizing Subjectivity of Individuals through Modeling Value Conflicts and Trade-offs. Younghun Lee, Dan Goldwasser
2025	SPARK: Simulating the Co-evolution of Stance and Topic Dynamics in Online Discourse with LLM-based Agents. Bowen Zhang, Yi Yang, Fuqiang Niu, Xianghua Fu, Genan Dai, Hu Huang
2025	SPE Attention: Making Attention Equivariant to Semantic-Preserving Permutation for Code Processing. Chengyu Jiao, Shuhao Chen, Yu Zhang
2025	SPECS: Specificity-Enhanced CLIP-Score for Long Image Caption Evaluation. Xiaofu Chen, Israfel Salazar, Yova Kementchedjhieva
2025	SPIRIT: Patching Speech Language Models against Jailbreak Attacks. Amirbek Djanibekov, Nurdaulet Mukhituly, Kentaro Inui, Hanan Aldarmaki, Nils Lukas
2025	SPaRC: A Spatial Pathfinding Reasoning Challenge. Lars Benedikt Kaesberg, Jan Philip Wahle, Terry Ruas, Bela Gipp
2025	SQLWOZ: A Realistic Task-Oriented Dialogue Dataset with SQL-Based Dialogue State Representation for Complex User Requirements. Heng-Da Xu, Xian-Ling Mao, Fanshu Sun, Tian-Yi Che, Cheng-Xin Xin, Heyan Huang
2025	SQUAB: Evaluating LLM robustness to Ambiguous and Unanswerable Questions in Semantic Parsing. Simone Papicchio, Luca Cagliero, Paolo Papotti
2025	SQUiD: Synthesizing Relational Databases from Unstructured Text. Mushtari Sadia, Zhenning Yang, Yunming Xiao, Ang Chen, Amrita Roy Chowdhury
2025	SSA-COMET: Do LLMs Outperform Learned Metrics in Evaluating MT for Under-Resourced African Languages? Senyu Li, Jiayi Wang, Felermino D. M. A. Ali, Colin Cherry, Daniel Deutsch, Eleftheria Briakou, Rui Sousa-Silva, Henrique Lopes Cardoso, Pontus Stenetorp, David Ifeoluwa Adelani
2025	SSA: Semantic Contamination of LLM-Driven Fake News Detection. Cheng Xu, Nan Yan, Shuhao Guan, Yuke Mei, M. Tahar Kechadi
2025	STARE at the Structure: Steering ICL Exemplar Selection with Structural Alignment. Jiaqian Li, Qisheng Hu, Jing Li, Wenya Wang
2025	STARQA: A Question Answering Dataset for Complex Analytical Reasoning over Structured Databases. Mounica Maddela, Lingjue Xie, Daniel Preotiuc-Pietro, Mausam
2025	START: Self-taught Reasoner with Tools. Chengpeng Li, Mingfeng Xue, Zhenru Zhang, Jiaxi Yang, Beichen Zhang, Bowen Yu, Binyuan Hui, Junyang Lin, Xiang Wang, Dayiheng Liu
2025	STEER-BENCH: A Benchmark for Evaluating the Steerability of Large Language Models. Kai Chen, Zihao He, Taiwei Shi, Kristina Lerman
2025	STRICT: Stress-Test of Rendering Image Containing Text. Tianyu Zhang, Xinyu Wang, Lu Li, Zhenghan Tai, Jijun Chi, Jingrui Tian, Hailin He, Suyuchen Wang
2025	SUA: Stealthy Multimodal Large Language Model Unlearning Attack. Xianren Zhang, Hui Liu, Delvin Ce Zhang, Xianfeng Tang, Qi He, Dongwon Lee, Suhang Wang
2025	SUE: Sparsity-based Uncertainty Estimation via Sparse Dictionary Learning. Tamás Ficsor, Gábor Berend
2025	SURE: Safety Understanding and Reasoning Enhancement for Multimodal Large Language Models. Yuxin Gou, Xiaoning Dong, Qin Li, Shishen Gu, Richang Hong, Wenbo Hu
2025	SWAM: Adaptive Sliding Window and Memory-Augmented Attention Model for Rumor Detection. Mei Guo, Chen Chen, Chunyan Hou, Yike Wu, Xiaojie Yuan
2025	SWAN: An Efficient and Scalable Approach for Long-Context Language Modeling. Krishna C. Puvvada, Faisal Ladhak, Santiago Akle Serano, Cheng-Ping Hsieh, Shantanu Acharya, Somshubra Majumdar, Fei Jia, Samuel Kriman, Simeng Sun, Dima Rekesh, Boris Ginsburg
2025	SYNC: A Synthetic Long-Context Understanding Benchmark for Controlled Comparisons of Model Capabilities. Shuyang Cao, Kaijian Zou, Lu Wang
2025	SafeKey: Amplifying Aha-Moment Insights for Safety Reasoning. Kaiwen Zhou, Xuandong Zhao, Jayanth Srinivasa, Gaowen Liu, Aosong Feng, Dawn Song, Xin Eric Wang
2025	SafeScientist: Enhancing AI Scientist Safety for Risk-Aware Scientific Discovery. Kunlun Zhu, Jiaxun Zhang, Ziheng Qi, Nuoxing Shang, Zijia Liu, Peixuan Han, Yu Su, Haofei Yu, Jiaxuan You
2025	Sali4Vid: Saliency-Aware Video Reweighting and Adaptive Caption Retrieval for Dense Video Captioning. MinJu Jeon, Si-Woo Kim, Ye-Chan Kim, HyunGee Kim, Dong-Jin Kim
2025	Same Question, Different Words: A Latent Adversarial Framework for Prompt Robustness. Tingchen Fu, Fazl Barez
2025	Same evaluation, more tokens: On the effect of input length for machine translation evaluation using Large Language Models. Tobias Domhan, Dawei Zhu
2025	Scalable Data Synthesis through Human-like Cognitive Imitation and Data Recombination. Zhongyi Ye, Weitai Zhang, Xinyuan Zhou, Yongxin Zhu, Ninghui Rao, Enhong Chen
2025	Scalable and Culturally Specific Stereotype Dataset Construction via Human-LLM Collaboration. Weicheng Ma, John J. Guerrerio, Soroush Vosoughi
2025	Scaling Low-Resource MT via Synthetic Data Generation with LLMs. Ona de Gibert, Joseph Attieh, Teemu Vahtola, Mikko Aulamo, Zihao Li, Raúl Vázquez, Tiancheng Hu, Jörg Tiedemann
2025	Scaling Rich Style-Prompted Text-to-Speech Datasets. Anuj Diwan, Zhisheng Zheng, David Harwath, Eunsol Choi
2025	Scaling Up Temporal Domain Generalization via Temporal Experts Averaging. Aoming Liu, Kevin Miller, Venkatesh Saligrama, Kate Saenko, Boqing Gong, Ser-Nam Lim, Bryan A. Plummer
2025	SciEvent: Benchmarking Multi-domain Scientific Event Extraction. Bofu Dong, Pritesh Shah, Sumedh Sonawane, Tiyasha Banerjee, Erin Brady, Xinya Du, Ming Jiang
2025	SciNLP: A Domain-Specific Benchmark for Full-Text Scientific Entity and Relation Extraction in NLP. Decheng Duan, Jitong Peng, Yingyi Zhang, Chengzhi Zhang
2025	SciRIFF: A Resource to Enhance Language Model Instruction-Following over Scientific Literature. David Wadden, Kejian Shi, Jacob Morrison, Alan Li, Aakanksha Naik, Shruti Singh, Nitzan Barzilay, Kyle Lo, Tom Hope, Luca Soldaini, Shannon Zejiang Shen, Doug Downey, Hannaneh Hajishirzi, Arman Cohan
2025	SeMob: Semantic Synthesis for Dynamic Urban Mobility Prediction. Runfei Chen, Shuyang Jiang, Wei Huang
2025	Search Wisely: Mitigating Sub-optimal Agentic Searches By Reducing Uncertainty. Peilin Wu, Mian Zhang, Xinlu Zhang, Xinya Du, Zhiyu Chen
2025	Search-o1: Agentic Search-Enhanced Large Reasoning Models. Xiaoxi Li, Guanting Dong, Jiajie Jin, Yuyao Zhang, Yujia Zhou, Yutao Zhu, Peitian Zhang, Zhicheng Dou
2025	Searching for the Most Human-like Emergent Language. Brendon Boldt, David R. Mortensen
2025	Section-Level Simplification of Biomedical Abstracts. Jan Bakker, Jaap Kamps
2025	Seeing Culture: A Benchmark for Visual Reasoning and Grounding. Burak Satar, Zhixin Ma, Patrick Amadeus Irawan, Wilfried A. Mulyawan, Jing Jiang, Ee-Peng Lim, Chong-Wah Ngo
2025	Seeing More, Saying More: Lightweight Language Experts are Dynamic Video Token Compressors. Xiangchen Wang, Jinrui Zhang, Teng Wang, Haigang Zhang, Feng Zheng
2025	Seeing Through Words, Speaking Through Pixels: Deep Representational Alignment Between Vision and Language Models. Zoe Wanying He, Sean Trott, Meenakshi Khosla
2025	Seeing is Believing, but How Much? A Comprehensive Analysis of Verbalized Calibration in Vision-Language Models. Weihao Xuan, Qingcheng Zeng, Heli Qi, Junjue Wang, Naoto Yokoya
2025	Seeing the Same Story Differently: Framing-Divergent Event Coreference for Computational Framing Analysis. Jin Zhao, Xinrui Hu, Nianwen Xue
2025	Select-Then-Decompose: From Empirical Analysis to Adaptive Selection Strategy for Task Decomposition in Large Language Models. Shuodi Liu, Yingzhuo Liu, Zi Wang, Yusheng Wang, Huijia Wu, Liuyu Xiang, Zhaofeng He
2025	Selective Preference Optimization via Token-Level Reward Function Estimation. Kailai Yang, Zhiwei Liu, Qianqian Xie, Jimin Huang, Erxue Min, Sophia Ananiadou
2025	Self-Adjust Softmax. Chuanyang Zheng, Yihang Gao, Guoxuan Chen, Han Shi, Jing Xiong, Xiaozhe Ren, Chao Huang, Zhenguo Li, Yu Li
2025	Self-Augmented Preference Alignment for Sycophancy Reduction in LLMs. Chien Hung Chen, Hen-Hsen Huang, Hsin-Hsi Chen
2025	Self-Critique and Refinement for Faithful Natural Language Explanations. Yingming Wang, Pepa Atanasova
2025	SelfRACG: Enabling LLMs to Self-Express and Retrieve for Code Generation. Qian Dong, Jia Chen, Qingyao Ai, Hongning Wang, Haitao Li, Yi Wu, Yao Hu, Yiqun Liu, Shaoping Ma
2025	SemCSE: Semantic Contrastive Sentence Embeddings Using LLM-Generated Summaries For Scientific Abstracts. Marc Felix Brinner, Sina Zarrieß
2025	SemVink: Advancing VLMs' Semantic Understanding of Optical Illusions via Visual Global Thinking. Sifan Li, Yujun Cai, Yiwei Wang
2025	Semantic Inversion, Identical Replies: Revisiting Negation Blindness in Large Language Models. Jinsung Kim, Seonmin Koo, Heuiseok Lim
2025	Semantic Networks Extracted from Students' Think-Aloud Data are Correlated with Students' Learning Performance. Pingjing Yang, Sullam Jeoung, Jennifer Cromley, Jana Diesner
2025	SenDetEX: Sentence-Level AI-Generated Text Detection for Human-AI Hybrid Content via Style and Context Fusion. Lei Jiang, Desheng Wu, Xiaolong Zheng
2025	SensorLLM: Aligning Large Language Models with Motion Sensors for Human Activity Recognition. Zechen Li, Shohreh Deldari, Linyao Chen, Hao Xue, Flora D. Salim
2025	Sentence Smith: Controllable Edits for Evaluating Text Embeddings. Hongji Li, Andrianos Michail, Reto Gubelmann, Simon Clematide, Juri Opitz
2025	Separate the Wheat from the Chaff: Winnowing Down Divergent Views in Retrieval Augmented Generation. Song Wang, Zihan Chen, Peng Wang, Zhepei Wei, Zhen Tan, Yu Meng, Cong Shen, Jundong Li
2025	Sequential-NIAH: A Needle-In-A-Haystack Benchmark for Extracting Sequential Needles from Long Contexts. Yifei Yu, Qian-Wen Zhang, Lingfeng Qiao, Di Yin, Fang Li, Jie Wang, Chen Zeng Xi, Suncong Zheng, Xiaolong Liang, Xing Sun
2025	Shallow Focus, Deep Fixes: Enhancing Shallow Layers Vision Attention Sinks to Alleviate Hallucination in LVLMs. Xiaofeng Zhang, Yihao Quan, Chen Shen, Chaochen Gu, Xiaosong Yuan, Shaotian Yan, Jiawei Cao, Hao Cheng, Kaijie Wu, Jieping Ye
2025	Shared Path: Unraveling Memorization in Multilingual LLMs through Language Similarities. Xiaoyu Luo, Yiyi Chen, Johannes Bjerva, Qiongxiu Li
2025	Sheaf Discovery with Joint Computation Graph Pruning and Flexible Granularity. Lei Yu, Jingcheng Niu, Zining Zhu, Xi Chen, Gerald Penn
2025	SheetDesigner: MLLM-Powered Spreadsheet Layout Generation with Rule-Based and Vision-Based Reflection. Qin Chen, Yuanyi Ren, Xiaojun Ma, Mugeng Liu, Shi Han, Dongmei Zhang
2025	Should I Share this Translation? Evaluating Quality Feedback for User Reliance on Machine Translation. Dayeon Ki, Kevin Duh, Marine Carpuat
2025	SilVar: Speech-Driven Multimodal Model for Reasoning Visual Question Answering and Object Localization. Tan-Hanh Pham, Hoang-Nam Le, Phu-Vinh Nguyen, Chris Ngo, Truong-Son Hy
2025	SimMark: A Robust Sentence-Level Similarity-Based Watermarking Algorithm for Large Language Models. AmirHossein Dabiri Aghdam, Lele Wang
2025	SimVBG: Simulating Individual Values by Backstory Generation. Bangde Du, Ziyi Ye, Zhijing Wu, Monika Jankowska, Shuqi Zhu, Qingyao Ai, Yujia Zhou, Yiqun Liu
2025	Similarity = Value? Consultation Value-Assessment and Alignment for Personalized Search. Weicong Qin, Yi Xu, Weijie Yu, Teng Shi, Chenglei Shen, Ming He, Jianping Fan, Xiao Zhang, Jun Xu
2025	Simple Yet Effective: An Information-Theoretic Approach to Multi-LLM Uncertainty Quantification. Maya Kruse, Majid Afshar, Saksham Khatwani, Anoop M. Mayampurath, Guanhua Chen, Yanjun Gao
2025	SimpleDoc: Multi-Modal Document Understanding with Dual-Cue Page Retrieval and Iterative Refinement. Chelsi Jain, Yiran Wu, Yifan Zeng, Jiale Liu, Shengyu Dai, Zhenwen Shao, Qingyun Wu, Huazheng Wang
2025	SimulatorArena: Are User Simulators Reliable Proxies for Multi-Turn Evaluation of AI Assistants? Yao Dou, Michel Galley, Baolin Peng, Chris Kedzie, Weixin Cai, Alan Ritter, Chris Quirk, Wei Xu, Jianfeng Gao
2025	Single LLM, Multiple Roles: A Unified Retrieval-Augmented Generation Framework Using Role-Specific Token Optimization. Yutao Zhu, Jiajie Jin, Hongjin Qian, Zheng Liu, Zhicheng Dou, Ji-Rong Wen
2025	SinhalaMMLU: A Comprehensive Benchmark for Evaluating Multitask Language Understanding in Sinhala. Ashmari Pramodya, Nirasha Nelki, Heshan Shalinda, Chamila Liyanage, Yusuke Sakai, Randil Pushpananda, Ruvan Weerasinghe, Hidetaka Kamigaito, Taro Watanabe
2025	Skeletons Matter: Dynamic Data Augmentation for Text-to-Query. Yuchen Ji, Bo Xu, Jie Shi, Jiaqing Liang, Deqing Yang, Yu Mao, Hai Chen, Yanghua Xiao
2025	Sketch-of-Thought: Efficient LLM Reasoning with Adaptive Cognitive-Inspired Sketching. Simon A. Aytes, Jinheon Baek, Sung Ju Hwang
2025	Skip-Thinking: Chunk-wise Chain-of-Thought Distillation Enable Smaller Language Models to Reason Better and Faster. Xiaoshu Chen, Sihang Zhou, Ke Liang, Xiaoyu Sun, Xinwang Liu
2025	SliceMoE: Routing Embedding Slices Instead of Tokens for Fine-Grained and Balanced Transformer Scaling. Harshil Vejendla
2025	SlideCoder: Layout-aware RAG-enhanced Hierarchical Slide Generation from Design. Wenxin Tang, Jingyu Xiao, Wenxuan Jiang, Xi Xiao, Yuhang Wang, Xuxin Tang, Qing Li, Yuehe Ma, Junliang Liu, Shisong Tang, Michael R. Lyu
2025	Slim-SC: Thought Pruning for Efficient Scaling with Self-Consistency. Colin Hong, Xu Guo, Anand Chaanan Singh, Esha Choukse, Dmitrii Ustiugov
2025	Small Models, Big Results: Achieving Superior Intent Extraction through Decomposition. Danielle Cohen, Yoni Halpern, Noam Kahlon, Joel Oren, Omri Berkovitch, Sapir Caduri, Ido Dagan, Anatoly Efros
2025	SmartBench: Is Your LLM Truly a Good Chinese Smartphone Assistant? Xudong Lu, Haohao Gao, Renshou Wu, Shuai Ren, Xiaoxin Chen, Hongsheng Li, Fangyuan Li
2025	Social Bias in Multilingual Language Models: A Survey. Lance Calvin Lim Gamboa, Yue Feng, Mark G. Lee
2025	Social Genome: Grounded Social Reasoning Abilities of Multimodal Models. Leena Mathur, Marian Qian, Paul Pu Liang, Louis-Philippe Morency
2025	Social Good or Scientific Curiosity? Uncovering the Research Framing Behind NLP Artefacts. Eric Chamoun, Nedjma Ousidhoum, Michael Sejr Schlichtkrull, Andreas Vlachos
2025	SocioBench: Modeling Human Behavior in Sociological Surveys with Large Language Models. Jia Wang, Ziyu Zhao, Tingjuntao Ni, Zhongyu Wei
2025	Socratic-MCTS: Test-Time Visual Reasoning by Asking the Right Questions. David Acuna, Ximing Lu, Jaehun Jung, Hyunwoo Kim, Amlan Kar, Sanja Fidler, Yejin Choi
2025	SolEval: Benchmarking Large Language Models for Repository-level Solidity Smart Contract Generation. Zhiyuan Peng, Xin Yin, Rui Qian, Peiqin Lin, Yongkang Liu, Hao Zhang, Chenhao Ying, Yuan Luo
2025	SoundMind: RL-Incentivized Logic Reasoning for Audio-Language Models. Xingjian Diao, Chunhui Zhang, Keyi Kong, Weiyi Wu, Chiyu Ma, Zhongyu Ouyang, Peijun Qing, Soroush Vosoughi, Jiang Gui
2025	Sparse Activation Editing for Reliable Instruction Following in Narratives. Runcong Zhao, Chengyu Cao, Qinglin Zhu, Xiucheng Lyu, Shun Shao, Lin Gui, Ruifeng Xu, Yulan He
2025	Sparse Autoencoder Features for Classifications and Transferability. Jack Gallifant, Shan Chen, Kuleen Sasse, Hugo J. W. L. Aerts, Thomas Hartvigsen, Danielle S. Bitterman
2025	Sparse Neurons Carry Strong Signals of Question Ambiguity in LLMs. Zhuoxuan Zhang, Jinhao Duan, Edward Kim, Kaidi Xu
2025	Spatial Layouts in News Homepages Capture Human Preferences. Alexander Spangher, Michael Vu, Arda Kaz, Naitian Zhou, Ben Welsh
2025	Spec-VLA: Speculative Decoding for Vision-Language-Action Models with Relaxed Acceptance. Songsheng Wang, Rucheng Yu, Zhihang Yuan, Chao Yu, Feng Gao, Yu Wang, Derek F. Wong
2025	SpecVLM: Enhancing Speculative Decoding of Video LLMs via Verifier-Guided Token Pruning. Yicheng Ji, Jun Zhang, Heming Xia, Jinpeng Chen, Lidan Shou, Gang Chen, Huan Li
2025	Spectral Scaling Laws in Language Models: emphHow Effectively Do Feed-Forward Networks Use Their Latent Space? Nandan Kumar Jha, Brandon Reagen
2025	Speculating LLMs' Chinese Training Data Pollution from Their Tokens. Qingjie Zhang, Di Wang, Haoting Qian, Liu Yan, Tianwei Zhang, Ke Xu, Qi Li, Minlie Huang, Hewu Li, Han Qiu
2025	Speculative Safety-Aware Decoding. Xuekang Wang, Shengyu Zhu, Xueqi Cheng
2025	Speculative Streaming: Efficient and Scalable Speculative Decoding with Multi-Stream Attention. Nikhil Bhendawade, Irina Belousova, Qichen Fu, Henry Mason, Antonie Lin, Mohammad Rastegari, Mahyar Najibi
2025	Speech Discrete Tokens or Continuous Features? A Comparative Analysis for Spoken Language Understanding in SpeechLLMs. Dingdong Wang, Junan Li, Mingyu Cui, Dongchao Yang, Xueyuan Chen, Helen M. Meng
2025	Speech Vecalign: an Embedding-based Method for Aligning Parallel Speech Documents. Chutong Meng, Philipp Koehn
2025	Split-Merge: Scalable and Memory-Efficient Merging of Expert LLMs. Sruthi Gorantla, Aditya Rawal, Devamanyu Hazarika, Kaixiang Lin, Mingyi Hong, Mahdi Namazifar
2025	Spontaneous Giving and Calculated Greed in Language Models. Yuxuan Li, Hirokazu Shirado
2025	SportReason: Evaluating Retrieval-Augmented Reasoning across Tables and Text for Sports Question Answering. Kaiyue Feng, Siyue Zhang, Bingsen Chen, Yilun Zhao, Chen Zhao
2025	Stand on The Shoulders of Giants: Building JailExpert from Previous Attack Experience. Xi Wang, Songlei Jian, Shasha Li, Xiaopeng Li, Bin Ji, Ma Jun, Xiaodong Liu, Jing Wang, Jianfeng Zhang, Jie Yu, Feilong Bao, Wangbaosheng
2025	Static Word Embeddings for Sentence Semantic Representation. Takashi Wada, Yuki Hirakawa, Ryotaro Shimizu, Takahiro Kawashima, Yuki Saito
2025	Static or Dynamic: Towards Query-Adaptive Token Selection for Video Question Answering. Yumeng Shi, Quanyu Long, Wenya Wang
2025	Statistical and Neural Methods for Hawaiian Orthography Modernization. Jaden Kapali, Keaton Williamson, Winston Wu
2025	Steering LLM Reasoning Through Bias-Only Adaptation. Viacheslav Sinii, Alexey Gorbatovski, Artem Cherepanov, Boris Shaposhnikov, Nikita Balagansky, Daniil Gavrilov
2025	Steering Language Models in Multi-Token Generation: A Case Study on Tense and Aspect. Alina Klerings, Jannik Brinkmann, Daniel Ruffinelli, Simone Paolo Ponzetto
2025	Step Guided Reasoning: Improving Mathematical Reasoning using Guidance Generation and Step Reasoning. Lang Cao, Yingtian Zou, Chao Peng, Renhong Chen, Wu Ning, Yitong Li
2025	Step-level Verifier-guided Hybrid Test-Time Scaling for Large Language Models. Kaiyan Chang, Yonghao Shi, Chenglong Wang, Hang Zhou, Chi Hu, Xiaoqian Liu, Yingfeng Luo, Yuan Ge, Tong Xiao, Jingbo Zhu
2025	StepER: Step-wise Knowledge Distillation for Enhancing Reasoning Ability in Multi-Step Retrieval-Augmented Language Models. Kyumin Lee, Minjin Jeon, Sanghwan Jang, Hwanjo Yu
2025	StepSearch: Igniting LLMs Search Ability via Step-Wise Proximal Policy Optimization. Xuhui Zheng, Kang An, Ziliang Wang, Yuhang Wang, Yichao Wu
2025	Stepwise Informativeness Search for Improving LLM Reasoning. Siyuan Wang, Enda Zhao, Xiang Ren
2025	Stepwise Reasoning Checkpoint Analysis: A Test Time Scaling Method to Enhance LLMs' Reasoning. Zezhong Wang, Xingshan Zeng, Weiwen Liu, Yufei Wang, Liangyou Li, Yasheng Wang, Lifeng Shang, Xin Jiang, Qun Liu, Kam-Fai Wong
2025	Sticker-TTS: Learn to Utilize Historical Experience with a Sticker-driven Test-Time Scaling Framework. Jie Chen, Jinhao Jiang, Yingqian Min, Zican Dong, Shijie Wang, Wayne Xin Zhao, Ji-Rong Wen
2025	Stimulate the Critical Thinking of LLMs via Debiasing Discussion. Ruiyu Xiao, Lei Wu, Yuanxing Liu, Weinan Zhang, Ting Liu
2025	Stop Looking for "Important Tokens" in Multimodal Language Models: Duplication Matters More. Zichen Wen, Yifeng Gao, Shaobo Wang, Junyuan Zhang, Qintong Zhang, Weijia Li, Conghui He, Linfeng Zhang
2025	Stronger Baselines for Retrieval-Augmented Generation with Long-Context Language Models. Alex Laitenberger, Christopher D. Manning, Nelson F. Liu
2025	Structure-Conditional Minimum Bayes Risk Decoding. Bryan Eikema, Anna Rutkiewicz, Mario Giulianelli
2025	Structured Moral Reasoning in Language Models: A Value-Grounded Evaluation Framework. Mohna Chakraborty, Lu Wang, David Jurgens
2025	Structured Preference Optimization for Vision-Language Long-Horizon Task Planning. Xiwen Liang, Min Lin, Weiqi Ruan, Rongtao Xu, Yuecheng Liu, Jiaqi Chen, Bingqian Lin, Yuzheng Zhuang, Xiaodan Liang
2025	Structuring Radiology Reports: Challenging LLMs with Lightweight Models. Johannes Moll, Louisa Fay, Asfandyar Azhar, Sophie Ostmeier, Sergios Gatidis, Tim C. Lueth, Curtis Langlotz, Jean-Benoit Delbrouck
2025	Studying Rhetorically Ambiguous Questions. Oghenevovwe Ikumariegbe, Eduardo Blanco, Ellen Riloff
2025	Studying the Role of Input-Neighbor Overlap in Retrieval-Augmented Language Models Training Efficiency. Ehsan Doostmohammadi, Marco Kuhlmann
2025	Subjective Behaviors and Preferences in LLM: Language of Browsing. Sai Sundaresan, Harshita Chopra, Atanu R. Sinha, Koustava Goswami, Nagasai Saketh Naidu, Raghav Karan, N. Anushka
2025	Subtle Risks, Critical Failures: A Framework for Diagnosing Physical Safety of LLMs for Embodied Decision Making. Yejin Son, Minseo Kim, Sungwoong Kim, Seungju Han, Jian Kim, Dongju Jang, Youngjae Yu, Chan Young Park
2025	Summarizing Speech: A Comprehensive Survey. Fabian Retkowski, Maike Züfle, Andreas Sudmann, Dinah Pfau, Shinji Watanabe, Jan Niehues, Alexander Waibel
2025	Superficial Self-Improved Reasoners Benefit from Model Merging. Xiangchi Yuan, Chunhui Zhang, Zheyuan Liu, Dachuan Shi, Leyan Pan, Soroush Vosoughi, Wenke Lee
2025	Superpose Task-specific Features for Model Merging. Haiquan Qiu, You Wu, Dong Li, Jianmin Guo, Quanming Yao
2025	Supervised Attention Mechanism for Low-quality Multimodal Data. Sijie Mai, Shiqin Han, Haifeng Hu
2025	Surge: On the Potential of Large Language Models as General-Purpose Surrogate Code Executors. Bohan Lyu, Siqiao Huang, Zichen Liang, Qian Sun, Jiaming Zhang
2025	Surprise Calibration for Better In-Context Learning. Zhihang Tan, Jingrui Hou, Ping Wang, Qibiao Hu, Peng Zhu
2025	SurveyGen: Quality-Aware Scientific Survey Generation with Large Language Models. Tong Bao, Mir Tafseer Nayeem, Davood Rafiei, Chengzhi Zhang
2025	SwarmAgentic: Towards Fully Automated Agentic System Generation via Swarm Intelligence. Yao Zhang, Chenyang Lin, Shijie Tang, Haokun Chen, Shijie Zhou, Yunpu Ma, Volker Tresp
2025	SwiftKV: Fast Prefill-Optimized Inference with Knowledge-Preserving Model Transformation. Aurick Qiao, Zhewei Yao, Samyam Rajbhandari, Yuxiong He
2025	Sycophancy Mitigation Through Reinforcement Learning with Uncertainty-Aware Adaptive Reasoning Trajectories. Mohammad Beigi, Ying Shen, Parshin Shojaee, Qifan Wang, Zichao Wang, Chandan K. Reddy, Ming Jin, Lifu Huang
2025	SynC-LLM: Generation of Large-Scale Synthetic Circuit Code with Hierarchical Language Models. Shang Liu, Yao Lu, Wenji Fang, Jing Wang, Zhiyao Xie
2025	Synergizing Multimodal Temporal Knowledge Graphs and Large Language Models for Social Relation Recognition. Haorui Wang, Zheng Wang, Yuxuan Zhang, Bo Wang, Bin Wu
2025	Syntax-Aware Retrieval Augmentation for Neural Symbolic Regression. Canmiao Zhou, Han Huang
2025	Synth-SBDH: A Synthetic Dataset of Social and Behavioral Determinants of Health for Clinical Text. Avijit Mitra, Zhichao Yang, Emily Druhl, Raelene Goodwin, Hong Yu
2025	Synthetic Socratic Debates: Examining Persona Effects on Moral Decision and Persuasion Dynamics. Jiarui Liu, Yueqi Song, Yunze Xiao, Mingqian Zheng, Lindia Tjuatja, Jana Schaich Borg, Mona T. Diab, Maarten Sap
2025	T Zhengyi Zhao, Shubo Zhang, Zezhong Wang, Huimin Wang, Yutian Zhao, Bin Liang, Yefeng Zheng, Binyang Li, Kam-Fai Wong, Xian Wu
2025	T-MAD: Target-driven Multimodal Alignment for Stance Detection. Zhaodan Zhang, Jin Zhang, Xueqi Cheng, Hui Xu
2025	T2R-BENCH: A Benchmark for Real World Table-to-Report Task. Jie Zhang, Changzai Pan, Sishi Xiong, Kaiwen Wei, Yu Zhao, Xiangyu Li, Jiaxin Peng, Xiaoyan Gu, Jian Yang, Wenhan Chang, Zhenhe Wu, Jiang Zhong, Shuangyong Song, Xuelong Li
2025	TACO: Enhancing Multimodal In-context Learning via Task Mapping-Guided Sequence Configuration. Yanshu Li, Jianjiang Yang, Tian Yun, Pinyuan Feng, Jinfa Huang, Ruixiang Tang
2025	TALON: A Multi-Agent Framework for Long-Table Exploration and Question Answering. Ruochun Jin, Xiyue Wang, Dong Wang, Haoqi Zheng, Yunpeng Qi, Silin Yang, Meng Zhang
2025	TAPS: Tool-Augmented Personalisation via Structured Tagging. Ekaterina Taktasheva, Jeff Dalton
2025	TASO: Task-Aligned Sparse Optimization for Parameter-Efficient Model Adaptation. Daiye Miao, Yufang Liu, Jie Wang, Changzhi Sun, Yunke Zhang, Demei Yan, Shaokang Dong, Qi Zhang, Yuanbin Wu
2025	TCP: a Benchmark for Temporal Constraint-Based Planning. Zifeng Ding, Sikuan Yan, Moy Yuan, Xianglong Hu, Fangru Lin, Andreas Vlachos
2025	TCPO: Thought-Centric Preference Optimization for Effective Embodied Decision-making. Kechen Jiao, Zhirui Fang, Jiahao Liu, Bei Li, Qifan Wang, Xinyu Liu, Junhao Ruan, Zhongjian Qiao, Yifan Zhu, Yaxin Xu, Jingang Wang, Xiu Li
2025	TFDP: Token-Efficient Disparity Audits for Autoregressive LLMs via Single-Token Masked Evaluation. Inderjeet Singh, Ramya Srinivasan, Roman Vainshtein, Hisashi Kojima
2025	TIDES: Technical Information Discovery and Extraction System. Jihee Kim, Subeen Park, Hakyung Lee, YongTaek Lim, Hyo-Won Suh, Kyungwoo Song
2025	TLUE: A Tibetan Language Understanding Evaluation Benchmark. Fan Gao, Cheng Huang, Yutong Liu, Nyima Tashi, Xiangxiang Wang, Thupten Tsering, Ban Ma-bao, Renzeng Duojie, Gadeng Luosang, Rinchen Dongrub, Dorje Tashi, Xiao Feng, Yongbin Yu, Hao Wang
2025	TORSO: Template-Oriented Reasoning Towards General Tasks. Minhyuk Kim, Seungyoon Lee, Heuiseok Lim
2025	TP-RAG: Benchmarking Retrieval-Augmented Large Language Model Agents for Spatiotemporal-Aware Travel Planning. Hang Ni, Fan Liu, Xinyu Ma, Lixin Su, Shuaiqiang Wang, Dawei Yin, Hui Xiong, Hao Liu
2025	TRIAL: Token Relations and Importance Aware Late-interaction for Accurate Text Retrieval. Hyukkyu Kang, Injung Kim, Wook-Shin Han
2025	TRUST-VL: An Explainable News Assistant for General Multimodal Misinformation Detection. Zehong Yan, Peng Qi, Wynne Hsu, Mong-Li Lee
2025	TS-CLIP: Time Series Understanding by CLIP. Ziwen Chen, Xiaoyuan Zhang, Ming Zhu
2025	TSVer: A Benchmark for Fact Verification Against Time-Series Evidence. Marek Strong, Andreas Vlachos
2025	TTT-Bench: A Benchmark for Evaluating Reasoning Ability with Simple and Novel Tic-Tac-Toe-style Games. Prakamya Mishra, Jiang Liu, Jialian Wu, Xiaodong Yu, Zicheng Liu, Emad Barsoum
2025	TVQACML: Benchmarking Text-Centric Visual Question Answering in Multilingual Chinese Minority Languages. Jiu Sha, Yu Weng, Mengxiao Zhu, Chong Feng, Zheng Liu, Jialedongzhu
2025	Table-LLM-Specialist: Language Model Specialists for Tables using Iterative Fine-tuning. Junjie Xing, Yeye He, Mengyu Zhou, Haoyu Dong, Shi Han, Dongmei Zhang, Surajit Chaudhuri
2025	Table-R1: Inference-Time Scaling for Table Reasoning Tasks. Zheyuan Yang, Lyuhao Chen, Arman Cohan, Yilun Zhao
2025	TableEval: A Real-World Benchmark for Complex, Multilingual, and Multi-Structured Table Question Answering. Junnan Zhu, Jingyi Wang, Bohan Yu, Xiaoyu Wu, Junbo Li, Lei Wang, Nan Xu
2025	TableRAG: A Retrieval Augmented Generation Framework for Heterogeneous Document Reasoning. Xiaohan Yu, Pu Jian, Chong Chen
2025	TactfulToM: Do LLMs have the Theory of Mind ability to understand White Lies? Yiwei Liu, Emma Jane Pretty, Jiahao Huang, Saku Sugawara
2025	Tailoring Table Retrieval from a Field-aware Hybrid Matching Perspective. Da Li, Keping Bi, Jiafeng Guo, Xueqi Cheng
2025	Taking Notes Brings Focus? Towards Multi-Turn Multimodal Dialogue Learning. Jiazheng Liu, Sipeng Zheng, Börje F. Karlsson, Zongqing Lu
2025	Taming Text-to-Image Synthesis for Novices: User-centric Prompt Generation via Multi-turn Guidance. Yilun Liu, Minggui He, Feiyu Yao, Yuhe Ji, Shimin Tao, Jingzhou Du, Justin Li, Jian Gao, Zhang Li, Hao Yang, Boxing Chen, Osamu Yoshie
2025	Targeted Distillation for Sentiment Analysis. Yice Zhang, Guangyu Xie, Jingjie Lin, Jianzhu Bao, Qianlong Wang, Xi Zeng, Ruifeng Xu
2025	Task-Aware Resolution Optimization for Visual Large Language Models. Weiqing Luo, Zhen Tan, Yifan Li, Xinyu Zhao, Kwonjoon Lee, Behzad Dariush, Tianlong Chen
2025	Task-aware Contrastive Mixture of Experts for Quadruple Extraction in Conversations with Code-like Replies and Non-opinion Detection. Chenyuan He, Yuxiang Jia, Fei Gao, Senbin Zhu, Hongde Liu, Hongying Zan, Min Peng
2025	TaxoAlign: Scholarly Taxonomy Generation Using Language Models. Avishek Lahiri, Yufang Hou, Debarshi Kumar Sanyal
2025	Teach Small Models to Reason by Curriculum Distillation. Wangyi Jiang, Yaojie Lu, Hongyu Lin, Xianpei Han, Le Sun
2025	Teaching Your Models to Understand Code via Focal Preference Alignment. Jie Wu, Haoling Li, Xin Zhang, Xiao Liu, Yangyu Huang, Jianwen Luo, Yizhen Zhang, Zuchao Li, Ruihang Chu, Yujiu Yang, Scarlett Li
2025	TempParaphraser: "Heating Up" Text to Evade AI-Text Detection through Paraphrasing. Junjie Huang, Ruiquan Zhang, Jinsong Su, Yidong Chen
2025	Temporal Referential Consistency: Do LLMs Favor Sequences Over Absolute Time References? Ashutosh Bajpai, Tanmoy Chakraborty
2025	Temporal Scaling Law for Large Language Models. Yizhe Xiong, Xiansheng Chen, Xin Ye, Hui Chen, Zijia Lin, Haoran Lian, Zhenpeng Su, Wei Huang, Jianwei Niu, Jungong Han, Guiguang Ding
2025	Text Detoxification: Data Efficiency, Semantic Preservation and Model Generalization. Jing Yu, Yibo Zhao, Jiapeng Zhu, Wenming Shao, Bo Pang, Zhao Zhang, Xiang Li
2025	Text Meets Topology: Rethinking Out-of-distribution Detection in Text-Rich Networks. Danny Wang, Ruihong Qiu, Guangdong Bai, Zi Huang
2025	Text Takes Over: A Study of Modality Bias in Multimodal Intent Detection. Ankan Mullick, Saransh Sharma, Abhik Jana, Pawan Goyal
2025	Text2Vis: A Challenging and Diverse Benchmark for Generating Multimodal Visualizations from Text. Mizanur Rahman, Md. Tahmid Rahman Laskar, Shafiq Joty, Enamul Hoque
2025	Textual Aesthetics in Large Language Models. Lingjie Jiang, Shaohan Huang, Xun Wu, Furu Wei
2025	The Arabic Generality Score: Another Dimension of Modeling Arabic Dialectness. Sanad Shaban, Nizar Habash
2025	The Emperor's New Reasoning: Format Imitation Overshadows Genuine Mathematical Understanding in SFT. Linyao Yang, Jian-Tao Huang, Yafei Lu, Zhenhui Jessie Li, Guirong Xue
2025	The Enemy from Within: A Study of Political Delegitimization Discourse in Israeli Political Speech. Naama Rivlin-Angert, Guy Mor-Lan
2025	The Good, the Bad and the Constructive: Automatically Measuring Peer Review's Utility for Authors. Abdelrahman Sadallah, Tim Baumgärtner, Iryna Gurevych, Ted Briscoe
2025	The Good, the Bad, and the Debatable: A Survey on the Impacts of Data for In-Context Learning. Stephanie Schoch, Yangfeng Ji
2025	The Hidden Strength of Disagreement: Unraveling the Consensus-Diversity Tradeoff in Adaptive Multi-Agent Systems. Zengqing Wu, Takayuki Ito
2025	The Illusion of Progress: Re-evaluating Hallucination Detection in LLMs. Denis Janiak, Jakub Binkowski, Albert Sawczyn, Bogdan Gabrys, Ravid Shwartz-Ziv, Tomasz Kajdanowicz
2025	The Impact of Language Mixing on Bilingual LLM Reasoning. Yihao Li, Jiayi Xin, Miranda Muqing Miao, Qi Long, Lyle H. Ungar
2025	The Impact of Negated Text on Hallucination with Large Language Models. Jaehyung Seo, Hyeonseok Moon, Heuiseok Lim
2025	The LLM Already Knows: Estimating LLM-Perceived Question Difficulty via Hidden Representations. Yubo Zhu, Dongrui Liu, Zecheng Lin, Wei Tong, Sheng Zhong, Jing Shao
2025	The Medium Is Not the Message: Deconfounding Document Embeddings via Linear Concept Erasure. Yu Fan, Yang Tian, Shauli Ravfogel, Mrinmaya Sachan, Elliott Ash, Alexander Miserlis Hoyle
2025	The Missing Parts: Augmenting Fact Verification with Half Truth Detection. Yixuan Tang, Jincheng Wang, Anthony Kum Hoe Tung
2025	The Practical Impacts of Theoretical Constructs on Empathy Modeling. Allison Lahnala, Charles Welch, David Jurgens, Lucie Flek
2025	The Psychology of Falsehood: A Human-Centric Survey of Misinformation Detection. Arghodeep Nandi, Megha Sundriyal, Euna Mehnaz Khan, Jikai Sun, Emily K. Vraga, Jaideep Srivastava, Tanmoy Chakraborty
2025	The Pursuit of Empathy: Evaluating Small Language Models for PTSD Dialogue Support. Suhas BN, Yash Mahajan, Dominik Mattioli, Andrew M. Sherrill, Rosa I. Arriaga, Christopher W. Wiese, Saeed Abdullah
2025	The Ranking Blind Spot: Decision Hijacking in LLM-based Text Ranking. Yaoyao Qian, Yifan Zeng, Yuchao Jiang, Chelsi Jain, Huazheng Wang
2025	The Role of Outgoing Connection Heterogeneity in Feedforward Layers of Large Language Models. Felix Stahlberg, Shankar Kumar
2025	The Sound of Syntax: Finetuning and Comprehensive Evaluation of Language Models for Speech Pathology. Fagun Patel, Duc Q. Nguyen, Sang T. Truong, Jody Vaynshtok, Sanmi Koyejo, Nick Haber
2025	The Staircase of Ethics: Probing LLM Value Priorities through Multi-Step Induction to Complex Moral Dilemmas. Ya Wu, Qiang Sheng, Danding Wang, Guang Yang, Yifan Sun, Zhengjia Wang, Yuyan Bu, Juan Cao
2025	The State of Multilingual LLM Safety Research: From Measuring The Language Gap To Mitigating It. Zheng Xin Yong, Beyza Ermis, Marzieh Fadaee, Stephen H. Bach, Julia Kreutzer
2025	The Stepwise Deception: Simulating the Evolution from True News to Fake News with LLM Agents. Yuhan Liu, Zirui Song, Juntian Zhang, Xiaoqing Zhang, Xiuying Chen, Rui Yan
2025	The Strawberry Problem: Emergence of Character-level Understanding in Tokenized Language Models. Adrian Cosma, Stefan Ruseti, Emilian Radoi, Mihai Dascalu
2025	The Transfer Neurons Hypothesis: An Underlying Mechanism for Language Latent Space Transitions in Multilingual LLMs. Hinata Tezuka, Naoya Inoue
2025	The Validation Gap: A Mechanistic Analysis of How Language Models Compute Arithmetic but Fail to Validate It. Leonardo Bertolazzi, Philipp Mondorf, Barbara Plank, Raffaella Bernardi
2025	The discordance between embedded ethics and cultural inference in large language models. Aida Ramezani, Yang Xu
2025	Theorem-Validated Reverse Chain-of-Thought Problem Generation for Geometric Reasoning. Linger Deng, Linghao Zhu, Yuliang Liu, Yu Wang, Qunyi Xie, Jingjing Wu, Gang Zhang, Yingying Zhu, Xiang Bai
2025	Think Globally, Group Locally: Evaluating LLMs Using Multi-Lingual Word Grouping Games. César Guerra-Solano, Zhuochun Li, Xiang Lorraine Li
2025	Think Wider, Detect Sharper: Reinforced Reference Coverage for Document-Level Self-Contradiction Detection. Yuhao Chen, Yuanjie Lyu, Shuochen Liu, Chao Zhang, Junhui Lv, Tong Xu
2025	Think and Recall: Layer-Level Prompting for Lifelong Model Editing. Jinke Wang, Zenan Ying, Qi Liu, Wei Chen, Tong Xu, Huijun Hou, Zhi Zheng
2025	Think in Safety: Unveiling and Mitigating Safety Alignment Collapse in Multimodal Large Reasoning Model. Xinyue Lou, You Li, Jinan Xu, Xiangyu Shi, Chi Chen, Kaiyu Huang
2025	Think, Verbalize, then Speak: Bridging Complex Thoughts and Comprehensible Speech. Tony Woo, Sehun Lee, Kang-Wook Kim, Gunhee Kim
2025	ThinkEdit: Interpretable Weight Editing to Mitigate Overly Short Thinking in Reasoning Models. Chung-En Sun, Ge Yan, Tsui-Wei Weng
2025	ThinkSLM: Towards Reasoning in Small Language Models. Gaurav Srivastava, Shuxiang Cao, Xuan Wang
2025	ThinkTuning: Instilling Cognitive Reflections without Distillation. Aswin RRV, Jacob Dineen, Divij Handa, Md Nayem Uddin, Mihir Parmar, Chitta Baral, Ben Zhou
2025	Thinking Out Loud: Do Reasoning Models Know When They're Right? Qingcheng Zeng, Weihao Xuan, Leyang Cui, Rob Voigt
2025	Thought calibration: Efficient and confident test-time scaling. Menghua Wu, Cai Zhou, Stephen Bates, Tommi S. Jaakkola
2025	ThoughtProbe: Classifier-Guided LLM Thought Space Exploration via Probing Representations. Zijian Wang, Chang Xu
2025	Thread: A Logic-Based Data Organization Paradigm for How-To Question Answering with Retrieval Augmented Generation. Kaikai An, Fangkai Yang, Liqun Li, Junting Lu, Sitao Cheng, Shuzheng Si, Lu Wang, Pu Zhao, Lele Cao, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang, Baobao Chang
2025	Threading the Needle: Reweaving Chain-of-Thought Reasoning to Explain Human Label Variation. Beiduo Chen, Yang Janet Liu, Anna Korhonen, Barbara Plank
2025	Through the Valley: Path to Effective Long CoT Training for Small Language Models. Renjie Luo, Jiaxi Li, Chen Huang, Wei Lu
2025	Tiny Budgets, Big Gains: Parameter Placement Strategy in Parameter Super-Efficient Fine-Tuning. Jinman Zhao, Xueyan Zhang, Jiaru Li, Jingcheng Niu, Yulan Hu, Erxue Min, Gerald Penn
2025	TinySQL: A Progressive Text-to-SQL Dataset for Mechanistic Interpretability Research. Abir Harrasse, Philip Quirke, Clement Neo, Dhruv Nathawani, Luke Marks, Amir Abdullah
2025	To Mask or to Mirror: Human-AI Alignment in Collective Reasoning. Crystal Qian, Aaron T. Parisi, Clémentine Bouleau, Vivian Tsai, Maël Lebreton, Lucas Dixon
2025	To See a World in a Spark of Neuron: Disentangling Multi-Task Interference for Training-Free Model Merging. Zitao Fang, Guodong Du, Shuyang Yu, Yifei Guo, Yiwei Zhang, Yiyao Cao, Jing Li, Ho-Kin Tang, Sim Kuan Goh
2025	ToDi: Token-wise Distillation via Fine-Grained Divergence Control. Seongryong Jung, Suwan Yoon, DongGeon Kim, Hwanhee Lee
2025	ToM-SSI: Evaluating Theory of Mind in Situated Social Interactions. Matteo Bortoletto, Constantin Ruhdorfer, Andreas Bulling
2025	ToM: Leveraging Tree-oriented MapReduce for Long-Context Reasoning in Large Language Models. Jiani Guo, Zuchao Li, Jie Wu, Qianren Wang, Yun Li, Lefei Zhang, Hai Zhao, Yu-Jiu Yang
2025	Token-Aware Editing of Internal Activations for Large Language Model Alignment. Tianbo Wang, Yuqing Ma, Kewei Liao, Chengzhao Yang, Zhange Zhang, Jiakai Wang, Xianglong Liu
2025	Token-level Proximal Policy Optimization for Query Generation. Yichen Ouyang, Lu Wang, Fangkai Yang, Pu Zhao, Chenghua Huang, Jianfeng Liu, Bochen Pang, Yaming Yang, Yuefeng Zhan, Hao Sun, Qingwei Lin, Saravan Rajmohan, Weiwei Deng, Dongmei Zhang, Feng Sun
2025	TokenSelect: Efficient Long-Context Inference and Length Extrapolation for LLMs via Dynamic Token-Level KV Cache Selection. Wei Wu, Zhuoshi Pan, Kun Fu, Chao Wang, Liyi Chen, Yunchu Bai, Tianfu Wang, Zheng Wang, Hui Xiong
2025	TokenSkip: Controllable Chain-of-Thought Compression in LLMs. Heming Xia, Chak Tou Leong, Wenjie Wang, Yongqi Li, Wenjie Li
2025	Tokenization and Representation Biases in Multilingual Models on Dialectal NLP Tasks. Vani Kanjirangat, Tanja Samardzic, Ljiljana Dolamic, Fabio Rinaldi
2025	TombRaider: Entering the Vault of History to Jailbreak Large Language Models. Junchen Ding, Jiahao Zhang, Yi Liu, Ziqi Ding, Gelei Deng, Yuekang Li
2025	ToneCraft: Cantonese Lyrics Generation with Harmony of Tones and Pitches. Junyu Cheng, Chang Pan, Shuangyin Li
2025	Too Consistent to Detect: A Study of Self-Consistent Errors in LLMs. Hexiang Tan, Fei Sun, Sha Liu, Du Su, Qi Cao, Xin Chen, Jingang Wang, Xunliang Cai, Yuanzhuo Wang, Huawei Shen, Xueqi Cheng
2025	Too Helpful, Too Harmless, Too Honest or Just Right? Gautam Siddharth Kashyap, Mark Dras, Usman Naseem
2025	Tool Preferences in Agentic LLMs are Unreliable. Kazem Faghih, Wenxiao Wang, Yize Cheng, Siddhant Bharti, Gaurang Sriramanan, Sriram Balasubramanian, Parsa Hosseini, Soheil Feizi
2025	ToolSafety: A Comprehensive Dataset for Enhancing Safety in LLM-Based Agent Tool Invocations. Yuejin Xie, Youliang Yuan, Wenxuan Wang, Fan Mo, Jianmin Guo, Pinjia He
2025	Topic Coverage-based Demonstration Retrieval for In-Context Learning. Wonbin Kweon, SeongKu Kang, Runchu Tian, Pengcheng Jiang, Jiawei Han, Hwanjo Yu
2025	TopicAttack: An Indirect Prompt Injection Attack via Topic Transition. Yulin Chen, Haoran Li, Yuexin Li, Yue Liu, Yangqiu Song, Bryan Hooi
2025	TounsiBench: Benchmarking Large Language Models for Tunisian Arabic. Souha Hassine, Asma Arrak, Marouene Addhoum, Steven R. Wilson
2025	Toward Efficient Sparse Autoencoder-Guided Steering for Improved In-Context Learning in Large Language Models. Ikhyun Cho, Julia Hockenmaier
2025	Toward Machine Interpreting: Lessons from Human Interpreting Studies. Matthias Sperber, Maureen de Seyssel, Jiajun Bao, Matthias Paulik
2025	Toward Machine Translation Literacy: How Lay Users Perceive and Rely on Imperfect Translations. Yimin Xiao, Yongle Zhang, Dayeon Ki, Calvin Bao, Marianna J. Martindale, Charlotte Vaughn, Ge Gao, Marine Carpuat
2025	Toward Multi-Session Personalized Conversation: A Large-Scale Dataset and Hierarchical Tree Framework for Implicit Reasoning. Xintong Li, Jalend Bantupalli, Ria Dharmani, Yuwei Zhang, Jingbo Shang
2025	Towards AI-Assisted Psychotherapy: Emotion-Guided Generative Interventions. Kilichbek Haydarov, Youssef Mohamed, Emilio Goldenhersch, Paul OCallaghan, Li-jia Li, Mohamed Elhoseiny
2025	Towards Advanced Mathematical Reasoning for LLMs via First-Order Logic Theorem Proving. Chuxue Cao, Mengze Li, Juntao Dai, Jinluan Yang, Zijian Zhao, Shengyu Zhang, Weijie Shi, Chengzhong Liu, Sirui Han, Yike Guo
2025	Towards Author-informed NLP: Mind the Social Bias. Inbar Pendzel, Einat Minkov
2025	Towards Automated Error Discovery: A Study in Conversational AI. Dominic Petrak, Thy Thy Tran, Iryna Gurevych
2025	Towards Controllable Speech Synthesis in the Era of Large Language Models: A Systematic Survey. Tianxin Xie, Yan Rong, Pengfei Zhang, Wenwu Wang, Li Liu
2025	Towards Event Extraction with Massive Types: LLM-based Collaborative Annotation and Partitioning Extraction. Wenxuan Liu, Zixuan Li, Long Bai, Yuxin Zuo, Daozhu Xu, Xiaolong Jin, Jiafeng Guo, Xueqi Cheng
2025	Towards Faithful Natural Language Explanations: A Study Using Activation Patching in Large Language Models. Wei Jie Yeo, Ranjan Satapathy, Erik Cambria
2025	Towards General-Domain Word Sense Disambiguation: Distilling Large Language Model into Compact Disambiguator. Liqiang Ming, Sheng-hua Zhong, Yuncong Li
2025	Towards Holistic Evaluation of Large Audio-Language Models: A Comprehensive Survey. Chih-Kai Yang, Neo S. Ho, Hung-yi Lee
2025	Towards Infinite-Long Prefix in Transformer. Yingyu Liang, Zhenmei Shi, Zhao Song, Chiwun Yang
2025	Towards Language-Agnostic STIPA: Universal Phonetic Transcription to Support Language Documentation at Scale. Jacob Lee Suchardt, Hana El-Shazli, Pierluigi Cassotti
2025	Towards Optimal Evaluation Efficiency for Large Language Models. Guohong Li, Deyi Xiong
2025	Towards Robust Mathematical Reasoning. Thang Luong, Dawsen Hwang, Hoang H. Nguyen, Golnaz Ghiasi, Yuri Chervonyi, Insuk Seo, Junsu Kim, Garrett Bingham, Jonathan Lee, Swaroop Mishra, Alex Zhai, Clara Huiyi Hu, Henryk Michalewski, Jimin Kim, Jeonghyun Ahn, Junhwi Bae, Xingyou Song, Trieu H. Trinh, Quoc V. Le, Junehyuk Jung
2025	Towards Statistical Factuality Guarantee for Large Vision-Language Models. Zhuohang Li, Chao Yan, Nicholas J. Jackson, Wendi Cui, Bo Li, Jiaxin Zhang, Bradley A. Malin
2025	Towards Transferable Personality Representation Learning based on Triplet Comparisons and Its Applications. Kai Tang, Rui Wang, Renyu Zhu, Minmin Lin, Xiao Ding, Tangjie Lv, Changjie Fan, Runze Wu, Haobo Wang
2025	Towards a Holistic and Automated Evaluation Framework for Multi-Level Comprehension of LLMs in Book-Length Contexts. Yuho Lee, Jiaqi Deng, Nicole Hee-Yeon Kim, Hyangsuk Min, Taewon Yun, Minjeong Ban, Kim Yul, Hwanjun Song
2025	Towards a Unified Paradigm of Concept Editing in Large Language Models. Zhuowen Han, Xinwei Wu, Dan Shi, Renren Jin, Deyi Xiong
2025	Toxicity Red-Teaming: Benchmarking LLM Safety in Singapore's Low-Resource Languages. Yujia Hu, Ming Shan Hee, Preslav Nakov, Roy Ka-Wei Lee
2025	TrInk: Ink Generation with Transformer Network. Zezhong Jin, Shubhang Desai, Xu Chen, Biyi Fang, Zhuoyi Huang, Zhe Li, Chong-Xin Gan, Xiao Tu, Man-Wai Mak, Yan Lu, Shujie Liu
2025	TracSum: A New Benchmark for Aspect-Based Summarization with Sentence-Level Traceability in Medical Domain. Bohao Chu, Meijie Li, Sameh Frihat, Chengyu Gu, Georg Lodde, Elisabeth Livingstone, Norbert Fuhr
2025	Tracing L1 Interference in English Learner Writing: A Longitudinal Corpus with Error Annotations. Poorvi Acharya, J. Elizabeth Liebl, Dhiman Goswami, Kai North, Marcos Zampieri, Antonios Anastasopoulos
2025	Train It and Forget It: Merge Lists are Unnecessary for BPE Inference in Language Models. Tomohiro Sawada, Kartik Goyal
2025	Train One Sparse Autoencoder Across Multiple Sparsity Budgets to Preserve Interpretability and Accuracy. Nikita Balagansky, Yaroslav Aksenov, Daniil Laptev, Vadim Kurochkin, Gleb Gerasimov, Nikita Koriagin, Daniil Gavrilov
2025	Training LLMs to be Better Text Embedders through Bidirectional Reconstruction. Chang Su, Dengliang Shi, Siyuan Huang, Jintao Du, Changhua Meng, Yu Cheng, Weiqiang Wang, Zhouhan Lin
2025	Training a Utility-based Retriever Through Shared Context Attribution for Retrieval-Augmented Language Models. Yilong Xu, Jinhua Gao, Xiaoming Yu, Yuanhai Xue, Baolong Bi, Huawei Shen, Xueqi Cheng
2025	Training compute-optimal transformer encoder models. Megi Dervishi, Alexandre Allauzen, Gabriel Synnaeve, Yann LeCun
2025	Transferable Direct Prompt Injection via Activation-Guided MCMC Sampling. Minghui Li, Hao Zhang, Yechao Zhang, Wei Wan, Shengshan Hu, Pei Xiaobing, Jing Wang
2025	Transformer-Based Temporal Information Extraction and Application: A Review. Xin Su, Phillip Howard, Steven Bethard
2025	Transitive self-consistency evaluation of NLI models without gold labels. Wei Wu, Mark Last
2025	Translate Smart, not Hard: Cascaded Translation Systems with Quality-Aware Deferral. António Farinhas, Nuno Miguel Guerreiro, Sweta Agrawal, Ricardo Rei, André F. T. Martins
2025	Translating Domain-Specific Terminology in Typologically-Diverse Languages: A Study in Tax and Financial Education. Arturo Oncevay, Elena Kochkina, Keshav Ramani, Toyin Aguda, Simerjot Kaur, Charese Smiley
2025	Translation in the Hands of Many: Centering Lay Users in Machine Translation Interactions. Beatrice Savoldi, Alan Ramponi, Matteo Negri, Luisa Bentivogli
2025	Translationese-index: Using Likelihood Ratios for Graded and Generalizable Measurement of Translationese. Yikang Liu, Wanyang Zhang, Yiming Wang, Jialong Tang, Pei Zhang, Baosong Yang, Fei Huang, Rui Wang, Hai Hu
2025	Transparent and Coherent Procedural Mistake Detection. Shane Storks, Itamar Bar-Yossef, Yayuan Li, Zheyuan Zhang, Jason J. Corso, Joyce Chai
2025	Transplant Then Regenerate: A New Paradigm for Text Data Augmentation. Guangzhan Wang, Hongyu Zhang, Beijun Shen, Xiaodong Gu
2025	Tree-of-Quote Prompting Improves Factuality and Attribution in Multi-Hop and Medical Reasoning. Justin Xu, Yiming Li, Zizheng Zhang, Augustine Yui Hei Luk, Mayank Jobanputra, Samarth Oza, Ashley Murray, Meghana Reddy Kasula, Andrew Parker, David W. Eyre
2025	TreeRare: Syntax Tree-Guided Retrieval and Reasoning for Knowledge-Intensive Question Answering. Boyi Zhang, Zhuo Liu, Hangfeng He
2025	TreeReview: A Dynamic Tree of Questions Framework for Deep and Efficient LLM-based Scientific Peer Review. Yuan Chang, Ziyue Li, Hengyuan Zhang, Yuanbo Kong, Yanru Wu, Hayden Kwok-Hay So, Zhijiang Guo, Liya Zhu, Ngai Wong
2025	TrojanStego: Your Language Model Can Secretly Be A Steganographic Privacy Leaking Agent. Dominik Meier, Jan Philip Wahle, Paul Röttger, Terry Ruas, Bela Gipp
2025	TrojanWave: Exploiting Prompt Learning for Stealthy Backdoor Attacks on Large Audio-Language Models. Asif Hanif, Maha Tufail Agro, Fahad Shamshad, Karthik Nandakumar
2025	Trojsten Benchmark: Evaluating LLM Problem-Solving in Slovak STEM Competition Problems. Adam Zahradník, Marek Suppa
2025	Trustworthy Medical Question Answering: An Evaluation-Centric Survey. Yinuo Wang, Baiyang Wang, Robert E. Mercer, Frank Rudzicz, Sudipta Singha Roy, Pengjie Ren, Zhumin Chen, Xindi Wang
2025	Tuning Less, Prompting More: In-Context Preference Learning Pipeline for Natural Language Transformation. Shuyun Yang, Yan Zhang, Zhengmao Ye, Lei Duan, Mingjie Tang
2025	TurBLiMP: A Turkish Benchmark of Linguistic Minimal Pairs. Ezgi Basar, Francesca Padovani, Jaap Jumelet, Arianna Bisazza
2025	TurboRAG: Accelerating Retrieval-Augmented Generation with Precomputed KV Caches for Chunked Text. Songshuo Lu, Hua Wang, Yutian Rong, Zhi Chen, Yaohua Tang
2025	TurnBack: A Geospatial Route Cognition Benchmark for Large Language Models through Reverse Route. Hongyi Luo, Qing Cheng, Daniel Matos, Hari Krishna Gadi, Yanfeng Zhang, Lu Liu, Yongliang Wang, Niclas Zeller, Daniel Cremers, Liqiu Meng
2025	TurnaboutLLM: A Deductive Reasoning Benchmark from Detective Games. Yuan Yuan, Muyu He, Muhammad Adil Shahid, Ziyang Li, Jiani Huang, Li Zhang
2025	Turning Logic Against Itself: Probing Model Defenses Through Contrastive Questions. Rachneet Singh Sachdeva, Rima Hazra, Iryna Gurevych
2025	Two Heads Are Better Than One: Dual-Model Verbal Reflection at Inference-Time. Jiazheng Li, Yuxiang Zhou, Junru Lu, Gladys Tyen, Lin Gui, Cesare Aloisi, Yulan He
2025	Type-Less yet Type-Aware Inductive Link Prediction with Pretrained Language Models. Alessandro De Bellis, Salvatore Bufi, Giovanni Servedio, Vito Walter Anelli, Tommaso Di Noia, Eugenio Di Sciascio
2025	UI-Hawk: Unleashing the Screen Stream Understanding for Mobile GUI Agents. Jiwen Zhang, Ya-Qi Yu, Minghui Liao, Wentao Li, Jihao Wu, Zhongyu Wei
2025	UICOMPASS: UI Map Guided Mobile Task Automation via Adaptive Action Generation. Yuanzhang Lin, Zhe Zhang, He Rui, Qingao Dong, Mingyi Zhou, Jing Zhang, Xiang Gao, Hailong Sun
2025	UNCERTAINTY-LINE: Length-Invariant Estimation of Uncertainty for Large Language Models. Roman Vashurin, Maiya Goloburda, Preslav Nakov, Maxim Panov
2025	UNCLE: Benchmarking Uncertainty Expressions in Long-Form Generation. Ruihan Yang, Caiqi Zhang, Zhisong Zhang, Xinting Huang, Dong Yu, Nigel Collier, Deqing Yang
2025	UNComp: Can Matrix Entropy Uncover Sparsity? - A Compressor Design from an Uncertainty-Aware Perspective. Jing Xiong, Jianghan Shen, Fanghua Ye, Chaofan Tao, Zhongwei Wan, Jianqiao Lu, Xun Wu, Chuanyang Zheng, Zhijiang Guo, Min Yang, Lingpeng Kong, Ngai Wong
2025	UltraIF: Advancing Instruction Following from the Wild. Kaikai An, Li Sheng, Ganqu Cui, Shuzheng Si, Ning Ding, Yu Cheng, Baobao Chang
2025	UnCo: Uncertainty-Driven Collaborative Framework of Large and Small Models for Grounded Multimodal NER. Jielong Tang, Yang Yang, Jianxing Yu, Zhen-Xing Wang, Haoyuan Liang, Liang Yao, Jian Yin
2025	Unconditional Truthfulness: Learning Unconditional Uncertainty of Large Language Models. Artem Vazhentsev, Ekaterina Fadeeva, Rui Xing, Gleb Kuzmin, Ivan Lazichny, Alexander Panchenko, Preslav Nakov, Timothy Baldwin, Maxim Panov, Artem Shelmanov
2025	Uncovering Argumentative Flow: A Question-Focus Discourse Structuring Framework. Yini Wang, Xian Zhou, Shengan Zheng, Linpeng Huang, Zhunchen Luo, Wei Luo, Xiaoying Bai
2025	Uncovering the Bigger Picture: Comprehensive Event Understanding Via Diverse News Retrieval. Yixuan Tang, Yuanyuan Shi, Yiqun Sun, Anthony Kum Hoe Tung
2025	Understanding LLMs' Cross-Lingual Context Retrieval: How Good It Is And Where It Comes From. Changjiang Gao, Hankun Lin, Xin Huang, Xue Han, Junlan Feng, Chao Deng, Jiajun Chen, Shujian Huang
2025	Understanding Subword Compositionality of Large Language Models. Qiwei Peng, Yekun Chai, Anders Søgaard
2025	Understanding and Leveraging the Expert Specialization of Context Faithfulness in Mixture-of-Experts LLMs. Jun Bai, Minghao Tong, Yang Liu, Zixia Jia, Zilong Zheng
2025	Understanding and Mitigating Overrefusal in LLMs from an Unveiling Perspective of Safety Decision Boundary. Licheng Pan, Yongqi Tong, Xin Zhang, Xiaolu Zhang, Jun Zhou, Zhixuan Chu
2025	Understanding the Information Propagation Effects of Communication Topologies in LLM-based Multi-Agent Systems. Xu Shen, Yixin Liu, Yiwei Dai, Yili Wang, Rui Miao, Yue Tan, Shirui Pan, Xin Wang
2025	Understanding the Modality Gap: An Empirical Study on the Speech-Text Alignment Mechanism of Large Speech Language Models. Bajian Xiang, Shuaijiang Zhao, Tingwei Guo, Wei Zou
2025	Understanding the Thinking Process of Reasoning Models: A Perspective from Schoenfeld's Episode Theory. Ming Li, Nan Zhang, Chenrui Fan, Hong Jiao, Yanbin Fu, Sydney Peters, Qingshu Xu, Robert Lissitz, Tianyi Zhou
2025	UniDebugger: Hierarchical Multi-Agent Framework for Unified Software Debugging. Cheryl Lee, Chunqiu Steven Xia, Longji Yang, Jen-tse Huang, Zhouruixin Zhu, Lingming Zhang, Michael R. Lyu
2025	UnifiedVisual: A Framework for Constructing Unified Vision-Language Datasets. Pengyu Wang, Shaojun Zhou, Chenkun Tan, Xinghao Wang, Wei Huang, Zhen Ye, Zhaowei Li, Botian Jiang, Dong Zhang, Xipeng Qiu
2025	Uniform Information Density and Syntactic Reduction: Revisiting that-Mentioning in English Complement Clauses. Hailin Hao, Elsi Kaiser
2025	Unilaw-R1: A Large Language Model for Legal Reasoning with Reinforcement Learning and Iterative Inference. Hua Cai, Shuang Zhao, Liang Zhang, Xuli Shen, Qing Xu, Weilin Shen, Zihao Wen, Tianke Ban
2025	UnitCoder: Scalable Code Synthesis from Pre-training Corpora. Yichuan Ma, Yunfan Shao, Peiji Li, Demin Song, Qipeng Guo, Linyang Li, Xipeng Qiu, Kai Chen
2025	UniversalCEFR: Enabling Open Multilingual Research on Language Proficiency Assessment. Joseph Marvin Imperial, Abdullah Barayan, Regina Stodden, Rodrigo Wilkens, Ricardo Muñoz Sánchez, Lingyun Gao, Melissa Torgbi, Dawn Knight, Gail Forey, Reka R. Jablonkai, Ekaterina Kochmar, Robert Reynolds, Eugénio Ribeiro, Horacio Saggion, Elena Volodina, Sowmya Vajjala, Thomas François, Fernando Alva-Manchego, Harish Tayyar Madabushi
2025	Unlearning vs. Obfuscation: Are We Truly Removing Knowledge? Guangzhi Sun, Potsawee Manakul, Xiao Zhan, Mark J. F. Gales
2025	Unleashing the Reasoning Potential of LLMs by Critique Fine-Tuning on One Problem. Yubo Wang, Ping Nie, Kai Zou, Lijun Wu, Wenhu Chen
2025	Unmasking Deceptive Visuals: Benchmarking Multimodal Large Language Models on Misleading Chart Question Answering. Zixin Chen, Sicheng Song, Kashun Shum, Yanna Lin, Rui Sheng, Weiqi Wang, Huamin Qu
2025	Unmasking Fake Careers: Detecting Machine-Generated Career Trajectories via Multi-layer Heterogeneous Graphs. Michiharu Yamashita, Thanh Tran, Delvin Ce Zhang, Dongwon Lee
2025	Unpacking Wesley Scivetti, Tatsuya Aoyama, Ethan Wilcox, Nathan Schneider
2025	Unraveling Interwoven Roles of Large Language Models in Authorship Privacy: Obfuscation, Mimicking, and Verification. Tuc Nguyen, Yifan Hu, Thai Le
2025	Unstructured Evidence Attribution for Long Context Query Focused Summarization. Dustin Wright, Zain Muhammad Mujahid, Lu Wang, Isabelle Augenstein, David Jurgens
2025	Unsupervised Concept Vector Extraction for Bias Control in LLMs. Hannah Cyberey, Yangfeng Ji, David Evans
2025	Unsupervised Hallucination Detection by Inspecting Reasoning Processes. Ponhvoan Srey, Xiaobao Wu, Anh Tuan Luu
2025	Unsupervised Word-level Quality Estimation for Machine Translation Through the Lens of Annotators (Dis)agreement. Gabriele Sarti, Vilém Zouhar, Malvina Nissim, Arianna Bisazza
2025	Unveiling Internal Reasoning Modes in LLMs: A Deep Dive into Latent Reasoning vs. Factual Shortcuts with Attribute Rate Ratio. Yiran Yang, Haifeng Sun, Jingyu Wang, Qi Qi, Zirui Zhuang, Huazheng Wang, Pengfei Ren, Jing Wang, Jianxin Liao
2025	Unveiling the Response of Large Vision-Language Models to Visually Absent Tokens. Sohee Kim, Soohyun Ryu, Joonhyung Park, Eunho Yang
2025	User Feedback in Human-LLM Dialogues: A Lens to Understand Users But Noisy as a Learning Signal. Yuhan Liu, Michael JQ Zhang, Eunsol Choi
2025	Utility-Focused LLM Annotation for Retrieval and Retrieval-Augmented Generation. Hengran Zhang, Minghao Tang, Keping Bi, Jiafeng Guo, Shihao Liu, Daiting Shi, Dawei Yin, Xueqi Cheng
2025	V-SEAM: Visual Semantic Editing and Attention Modulating for Causal Interpretability of Vision-Language Models. Qidong Wang, Junjie Hu, Ming Jiang
2025	V-VAE: A Variational Auto Encoding Framework Towards Fine-Grained Control over Human-Like Chat. Qi Lin, Weikai Xu, Lisi Chen, Bin Dai
2025	VC4VG: Optimizing Video Captions for Text-to-Video Generation. Yang Du, Zhuoran Lin, Kaiqiang Song, Biao Wang, Zhicheng Zheng, Tiezheng Ge, Bo Zheng, Qin Jin
2025	VCSearch: Bridging the Gap Between Well-Defined and Ill-Defined Problems in Mathematical Reasoning. Shi-Yu Tian, Zhi Zhou, Kun-Yang Yu, Ming Yang, Lin-Han Jia, Lan-Zhe Guo, Yufeng Li
2025	VEHME: A Vision-Language Model For Evaluating Handwritten Mathematics Expressions. Thu Phuong Nguyen, Duc M. Nguyen, Hyotaek Jeon, Hyunwook Lee, Hyunmin Song, Sungahn Ko, Taehwan Kim
2025	VELA: An LLM-Hybrid-as-a-Judge Approach for Evaluating Long Image Captions. Kazuki Matsuda, Yuiga Wada, Shinnosuke Hirano, Seitaro Otsuki, Komei Sugiura
2025	VERITAS: Leveraging Vision Priors and Expert Fusion to Improve Multimodal Data. Tingqiao Xu, Ziru Zeng, Jiayu Chen
2025	VISaGE: Understanding Visual Generics and Exceptions. Stella Frank, Emily Allaway
2025	VLA-Mark: A cross modal watermark for large vision-language alignment models. Shuliang Liu, Zheng Qi, Jesse Jiaxi Xu, Yibo Yan, Junyan Zhang, He Geng, Aiwei Liu, Peijie Jiang, Jia Liu, Yik-Cheung Tam, Xuming Hu
2025	VLASCD: A Visual Language Action Model for Simultaneous Chatting and Decision Making. Zuojin Tang, Bin Hu, Chenyang Zhao, De Ma, Gang Pan, Bin Liu
2025	VLP: Vision-Language Preference Learning for Embodied Manipulation. Runze Liu, Chenjia Bai, Jiafei Lyu, Shengjie Sun, Yali Du, Xiu Li
2025	VRoPE: Rotary Position Embedding for Video Large Language Models. Zikang Liu, Longteng Guo, Yepeng Tang, Tongtian Yue, Junxian Cai, Kai Ma, Qingbin Liu, Xi Chen, Jing Liu
2025	Value Profiles for Encoding Human Variation. Taylor Sorensen, Pushkar Mishra, Roma Patel, Michael Henry Tessler, Michiel A. Bakker, Georgina Evans, Iason Gabriel, Noah D. Goodman, Verena Rieser
2025	Variance Sensitivity Induces Attention Entropy Collapse and Instability in Transformers. Jonghyun Hong, Sungyoon Lee
2025	VerIF: Verification Engineering for Reinforcement Learning in Instruction Following. Hao Peng, Yunjia Qi, Xiaozhi Wang, Bin Xu, Lei Hou, Juanzi Li
2025	VeriFact: Enhancing Long-Form Factuality Evaluation with Refined Fact Extraction and Reference Facts. Xin Liu, Lechen Zhang, Sheza Munir, Yiyang Gu, Lu Wang
2025	VeriLocc: End-to-End Cross-Architecture Register Allocation via LLM. Lesheng Jin, Zhenyuan Ruan, Haohui Mai, Jingbo Shang
2025	VersaTune: An Efficient Data Composition Framework for Training Multi-Capability LLMs. Keer Lu, Keshi Zhao, Zhuoran Zhang, Zheng Liang, Bin Cui, Tengjiao Wang, Wentao Zhang
2025	ViClaim: A Multilingual Multilabel Dataset for Automatic Claim Detection in Videos. Patrick Giedemann, Pius von Däniken, Jan Milan Deriu, Álvaro Rodrigo, Anselmo Peñas, Mark Cieliebak
2025	ViDoRAG: Visual Document Retrieval-Augmented Generation via Dynamic Iterative Reasoning Agents. Qiuchen Wang, Ruixue Ding, Zehui Chen, Weiqi Wu, Shihang Wang, Pengjun Xie, Feng Zhao
2025	ViLBench: A Suite for Vision-Language Process Reward Modeling. Haoqin Tu, Weitao Feng, Hardy Chen, Hui Liu, Xianfeng Tang, Cihang Xie
2025	ViPE: Visual Perception in Parameter Space for Efficient Video-Language Understanding. Shichen Lu, Tongtian Yue, Longteng Guo, Handong Li, Xingjian He, Si Liu, Jing Liu
2025	Viability of Machine Translation for Healthcare in Low-Resourced Languages. Hellina Hailu Nigatu, Nikita Mehandru, Negasi Haile Abadi, Blen Gebremeskel, Ahmed Alaa, Monojit Choudhury
2025	Video Compression Commander: Plug-and-Play Inference Acceleration for Video Large Language Models. Xuyang Liu, Yiyu Wang, Junpeng Ma, Linfeng Zhang
2025	Video-RTS: Rethinking Reinforcement Learning and Test-Time Scaling for Efficient and Enhanced Video Reasoning. Ziyang Wang, Jaehong Yoon, Shoubin Yu, Md Mohaiminul Islam, Gedas Bertasius, Mohit Bansal
2025	Video2Roleplay: A Multimodal Dataset and Framework for Video-Guided Role-playing Agents. Xueqiao Zhang, Chao Zhang, Jingtao Xu, Yifan Zhu, Xin Shi, Yi Yang, Yawei Luo
2025	VideoEraser: Concept Erasure in Text-to-Video Diffusion Models. Naen Xu, Jinghuai Zhang, Changjiang Li, Zhi Chen, Chunyi Zhou, Qingming Li, Tianyu Du, Shouling Ji
2025	VideoPASTA: 7K Preference Pairs That Matter for Video-LLM Alignment. Yogesh Kulkarni, Pooyan Fazli
2025	VisBias: Measuring Explicit and Implicit Social Biases in Vision Language Models. Jen-tse Huang, Jiantong Qin, Jianping Zhang, Youliang Yuan, Wenxuan Wang, Jieyu Zhao
2025	VisCRA: A Visual Chain Reasoning Attack for Jailbreaking Multimodal Large Language Models. Bingrui Sima, Linhua Cong, Wenxuan Wang, Kun He
2025	VisEscape: A Benchmark for Evaluating Exploration-driven Decision-making in Virtual Escape Rooms. Seungwon Lim, Sungwoong Kim, Jihwan Yu, Sungjae Lee, Jiwan Chung, Youngjae Yu
2025	VisFinEval: A Scenario-Driven Chinese Multimodal Benchmark for Holistic Financial Understanding. Zhaowei Liu, Xin Guo, Haotian Xia, Lingfeng Zeng, Fangqi Lou, Jinyi Niu, Mengping Li, Qi Qi, Jiahuan Li, Wei Zhang, Yinglong Wang, Weige Cai, Weining Shen, Liwen Zhang
2025	VisiPruner: Decoding Discontinuous Cross-Modal Dynamics for Efficient Multimodal LLMs. Yingqi Fan, Anhao Zhao, Jinlan Fu, Junlong Tong, Hui Su, Yijie Pan, Wei Zhang, Xiaoyu Shen
2025	Vision-Free Retrieval: Rethinking Multimodal Search with Textual Scene Descriptions. Ioanna Ntinou, Alexandros Xenos, Yassine Ouali, Adrian Bulat, Georgios Tzimiropoulos
2025	Vision-and-Language Navigation with Analogical Textual Descriptions in LLMs. Yue Zhang, Tianyi Ma, Zun Wang, Yanyuan Qiao, Parisa Kordjamshidi
2025	VistaWise: Building Cost-Effective Agent with Cross-Modal Knowledge Graph for Minecraft. Honghao Fu, Junlong Ren, Qi Chai, Deheng Ye, Yujun Cai, Hao Wang
2025	Visual Contextual Attack: Jailbreaking MLLMs with Image-Driven Context Injection. Ziqi Miao, Yi Ding, Lijun Li, Jing Shao
2025	Visual-Aware Speech Recognition for Noisy Scenarios. Balaji Darur, Karan Singla
2025	VisualWebInstruct: Scaling up Multimodal Instruction Data through Web Search. Yiming Jia, Jiachen Li, Xiang Yue, Bo Li, Ping Nie, Kai Zou, Wenhu Chen
2025	VocalNet: Speech LLMs with Multi-Token Prediction for Faster and High-Quality Generation. Yuhao Wang, Heyang Liu, Ziyang Cheng, Ronghua Wu, Qunshan Gu, Yanfeng Wang, Yu Wang
2025	Voice of a Continent: Mapping Africa's Speech Technology Frontier. AbdelRahim A. Elmadany, Sang Yun Kwon, Hawau Olamide Toyin, Alcides Alcoba Inciarte, Hanan Aldarmaki, Muhammad Abdul-Mageed
2025	VoiceBBQ: Investigating Effect of Content and Acoustics in Social Bias of Spoken Language Model. Junhyuk Choi, Ro-hoon Oh, Jihwan Seol, Bugeun Kim
2025	VoiceCraft-X: Unifying Multilingual, Voice-Cloning Speech Synthesis and Speech Editing. Zhisheng Zheng, Puyuan Peng, Anuj Diwan, Cong Phuoc Huynh, Xiaohang Sun, Zhu Liu, Vimal Bhat, David Harwath
2025	WISE: Weak-Supervision-Guided Step-by-Step Explanations for Multimodal LLMs in Image Classification. Yiwen Jiang, Deval Mehta, Siyuan Yan, Yaling Shen, Zimu Wang, Zongyuan Ge
2025	Walk and Read Less: Improving the Efficiency of Vision-and-Language Navigation via Tuning-Free Multimodal Token Pruning. Wenda Qin, Andrea Burns, Bryan A. Plummer, Margrit Betke
2025	WangchanThaiInstruct: An instruction-following Dataset for Culture-Aware, Multitask, and Multi-domain Evaluation in Thai. Peerat Limkonchotiwat, Pume Tuchinda, Lalita Lowphansirikul, Surapon Nonesung, Panuthep Tasawong, Alham Fikri Aji, Can Udomcharoenchaikit, Sarana Nutanong
2025	Warm Up Before You Train: Unlocking General Reasoning in Resource-Constrained Settings. Safal Shrestha, Minwu Kim, Aadim Nepal, Anubhav Shrestha, Keith W. Ross
2025	Waste-Bench: A Comprehensive Benchmark for Evaluating VLLMs in Cluttered Environments. Muhammad Ali, Salman Khan
2025	We Need to Measure Data Diversity in NLP - Better and Broader. Dong Nguyen, Esther Ploeger
2025	We Politely Insist: Your LLM Must Learn the Persian Art of Taarof. Nikta Gohari Sadr, Sahar Heidariasl, Karine Megerdoomian, Laleh Seyyed-Kalantari, Ali Emami
2025	Weaver: Interweaving SQL and LLM for Table Reasoning. Rohit Khoja, Devanshu Gupta, Yanjie Fu, Dan Roth, Vivek Gupta
2025	Web Intellectual Property at Risk: Preventing Unauthorized Real-Time Retrieval by Large Language Models. Yisheng Zhong, Yizhu Wen, Junfeng Guo, Mehran Kafai, Heng Huang, Hanqing Guo, Zhuangdi Zhu
2025	WebAgent-R1: Training Web Agents via End-to-End Multi-Turn Reinforcement Learning. Zhepei Wei, Wenlin Yao, Yao Liu, Weizhi Zhang, Qin Lu, Liang Qiu, Changlong Yu, Puyang Xu, Chao Zhang, Bing Yin, Hyokun Yun, Lihong Li
2025	WebEvolver: Enhancing Web Agent Self-Improvement with Co-evolving World Model. Tianqing Fang, Hongming Zhang, Zhisong Zhang, Kaixin Ma, Wenhao Yu, Haitao Mi, Dong Yu
2025	WebInject: Prompt Injection Attack to Web Agents. Xilong Wang, John Bloch, Zedian Shao, Yuepeng Hu, Shuyan Zhou, Neil Zhenqiang Gong
2025	WebMMU: A Benchmark for Multimodal Multilingual Website Understanding and Code Generation. Rabiul Awal, Mahsa Massoud, Aarash Feizi, Zichao Li, Suyuchen Wang, Christopher Pal, Aishwarya Agrawal, David Vázquez, Siva Reddy, Juan A. Rodríguez, Perouz Taslakian, Spandana Gella, Sai Rajeswar
2025	Weight-Aware Activation Sparsity with Constrained Bayesian Optimization Scheduling for Large Language Models. Ming Wang, Miao Zhang, Xuebo Liu, Liqiang Nie
2025	Weights-Rotated Preference Optimization for Large Language Models. Chenxu Yang, Ruipeng Jia, Mingyu Zheng, Naibin Gu, Zheng Lin, Siyuan Chen, Weichong Yin, Hua Wu, Weiping Wang
2025	What Do Indonesians Really Need from Language Technology? A Nationwide Survey. Muhammad Dehan Al Kautsar, Lucky Susanto, Derry Tanti Wijaya, Fajri Koto
2025	What Makes a Good Reasoning Chain? Uncovering Structural Patterns in Long Chain-of-Thought Reasoning. Gangwei Jiang, Yahui Liu, Zhaoyi Li, Wei Bi, Fuzheng Zhang, Linqi Song, Ying Wei, Defu Lian
2025	What You Read Isn't What You Hear: Linguistic Sensitivity in Deepfake Speech Detection. Binh Nguyen, Shuju Shi, Ryan Ofman, Thai Le
2025	What You See is What You Ask: Evaluating Audio Descriptions. Divy Kala, Eshika Khandelwal, Makarand Tapaswi
2025	What are Foundation Models Cooking in the Post-Soviet World? Anton Lavrouk, Tarek Naous, Alan Ritter, Wei Xu
2025	What's in a prompt? Language models encode literary style in prompt embeddings. Raphaël Sarfati, Haley Moller, Toni J. B. Liu, Nicolas Boullé, Christopher J. Earls
2025	When Annotators Disagree, Topology Explains: Mapper, a Topological Tool for Exploring Text Embedding Geometry and Ambiguity. Nisrine Rair, Alban Goupil, Valeriu Vrabie, Emmanuel Chochoy
2025	When Audio and Text Disagree: Revealing Text Bias in Large Audio-Language Models. Cheng Wang, Gelei Deng, Xianglin Yang, Han Qiu, Tianwei Zhang
2025	When Big Models Train Small Ones: Label-Free Model Parity Alignment for Efficient Visual Question Answering using Small VLMs. Abhirama Subramanyam Penamakuri, Navlika Singh, Piyush Arora, Anand Mishra
2025	When Life Gives You Samples: The Benefits of Scaling up Inference Compute for Multilingual LLMs. Ammar Khairi, Daniel D'souza, Ye Shen, Julia Kreutzer, Sara Hooker
2025	When Long Helps Short: How Context Length in Supervised Fine-tuning Affects Behavior of Large Language Models. Yingming Zheng, Hanqi Li, Kai Yu, Lu Chen
2025	When Truthful Representations Flip Under Deceptive Instructions? Xianxuan Long, Yao Fu, Runchao Li, Mu Sheng, Haotian Yu, Xiaotian Han, Pan Li
2025	When Words Smile: Generating Diverse Emotional Facial Expressions from Text. Haidong Xu, Meishan Zhang, Hao Ju, Zhedong Zheng, Erik Cambria, Min Zhang, Hao Fei
2025	Where Confabulation Lives: Latent Feature Discovery in LLMs. Thibaud Ardoin, Yi Cai, Gerhard Wunder
2025	Where to show Demos in Your Prompt: A Positional Bias of In-Context Learning. Kwesi A. Cobbina, Tianyi Zhou
2025	Which Word Orders Facilitate Length Generalization in LMs? An Investigation with GCG-Based Artificial Languages. Nadine El-Naggar, Tatsuki Kuribayashi, Ted Briscoe
2025	Whisper-UT: A Unified Translation Framework for Speech and Text. Cihan Xiao, Matthew Wiesner, Debashish Chakraborty, Reno Kriz, Keith Cunningham, Kenton Murray, Kevin Duh, Luis Tavarez-Arce, Paul McNamee, Sanjeev Khudanpur
2025	Who Holds the Pen? Caricature and Perspective in LLM Retellings of History. Lubna Zahan Lamia, Mabsur Fatin Bin Hossain, Md. Mosaddek Khan
2025	Who is in the Spotlight: The Hidden Bias Undermining Multimodal Retrieval-Augmented Generation. Jiayu Yao, Shenghua Liu, Yiwei Wang, Lingrui Mei, Baolong Bi, Yuyao Ge, Zhecheng Li, Xueqi Cheng
2025	Why Do Some Inputs Break Low-Bit LLM Quantization? Ting-Yun Chang, Muru Zhang, Jesse Thomason, Robin Jia
2025	Why Stop at One Error? Benchmarking LLMs as Data Science Code Debuggers for Multi-Hop and Multi-Bug Errors. Zhiyu Yang, Shuo Wang, Yukun Yan, Yang Deng
2025	Why and How LLMs Benefit from Knowledge Introspection in Commonsense Reasoning. Chengfeng Zhao, Shizhu He, Shanshan Jiang, Bin Dong, Jun Zhao, Kang Liu
2025	WildDoc: How Far Are We from Achieving Comprehensive and Robust Document Understanding in the Wild? An-Lan Wang, Jingqun Tang, Lei Liao, Hao Feng, Qi Liu, Xiang Fei, Jinghui Lu, Han Wang, Hao Liu, Yuliang Liu, Xiang Bai, Can Huang
2025	WildScore: Benchmarking MLLMs in-the-Wild Symbolic Music Reasoning. Gagan Mundada, Yash Vishe, Amit Namburi, Xin Xu, Zachary Novack, Julian J. McAuley, Junda Wu
2025	Will It Still Be True Tomorrow? Multilingual Evergreen Question Classification to Improve Trustworthy QA. Sergey Pletenev, Maria Marina, Nikolay Ivanov, Daria Galimzianova, Nikita Krayko, Mikhail Salnikov, Vasily Konovalov, Alexander Panchenko, Viktor Moskvoretskii
2025	Wojood Alaa Aljabari, Mohammed Khalilia, Mustafa Jarrar
2025	Women, Infamous, and Exotic Beings: A Comparative Study of Honorific Usages in Wikipedia and LLMs for Bengali and Hindi. Sourabrata Mukherjee, Atharva Mehta, Sougata Saha, Akhil Arora, Monojit Choudhury
2025	Word Salad Chopper: Reasoning Models Waste A Ton Of Decoding Budget On Useless Repetitions, Self-Knowingly. Wenya Xie, Shaochen Zhong, Hoang Anh Duy Le, Zhaozhuo Xu, Jianwen Xie, Zirui Liu
2025	Words Like Knives: Backstory-Personalized Modeling and Detection of Violent Communication. Jocelyn J. Shen, Akhila Yerukola, Xuhui Zhou, Cynthia Breazeal, Maarten Sap, Hae-Won Park
2025	X-CoT: Explainable Text-to-Video Retrieval via LLM-based Chain-of-Thought Reasoning. Prasanna Reddy Pulakurthi, Jiamian Wang, Majid Rabbani, Sohail A. Dianat, Raghuveer Rao, Zhiqiang Tao
2025	X-FLoRA: Cross-modal Federated Learning with Modality-expert LoRA for Medical VQA. Min Hyuk Kim, Changheon Kim, Seok Bong Yoo
2025	XAutoLM: Efficient Fine-Tuning of Language Models via Meta-Learning and AutoML. Ernesto Luis Estevanell-Valladares, Suilan Estevez-Velarde, Yoan Gutiérrez, Andrés Montoyo, Ruslan Mitkov
2025	XLQA: A Benchmark for Locale-Aware Multilingual Open-Domain Question Answering. Keon-Woo Roh, Yeong-Joon Ju, Seong-Whan Lee
2025	XQuant: Achieving Ultra-Low Bit KV Cache Quantization with Cross-Layer Compression. Haoqi Yang, Yao Yao, Zuchao Li, Baoyuan Qi, Guoming Liu, Hai Zhao
2025	You Are What You Train: Effects of Data Composition on Training Context-aware Machine Translation Models. Pawel Maka, Yusuf Can Semerci, Jan Scholtes, Gerasimos Spanakis
2025	Your Language Model Can Secretly Write Like Humans: Contrastive Paraphrase Attacks on LLM-Generated Text Detectors. Hao Fang, Jiawei Kong, Tianqu Zhuang, Yixiang Qiu, Kuofeng Gao, Bin Chen, Shu-Tao Xia, Yaowei Wang, Min Zhang
2025	Your RAG is Unfair: Exposing Fairness Vulnerabilities in Retrieval-Augmented Generation via Backdoor Attacks. Gaurav Bagwe, Saket S. Chaturvedi, Xiaolong Ma, Xiaoyong Yuan, Kuang-Ching Wang, Lan Zhang
2025	ZERA: Zero-init Instruction Evolving Refinement Agent - From Zero Instructions to Structured Prompts via Principle-based Optimization. Seungyoun Yi, Minsoo Khang, Sungrae Park
2025	Zero-shot Multimodal Document Retrieval via Cross-modal Question Generation. Yejin Choi, Jae-Woo Park, Janghan Yoon, Saejin Kim, Jaehyun Jeon, Youngjae Yu
2025	ZoomEye: Enhancing Multimodal LLMs with Human-Like Zooming Capabilities through Tree-Based Image Exploration. Haozhan Shen, Kangjia Zhao, Tiancheng Zhao, Ruochen Xu, Zilun Zhang, Mingwei Zhu, Jianwei Yin
2025	fLSA: Learning Semantic Structures in Document Collections Using Foundation Models. Weijia Xu, Nebojsa Jojic, Nicolas Le Roux
2025	iKnow-audio: Integrating Knowledge Graphs with Audio-Language Models. Michel Olvera, Changhong Wang, Paraskevas Stamatiadis, Gaël Richard, Slim Essid
2025	iTool: Reinforced Fine-Tuning with Dynamic Deficiency Calibration for Advanced Tool Use. Yirong Zeng, Xiao Ding, Yuxian Wang, Weiwen Liu, Yutai Hou, Wu Ning, Xu Huang, Duyu Tang, Dandan Tu, Bing Qin, Ting Liu
2025	iVISPAR - An Interactive Visual-Spatial Reasoning Benchmark for VLMs. Julius Mayer, Mohamad Ballout, Serwan Jassim, Farbod Nosrat Nezami, Elia Bruni
2025	pFedGPT: Hierarchically Optimizing LoRA Aggregation Weights for Personalized Federated GPT Models. Zhanming Shen, Tianqi Xu, Hao Wang, Jian Li, Miao Pan
2025	reWordBench: Benchmarking and Improving the Robustness of Reward Models with Transformed Inputs. Zhaofeng Wu, Michihiro Yasunaga, Andrew Cohen, Yoon Kim, Asli Celikyilmaz, Marjan Ghazvininejad
2025	s1: Simple test-time scaling. Niklas Muennighoff, Zitong Yang, Weijia Shi, Xiang Lisa Li, Li Fei-Fei, Hannaneh Hajishirzi, Luke Zettlemoyer, Percy Liang, Emmanuel J. Candès, Tatsunori Hashimoto
2025	s3: You Don't Need That Much Data to Train a Search Agent via RL. Pengcheng Jiang, Xueqiang Xu, Jiacheng Lin, Jinfeng Xiao, Zifeng Wang, Jimeng Sun, Jiawei Han
2025	seqBench: A Tunable Benchmark to Quantify Sequential Reasoning Limits of LLMs. Mohammad Ramezanali, Mo Vazifeh, Paolo Santi
2025	so much depends / upon / a whitespace: Why Whitespace Matters for Poets and LLMs. Sriharsh Bhyravajjula, Melanie Walsh, Anna Preus, Maria Antoniak
2025	xCoRe: Cross-context Coreference Resolution. Giuliano Martinelli, Bruno Gatti, Roberto Navigli
2025	zFLoRA: Zero-Latency Fused Low-Rank Adapters. Dhananjaya Gowda, Seoha Song, Harshith Goka, Junhyun Lee