MICRO - RankMe

124 papers

Year	Title / Authors
2025	3D-PATH: A Hierarchy LUT Processing-in-memory Accelerator with Thermal-aware Hybrid Bonding Integration. Zhiheng Yue, Yang Wang, Chao Li, Shaojun Wei, Yang Hu, Shouyi Yin
2025	A Probabilistic Perspective on Tiling Sparse Tensor Algebra. Ritvik Sharma, Zi Yu Xue, Nathan Zhang, Rubens Lacouture, Fredrik Kjolstad, Sara Achour, Mark Horowitz
2025	A TRRIP Down Memory Lane: Temperature-Based Re-Reference Interval Prediction For Instruction Caching. Henry Kao, Nikhil Sreekumar, Prabhdeep Singh Soni, Ali Sedaghati, Fang Su, Bryan Chan, Maziar Goudarzi, Reza Azimi
2025	A. Delegato: Locality-Aware Atomic Memory Operations on Chiplets. Víctor Soria Pardos, Adrià Armejach, Tiago Mück, Darío Suárez Gracia, José A. Joao, Miquel Moretó
2025	ATR: Out-of-Order Register Release Exploiting Atomic Regions. Yinyuan Zhao, Surim Oh, Mingsheng Xu, Heiner Litz
2025	Accelerating Retrieval Augmented Language Model via PIM and PNM Integration. Je-Woo Jang, Junyong Oh, Youngbae Kong, Jae-Youn Hong, Sung-Hyuk Cho, Jeongyeol Lee, Hoeseok Yang, Joon-Sung Yang
2025	Accurate Leakage Speculation for Quantum Error Correction. Chaithanya Naik Mude, Swamit Tannu
2025	Amove: Accelerating LLMs through Mitigating Outliers and Salient Points via Fine-Grained Grouped Vectorized Data Type. Xilong Xie, Liang Wang, Limin Xiao, Meng Han, Lei Liu, Xiangrong Xu, Jinquan Wang, Zhen Song, Xiaojian Liao
2025	Athena: Accelerating Quantized Convolutional Neural Networks under Fully Homomorphic Encryption. Yinghao Yang, Xicheng Xu, Liang Chang, Hang Lu, Xiaowei Li
2025	AxCore: A Quantization-Aware Approximate GEMM Unit for LLM Inference. Jiaxiang Zou, Yonghao Chen, Xingyu Chen, Chenxi Xu, Xinyu Chen
2025	Beyond Page Migration: Enhancing Tiered Memory Performance via Integrated Last-Level Cache Management and Page Migration. Hwanjun Lee, Minho Kim, Yeji Jung, Seonmu Oh, Ki-Dong Kang, Seunghak Lee, Daehoon Kim
2025	BitL: A Hybrid Bit-Serial and Parallel Deep Learning Accelerator for Critical Path Reduction. Seunghyun Lee, Dongho Ha, Sungbin Kim, Sungwoo Kim, Hyunwuk Lee, Won Woo Ro
2025	Boosting Task Scheduling Data Locality with Low-latency, HW-accelerated Label Propagation. Lucas Morais, Juan Miguel De Haro Ruiz, Alfredo Goldman, Guido Araujo, Giacomo Pedretti, Jim Ignowski, Michael Frank, Xavier Martorell, Daniel Jiménez-González, Carlos Álvarez
2025	Bootes: Boosting the Efficiency of Sparse Accelerators Using Spectral Clustering. Sanjali Yadav, Bahar Asgari
2025	C3ache: Towards Hierarchical Cache-Centric Computing for Sparse Matrix Multiplication on GPGPUs. Xiaojie Li, Mingyu Wang, Baiqing Zhong, Haiqiu Huang, Guangjie Cao, Zhiyi Yu
2025	COSMOS: RL-Enhanced Locality-Aware Counter Cache Optimization for Secure Memory. Haoran Geng, Xiaoyang Lu, Yuezhi Che, Ziang Tian, Dazhao Cheng, Xian-He Sun, Michael T. Niemier, X. Sharon Hu
2025	Chameleon: Adaptive Caching and Scheduling for Many-Adapter LLM Inference Environments. Nikoleta Iliakopoulou, Jovan Stojkovic, Chloe Alverti, Tianyin Xu, Hubertus Franke, Josep Torrellas
2025	Characterizing and Optimizing Realistic Workloads on a Commercial Compute-in-SRAM Device. Niansong Zhang, Wenbo Zhu, Courtney Golden, Dan Ilan, Hongzheng Chen, Christopher Batten, Zhiru Zhang
2025	Characterizing the Efficiency of Distributed Training: A Power, Performance, and Thermal Perspective. Seokjin Go, Joongun Park, Spandan More, Hanjiang Wu, Irene Wang, Aaron Jezghani, Tushar Krishna, Divya Mahajan
2025	Chasoň: Supporting Cross HBM Channel Data Migration to Enable Efficient Sparse Algebraic Acceleration. Ubaid Bakhtiar, Amirmahdi Namjoo, Bahar Asgari
2025	Citadel: Rethinking Memory Allocation to Safeguard Against Inter-Domain Rowhammer Exploits. Anish Saxena, Walter Wang, Alexandros Daglis
2025	ColumnDisturb: Understanding Column-based Read Disturbance in Real DRAM Chips and Implications for Future Systems. Ismail Emir Yuksel, Ataberk Olgun, Nisa Bostanci, Haocong Luo, Abdullah Giray Yaglikçi, Onur Mutlu
2025	ComPASS: A Compatible PIM Protocol Architecture and Scheduling Solution for Processor-PIM Collaboration. Seunghyuk Yu, Hyeonu Kim, Kyoungho Jeun, Sunyoung Hwang, Seongmin Cho, Eojin Lee
2025	Coruscant: Co-Designing GPU Kernel and Sparse Tensor Core to Advocate Unstructured Sparsity in Efficient LLM Inference. Donghyeon Joo, Helya Hosseini, Ramyad Hadidi, Bahar Asgari
2025	Crane: Inter-Layer Scheduling Framework for DNN Inference and Training Co-Support on Tiled Architecture. Yu Gong, Lingyi Huang, Haodong Chang, Rongjian Liang, Cheng Yang, Zhexiang Tang, Jiang Hu, Bo Yuan
2025	CrossBit: Bitwise Computing in NAND Flash Memory with Inter-Bitline Data Communication. HyunJin Kim, Seunghwan Song, Sukhyun Choi, Jeongin Choe, SangHyeok Han, Jisung Park, Jinho Lee, Jae-Joon Kim
2025	CryptoBTB: A Secure Hierarchical BTB for Diverse Instruction Footprint Workloads. Debpratim Adak, Eric Rotenberg, Amro Awad, Huiyang Zhou
2025	DEAR: Improving Performance and Lifetime of SSDs Using Dynamic Error-Aware Refresh. Jaeyong Lee, Beomjun Kim, Myoungjun Chun, Myungsuk Kim, Jihong Kim
2025	DECA: A Near-Core LLM Decompression Accelerator Grounded on a 3D Roofline Model. Gerasimos Gerogiannis, Stijn Eyerman, Evangelos Georganas, Wim Heirman, Josep Torrellas
2025	DExiM: Exposing Impedance-Based Data Leakage in Emerging Memories. Md. Sadik Awal, Md. Tauhidur Rahman
2025	DRAM Fault Classification through Large-Scale Field Monitoring for Robust Memory RAS Management. Hoiju Chung, Euisang Oh, Seungmin Baek, Hyeongshin Yoon, Jaesung Yoo, Sanghwan Lee, Yongjun Lee, Arhatha Bramhanand, Brett Dodds, Yang Zhou, Nam Sung Kim
2025	DS-TIDE: Harnessing Dynamical Systems for Efficient Time-Independent Differential Equation Solving. Chuan Liu, Chunshu Wu, Ruibing Song, Guangyan Sun, Ying Nian Wu, Yousu Chen, Ang Li, Tong Geng
2025	DiffTest-H: Toward Semantic-Aware Communication in Hardware-Accelerated Processor Verification. Kunlin You, Yinan Xu, Kehan Feng, Luoshan Cai, Yaoyang Zhou, Yungang Bao
2025	Dissecting and Modeling the Architecture of Modern GPU Cores. Rodrigo Huerta, Mojtaba Abaie Shoushtary, José-Lorenzo Cruz, Antonio González
2025	Distributed-HISQ: A Distributed Quantum Control Architecture. Yilun Zhao, Kangding Zhao, Peng Zhou, Dingdong Liu, Tingyu Luo, Yuzhen Zheng, Peng Luo, Shun Hu, Jin Lin, Cheng Guo, Yinhe Han, Ying Wang, Mingtang Deng, Junjie Wu, Xiang Fu
2025	Drishti: Do Not Forget Slicing While Designing Last-Level Cache Replacement Policies for Many-Core Systems. Sweta, Prerna Priyadarshini, Biswabandan Panda
2025	EcoCore: Dynamic Core Management for Improving Energy Efficiency in Latency-Critical Applications. Gyeongseo Park, Minho Kim, Ki-Dong Kang, Yunhyeong Jeon, Seulki Kim, Daehoon Kim
2025	Efficient Security Support for CXL Memory through Adaptive Incremental Offloaded (Re-)Encryption. Chuanhan Li, Jishen Zhao, Yuanchao Xu
2025	Elevating Temporal Prefetching Through Instruction Correlation. Shuiyi He, Zicong Wang, Xuan Tang, Hao Tang, Dezun Dong, Liquan Xiao
2025	Elk: Exploring the Efficiency of Inter-core Connected AI Chips with Deep Learning Compiler Techniques. Yiqi Liu, Yuqi Xue, Noelle Crawford, Jilong Xue, Jian Huang
2025	Empowering Vector Architectures for ML: The CAMP Architecture for Matrix Multiplication. Mohammadreza Esmali Nojehdeh, Hossein Mokhtarnia, Julian Pavon, Narcís Rodas, Roger Figueras Bagué, Enrico Reggiani, Miquel Moretó, Osman S. Unsal, Adrián Cristal, Eduard Ayguadé
2025	FALA: Locality-Aware PIM-Host Cooperation for Graph Processing with Fine-Grained Column Access. Changmin Shin, Jaeyong Song, Seongmin Na, Jun Sung, Hongsun Jang, Jinho Lee
2025	FexMo: Enabling Fuse Execution Mode for Multi-task CGRAs. Yufei Yang, Chenhao Xie, Chuliang Guo, Liansheng Liu, Xiyuan Peng, Datong Liu, Yu Peng
2025	Flexing RISC-V Instruction Subset Processors to Extreme Edge. Alireza Raisiardali, Konstantinos Iordanou, Jedrzej Kufel, Kowshik Gudimetla, Kris Myny, Emre Ozer
2025	GCC: A 3DGS Inference Architecture with Gaussian-Wise and Cross-Stage Conditional Processing. Minnan Pei, Gang Li, Junwen Si, Zeyu Zhu, Zitao Mo, Peisong Wang, Zhuoran Song, Xiaoyao Liang, Jian Cheng
2025	GateBleed: Exploiting On-Core Accelerator Power Gating for High Performance and Stealthy Attacks on AI. Joshua Kalyanapu, Farshad Dizani, Darsh Asher, Azam Ghanbari, Rosario Cammarota, Aydin Aysu, Samira Mirbagher Ajorpaz
2025	Ghost Threading: Helper-Thread Prefetching for Real Systems. Yuxin Guo, Akshay Bhosale, Utpal Bora, Alexandra W. Chadwick, Márton Erdos, Giacomo Gabrielli, Timothy M. Jones
2025	HAWK: Fully Homomorphic Encryption Accelerator with Fixed-Word Key Decomposition Switching. Liang Kong, Shengyu Fan, Xianglong Deng, Lei Chen, Guang Fan, Guiming Shi, Yilan Zhu, Geng Yang, Shoumeng Yan, Mingzhe Zhang
2025	HEAT: NPU-NDP HEterogeneous Architecture for Transformer-Empowered Graph Neural Networks. Ruiyang Chen, Zhuoran Song, Yicheng Zheng, Zeyu Zhu, Gang Li, Naifeng Jing, Xiaoyao Liang, Haibing Guan
2025	HLX: A Unified Pipelined Architecture for Optimized Performance of Hybrid Transformer-Mamba Language Models. In-Jun Jung, Gyeongrok Yang, Jaeha Min, Joo-Young Kim
2025	HiPACK: Efficient Sub-8-Bit Direct Convolution with SIMD and Bitwise Management. Yao Chen, Cheng Gong, Bingsheng He
2025	Interleaved Bitstream Execution for Multi-Pattern Regex Matching on GPUs. Tianao Ge, Xiaowen Chu, Hongyuan Liu
2025	Ironman: Accelerating Oblivious Transfer Extension for Privacy-Preserving AI with Near-Memory Processing. Chenqi Lin, Kang Yang, Tianshi Xu, Ling Liang, Yufei Wang, Zhaohui Chen, Runsheng Wang, Mingyu Gao, Meng Li
2025	Kelle: Co-design KV Caching and eDRAM for Efficient LLM Serving in Edge Computing. Tianhua Xia, Sai Qian Zhang
2025	LANCER: Low-Overhead, Accurate, and Non-Destructive Calibration for Real-World Fault-Tolerant Quantum Applications. Junpyo Kim, Jungmin Cho, Hyeonseong Jeong, Dongmoon Min, Junhyuk Choi, Juwon Hong, Jangwoo Kim
2025	LATPC: Accelerating GPU Address Translation Using Locality-Aware TLB Prefetching and MSHR Compression. Yeonan Ha, Jiho Park, Hanna Cha, Jiwon Lee, Joonsung Kim, Won Woo Ro, Youngsok Kim
2025	LEGOSim: A Unified Parallel Simulation Framework for Multi-chiplet Heterogeneous Integration. Tiantian Lin, Cheng Qiu, Xiaohang Wang, Ling Wang, Zhulin Zheng, Yingtao Jiang, Amit Kumar Singh, Jieming Yin, Sihai Qiu, Xiaodong Li, Xin Tang, Jie Song, Mingzhe Zhang, Kui Ren
2025	LLM.265: Video Codecs are Secretly Tensor Codecs. Ceyu Xu, Yongji Wu, Xinyu Yang, Beidi Chen, Matthew Lentz, Danyang Zhuo, Lisa Wu Wills
2025	LLMulator: Generalizable Cost Modeling for Dataflow Accelerators with Input-Adaptive Control Flow. Kaiyan Chang, Wenlong Zhu, Shengwen Liang, Huawei Li, Ying Wang
2025	Learning to Walk: Architecting Learned Virtual Memory Translation. Kaiyang Zhao, Yuang Chen, Xenia Xu, Dan Schatzberg, Nastaran Hajinaza, Rupin Vakharwala, Andy Anderson, Dimitrios Skarlatos
2025	Leveraging Chiplet-Locality for Efficient Memory Mapping in Multi-Chip Module GPUs. Junhyeok Park, Sungbin Jang, Osang Kwon, Yongho Lee, Seokin Hong
2025	LongSight: Compute-Enabled Memory to Accelerate Large-Context LLMs via Sparse Attention. Derrick Quinn, E. Ezgi Yücel, Jinkwon Kim, José F. Martínez, Mohammad Alian
2025	LoopFrog: In-Core Hint-Based Loop Parallelization. Márton Erdos, Utpal Bora, Akshay Bhosale, Bob Lytton, Ali Mustafa Zaidi, Alexandra W. Chadwick, Yuxin Guo, Giacomo Gabrielli, Timothy M. Jones
2025	MCBP: A Memory-Compute Efficient LLM Inference Accelerator Leveraging Bit-Slice-enabled Sparsity and Repetitiveness. Huizheng Wang, Zichuan Wang, Zhiheng Yue, Yousheng Long, Taiquan Wei, Jianxun Yang, Yang Wang, Chao Li, Shaojun Wei, Yang Hu, Shouyi Yin
2025	MHE-TPE: Multi-Operand High-Radix Encoder for Mixed-Precision Fixed-Point Tensor Processing Engines. Qizhe Wu, Jinyi Zhou, Zhanhe Hu, Zhichen Zeng, Huawen Liang, Jiuru Zhu, Linfeng Tao, Xin Zhang, Zekang Cheng, Letian Zhao, Wei Yuan, Xiaotian Wang, Xi Jin
2025	MINDFUL: Safe, Implantable, Large-Scale Brain-Computer Interfaces from a System-Level Design Perspective. Guy Eichler, Yatin Gilhotra, Nanyu Zeng, Martha A. Kim, Kenneth L. Shepard, Luca P. Carloni
2025	MUSS-TI: Multi-level Shuttle Scheduling for Large-Scale Entanglement Module Linked Trapped-Ion. Xian Wu, Chenghong Zhu, Jingbo Wang, Xin Wang
2025	MX+: Pushing the Limits of Microscaling Formats for Efficient Large Language Model Serving. Jungi Lee, Junyong Park, Soohyun Cha, Jaehoon Cho, Jaewoong Sim
2025	Micro-MAMA: Multi-Agent Reinforcement Learning for Multicore Prefetching. Charles Block, Gerasimos Gerogiannis, Josep Torrellas
2025	Misam: Machine Learning Assisted Dataflow Selection in Accelerators for Sparse Matrix Multiplication. Sanjali Yadav, Amirmahdi Namjoo, Bahar Asgari
2025	Multi-Dimensional ML-Pipeline Optimization in Cost-Effective Disaggregated Datacenter. Pingyi Huo, Anusha Devulapally, Hasan Al Maruf, Nandhini Chandramoorthy, Meena Arunachalam, Gulsum Gudukbay Akbulut, Mahmut T. Kandemir, Vijaykrishnan Narayanan
2025	Multi-Stream Squash Reuse for Control-Independent Processors. Qingxuan Kang, Trevor E. Carlson
2025	NetSparse: In-Network Acceleration of Distributed Sparse Kernels. Gerasimos Gerogiannis, Dimitrios Merkouriadis, Charles Block, Annus Zulfiqar, Filippos Tofalos, Muhammad Shahbaz, Josep Torrellas
2025	NetZIP: Algorithm/Hardware Co-design of In-network Lossless Compression for Distributed Large Model Training. Jinghan Huang, Hyungyo Kim, Nachuan Wang, Jaeyoung Kang, Hrishi Shah, Eun Kyung Lee, Minjia Zhang, Fan Lai, Nam Sung Kim
2025	Nexus Machine: An Energy-Efficient Active Message Inspired Reconfigurable Architecture. Rohan Juneja, Pranav Dangi, Thilini Kaushalya Bandara, Tulika Mitra, Li-Shiuan Peh
2025	OASIS: A Commercial High Performance Terminal AI Processor Supporting RISC-V Tensor Extension Instructions. Peng Gao, Yang Liu, Haonan Sun, Jiang Jiang, Jun Wang, Zonghui Hong, Jiali Qu
2025	ORCHES: Orchestrated Test-Time-Compute-based LLM Reasoning on Collaborative GPU-PIM HEterogeneous System. Sixu Li, Yuzhou Chen, Chaojian Li, Yonggan Fu, Zheng Wang, Zhongzhi Yu, Haoran You, Zhifan Ye, Wei Zhou, Yongan Zhang, Yingyan (Celine) Lin
2025	OmniSim: Simulating Hardware with C Speed and RTL Accuracy for High-Level Synthesis Designs. Rishov Sarkar, Cong Hao
2025	One Flew over the Stack Engine's Nest: Practical Microarchitectural Attacks on the Stack Engine. Silvan Niederer, Sandro Rüegge, Ali Hajiabadi, Kaveh Razavi
2025	OneAdapt: Resource-Adaptive Compilation of Measurement-Based Quantum Computing for Photonic Hardware. Hezi Zhang, Jixuan Ruan, Dean Tullsen, Yufei Ding, Ang Li, Travis S. Humble
2025	Optimizing All-to-All Collective Communication with Fault Tolerance on Torus Networks. Le Qin, Junwei Cui, Weilin Cai, Meng Niu, Yan Yang, Jiayi Huang
2025	PIM-CCA: An Efficient PIM Architecture with Optimized Integration of Configurable Functional Units. Jeehyun Kim, Donghyeon Kim, Seokwon Kang, Bongjoon Hyun, Inho Lee, Yongjun Park
2025	Pimba: A Processing-in-Memory Acceleration for Post-Transformer Large Language Model Serving. Wonung Kim, Yubin Lee, Yoonsung Kim, Jinwoo Hwang, Seongryong Oh, Jiyong Jung, Aziz Huseynov, Woong Gyu Park, Chang Hyun Park, Divya Mahajan, Jongse Park
2025	PointISA: ISA-Extensions for Efficient Point Cloud Analytics via Architecture and Algorithm Co-Design. Meng Han, Liang Wang, Limin Xiao, Hao Zhang, Bowen Jiang, Xilong Xie, Jianfeng Zhu, Shaojun Wei, Leibo Liu
2025	PolymorPIC: Embedding Polymorphic Processing-in-Cache in RISC-V based Processor for Full-stack Efficient AI Inference. Cheng Zou, Ziling Wei, Jun Yan Lee, Chen Nie, Kang You, Zhezhi He
2025	Proceedings of the 58th IEEE/ACM International Symposium on Microarchitecture, MICRO 2025, Seoul, Republic of Korea, October 18-22, 2025
2025	PyTorchSim: A Comprehensive, Fast, and Accurate NPU Simulation Framework. Wonhyuk Yang, Yunseon Shin, Okkyun Woo, Geonwoo Park, Hyungkyu Ham, Jeehoon Kang, Jongse Park, Gwangsun Kim
2025	Quartz: A Reconfigurable, Distributed-Memory Accelerator for Sparse Applications. Courtney Golden, Axel Feldmann, Joel S. Emer, Daniel Sánchez
2025	REACT3D: Real-time Edge Accelerator for Incremental Training in 3D Gaussian Splatting based SLAM Systems. Hongyi Wang, Zhenhua Zhu, Tianchen Zhao, Yunfei Xiang, Zehao Wang, Jincheng Yu, Huazhong Yang, Yuan Xie, Yu Wang
2025	RICH Prefetcher: Storing Rich Information in Memory to Trade Capacity and Bandwidth for Latency Hiding. Ningzhi Ai, Wenjian He, Hu He, Jing Xia, Heng Liao, Guowei Zhang
2025	RTGS: Real-Time 3D Gaussian Splatting SLAM via Multi-Level Redundancy Reduction. Leshu Li, Jiayin Qin, Jie Peng, Zishen Wan, Huaizhi Qu, Ye Han, Pingqing Zheng, Hongsen Zhang, Yu Cao, Tianlong Chen, Yang Katie Zhao
2025	Rasengan: A Transition Hamiltonian-based Approximation Algorithm for Solving Constrained Binary Optimization Problems. Qifan Jiang, Liqiang Lu, Debin Xiang, Tianyao Chu, Tianze Zhu, Jingwen Leng, Yun Liang, Xiaoming Sun, Jianwei Yin
2025	RayN: Ray Tracing Acceleration with Near-memory Computing. Mohammadreza Saed, Prashant J. Nair, Tor M. Aamodt
2025	Re-architecting End-host Networking with CXL: Coherence, Memory, and Offloading. Houxiang Ji, Yifan Yuan, Yang Zhou, Ipoom Jeong, Ren Wang, Saksham Agarwal, Nam Sung Kim
2025	ReGate: Enabling Power Gating in Neural Processing Units. Yuqi Xue, Jian Huang
2025	Rethinking Tiling and Dataflow for SpMM Acceleration: A Graph Transformation Framework. Amir Ghazizadeh Ahsaei, Lingxiang Yin, Shilin Tian, Fangzhou Ye, Fan Yao, Hao Zheng
2025	S-DMA: Sparse Diffusion Models Acceleration via Spatiality-Aware Prediction and Dimension-Adaptive Dataflow. Zihan Zou, Xinming Yan, Shun Zhang, Peng Zheng, Guang Yang, Hao Cai, Bo Liu
2025	SHADOW: Simultaneous Multi-Threading Architecture with Asymmetric Threads. Ishita Chaturvedi, Bhargav Reddy Godala, Abiram Gangavaram, Daniel Flyer, Tyler Sorensen, Tor M. Aamodt, David I. August
2025	SMX: Heterogeneous Architecture for Universal Sequence Alignment Acceleration. Max Doblas, Po Jui Shih, Oscar Lostes-Cazorla, Miquel Moretó, Christopher Batten, Santiago Marco-Sola
2025	SeaCache: Efficient and Adaptive Caching for Sparse Accelerators. Xintong Li, Jinchen Jiang, Mingyu Gao
2025	Security and Performance Implications of GPU Cache Eviction Priority Hints. Qizhong Wang, Xiangyue Huang, Yanan Guo, Yuanchao Xu
2025	ShadowBinding: Realizing Effective Microarchitectures for In-Core Secure Speculation Schemes. Amund Bergland Kvalsvik, Magnus Själander
2025	SkipReduce: (Interconnection) Network Sparsity to Accelerate Distributed Machine Learning. Hans Kasan, Dennis Abts, Jungwook Choi, John Kim
2025	SmartPIR: A Private Information Retrieval System using Computational Storage Devices. Zehao Chen, Honghui You, Qian Wei, Hang Lu, Lei Ju, Zhaoyan Shen
2025	SoftWalker: Supporting Software Page Table Walk for Irregular GPU Applications. Sungbin Jang, Junhyeok Park, Yongho Lee, Osang Kwon, Donghyun Kim, Juyoung Seok, Seokin Hong
2025	Software Prefetch Multicast: Sharer-Exposed Prefetching for Bandwidth Efficiency in Manycore Processors. Yanhua Chen, Jiong Feng, Zhe Wang, Christopher J. Hughes, Jiayi Huang
2025	Sonar: A Hardware Fuzzing Framework to Uncover Contention Side Channels in Processors. Kanqi Zhang, Peinan Li, Miao Li, Xin Tian, Zelong Du, Quanchen Liu, Yongqiang Lyu, Yu Jiang, Dan Meng, Rui Hou
2025	Stratum: System-Hardware Co-Design with Tiered Monolithic 3D-Stackable DRAM for Efficient MoE Serving. Yue Pan, Zihan Xia, Po-Kai Hsu, Lanxiang Hu, Hyungyo Kim, Janak Sharda, Minxuan Zhou, Nam Sung Kim, Shimeng Yu, Tajana Rosing, Mingu Kang
2025	StreamTensor: Make Tensors Stream in Dataflow Accelerators for LLMs. Hanchen Ye, Deming Chen
2025	SuperMesh: Energy-Efficient Collective Communications for Accelerators. Sabuj Laskar, Pranati Majhi, Abdullah Muzahid, Eun Jung Kim
2025	SuperSFQ: A Hardware Design to Realize High-Frequency Superconducting Processors. Junhyuk Choi, Juwon Hong, Junpyo Kim, Jungmin Cho, Hyeonseong Jeong, Dongmoon Min, Masamitsu Tanaka, Koji Inoue, Jangwoo Kim
2025	Swift and Trustworthy Large-Scale GPU Simulation with Fine-Grained Error Modeling and Hierarchical Clustering. Euijun Chung, Seonjin Na, Sung Ha Kang, Hyesoon Kim
2025	SymbFuzz: Symbolic Execution Guided Hardware Fuzzing. Samit Shahnawaz Miftah, Amisha Srivastava, Hyunmin Kim, Shiyi Wei, Kanad Basu
2025	Symbiotic Task Scheduling and Data Prefetching. Gilead Posluns, Mark C. Jeffrey
2025	TAIDL: Tensor Accelerator ISA Definition Language with Auto-generation of Scalable Test Oracles. Devansh Jain, Marco Frigo, Jai Arora, Akash Pardeshi, Zhihao Wang, Krut Patel, Charith Mendis
2025	Titan-I: An Open-Source, High Performance RISC-V Vector Core. Jiuyang Liu, Qinjun Li, Yunqian Luo, Hongbin Zhang, Jiongjia Lu, Shupei Fan, Jianhao Ye, Yang Liu, Xiaoyi Liu, Yanqi Yang, Zewen Ye, Yuhang Zeng, Ao Shen, Rui Huang, Wei Cong, Xuecheng Zou, Mingyu Gao
2025	Towards Closing the Performance Gap for Cryptographic Kernels Between CPUs and Specialized Hardware. Naifeng Zhang, Sophia Fu, Franz Franchetti
2025	TransFusion: End-to-End Transformer Acceleration via Graph Fusion and Pipelining. Linxuan Zhang, José Nelson Amaral, Di Niu
2025	Understanding and Mitigating Covert Channel and Side Channel Vulnerabilities Introduced by RowHammer Defenses. F. Nisa Bostanci, Oguzhan Canpolat, Ataberk Olgun, Ismail Emir Yüksel, Konstantinos Kanellopoulos, Mohammad Sadrosadati, Abdullah Giray Yaglikçi, Onur Mutlu
2025	Vegapunk: Accurate and Fast Decoding for Quantum LDPC Codes with Online Hierarchical Algorithm and Sparse Accelerator. Kaiwen Zhou, Liqiang Lu, Debin Xiang, Chenning Tao, Anbang Wu, Jingwen Leng, Fangxin Liu, Mingshuai Chen, Jianwei Yin
2025	X-SET: An Efficient Graph Pattern Matching Accelerator With Order-Aware Parallel Intersection Units. Chenxi Xu, Tianhui Shi, Shixuan Sun, Jidong Zhai, Xinyu Chen
2025	YOUTIAO: Hybrid Multiplexing with Dynamic Qubit Grouping for Low-cost and Scalable Quantum Wiring. Wuwei Tian, Liqiang Lu, Siwei Tan, Shiyu Li, Hengyi Li, Tianyao Chu, Xuhong Zhang, Mingshuai Chen, Jianwei Yin
2025	ccAI: A Compatible and Confidential System for AI Computing. Chenxu Wang, Danqing Tang, Changxu Ci, Junjie Huang, Yankai Xu, Fengwei Zhang, Jiannong Cao, Jie Song, Shoumeng Yan, Tao Wei, Zhengyu He
2025	ρHammer: Reviving RowHammer Attacks on New Architectures via Prefetching. Weijie Chen, Shan Tang, Yulin Tang, Xiapu Luo, Yinqian Zhang, Weizhong Qiang