PPoPP B

47 papers

Year	Title / Authors
2014	21st century computer architecture. Mark D. Hill
2014	A decomposition for in-place matrix transposition. Bryan Catanzaro, Alexander Keller, Michael Garland
2014	A general technique for non-blocking trees. Trevor Brown, Faith Ellen, Eric Ruppert
2014	A practical wait-free simulation for lock-free data structures. Shahar Timnat, Erez Petrank
2014	A tool to analyze the performance of multithreaded programs on NUMA architectures. Xu Liu, John M. Mellor-Crummey
2014	ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming, PPoPP '14, Orlando, FL, USA, February 15-19, 2014 José E. Moreira, James R. Larus
2014	Automatic semantic locking. Guy Golan-Gueta, G. Ramalingam, Mooly Sagiv, Eran Yahav
2014	Beyond parallel programming with domain specific languages. Kunle Olukotun
2014	CUDA-NP: realizing nested thread-level parallelism in GPGPU applications. Yi Yang, Huiyang Zhou
2014	Concurrency bug localization using shared memory access pairs. Wenwen Wang, Chenggang Wu, Pen-Chung Yew, Xiang Yuan, Zhenjiang Wang, Jianjun Li, Xiaobing Feng
2014	Concurrency testing using schedule bounding: an empirical study. Paul Thomson, Alastair F. Donaldson, Adam Betts
2014	Data structures for task-based priority scheduling. Martin Wimmer, Francesco Versaci, Jesper Larsson Träff, Daniel Cederman, Philippas Tsigas
2014	Designing and auto-tuning parallel 3-D FFT for computation-communication overlap. Sukhyun Song, Jeffrey K. Hollingsworth
2014	Detecting silent data corruption through data dynamic monitoring for scientific applications. Leonardo Arturo Bautista-Gomez, Franck Cappello
2014	Efficient deterministic multithreading without global barriers. Kai Lu, Xu Zhou, Tom Bergan, Xiaoping Wang
2014	Efficient search for inputs causing high floating-point errors. Wei-Fan Chiang, Ganesh Gopalakrishnan, Zvonimir Rakamaric, Alexey Solovyev
2014	Eliminating global interpreter locks in ruby through hardware transactional memory. Rei Odaira, José G. Castaños, Hisanobu Tomari
2014	Extracting logical structure and identifying stragglers in parallel execution traces. Katherine E. Isaacs, Todd Gamblin, Abhinav Bhatele, Peer-Timo Bremer, Martin Schulz, Bernd Hamann
2014	Fast concurrent lock-free binary search trees. Aravind Natarajan, Neeraj Mittal
2014	Fine-grain parallel megabase sequence comparison with multiple heterogeneous GPUs. Edans F. de O. Sandes, Guillermo Miranda, Alba Cristina Magalhaes Alves de Melo, Xavier Martorell, Eduard Ayguadé
2014	Heterogeneous computing: what does it mean for compiler research? Norm Rubin
2014	In-place transposition of rectangular matrices on accelerators. I-Jui Sung, Juan Gómez-Luna, José María González-Linares, Nicolás Guil, Wen-mei W. Hwu
2014	Infrastructure-free logging and replay of concurrent execution on multiple cores. Kyu Hyung Lee, Dohyeong Kim, Xiangyu Zhang
2014	Initial study of multi-endpoint runtime for MPI+OpenMP hybrid programming model on multi-core systems. Miao Luo, Xiaoyi Lu, Khaled Hamidouche, Krishna Chaitanya Kandalla, Dhabaleswar K. Panda
2014	Leveraging hardware message passing for efficient thread synchronization. Darko Petrovic, Thomas Ropars, André Schiper
2014	Lock contention aware thread migrations. Kishore Kumar Pusukuri, Rajiv Gupta, Laxmi Narayan Bhuyan
2014	Optimistic transactional boosting. Ahmed Hassan, Roberto Palmieri, Binoy Ravindran
2014	PREDATOR: predictive false sharing detection. Tongping Liu, Chen Tian, Ziang Hu, Emery D. Berger
2014	Parallelization hints via code skeletonization. Cfir Aguston, Yosi Ben-Asher, Gadi Haber
2014	Parallelizing dynamic programming through rank convergence. Saeed Maleki, Madanlal Musuvathi, Todd Mytkowicz
2014	Portable, MPI-interoperable coarray fortran. Chaoran Yang, Wesley Bland, John M. Mellor-Crummey, Pavan Balaji
2014	Practical concurrent binary search trees via logical ordering. Dana Drachsler, Martin T. Vechev, Eran Yahav
2014	Provably good scheduling for parallel programs that use data structures through implicit batching. Kunal Agrawal, Jeremy T. Fineman, Brendan Sheridan, Jim Sukha, Robert Utterback
2014	Race directed scheduling of concurrent programs. Mahdi Eslamimehr, Jens Palsberg
2014	Resilient X10: efficient failure-aware programming. David Cunningham, David Grove, Benjamin Herta, Arun Iyengar, Kiyokuni Kawachiya, Hiroki Murata, Vijay A. Saraswat, Mikio Takeuchi, Olivier Tardieu
2014	Revisiting loop fusion in the polyhedral framework. Sanyam Mehta, Pei-Hung Lin, Pen-Chung Yew
2014	SCCMulti: an improved parallel strongly connected components algorithm. Daniel Tomkins, Timmie G. Smith, Nancy M. Amato, Lawrence Rauchwerger
2014	Singe: leveraging warp specialization for high performance on GPUs. Michael Bauer, Sean Treichler, Alex Aiken
2014	Task mapping stencil computations for non-contiguous allocations. Vitus J. Leung, David P. Bunde, Jonathan Ebbers, Stefan P. Feer, Nickolas W. Price, Zachary D. Rhodes, Matthew Swank
2014	Theoretical analysis of classic algorithms on highly-threaded many-core GPUs. Lin Ma, Kunal Agrawal, Roger D. Chamberlain
2014	Time-warp: lightweight abort minimization in transactional memory. Nuno Lourenco Diegues, Paolo Romano
2014	Towards fair and efficient SMP virtual machine scheduling. Jia Rao, Xiaobo Zhou
2014	Trace driven dynamic deadlock detection and reproduction. Malavika Samak, Murali Krishna Ramanathan
2014	Triolet: a programming system that unifies algorithmic skeleton interfaces for high-performance cluster computing. Christopher I. Rodrigues, Thomas B. Jablin, Abdul Dakkak, Wen-mei W. Hwu
2014	Well-structured futures and cache locality. Maurice Herlihy, Zhiyu Liu
2014	X10 and APGAS at Petascale. Olivier Tardieu, Benjamin Herta, David Cunningham, David Grove, Prabhanjan Kambadur, Vijay A. Saraswat, Avraham Shinnar, Mikio Takeuchi, Mandana Vaziri
2014	yaSpMV: yet another SpMV framework on GPUs. Shengen Yan, Chao Li, Yunquan Zhang, Huiyang Zhou