LREC - RankMe – RankMe

896 papers

Year	Title / Authors
2020	"Alexa in the wild" - Collecting Unconstrained Conversations with a Modern Voice Assistant in a Public Environment. Ingo Siegert
2020	"Cheese!": a Corpus of Face-to-face French Interactions. A Case Study for Analyzing Smiling and Conversational Humor. Béatrice Priego-Valverde, Brigitte Bigi, Mary Amoyal
2020	"Voices of the Great War": A Richly Annotated Corpus of Italian Texts on the First World War. Federico Boschetti, Irene De Felice, Stefano Dei Rossi, Felice Dell'Orletta, Michele Di Giorgio, Martina Miliani, Lucia C. Passaro, Angelica Puddu, Giulia Venturi, Nicola Labanca, Alessandro Lenci, Simonetta Montemagni
2020	A Broad-Coverage Deep Semantic Lexicon for Verbs. James F. Allen, Hannah An, Ritwik Bose, William de Beaumont, Choh Man Teng
2020	A Broad-coverage Corpus for Finnish Named Entity Recognition. Jouni Luoma, Miika Oinonen, Maria Pyykönen, Veronika Laippala, Sampo Pyysalo
2020	A CLARIN Transcription Portal for Interview Data. Christoph Draxler, Henk van den Heuvel, Arjan van Hessen, Silvia Calamai, Louise Corti
2020	A Chinese Corpus for Fine-grained Entity Typing. Chin Lee, Hongliang Dai, Yangqiu Song, Xin Li
2020	A Closer Look on Unsupervised Cross-lingual Word Embeddings Mapping. Kamil Plucinski, Mateusz Lango, Michal Zimniewicz
2020	A Cluster Ranking Model for Full Anaphora Resolution. Juntao Yu, Alexandra Uma, Massimo Poesio
2020	A Comparison of Explicit and Implicit Proactive Dialogue Strategies for Conversational Recommendation. Matthias Kraus, Fabian Fischbach, Pascal Jansen, Wolfgang Minker
2020	A Contract Corpus for Recognizing Rights and Obligations. Ruka Funaki, Yusuke Nagata, Kohei Suenaga, Shinsuke Mori
2020	A Conversation-Analytic Annotation of Turn-Taking Behavior in Japanese Multi-Party Conversation and its Preliminary Analysis. Mika Enomoto, Yasuharu Den, Yuichi Ishimoto
2020	A Corpus Linguistic Perspective on Contemporary German Pop Lyrics with the Multi-Layer Annotated "Songkorpus". Roman Schneider
2020	A Corpus for Automatic Readability Assessment and Text Simplification of German. Alessia Battisti, Dominik Pfütze, Andreas Säuberli, Marek Kostrzewa, Sarah Ebling
2020	A Corpus for Detecting High-Context Medical Conditions in Intensive Care Patient Notes Focusing on Frequently Readmitted Patients. Edward T. Moseley, Joy T. Wu, Jonathan Welt, John Foote Jr., Patrick D. Tyler, David W. Grant, Eric T. Carlson, Sebastian Gehrmann, Franck Dernoncourt, Leo Anthony Celi
2020	A Corpus for Visual Question Answering Annotated with Frame Semantic Information. Mehrdad Alizadeh, Barbara Di Eugenio
2020	A Corpus of Adpositional Supersenses for Mandarin Chinese. Siyao Peng, Yang Liu, Yilun Zhu, Austin Blodgett, Yushi Zhao, Nathan Schneider
2020	A Corpus of Controlled Opinionated and Knowledgeable Movie Discussions for Training Neural Conversation Models. Fabian Galetzka, Chukwuemeka Uchenna Eneh, David Schlangen
2020	A Corpus of Encyclopedia Articles with Logical Forms. Nathan Rasmussen, William Schuler
2020	A Corpus of German Reddit Exchanges (GeRedE). Andreas Blombach, Natalie Dykes, Philipp Heinrich, Besim Kabashi, Thomas Proisl
2020	A Corpus of Spanish Political Speeches from 1937 to 2019. Elena Álvarez Mellado
2020	A Corpus of Turkish Offensive Language on Social Media. Çagri Çöltekin
2020	A Data Set for the Analysis of Text Quality Dimensions in Summarization Evaluation. Margot Mieskes, Eneldo Loza Mencía, Tim Kronsbein
2020	A Dataset for Investigating the Impact of Feedback on Student Revision Outcome. Ildikó Pilán, John Lee, Chak Yan Yeung, Jonathan J. Webster
2020	A Dataset for Multi-lingual Epidemiological Event Extraction. Stephen Mutuvi, Antoine Doucet, Gaël Lejeune, Moses Odeo
2020	A Dataset of German Legal Documents for Named Entity Recognition. Elena Leitner, Georg Rehm, Julián Moreno Schneider
2020	A Dataset of Mycenaean Linear B Sequences. Katerina Papavassiliou, Gareth Owens, Dimitrios I. Kosmopoulos
2020	A Dataset of Translational Equivalents Built on the Basis of plWordNet-Princeton WordNet Synset Mapping. Ewa Rudnicka, Tomasz Naskret
2020	A Diachronic Treebank of Russian Spanning More Than a Thousand Years. Aleksandrs Berdicevskis, Hanne M. Eckhoff
2020	A Domain-Specific Dataset of Difficulty Ratings for German Noun Compounds in the Domains DIY, Cooking and Automotive. Julia Bettinger, Anna Hätty, Michael Dorna, Sabine Schulte im Walde
2020	A Fine-grained Sentiment Dataset for Norwegian. Lilja Øvrelid, Petter Mæhlum, Jeremy Barnes, Erik Velldal
2020	A Finite-State Morphological Analyser for Evenki. Anna Zueva, Anastasia Kuznetsova, Francis M. Tyers
2020	A First Dataset for Film Age Appropriateness Investigation. Emad Mohamed, Le An Ha
2020	A Formal Analysis of Multimodal Referring Strategies Under Common Ground. Nikhil Krishnaswamy, James Pustejovsky
2020	A Framework for Evaluation of Machine Reading Comprehension Gold Standards. Viktor Schlegel, Marco Valentino, André Freitas, Goran Nenadic, Riza Batista-Navarro
2020	A Framework for Shared Agreement of Language Tags beyond ISO 639. Frances Gillis-Webber, Sabine Tittel
2020	A French Corpus and Annotation Schema for Named Entity Recognition and Relation Extraction of Financial News. Ali Jabbari, Olivier Sauvage, Hamada Zeine, Hamza Chergui
2020	A French Corpus for Event Detection on Twitter. Béatrice Mazoyer, Julia Cagé, Nicolas Hervé, Céline Hudelot
2020	A French Corpus for Semantic Similarity. Rémi Cardon, Natalia Grabar
2020	A French Medical Conversations Corpus Annotated for a Virtual Patient Dialogue System. Fréjus A. A. Laleye, Gaël de Chalendar, Antonia Blanié, Antoine Brouquet, Dan Benhamou
2020	A French Version of the FraCaS Test Suite. Maxime Amblard, Clément Beysson, Philippe de Groote, Bruno Guillaume, Sylvain Pogodalla
2020	A Gold Standard Dependency Treebank for Turkish. Tolga Kayadelen, Adnan Ozturel, Bernd Bohnet
2020	A Joint Approach to Compound Splitting and Idiomatic Compound Detection. Irina Krotova, Sergey Aksenov, Ekaterina Artemova
2020	A Large Harvested Corpus of Location Metonymy. Kevin Alex Mathews, Michael Strube
2020	A Large Scale Speech Sentiment Corpus. Eric Chen, Zhiyun Lu, Hao Xu, Liangliang Cao, Yu Zhang, James Fan
2020	A Large-Scale Leveled Readability Lexicon for Standard Arabic. Muhamed Al-Khalil, Nizar Habash, Zhengyang Jiang
2020	A Lexicon-Based Approach for Detecting Hedges in Informal Text. Jumayel Islam, Lu Xiao, Robert E. Mercer
2020	A Major Wordnet for a Minority Language: Scottish Gaelic. Gábor Bella, Fiona McNeill, Rody Gorman, Caoimhin O. Donnaile, Kirsty MacDonald, Yamini Chandrashekar, Abed Alhakim Freihat, Fausto Giunchiglia
2020	A Manually Annotated Resource for the Investigation of Nasal Grunts. Aurélie Chlébowski, Nicolas Ballier
2020	A Multi-Orthography Parallel Corpus of Yiddish Nouns. Jonne Sälevä
2020	A Multi-Platform Arabic News Comment Dataset for Offensive Language Detection. Shammur A. Chowdhury, Hamdy Mubarak, Ahmed Abdelali, Soon-Gyo Jung, Bernard J. Jansen, Joni Salminen
2020	A Multi-level Annotated Corpus of Scientific Papers for Scientific Document Summarization and Cross-document Relation Discovery. Ahmed AbuRa'ed, Horacio Saggion, Luis Chiruzzo
2020	A Multi-word Expression Dataset for Swedish. Murathan Kurfali, Robert Östling, Johan Sjons, Mats Wirén
2020	A Multilingual Evaluation Dataset for Monolingual Word Sense Alignment. Sina Ahmadi, John Philip McCrae, Sanni Nimb, Anas Fahad Khan, Monica Monachini, Bolette S. Pedersen, Thierry Declerck, Tanja Wissik, Andrea Bellandi, Irene Pisani, Thomas Troelsgård, Sussi Olsen, Simon Krek, Veronika Lipp, Tamás Váradi, László Simon, András Gyorffy, Carole Tiberius, Tanneke Schoonheim, Yifat Ben Moshe, Maya Rudich, Raya Abu Ahmad, Dorielle Lonke, Kira Kovalenko, Margit Langemets, Jelena Kallas, Oksana Dereza, Theodorus Fransen, David Cillessen, David Lindemann, Mikel Alonso, Ana Salgado, José-Luis Sancho, Rafael-J. Ureña-Ruiz, Jordi Porta-Zamorano, Kiril Simov, Petya Osenova, Zara Kancheva, Ivaylo Radev, Ranka Stankovic, Andrej Perdih, Dejan Gabrovsek
2020	A Multilingual Parallel Corpora Collection Effort for Indian Languages. Shashank Siripragada, Jerin Philip, Vinay P. Namboodiri, C. V. Jawahar
2020	A Multimodal Educational Corpus of Oral Courses: Annotation, Analysis and Case Study. Salima Mdhaffar, Yannick Estève, Antoine Laurent, Nicolas Hernandez, Richard Dufour, Delphine Charlet, Géraldine Damnati, Solen Quiniou, Nathalie Camelin
2020	A Myanmar (Burmese)-English Named Entity Transliteration Dictionary. Aye Myat Mon, Chenchen Ding, Hour Kaing, Khin Mar Soe, Masao Utiyama, Eiichiro Sumita
2020	A New Latin Treebank for Universal Dependencies: Charters between Ancient Latin and Romance Languages. Flavio Massimiliano Cecchini, Timo Korkiakangas, Marco Passarotti
2020	A New Resource for German Causal Language. Ines Rehbein, Josef Ruppenhofer
2020	A Parallel WordNet for English, Swedish and Bulgarian. Krasimir Angelov
2020	A Penn-style Treebank of Middle Low German. Hannah Booth, Anne Breitbarth, Aaron Ecay, Melissa Farasyn
2020	A Platform for Event Extraction in Hindi. Sovan Kumar Sahoo, Saumajit Saha, Asif Ekbal, Pushpak Bhattacharyya
2020	A Post-Editing Dataset in the Legal Domain: Do we Underestimate Neural Machine Translation Quality? Julia Ive, Lucia Specia, Sara Szoc, Tom Vanallemeersch, Joachim Van den Bogaert, Eduardo Farah, Christine Maroti, Artur Ventura, Maxim Khalilov
2020	A Process-oriented Dataset of Revisions during Writing. Rianne Conijn, Emily Dux Speltz, Menno van Zaanen, Luuk van Waes, Evgeny Chukharev-Hudilainen
2020	A Progress Report on Activities at the Linguistic Data Consortium Benefitting the LREC Community. Christopher Cieri, James Fiumara, Stephanie M. Strassel, Jonathan Wright, Denise DiPersio, Mark Y. Liberman
2020	A Real-Time System for Credibility on Twitter. Adrian Iftene, Daniela Gîfu, Andrei-Remus Miron, Mihai-Stefan Dudu
2020	A Real-World Data Resource of Complex Sensitive Sentences Based on Documents from the Monsanto Trial. Jan Neerbek, Morten Eskildsen, Peter Dolog, Ira Assent
2020	A Resource for Computational Experiments on Mapudungun. Mingjun Duan, Carlos Fasola, Sai Krishna Rallabandi, Rodolfo Vega, Antonios Anastasopoulos, Lori S. Levin, Alan W. Black
2020	A Resource for Studying Chatino Verbal Morphology. Hilaria Cruz, Antonios Anastasopoulos, Gregory Stump
2020	A Robust Self-Learning Method for Fully Unsupervised Cross-Lingual Mappings of Word Embeddings: Making the Method Robustly Reproducible as Well. Nicolas Garneau, Mathieu Godbout, David Beauchemin, Audrey Durand, Luc Lamontagne
2020	A Scientific Information Extraction Dataset for Nature Inspired Engineering. Ruben Kruiper, Julian F. V. Vincent, Jessica Chen-Burger, Marc P. Y. Desmulliez, Ioannis Konstas
2020	A Seed Corpus of Hindu Temples in India. Priya Radhakrishnan
2020	A Semi-supervised Approach for De-identification of Swedish Clinical Text. Hanna Berg, Hercules Dalianis
2020	A Shared Task of a New, Collaborative Type to Foster Reproducibility: A First Exercise in the Area of Language Science and Technology with REPROLANG2020. António Branco, Nicoletta Calzolari, Piek Vossen, Gertjan van Noord, Dieter Van Uytvanck, João Silva, Luís Gomes, André Moreira, Willem Elbers
2020	A Short Survey on Sense-Annotated Corpora. Tommaso Pasini, José Camacho-Collados
2020	A Spelling Correction Corpus for Multiple Arabic Dialects. Fadhl Eryani, Nizar Habash, Houda Bouamor, Salam Khalifa
2020	A Study on Entity Resolution for Email Conversations. Parag Dakle, Takshak Desai, Dan I. Moldovan
2020	A Summarization Dataset of Slovak News Articles. Marek Suppa, Jergus Adamec
2020	A Supervised Part-Of-Speech Tagger for the Greek Language of the Social Web. Maria Nefeli Nikiforos, Katia Lida Kermanidis
2020	A Survey on Natural Language Processing for Fake News Detection. Ray Oshikawa, Jing Qian, William Yang Wang
2020	A Swiss German Dictionary: Variation in Speech and Writing. Larissa Schmidt, Lucy Linder, Sandra Djambazovska, Alexandros Lazaridis, Tanja Samardzic, Claudiu Musat
2020	A Tale of Three Parsers: Towards Diagnostic Evaluation for Meaning Representation Parsing. Maja Buljan, Joakim Nivre, Stephan Oepen, Lilja Øvrelid
2020	A Term Extraction Approach to Survey Analysis in Health Care. Cécile Robin, Mona Isazad Mashinchi, Fatemeh Ahmadi Zeleti, Adegboyega Ojo, Paul Buitelaar
2020	A Test Set for Discourse Translation from Japanese to English. Masaaki Nagata, Makoto Morishita
2020	A Topic-Aligned Multilingual Corpus of Wikipedia Articles for Studying Information Asymmetry in Low Resource Languages. Dwaipayan Roy, Sumit Bhatia, Prateek Jain
2020	A Tree Extension for CoNLL-RDF. Christian Chiarcos, Luis Glaser
2020	A Visually-Grounded Parallel Corpus with Phrase-to-Region Linking. Hideki Nakayama, Akihiro Tamura, Takashi Ninomiya
2020	A Web-based Collaborative Annotation and Consolidation Tool. Tobias Daudert
2020	AIA-BDE: A Corpus of FAQs in Portuguese and their Variations. Hugo Gonçalo Oliveira, João Ferreira, José Santos, Pedro Fialho, Ricardo Rodrigues, Luísa Coheur, Ana Alves
2020	AMALGUM - A Free, Balanced, Multilayer English Web Corpus. Luke Gessler, Siyao Peng, Yang Liu, Yilun Zhu, Shabnam Behzad, Amir Zeldes
2020	AMUSED: A Multi-Stream Vector Representation Method for Use in Natural Dialogue. Gaurav Kumar, Rishabh Joshi, Jaspreet Singh, Promod Yenigalla
2020	AR-ASAG An ARabic Dataset for Automatic Short Answer Grading Evaluation. Leila Ouahrani, Djamal Bennouar
2020	ATC-ANNO: Semantic Annotation for Air Traffic Control with Assistive Auto-Annotation. Marc Schulder, Johannah O'Mahony, Yury Bakanouski, Dietrich Klakow
2020	Abstractive Document Summarization without Parallel Data. Nikola I. Nikolov, Richard H. R. Hahnloser
2020	Abstractive Text Summarization based on Language Model Conditioning and Locality Modeling. Dmitrii Aksenov, Julián Moreno Schneider, Peter Bourgonje, Robert Schwarzenberg, Leonhard Hennig, Georg Rehm
2020	Abusive language in Spanish children and young teenager's conversations: data preparation and short text classification with contextual word embeddings. Marta R. Costa-jussà, Esther González, Asunción Moreno, Eudald Cumalat
2020	Accelerated High-Quality Mutual-Information Based Word Clustering. Manuel R. Ciosici, Ira Assent, Leon Derczynski
2020	AccentDB: A Database of Non-Native English Accents to Assist Neural Speech Recognition. Afroz Ahamad, Ankit Anand, Pranesh Bhargava
2020	Acquiring Social Knowledge about Personality and Driving-related Behavior. Ritsuko Iwai, Daisuke Kawahara, Takatsune Kumada, Sadao Kurohashi
2020	Adapt or Get Left Behind: Domain Adaptation through BERT Language Model Finetuning for Aspect-Target Sentiment Classification. Alexander Rietzler, Sebastian Stabinger, Paul Opitz, Stefan Engl
2020	Adaptation of Deep Bidirectional Transformers for Afrikaans Language. Sello Ralethe
2020	Adapting BERT to Implicit Discourse Relation Classification with a Focus on Discourse Connectives. Yudai Kishimoto, Yugo Murawaki, Sadao Kurohashi
2020	Adding Gesture, Posture and Facial Displays to the PoliModal Corpus of Political Interviews. Daniela Trotta, Alessio Palmero Aprosio, Sara Tonelli, Annibale Elia
2020	Adjusting Image Attributes of Localized Regions with Low-level Dialogue. Tzu-Hsiang Lin, Alexander I. Rudnicky, Trung Bui, Doo Soon Kim, Jean Oh
2020	Affect inTweets: A Transfer Learning Approach. Linrui Zhang, Hsin-Lun Huang, Yang Yu, Dan Moldovan
2020	Affection Driven Neural Networks for Sentiment Analysis. Rong Xiang, Yunfei Long, Mingyu Wan, Jinghang Gu, Qin Lu, Chu-Ren Huang
2020	Age Recommendation for Texts. Alexis Blandin, Gwénolé Lecorvé, Delphine Battistelli, Aline Étienne
2020	Age Suitability Rating: Predicting the MPAA Rating Based on Movie Dialogues. Mahsa Shafaei, Niloofar Safi Samghabadi, Sudipta Kar, Thamar Solorio
2020	Alector: A Parallel Corpus of Simplified French Texts with Alignments of Misreadings by Poor and Dyslexic Readers. Núria Gala, Anaïs Tack, Ludivine Javourey-Drevet, Thomas François, Johannes C. Ziegler
2020	Align then Summarize: Automatic Alignment Methods for Summarization Corpus Creation. Paul Tardy, David Janiszek, Yannick Estève, Vincent Nguyen
2020	Aligning Wikipedia with WordNet: a Review and Evaluation of Different Techniques. Antoni Oliver
2020	Alignment Annotation for Clinic Visit Dialogue to Clinical Note Sentence Language Generation. Wen-Wai Yim, Meliha Yetisgen, Jenny Huang, Micah Grossman
2020	Alignment Data base for a Sign Language Concordancer. Marion Kaczmarek, Michael Filhol
2020	All That Glitters is Not Gold: A Gold Standard of Adjective-Noun Collocations for German. Yana Strakatova, Neele Falk, Isabel Fuhrmann, Erhard W. Hinrichs, Daniela Rossmann
2020	Allgemeine Musikalische Zeitung as a Searchable Online Corpus. Bernd Kampe, Tinghui Duan, Udo Hahn
2020	AlloSat: A New Call Center French Corpus for Satisfaction and Frustration Analysis. Manon Macary, Marie Tahon, Yannick Estève, Anthony Rousseau
2020	AlloVera: A Multilingual Allophone Database. David R. Mortensen, Xinjian Li, Patrick Littell, Alexis Michaud, Shruti Rijhwani, Antonios Anastasopoulos, Alan W. Black, Florian Metze, Graham Neubig
2020	An Algerian Corpus and an Annotation Platform for Opinion and Emotion Analysis. Leila Moudjari, Karima Akli-Astouati, Farah Benamara
2020	An Analysis of Massively Multilingual Neural Machine Translation for Low-Resource Languages. Aaron Mueller, Garrett Nicolai, Arya D. McCarthy, Dylan Lewis, Winston Wu, David Yarowsky
2020	An Annotated Corpus for Sexism Detection in French Tweets. Patricia Chiril, Véronique Moriceau, Farah Benamara, Alda Mari, Gloria Origgi, Marlène Coulomb-Gully
2020	An Annotated Corpus of Adjective-Adverb Interfaces in Romance Languages. Katharina Gerhalter, Gerlinde Schneider, Christopher Pollin, Martin Hummel
2020	An Annotated Dataset of Coreference in English Literature. David Bamman, Olivia Lewke, Anya Mansoor
2020	An Annotated Dataset of Discourse Modes in Hindi Stories. Swapnil Dhanwal, Hritwik Dutta, Hitesh Nankani, Nilay Shrivastava, Yaman Kumar, Junyi Jessy Li, Debanjan Mahata, Rakesh Gosangi, Haimin Zhang, Rajiv Ratn Shah, Amanda Stent
2020	An Annotated Social Media Corpus for German. Eckhard Bick
2020	An Annotation Approach for Social and Referential Gaze in Dialogue. Vidya Somashekarappa, Christine Howes, Asad B. Sayeed
2020	An Automatic Tool For Language Evaluation. Fabio Fassetti, Ilaria Fassetti
2020	An Emotional Mess! Deciding on a Framework for Building a Dutch Emotion-Annotated Corpus. Luna De Bruyne, Orphée De Clercq, Véronique Hoste
2020	An Empirical Comparison of Question Classification Methods for Question Answering Systems. Eduardo G. Cortes, Vinicius Woloszyn, Arne Binder, Tilo Himmelsbach, Dante Augusto Couto Barone, Sebastian Möller
2020	An Empirical Evaluation of Annotation Practices in Corpora from Language Documentation. Kilu von Prince, Sebastian Nordhoff
2020	An Empirical Examination of Online Restaurant Reviews. Hyun Jung Kang, Iris Eshkol-Taravella
2020	An Enhanced Mapping Scheme of the Universal Part-Of-Speech for Korean. Myung Hee Kim, Nathalie Colineau
2020	An Evaluation Benchmark for Testing the Word Sense Disambiguation Capabilities of Machine Translation Systems. Alessandro Raganato, Yves Scherrer, Jörg Tiedemann
2020	An Evaluation Dataset for Identifying Communicative Functions of Sentences in English Scholarly Papers. Kenichi Iwatsuki, Florian Boudin, Akiko Aizawa
2020	An Evaluation of Progressive Neural Networksfor Transfer Learning in Natural Language Processing. Abdul Moeed, Gerhard Hagerer, Sumit Dugar, Sarthak Gupta, Mainak Ghosh, Hannah Danner, Oliver Mitevski, Andreas Nawroth, Georg Groh
2020	An Event-comment Social Media Corpus for Implicit Emotion Analysis. Sophia Yat Mei Lee, Helena Yan Ping Lau
2020	An Experiment in Annotating Animal Species Names from ISTEX Resources. Sabine Barreaux, Dominique Besagni
2020	An Exploratory Study into Automated Précis Grading. Orphée De Clercq, Senne Van Hoecke
2020	An HMM Approach with Inherent Model Selection for Sign Language and Gesture Recognition. Sandrine Tornay, Oya Aran, Mathew Magimai-Doss
2020	An In-Depth Comparison of 14 Spelling Correction Tools on a Common Benchmark. Markus Näther
2020	An Unsupervised Method for Weighting Finite-state Morphological Analyzers. Amr Keleg, Francis M. Tyers, Nick Howell, Flammie A. Pirinen
2020	Analysis of GlobalPhone and Ethiopian Languages Speech Corpora for Multilingual ASR. Martha Yifiru Tachbelie, Solomon Teferra Abate, Tanja Schultz
2020	Analyzing Word Embedding Through Structural Equation Modeling. Namgi Han, Katsuhiko Hayashi, Yusuke Miyao
2020	Annotated Corpus for Sentiment Analysis in Odia Language. Gaurav Mohanty, Pruthwik Mishra, Radhika Mamidi
2020	Annotating Event Appearance for Japanese Chess Commentary Corpus. Hirotaka Kameko, Shinsuke Mori
2020	Annotating Perspectives on Vaccination. Roser Morante, Chantal van Son, Isa Maks, Piek Vossen
2020	Annotating a Fable in Italian Sign Language (LIS). Serena Trolvi, Rodolfo Delmonte
2020	Annotating and Analyzing Biased Sentences in News Articles using Crowdsourcing. Sora Lim, Adam Jatowt, Michael Färber, Masatoshi Yoshikawa
2020	Annotating and Extracting Synthesis Process of All-Solid-State Batteries from Scientific Literature. Fusataka Kuniyoshi, Kohei Makino, Jun Ozawa, Makoto Miwa
2020	Annotating for Hate Speech: The MaNeCo Corpus and Some Input from Critical Discourse Analysis. Stavros Assimakopoulos, Rebecca Vella Muskat, Lonneke van der Plas, Albert Gatt
2020	Annotation Interoperability for the Post-ISOCat Era. Christian Chiarcos, Christian Fäth, Frank Abromeit
2020	Annotation of Adverse Drug Reactions in Patients' Weblogs. Yuki Arase, Tomoyuki Kajiwara, Chenhui Chu
2020	Annotation of Emotion Carriers in Personal Narratives. Aniruddha Tammewar, Alessandra Cervone, Eva-Maria Messner, Giuseppe Riccardi
2020	Arabic Speech Rhythm Corpus: Read and Spontaneous Speaking Styles. Omnia Ibrahim, Homa Asadi, Eman Kassem, Volker Dellwo
2020	Are White Ravens Ever White? - Non-Literal Adjective-Noun Phrases in Polish. Agnieszka Mykowiecka, Malgorzata Marciniak
2020	Are Word Embeddings Really a Bad Fit for the Estimation of Thematic Fit? Emmanuele Chersoni, Ludovica Pannitto, Enrico Santus, Alessandro Lenci, Chu-Ren Huang
2020	Artie Bias Corpus: An Open Dataset for Detecting Demographic Bias in Speech Applications. Josh Meyer, Lindy Rauchenstein, Joshua D. Eisenberg, Nicholas Howell
2020	ArzEn: A Speech Corpus for Code-switched Egyptian Arabic-English. Injy Hamed, Ngoc Thang Vu, Slim Abdennadher
2020	Aspect Flow Representation and Audio Inspired Analysis for Texts. Larissa Vasconcelos, Cláudio E. C. Campelo, Caio Libânio Melo Jerônimo
2020	Aspect On: an Interactive Solution for Post-Editing the Aspect Extraction based on Online Learning. Mara Chinea-Rios, Marc Franco-Salvador, Yassine Benajiba
2020	Aspect-Based Sentiment Analysis as Fine-Grained Opinion Mining. Gerardo Ocampo Diaz, Xuanming Zhang, Vincent Ng
2020	Assessing Users' Reputation from Syntactic and Semantic Information in Community Question Answering. Yonas Woldemariam
2020	Augmented Prompt Selection for Evaluation of Spontaneous Speech Synthesis. Éva Székely, Jens Edlund, Joakim Gustafson
2020	Augmenting Small Data to Classify Contextualized Dialogue Acts for Exploratory Visualization. Abhinav Kumar, Barbara Di Eugenio, Jillian Aurisano, Andrew E. Johnson
2020	Automated Discovery of Mathematical Definitions in Text. Natalia Vanetik, Marina Litvak, Sergey Shevchuk, Lior Reznik
2020	Automated Essay Scoring System for Nonnative Japanese Learners. Reo Hirao, Mio Arai, Hiroki Shimanaka, Satoru Katsumata, Mamoru Komachi
2020	Automated Fact-Checking of Claims from Wikipedia. Aalok Sathe, Salar Ather, Tuan Manh Le, Nathan Perry, Joonsuk Park
2020	Automated Parsing of Interlinear Glossed Text from Page Images of Grammatical Descriptions. Erich R. Round, Mark Ellison, Jayden L. Macklin-Cordes, Sacha Beniamine
2020	Automated Phonological Transcription of Akkadian Cuneiform Text. Aleksi Sahala, Miikka Silfverberg, Antti Arppe, Krister Lindén
2020	Automated Writing Support Using Deep Linguistic Parsers. Luís Morgado da Costa, Roger Vivek Placidus Winder, Shu Yun Li, Benedict Christopher Tzer Liang Lin, Joseph MacKinnon, Francis Bond
2020	Automatic Compilation of Resources for Academic Writing and Evaluating with Informal Word Identification and Paraphrasing System. Seid Muhie Yimam, Gopalakrishnan Venkatesh, John Lee, Chris Biemann
2020	Automatic Creation of Text Corpora for Low-Resource Languages from the Internet: The Case of Swiss German. Lucy Linder, Michael Jungo, Jean Hennebert, Claudiu Cristian Musat, Andreas Fischer
2020	Automatic In-the-wild Dataset Annotation with Deep Generalized Multiple Instance Learning. Maria Joana Correia, Isabel Trancoso, Bhiksha Raj
2020	Automatic Orality Identification in Historical Texts. Katrin Ortmann, Stefanie Dipper
2020	Automatic Period Segmentation of Oral French. Natalia Kalashnikova, Loïc Grobol, Iris Eshkol-Taravella, François Delafontaine
2020	Automatic Reconstruction of Missing Romanian Cognates and Unattested Latin Words. Alina Maria Ciobanu, Liviu P. Dinu, Laurentiu Zoicas
2020	Automatic Section Recognition in Obituaries. Valentino Sabbatino, Laura Ana Maria Bostan, Roman Klinger
2020	Automatic Spanish Translation of SQuAD Dataset for Multi-lingual Question Answering. Casimiro Pio Carrino, Marta R. Costa-jussà, José A. R. Fonollosa
2020	Automatic Speech Recognition for Uyghur through Multilingual Acoustic Modeling. Ayimunishagu Abulimiti, Tanja Schultz
2020	Automatic Transcription Challenges for Inuktitut, a Low-Resource Polysynthetic Language. Vishwa Gupta, Gilles Boulianne
2020	Automatically Building a Multilingual Lexicon of False Friends With No Supervision. Ana Sabina Uban, Liviu P. Dinu
2020	BLISS: An Agent for Collecting Spoken Dialogue Data about Health and Well-being. Jelte van Waterschoot, Iris Hendrickx, Arif Khan, Esther Klabbers, Marcel de Korte, Helmer Strik, Catia Cucchiarini, Mariët Theune
2020	BabyFST - Towards a Finite-State Based Computational Model of Ancient Babylonian. Aleksi Sahala, Miikka Silfverberg, Antti Arppe, Krister Lindén
2020	Bag & Tag'em - A New Dutch Stemmer. Anne Jonker, Corné de Ruijt, Jornt de Gruijl
2020	BanFakeNews: A Dataset for Detecting Fake News in Bangla. Md Zobaer Hossain, Md Ashraful Rahman, Md. Saiful Islam, Sudipta Kar
2020	Being Generous with Sub-Words towards Small NMT Children. Arne Defauw, Tom Vanallemeersch, Koen Van Winckel, Sara Szoc, Joachim Van den Bogaert
2020	Benchmarking Neural and Statistical Machine Translation on Low-Resource African Languages. Kevin Duh, Paul McNamee, Matt Post, Brian Thompson
2020	Best Student Forcing: A Simple Training Mechanism in Adversarial Language Generation. Jonathan Sauder, Ting Hu, Xiaoyin Che, Gonçalo Mordido, Haojin Yang, Christoph Meinel
2020	Better Together: Modern Methods Plus Traditional Thinking in NP Alignment. Ádám Kovács, Judit Ács, András Kornai, Gábor Recski
2020	Beyond Citations: Corpus-based Methods for Detecting the Impact of Research Outcomes on Society. Rezvaneh Rezapour, Jutta Bopp, Norman Fiedler, Diana Steffen, Andreas Witt, Jana Diesner
2020	Books of Hours. the First Liturgical Data Set for Text Segmentation. Amir Hazem, Béatrice Daille, Christopher Kermorvant, Dominique Stutzmann, Marie-Laurence Bonhomme, Martin Maarand, Mélodie Boillet
2020	BrainPredict: a Tool for Predicting and Visualising Local Brain Activity. Youssef Hmamouche, Laurent Prévot, Magalie Ochs, Thierry Chaminade
2020	Brand-Product Relation Extraction Using Heterogeneous Vector Space Representations. Arkadiusz Janz, Lukasz Kopoci'nski, Maciej Piasecki, Agnieszka Pluwak
2020	Building OCR/NER Test Collections. Dawn J. Lawrie, James Mayfield, David Etter
2020	Building Semantic Grams of Human Knowledge. Valentina Leone, Giovanni Siragusa, Luigi Di Caro, Roberto Navigli
2020	Building a Hebrew Semantic Role Labeling Lexical Resource from Parallel Movie Subtitles. Ben Eyal, Michael Elhadad
2020	Building a Multimodal Entity Linking Dataset From Tweets. Omar Adjali, Romaric Besançon, Olivier Ferret, Hervé Le Borgne, Brigitte Grau
2020	Building a Task-oriented Dialog System for Languages with no Training Data: the Case for Basque. Maddalen Lopez de Lacalle, Xabier Saralegi, Iñaki San Vicente
2020	Building a Time-Aligned Cross-Linguistic Reference Corpus from Language Documentation Data (DoReCo). Ludger Paschen, François Delafontaine, Christoph Draxler, Susanne Fuchs, Matthew Stave, Frank Seifart
2020	Building a Universal Dependencies Treebank for Occitan. Aleksandra Miletic, Myriam Bras, Marianne Vergez-Couret, Louise Esher, Clamença Poujade, Jean Sibille
2020	Building an English-Chinese Parallel Corpus Annotated with Sub-sentential Translation Techniques. Yuming Zhai, Lufei Liu, Xinyi Zhong, Gabriel Illouz, Anne Vilnat
2020	Building the Old Javanese Wordnet. David Moeljadi, Zakariya Pamuji Aminullah
2020	Building the Spanish-Croatian Parallel Corpus. Bojana Mikelenic, Marko Tadic
2020	Burmese Speech Corpus, Finite-State Text Normalization and Pronunciation Grammars with an Application to Text-to-Speech. Yin May Oo, Theeraphol Wattanavekin, Chenfang Li, Pasindu De Silva, Supheakmungkol Sarin, Knot Pipatsrisawat, Martin Jansche, Oddur Kjartansson, Alexander Gutkin
2020	CA-EHN: Commonsense Analogy from E-HowNet. Peng-Hsuan Li, Tsan-Yu Yang, Wei-Yun Ma
2020	CAMeL Tools: An Open Source Python Toolkit for Arabic Natural Language Processing. Ossama Obeid, Nasser Zalmout, Salam Khalifa, Dima Taji, Mai Oudah, Bashar Alhafni, Go Inoue, Fadhl Eryani, Alexander Erdmann, Nizar Habash
2020	CBOW-tag: a Modified CBOW Algorithm for Generating Embedding Models from Annotated Corpora. Attila Novák, László János Laki, Borbála Novák
2020	CCNet: Extracting High Quality Monolingual Datasets from Web Crawl Data. Guillaume Wenzek, Marie-Anne Lachaux, Alexis Conneau, Vishrav Chaudhary, Francisco Guzmán, Armand Joulin, Edouard Grave
2020	CCOHA: Clean Corpus of Historical American English. Reem Alatrash, Dominik Schlechtweg, Jonas Kuhn, Sabine Schulte im Walde
2020	CEASE, a Corpus of Emotion Annotated Suicide notes in English. Soumitra Ghosh, Asif Ekbal, Pushpak Bhattacharyya
2020	CEASR: A Corpus for Evaluating Automatic Speech Recognition. Malgorzata Anna Ulasik, Manuela Hürlimann, Fabian Germann, Esin Gedik, Fernando Benites, Mark Cieliebak
2020	CLDFBench: Give Your Cross-Linguistic Data a Lift. Robert Forkel, Johann-Mattis List
2020	CLEEK: A Chinese Long-text Corpus for Entity Linking. Weixin Zeng, Xiang Zhao, Jiuyang Tang, Zhen Tan, Xuqian Huang
2020	CLFD: A Novel Vectorization Technique and Its Application in Fake News Detection. Michail Mersinias, Stergos D. Afantenos, Georgios Chalkiadakis
2020	COSTRA 1.0: A Dataset of Complex Sentence Transformations. Petra Barancíková, Ondrej Bojar
2020	CPLM, a Parallel Corpus for Mexican Languages: Development and Interface. Gerardo Eugenio Sierra Martínez, Cynthia Montaño, Gemma Bel-Enguix, Diego Córdova, Margarita Mota Montoya
2020	CRWIZ: A Framework for Crowdsourcing Real-Time Wizard-of-Oz Dialogues. Francisco Javier Chiyah Garcia, José Lopes, Xingkun Liu, Helen F. Hastie
2020	CTAP for Italian: Integrating Components for the Analysis of Italian into a Multilingual Linguistic Complexity Analysis Tool. Nadezda Okinina, Jennifer-Carmen Frey, Zarah Weiss
2020	Cairo Student Code-Switch (CSCS) Corpus: An Annotated Egyptian Arabic-English Corpus. Mohamed Balabel, Injy Hamed, Slim Abdennadher, Ngoc Thang Vu, Özlem Çetinoglu
2020	Call My Net 2: A New Resource for Speaker Recognition. Karen Jones, Stephanie M. Strassel, Kevin Walker, Jonathan Wright
2020	CanVEC - the Canberra Vietnamese-English Code-switching Natural Speech Corpus. Li Nguyen, Christopher Bryant
2020	CantoMap: a Hong Kong Cantonese MapTask Corpus. Grégoire Winterstein, Carmen Tang, Regine Lai
2020	Challenge Dataset of Cognates and False Friend Pairs from Indian Languages. Diptesh Kanojia, Malhar Kulkarni, Pushpak Bhattacharyya, Gholamreza Haffari
2020	Chat or Learn: a Data-Driven Robust Question-Answering System. Gabriel Luthier, Andrei Popescu-Belis
2020	Chinese Discourse Parsing: Model and Evaluation. Lin Chuan-An, Shyh-Shiun Hung, Hen-Hsen Huang, Hsin-Hsi Chen
2020	Chinese Whispers: A Multimodal Dataset for Embodied Language Grounding. Dimosthenis Kontogiorgos, Elena Sibirtseva, Joakim Gustafson
2020	Chunk Different Kind of Spoken Discourse: Challenges for Machine Learning. Iris Eshkol-Taravella, Mariame Maarouf, Flora Badin, Marie Skrovec, Isabelle Tellier
2020	Cifu: a Frequency Lexicon of Hong Kong Cantonese. Regine Lai, Grégoire Winterstein
2020	Ciron: a New Benchmark Dataset for Chinese Irony Detection. Rong Xiang, Xuefeng Gao, Yunfei Long, Anran Li, Emmanuele Chersoni, Qin Lu, Chu-Ren Huang
2020	Class-based LSTM Russian Language Model with Linguistic Information. Irina S. Kipyatkova, Alexey Karpov
2020	CoCo: A Tool for Automatically Assessing Conceptual Complexity of Texts. Sanja Stajner, Sergiu Nisioi, Ioana Hulpus
2020	CoSimLex: A Resource for Evaluating Graded Word Similarity in Context. Carlos Santos Armendariz, Matthew Purver, Matej Ulcar, Senja Pollak, Nikola Ljubesic, Mark Granroth-Wilding
2020	CoVoST: A Diverse Multilingual Speech-To-Text Translation Corpus. Changhan Wang, Juan Miguel Pino, Anne Wu, Jiatao Gu
2020	CodE Alltag 2.0 - A Pseudonymized German-Language Email Corpus. Elisabeth Eder, Ulrike Krieg-Holz, Udo Hahn
2020	Collecting Tweets to Investigate Regional Variation in Canadian English. Filip Miletic, Anne Przewozny-Desriaux, Ludovic Tanguy
2020	Collection and Annotation of the Romanian Legal Corpus. Dan Tufis, Maria Mitrofan, Vasile Florian Pais, Radu Ion, Andrei Coman
2020	Collocations in Russian Lexicography and Russian Collocations Database. Maria Khokhlova
2020	CombiNMT: An Exploration into Neural Text Simplification Models. Michael Cooper, Matthew Shardlow
2020	Common Voice: A Massively-Multilingual Speech Corpus. Rosana Ardila, Megan Branson, Kelly Davis, Michael Kohler, Josh Meyer, Michael Henretty, Reuben Morais, Lindsay Saunders, Francis M. Tyers, Gregor Weber
2020	Comparative Study of Sentence Embeddings for Contextual Paraphrasing. Louisa Pragst, Wolfgang Minker, Stefan Ultes
2020	Comparing Machine Learning and Deep Learning Approaches on NLP Tasks for the Italian Language. Bernardo Magnini, Alberto Lavelli, Simone Magnolini
2020	Comparing Methods for Measuring Dialect Similarity in Norwegian. Janne Bondi Johannessen, Andre Kåsen, Kristin Hagen, Anders Nøklestad, Joel Priestley
2020	Computational Etymology and Word Emergence. Winston Wu, David Yarowsky
2020	Computing with Subjectivity Lexicons. Caio Libânio Melo Jerônimo, Cláudio Elízio Calazans Campelo, Leandro Balby Marinho, Allan Sales da Costa Melo, Adriano Veloso, Roberta Viola
2020	Construct a Sense-Frame Aligned Predicate Lexicon for Chinese AMR Corpus. Li Song, Yuling Dai, Yihuan Liu, Bin Li, Weiguang Qu
2020	Constructing Multimodal Language Learner Texts Using LARA: Experiences with Nine Languages. Elham Akhlaghi, Branislav Bédi, Fatih Bektas, Harald Berthelsen, Matthias Butterweck, Cathy Chua, Catia Cucchiarini, Gülsen Eryigit, Johanna Gerlach, Hanieh Habibi, Neasa Ní Chiaráin, Manny Rayner, Steinþór Steingrímsson, Helmer Strik
2020	Constructing Web-Accessible Semantic Role Labels and Frames for Japanese as Additions to the NPCMJ Parsed Corpus. Koichi Takeuchi, Alastair Butler, Iku Nagasaki, Takuya Okamura, Prashant Pardeshi
2020	Constructing a Bilingual Hadith Corpus Using a Segmentation Tool. Shatha Altammami, Eric Atwell, Ammar Alsalka
2020	Constructing a Public Meeting Corpus. Koji Tanaka, Chenhui Chu, Haolin Ren, Benjamin Renoust, Yuta Nakashima, Noriko Takemura, Hajime Nagahara, Takao Fujikawa
2020	Construction and Analysis of a Multimodal Chat-talk Corpus for Dialog Systems Considering Interpersonal Closeness. Yoshihiro Yamazaki, Yuya Chiba, Takashi Nose, Akinori Ito
2020	Construction of an Evaluation Corpus for Grammatical Error Correction for Learners of Japanese as a Second Language. Aomi Koyama, Tomoshige Kiyuna, Kenji Kobayashi, Mio Arai, Mamoru Komachi
2020	Contemplata, a Free Platform for Constituency Treebank Annotation. Jakub Waszczuk, Ilaine Wang, Jean-Yves Antoine, Anaïs Lefeuvre-Halftermeyer
2020	Content-Equivalent Translated Parallel News Corpus and Extension of Domain Adaptation for NMT. Hideya Mino, Hideki Tanaka, Hitoshi Ito, Isao Goto, Ichiro Yamada, Takenobu Tokunaga
2020	Contextualized Embeddings based Transformer Encoder for Sentence Similarity Modeling in Answer Selection Task. Md. Tahmid Rahman Laskar, Jimmy Xiangji Huang, Enamul Hoque
2020	Controllable Sentence Simplification. Louis Martin, Éric de la Clergerie, Benoît Sagot, Antoine Bordes
2020	Conversational Question Answering in Low Resource Scenarios: A Dataset and Case Study for Basque. Arantxa Otegi, Aitor Gonzalez-Agirre, Jon Ander Campos, Aitor Soroa, Eneko Agirre
2020	Cooking Up a Neural-based Model for Recipe Classification. Elham Mohammadi, Nada Naji, Louis Marceau, Marc Queudot, Eric Charton, Leila Kosseim, Marie-Jean Meurs
2020	Corpora and Baselines for Humour Recognition in Portuguese. Hugo Gonçalo Oliveira, André Clemêncio, Ana Alves
2020	Corpora for Document-Level Neural Machine Translation. Siyou Liu, Xiaojun Zhang
2020	Corpora of Disordered Speech in the Light of the GDPR: Two Use Cases from the DELAD Initiative. Henk van den Heuvel, Aleksei Kelli, Katarzyna Klessa, Satu Salaasti
2020	Corpus Generation for Voice Command in Smart Home and the Effect of Speech Synthesis on End-to-End SLU. Thierry Desot, François Portet, Michel Vacher
2020	Corpus Query Lingua Franca part II: Ontology. Stefan Evert, Oleg Harlamov, Philipp Heinrich, Piotr Banski
2020	Corpus REDEWIEDERGABE. Annelen Brunner, Stefan Engelberg, Fotis Jannidis, Ngoc Duyen Tanja Tu, Lukas Weimer
2020	Corpus for Modeling User Interactions in Online Persuasive Discussions. Ryo Egawa, Gaku Morio, Katsuhide Fujita
2020	Corpus of Chinese Dynastic Histories: Gender Analysis over Two Millennia. Sergey Zinin, Yang Xu
2020	Correcting the Autocorrect: Context-Aware Typographical Error Correction via Training Data Augmentation. Kshitij Shah, Gerard de Melo
2020	Cortical Speech Databases For Deciphering the Articulatory Code. Harald Höge
2020	Coursera Corpus Mining and Multistage Fine-Tuning for Improving Lectures Translation. Haiyue Song, Raj Dabre, Atsushi Fujita, Sadao Kurohashi
2020	Creating Corpora for Research in Feedback Comment Generation. Ryo Nagata, Kentaro Inui, Shin'ichiro Ishikawa
2020	Creating Expert Knowledge by Relying on Language Learners: a Generic Approach for Mass-Producing Language Resources by Combining Implicit Crowdsourcing and Language Learning. Lionel Nicolas, Verena Lyding, Claudia Borg, Corina Forascu, Karën Fort, Katerina Zdravkova, Iztok Kosem, Jaka Cibej, Spela Arhar Holdt, Alice Millour, Alexander König, Christos T. Rodosthenous, Federico Sangati, Umair ul Hassan, Anisia Katinskaia, Anabela Barreiro, Lavinia Aparaschivei, Yaakov HaCohen-Kerner
2020	Creating a Corpus of Gestures and Predicting the Audience Response based on Gestures in Speeches of Donald Trump. Verena Ruf, Costanza Navarretta
2020	Creating a Dataset for Named Entity Recognition in the Archaeology Domain. Alex Brandsen, Suzan Verberne, Milco Wansleeben, Karsten Lambers
2020	Creating a Parallel Icelandic Dependency Treebank from Raw Text to Universal Dependencies. Hildur Jónsdóttir, Anton Karl Ingason
2020	Cross-Domain Evaluation of Edge Detection for Biomedical Event Extraction. Alan Ramponi, Barbara Plank, Rosario Lombardo
2020	Cross-Lingual Word Embeddings for Turkic Languages. Elmurod Kuriyozov, Yerai Doval, Carlos Gómez-Rodríguez
2020	Cross-domain Author Gender Classification in Brazilian Portuguese. Rafael Dias, Ivandré Paraboni
2020	Cross-lingual Named Entity List Search via Transliteration. Aleksandr Khakhmovich, Svetlana Pavlova, Kira Kirillova, Nikolay Arefyev, Ekaterina Savilova
2020	Cross-lingual Structure Transfer for Zero-resource Event Extraction. Di Lu, Ananya Subburathinam, Heng Ji, Jonathan May, Shih-Fu Chang, Avirup Sil, Clare R. Voss
2020	Cross-lingual Zero Pronoun Resolution. Abdulrahman Aloraini, Massimo Poesio
2020	Cross-lingual and Cross-domain Evaluation of Machine Reading Comprehension with Squad and CALOR-Quest Corpora. Delphine Charlet, Géraldine Damnati, Frédéric Béchet, Gabriel Marzinotto, Johannes Heinecke
2020	Cross-sentence Pre-trained Model for Interactive QA matching. Jinmeng Wu, Yanbin Hao
2020	Crowdsourcing Latin American Spanish for Low-Resource Text-to-Speech. Adriana Guevara-Rukoz, Isin Demirsahin, Fei He, Shan-Hui Cathy Chu, Supheakmungkol Sarin, Knot Pipatsrisawat, Alexander Gutkin, Alena Butryna, Oddur Kjartansson
2020	Crowdsourcing Speech Data for Low-Resource Languages from Low-Income Workers. Basil Abraham, Danish Goel, Divya Siddarth, Kalika Bali, Manu Chopra, Monojit Choudhury, Pratik Joshi, Preethi Jyothi, Sunayana Sitaram, Vivek Seshadri
2020	Crowdsourcing in the Development of a Multilingual FrameNet: A Case Study of Korean FrameNet. Younggyun Hahm, Youngbin Noh, Jiyoon Han, Tae Hwan Oh, Hyonsu Choe, Hansaem Kim, Key-Sun Choi
2020	CzeDLex 0.6 and its Representation in the PML-TQ. Jirí Mírovský, Lucie Poláková, Pavlína Synková
2020	Czech Historical Named Entity Corpus v 1.0. Helena Hubková, Pavel Král, Eva Pettersson
2020	DAICT: A Dialectal Arabic Irony Corpus Extracted from Twitter. Ines Abbes, Wajdi Zaghouani, Omaima El-Hardlo, Faten Ashour
2020	DEbateNet-mig15: Tracing the 2015 Immigration Debate in Germany Over Time. Gabriella Lapesa, André Blessing, Nico Blokker, Erenay Dayanik, Sebastian Haunss, Jonas Kuhn, Sebastian Padó
2020	DNN-based Speech Synthesis Using Abundant Tags of Spontaneous Speech Corpus. Yuki Yamashita, Tomoki Koriyama, Yuki Saito, Shinnosuke Takamichi, Yusuke Ijima, Ryo Masumura, Hiroshi Saruwatari
2020	DaCToR: A Data Collection Tool for the RELATER Project. Juan Hussain, Oussama Zenkri, Sebastian Stüker, Alex Waibel
2020	DaNE: A Named Entity Resource for Danish. Rasmus Hvingelby, Amalie Brogaard Pauli, Maria Barrett, Christina Rosted, Lasse Malm Lidegaard, Anders Søgaard
2020	DaNewsroom: A Large-scale Danish Summarisation Dataset. Daniel Varab, Natalie Schluter
2020	Data Augmentation using Machine Translation for Fake News Detection in the Urdu Language. Maaz Amjad, Grigori Sidorov, Alisa Zhila
2020	Data Query Language and Corpus Tools for Slot-Filling and Intent Classification Data. Stefan Larson, Eric Guldan, Kevin Leach
2020	Database Search vs. Information Retrieval: A Novel Method for Studying Natural Language Querying of Semi-Structured Data. Stefanie Nadig, Martin Braschler, Kurt Stockinger
2020	Dataset Creation and Evaluation of Aspect Based Sentiment Analysis in Telugu, a Low Resource Language. Yashwanth Reddy Regatte, Rama Rohit Reddy Gangula, Radhika Mamidi
2020	Dataset Reproducibility and IR Methods in Timeline Summarization. Leo Born, Maximilian Bacher, Katja Markert
2020	Dataset and Enhanced Model for Eligibility Criteria-to-SQL Semantic Parsing. Xiaojing Yu, Tianlong Chen, Zhengjie Yu, Huiyu Li, Yang Yang, Xiaoqian Jiang, Anxiao Jiang
2020	Dataset for Temporal Analysis of English-French Cognates. Esteban Frossard, Mickaël Coustaty, Antoine Doucet, Adam Jatowt, Simon Hengchen
2020	DecOp: A Multilingual and Multi-domain Corpus For Detecting Deception In Typed Text. Pasquale Capuozzo, Ivano Lauriola, Carlo Strapparava, Fabio Aiolli, Giuseppe Sartori
2020	Decode with Template: Content Preserving Sentiment Transfer. Zhiyuan Wen, Jiannong Cao, Ruosong Yang, Senzhang Wang
2020	Decomposing and Comparing Meaning Relations: Paraphrasing, Textual Entailment, Contradiction, and Specificity. Venelin Kovatchev, Darina Gold, Maria Antònia Martí, Maria Salamó, Torsten Zesch
2020	Dedicated Language Resources for Interdisciplinary Research on Multiword Expressions: Best Thing since Sliced Bread. Ferdy Hubers, Catia Cucchiarini, Helmer Strik
2020	Deduplication of Scholarly Documents using Locality Sensitive Hashing and Word Embeddings. Bikash Gyawali, Lucas Anastasiou, Petr Knoth
2020	DeepNLPF: A Framework for Integrating Third Party NLP Tools. Francisco Rodrigues, Rinaldo Lima, William Domingues, Robson do Nascimento Fidalgo, Adrian-Gabriel Chifu, Bernard Espinasse, Sébastien Fournier
2020	Defying Wikidata: Validation of Terminological Relations in the Web of Data. Patricia Martín-Chozas, Sina Ahmadi, Elena Montiel-Ponsoda
2020	Dependency Parsing for Urdu: Resources, Conversions and Learning. Toqeer Ehsan, Miriam Butt
2020	DerivBase.Ru: a Derivational Morphology Resource for Russian. Daniil Vodolazsky
2020	Design and Evaluation of SentiEcon: a fine-grained Economic/Financial Sentiment Lexicon from a Corpus of Business News. Antonio Moreno-Ortiz, Javier Fernandez-Cruz, Chantal Pérez Hernández
2020	Design of BCCWJ-EEG: Balanced Corpus with Human Electroencephalography. Yohei Oseki, Masayuki Asahara
2020	Designing Multilingual Interactive Agents using Small Dialogue Corpora. Donghui Lin, Masayuki Otani, Ryosuke Okuno, Toru Ishida
2020	Detecting Multiword Expression Type Helps Lexical Complexity Assessment. Ekaterina Kochmar, Sian Gooding, Matthew Shardlow
2020	Detecting Negation Cues and Scopes in Spanish. Salud María Jiménez-Zafra, Roser Morante, Eduardo Blanco, María Teresa Martín Valdivia, Luis Alfonso Ureña López
2020	Detecting Troll Tweets in a Bilingual Corpus. Lin Miao, Mark Last, Marina Litvak
2020	Detection of Reading Absorption in User-Generated Book Reviews: Resources Creation and Evaluation. Piroska Lendvai, Sándor Darányi, Christian Geng, Moniek M. Kuijpers, Oier Lopez de Lacalle, Jean-Christophe Mensonides, Simone Rebora, Uwe D. Reichel
2020	Developing Dataset of Japanese Slot Filling Quizzes Designed for Evaluation of Machine Reading Comprehension. Takuto Watarai, Masatoshi Tsuchiya
2020	Developing NLP Tools with a New Corpus of Learner Spanish. Sam Davidson, Aaron Yamada, Paloma Fernandez Mira, Agustina Carando, Claudia H. Sanchez Gutierrez, Kenji Sagae
2020	Developing Resources for Automated Speech Processing of Quebec French. Mélanie Lancien, Marie-Hélène Côté, Brigitte Bigi
2020	Developing a Corpus of Indirect Speech Act Schemas. Antonio Roque, Alexander Tsuetaki, Vasanth Sarathy, Matthias Scheutz
2020	Developing an Arabic Infectious Disease Ontology to Include Non-Standard Terminology. Lama Alsudias, Paul Rayson
2020	Development and Evaluation of Speech Synthesis Corpora for Latvian. Roberts Dargis, Peteris Paikens, Normunds Gruzitis, Ilze Auzina, Agate Akmane
2020	Development and Validation of a Corpus for Machine Humor Comprehension. Yuen-Hsien Tseng, Wun-Syuan Wu, Chia-Yueh Chang, Hsueh-Chih Chen, Wei-Lun Hsu
2020	Development of a Corpus Annotated with Medications and their Attributes in Psychiatric Health Records. Jaya Chaturvedi, Natalia Viani, Jyoti Sanyal, Chloe Tytherleigh, Idil Hasan, Kate Baird, Sumithra Velupillai, Robert Stewart, Angus Roberts
2020	Development of a General-Purpose Categorial Grammar Treebank. Yusuke Kubota, Koji Mineshima, Noritsugu Hayashi, Shinya Okano
2020	Development of a Guarani - Spanish Parallel Corpus. Luis Chiruzzo, Pedro J. Amarilla, Adolfo A. Rios, Gustavo Giménez Lugo
2020	Development of a Japanese Personality Dictionary based on Psychological Methods. Ritsuko Iwai, Daisuke Kawahara, Takatsune Kumada, Sadao Kurohashi
2020	Development of a Medical Incident Report Corpus with Intention and Factuality Annotation. Hongkuan Zhang, Ryohei Sasano, Koichi Takeda, Zoie Shui-Yee Wong
2020	DiMLex-Bangla: A Lexicon of Bangla Discourse Connectives. Debopam Das, Manfred Stede, Soumya Sankar Ghosh, Lahari Chatterjee
2020	Dialect Clustering with Character-Based Metrics: in Search of the Boundary of Language and Dialect. Yo Sato, Kevin Heffernan
2020	Dialogue Act Annotation in a Multimodal Corpus of First Encounter Dialogues. Costanza Navarretta, Patrizia Paggio
2020	Dialogue-AMR: Abstract Meaning Representation for Dialogue. Claire Bonial, Lucia Donatelli, Mitchell Abrams, Stephanie M. Lukin, Stephen Tratz, Matthew Marge, Ron Artstein, David R. Traum, Clare R. Voss
2020	Dicta-Sign-LSF-v2: Remake of a Continuous French Sign Language Dialogue Corpus and a First Baseline for Automatic Sign Language Processing. Valentin Belissen, Annelies Braffort, Michèle Gouiffès
2020	Digital Language Infrastructures - Documenting Language Actors. Verena Lyding, Alexander König, Monica Pretti
2020	Dirichlet-Smoothed Word Embeddings for Low-Resource Settings. Jakob Jungmaier, Nora Kassner, Benjamin Roth
2020	DiscSense: Automated Semantic Analysis of Discourse Markers. Damien Sileo, Tim Van de Cruys, Camille Pradel, Philippe Muller
2020	Discourse Component to Sentence (DC2S): An Efficient Human-Aided Construction of Paraphrase and Sentence Similarity Dataset. Won-Ik Cho, Jong In Kim, Young Ki Moon, Nam Soo Kim
2020	Discovering Biased News Articles Leveraging Multiple Human Annotations. Konstantina Lazaridou, Alexander Löser, Maria Mestre, Felix Naumann
2020	Diverging Divergences: Examining Variants of Jensen Shannon Divergence for Corpus Comparison Tasks. Jinghui Lu, Maeve Henchion, Brian Mac Namee
2020	Diversity, Density, and Homogeneity: Quantitative Characteristic Metrics for Text Collections. Yi-An Lai, Xuan Zhu, Yi Zhang, Mona T. Diab
2020	Do You Believe It Happened? Assessing Chinese Readers' Veridicality Judgments. Yu-Yun Chang, Shu-Kai Hsieh
2020	Do You Really Want to Hurt Me? Predicting Abusive Swearing in Social Media. Endang Wahyu Pamungkas, Valerio Basile, Viviana Patti
2020	Do not let the history haunt you: Mitigating Compounding Errors in Conversational Question Answering. Angrosh Mandya, James O'Neill, Danushka Bollegala, Frans Coenen
2020	Do you Feel Certain about your Annotation? A Web-based Semantic Frame Annotation Tool Considering Annotators' Concerns and Behaviors. Regina Stodden, Behrang QasemiZadeh, Laura Kallmeyer
2020	Doctor Who? Framing Through Names and Titles in German. Esther van den Berg, Katharina Korfhage, Josef Ruppenhofer, Michael Wiegand, Katja Markert
2020	Document Sub-structure in Neural Machine Translation. Radina Dobreva, Jie Zhou, Rachel Bawden
2020	Domain Adapted Distant Supervision for Pedagogically Motivated Relation Extraction. Oscar Sainz, Oier Lopez de Lacalle, Itziar Aldabe, Montse Maritxalar
2020	Dragonfly: Advances in Non-Speaker Annotation for Low Resource Languages. Cash Costello, Shelby Anderson, Caitlyn Bishop, James Mayfield, Paul McNamee
2020	Dynamic Classification in Web Archiving Collections. Krutarth Patel, Cornelia Caragea, Mark E. Phillips
2020	E: Calm Resource: a Resource for Studying Texts Produced by French Pupils and Students. Lydia-Mai Ho-Dac, Serge Fleury, Claude Ponton
2020	EDA: Enriching Emotional Dialogue Acts using an Ensemble of Neural Annotators. Chandrakant Bothe, Cornelius Weber, Sven Magg, Stefan Wermter
2020	EMPAC: an English-Spanish Corpus of Institutional Subtitles. Iris Serrat Roozen, José Manuel Martínez Martínez
2020	ENGLAWI: From Human- to Machine-Readable Wiktionary. Franck Sajous, Basilio Calderone, Nabil Hathout
2020	Editing OntoLex-Lemon in VocBench 3. Manuel Fiorelli, Armando Stellato, Tiziano Lorenzetti, Andrea Turbati, Peter Schmitz, Enrico Francesconi, Najeh Hajlaoui, Brahim Batouche
2020	Effective Crowdsourcing of Multiple Tasks for Comprehensive Knowledge Extraction. Sangha Nam, Minho Lee, Donghwan Kim, Kijong Han, Kuntae Kim, Sooji Yoon, Eun-Kyung Kim, Key-Sun Choi
2020	Effort Estimation in Named Entity Tagging Tasks. Inês Gomes, Rui Correia, Jorge Ribeiro, João Freitas
2020	Ellogon Casual Annotation Infrastructure. Georgios Petasis, Leonidas Tsekouras
2020	Email Classification Incorporating Social Networks and Thread Structure. Sakhar B. Alkhereyf, Owen Rambow
2020	Embedding Space Correlation as a Measure of Domain Similarity. Anne Beyer, Göran Kauermann, Hinrich Schütze
2020	Embeddings for Named Entity Recognition in Geoscience Portuguese Literature. Bernardo Scapini Consoli, Joaquim Santos, Diogo Gomes, Fábio Corrêa Cordeiro, Renata Vieira, Viviane Pereira Moreira
2020	EmoEvent: A Multilingual Emotion Corpus based on different Events. Flor Miriam Plaza del Arco, Carlo Strapparava, Luis Alfonso Ureña López, María Teresa Martín Valdivia
2020	Emotional Speech Corpus for Persuasive Dialogue System. Sara Asai, Koichiro Yoshino, Seitaro Shinagawa, Sakriani Sakti, Satoshi Nakamura
2020	EmpiriST Corpus 2.0: Adding Manual Normalization, Lemmatization and Semantic Tagging to a German Web and CMC Corpus. Thomas Proisl, Natalie Dykes, Philipp Heinrich, Besim Kabashi, Andreas Blombach, Stefan Evert
2020	English Recipe Flow Graph Corpus. Yoko Yamakata, Shinsuke Mori, John Carroll
2020	English WordNet Random Walk Pseudo-Corpora. Filip Klubicka, Alfredo Maldonado, Abhijit Mahalunkar, John D. Kelleher
2020	Enhancing a Lexicon of Polarity Shifters through the Supervised Classification of Shifting Directions. Marc Schulder, Michael Wiegand, Josef Ruppenhofer
2020	EstNLTK 1.6: Remastered Estonian NLP Pipeline. Sven Laur, Siim Orasmaa, Dage Särg, Paul Tammo
2020	Establishing a New State-of-the-Art for French Named Entity Recognition. Pedro Javier Ortiz Suárez, Yoann Dupont, Benjamin Muller, Laurent Romary, Benoît Sagot
2020	Estimating User Communication Styles for Spoken Dialogue Systems. Juliana Miehle, Isabel Feustel, Julia Hornauer, Wolfgang Minker, Stefan Ultes
2020	European Language Grid: An Overview. Georg Rehm, Maria Berger, Ela Elsholz, Stefanie Hegele, Florian Kintzel, Katrin Marheinecke, Stelios Piperidis, Miltos Deligiannis, Dimitris Galanis, Katerina Gkirtzou, Penny Labropoulou, Kalina Bontcheva, David Jones, Ian Roberts, Jan Hajic, Jana Hamrlová, Lukás Kacena, Khalid Choukri, Victoria Arranz, Andrejs Vasiljevs, Orians Anvari, Andis Lagzdins, Julija Melnika, Gerhard Backfried, Erinç Dikici, Miroslav Jánosík, Katja Prinz, Christoph Prinz, Severin Stampler, Dorothea Thomas-Aniola, José Manuél Gómez-Pérez, Andrés García-Silva, Cristian Berrio, Ulrich Germann, Steve Renals, Ondrej Klejch
2020	Evaluating Approaches to Personalizing Language Models. Milton King, Paul Cook
2020	Evaluating Information Loss in Temporal Dependency Trees. Mustafa Ocal, Mark A. Finlayson
2020	Evaluating Language Tools for Fifteen EU-official Under-resourced Languages. Diego Alves, Gaurish Thakkar, Marko Tadic
2020	Evaluating Sentence Segmentation in Different Datasets of Neuropsychological Language Tests in Brazilian Portuguese. Edresson Casanova, Marcos V. Treviso, Lilian Hübner, Sandra M. Aluísio
2020	Evaluating Sub-word Embeddings in Cross-lingual Models. Ali Hakimi Parizi, Paul Cook
2020	Evaluating Text Coherence at Sentence and Paragraph Levels. Sennan Liu, Shuang Zeng, Sujian Li
2020	Evaluating and Improving Child-Directed Automatic Speech Recognition. Eric G. Booth, Jake Carns, Casey Kennington, Nader Rafla
2020	Evaluating the Impact of Sub-word Information and Cross-lingual Word Embeddings on Mi'kmaq Language Modelling. Jeremie Boudreau, Akankshya Patra, Ashima Suvarna, Paul Cook
2020	Evaluation Dataset and Methodology for Extracting Application-Specific Taxonomies from the Wikipedia Knowledge Graph. Georgeta Bordea, Stefano Faralli, Fleur Mougin, Paul Buitelaar, Gayo Diallo
2020	Evaluation Dataset for Zero Pronoun in Japanese to English Translation. Sho Shimazu, Sho Takase, Toshiaki Nakazawa, Naoaki Okazaki
2020	Evaluation Metrics for Headline Generation Using Deep Pre-Trained Embeddings. Abdul Moeed, Yang An, Gerhard Hagerer, Georg Groh
2020	Evaluation of Argument Search Approaches in the Context of Argumentative Dialogue Systems. Niklas Rach, Yuki Matsuda, Johannes Daxenberger, Stefan Ultes, Keiichi Yasumoto, Wolfgang Minker
2020	Evaluation of Dataset Selection for Pre-Training and Fine-Tuning Transformer Language Models for Clinical Question Answering. Sarvesh Soni, Kirk Roberts
2020	Evaluation of Deep Gaussian Processes for Text Classification. P. Jayashree, P. K. Srijith
2020	Evaluation of Greek Word Embeddings. Stamatis Outsios, Christos Karatsalos, Konstantinos Skianis, Michalis Vazirgiannis
2020	Evaluation of Lifelong Learning Systems. Yevhenii Prokopalo, Sylvain Meignier, Olivier Galibert, Loïc Barrault, Anthony Larcher
2020	Evaluation of Manual and Non-manual Components for Sign Language Recognition. Medet Mukushev, Arman Sabyrov, Alfarabi Imashev, Kenessary Koishybay, Vadim Kimmelman, Anara Sandygulova
2020	Evaluation of Off-the-shelf Speech Recognizers Across Diverse Dialogue Domains. Kallirroi Georgila, Anton Leuski, Volodymyr Yanov, David R. Traum
2020	Evaluation of Sentence Representations in Polish. Slawomir Dadas, Michal Perelkiewicz, Rafal Poswiata
2020	Event Extraction from Unstructured Amharic Text. Ephrem Tadesse, Rosa Tsegaye, Kuulaa Qaqqabaa
2020	Exploiting Citation Knowledge in Personalised Recommendation of Recent Scientific Publications. Anita Khadka, Iván Cantador, Miriam Fernández
2020	Exploiting Cross-Lingual Hints to Discover Event Pronouns. Sharid Loáiciga, Christian Hardmeier, Asad B. Sayeed
2020	Exploring Bilingual Word Embeddings for Hiligaynon, a Low-Resource Language. Leah Michel, Viktor Hangya, Alexander M. Fraser
2020	Exploring Transformer Text Generation for Medical Dataset Augmentation. Ali Amin-Nejad, Julia Ive, Sumithra Velupillai
2020	Exploring a Choctaw Language Corpus with Word Vectors and Minimum Distance Length. Jacqueline Brixey, David J. Sides, Timothy Vizthum, David R. Traum, Khalil Iskarous
2020	Extraction of Hyponymic Relations in French with Knowledge-Pattern-Based Word Sketches. Antonio San Martín, Catherine Trekker, Pilar León Araúz
2020	Extraction of the Argument Structure of Tokyo Metropolitan Assembly Minutes: Segmentation of Question-and-Answer Sets. Keiichi Takamaru, Yasutomo Kimura, Hideyuki Shibuki, Hokuto Ototake, Yuzu Uchida, Kotaro Sakamoto, Madoka Ishioroshi, Teruko Mitamura, Noriko Kando
2020	Extrinsic Evaluation of French Dependency Parsers on a Specialized Corpus: Comparison of Distributional Thesauri. Ludovic Tanguy, Pauline Brunet, Olivier Ferret
2020	Eye4Ref: A Multimodal Eye Movement Dataset of Referentially Complex Situations. Özge Alaçam, Eugen Ruppert, Amr Rekaby Salama, Tobias Staron, Wolfgang Menzel
2020	FAB: The French Absolute Beginner Corpus for Pronunciation Training. Sean Robertson, Cosmin Munteanu, Gerald Penn
2020	Facilitating Corpus Usage: Making Icelandic Corpora More Accessible for Researchers and Language Users. Steinþór Steingrímsson, Starkaður Barkarson, Gunnar Thor Örnólfsson
2020	FactCorp: A Corpus of Dutch Fact-checks and its Multiple Usages. Marten van der Meulen, W. Gudrun Reijnierse
2020	Fakeddit: A New Multimodal Benchmark Dataset for Fine-grained Fake News Detection. Kai Nakamura, Sharon Levy, William Yang Wang
2020	Figure Me Out: A Gold Standard Dataset for Metaphor Interpretation. Omnia Zayed, John Philip McCrae, Paul Buitelaar
2020	Fine-grained Morphosyntactic Analysis and Generation Tools for More Than One Thousand Languages. Garrett Nicolai, Dylan Lewis, Arya D. McCarthy, Aaron Mueller, Winston Wu, David Yarowsky
2020	Fine-grained Named Entity Annotations for German Biographic Interviews. Josef Ruppenhofer, Ines Rehbein, Carolina Flinz
2020	Finite State Machine Pattern-Root Arabic Morphological Generator, Analyzer and Diacritizer. Maha Alkhairy, Afshan Jafri, David Smith
2020	Fintan - Flexible, Integrated Transformation and Annotation eNgineering. Christian Fäth, Christian Chiarcos, Björn Ebbrecht, Maxim Ionov
2020	FlauBERT: Unsupervised Language Model Pre-training for French. Hang Le, Loïc Vial, Jibril Frej, Vincent Segonne, Maximin Coavoux, Benjamin Lecouteux, Alexandre Allauzen, Benoît Crabbé, Laurent Besacier, Didier Schwab
2020	FloDusTA: Saudi Tweets Dataset for Flood, Dust Storm, and Traffic Accident Events. Btool Hamoui, Mourad Mars, Khaled Hatem Almotairi
2020	FrSemCor: Annotating a French Corpus with Supersenses. Lucie Barque, Pauline Haas, Richard Huyghe, Delphine Tribout, Marie Candito, Benoît Crabbé, Vincent Segonne
2020	French Coreference for Spoken and Written Language. Rodrigo Wilkens, Bruno Oberle, Frédéric Landragin, Amalia Todirascu
2020	French Tweet Corpus for Automatic Stance Detection. Marc Evrard, Rémi Uro, Nicolas Hervé, Béatrice Mazoyer
2020	From Linguistic Resources to Ontology-Aware Terminologies: Minding the Representation Gap. Giulia Speranza, Maria Pia di Buono, Johanna Monti, Federico Sangati
2020	From Spatial Relations to Spatial Configurations. Soham Dan, Parisa Kordjamshidi, Julia Bonn, Archna Bhatia, Zheng Cai, Martha Palmer, Dan Roth
2020	From Witch's Shot to Music Making Bones - Resources for Medical Laymen to Technical Language and Vice Versa. Laura Seiffe, Oliver Marten, Michael Mikhailov, Sven Schmeier, Sebastian Möller, Roland Roller
2020	GGP: Glossary Guided Post-processing for Word Embedding Learning. Ruosong Yang, Jiannong Cao, Zhiyuan Wen
2020	GM-RKB WikiText Error Correction Task and Baselines. Gabor Melli, Abdelrhman Eldallal, Bassim Lazem, Olga Moreira
2020	GRAIN-S: Manually Annotated Syntax for German Interviews. Agnieszka Falenska, Zoltán Czesznak, Kerstin Jung, Moritz Völkel, Wolfgang Seeker, Jonas Kuhn
2020	GameWikiSum: a Novel Large Multi-Document Summarization Dataset. Diego Antognini, Boi Faltings
2020	Gamification Platform for Collecting Task-oriented Dialogue Data. Haruna Ogawa, Hitoshi Nishikawa, Takenobu Tokunaga, Hikaru Yokono
2020	GeBioToolkit: Automatic Extraction of Gender-Balanced Multilingual Corpus of Wikipedia Biographies. Marta R. Costa-jussà, Pau Li Lin, Cristina España-Bonet
2020	GeCzLex: Lexicon of Czech and German Anaphoric Connectives. Lucie Poláková, Katerina Rysová, Magdaléna Rysová, Jirí Mírovský
2020	Gender Representation in Open Source Speech Resources. Mahault Garnerin, Solange Rossato, Laurent Besacier
2020	Generating Major Types of Chinese Classical Poetry in a Uniformed Framework. Jinyi Hu, Maosong Sun
2020	Generating Responses that Reflect Meta Information in User-Generated Question Answer Pairs. Takashi Kodama, Ryuichiro Higashinaka, Koh Mitsuda, Ryo Masumura, Yushi Aono, Ryuta Nakamura, Noritake Adachi, Hidetoshi Kawabata
2020	Geographically-Balanced Gigaword Corpora for 50 Language Varieties. Jonathan Dunn, Benjamin Adams
2020	GerDraCor-Coref: A Coreference Corpus for Dramatic Texts in German. Janis Pagel, Nils Reiter
2020	Getting More Data for Low-resource Morphological Inflection: Language Models and Data Augmentation. Alexey Sorokin
2020	Getting To Know You: User Attribute Extraction from Dialogues. Chien-Sheng Wu, Andrea Madotto, Zhaojiang Lin, Peng Xu, Pascale Fung
2020	Gigafida 2.0: The Reference Corpus of Written Standard Slovene. Simon Krek, Spela Arhar Holdt, Tomaz Erjavec, Jaka Cibej, Andraz Repar, Polona Gantar, Nikola Ljubesic, Iztok Kosem, Kaja Dobrovoljc
2020	GitHub Typo Corpus: A Large-Scale Multilingual Dataset of Misspellings and Grammatical Errors. Masato Hagiwara, Masato Mita
2020	Give your Text Representation Models some Love: the Case for Basque. Rodrigo Agerri, Iñaki San Vicente, Jon Ander Campos, Ander Barrena, Xabier Saralegi, Aitor Soroa, Eneko Agirre
2020	Glawinette: a Linguistically Motivated Derivational Description of French Acquired from GLAWI. Nabil Hathout, Franck Sajous, Basilio Calderone, Fiammetta Namer
2020	GoodNewsEveryone: A Corpus of News Headlines Annotated with Emotions, Semantic Roles, and Reader Perception. Laura Ana Maria Bostan, Evgeny Kim, Roman Klinger
2020	HAHA 2019 Dataset: A Corpus for Humor Analysis in Spanish. Luis Chiruzzo, Santiago Castro, Aiala Rosá
2020	HBCP Corpus: A New Resource for the Analysis of Behavioural Change Intervention Reports. Francesca Bonin, Martin Gleize, Ailbhe Finnerty, Candice Moore, Charles Jochim, Emma Norris, Yufang Hou, Alison J. Wright, Debasis Ganguly, Emily Hayes, Silje Zink, Alessandra Pascale, Pol Mac Aonghusa, Susan Michie
2020	HELFI: a Hebrew-Greek-Finnish Parallel Bible Corpus with Cross-Lingual Morpheme Alignment. Anssi Yli-Jyrä, Josi Purhonen, Matti Liljeqvist, Arto Antturi, Pekka Nieminen, Kari M. Räntilä, Valtter Luoto
2020	Habibi - a multi Dialect multi National Arabic Song Lyrics Corpus. Mahmoud El-Haj
2020	HamNoSyS2SiGML: Translating HamNoSys Into SiGML. Carolina C. Neves, Luísa Coheur, Hugo Nicolau
2020	Handle with Care: A Case Study in Comparable Corpora Exploitation for Neural Machine Translation. Thierry Etchegoyhen, Harritxu Gete
2020	Handling Entity Normalization with no Annotated Corpus: Weakly Supervised Methods Based on Distributional Representation and Ontological Information. Arnaud Ferré, Robert Bossy, Mouhamadou Ba, Louise Deléger, Thomas Lavergne, Pierre Zweigenbaum, Claire Nédellec
2020	HardEval: Focusing on Challenging Tokens to Assess Robustness of NER. Gabriel Bernier-Colborne, Philippe Langlais
2020	Have a Cake and Eat it Too: Assessing Discriminating Performance of an Intelligibility Index Obtained from a Reduced Sample Size. Anna K. Marczyk, Alain Ghio, Muriel Lalain, Marie Rebourg, Corinne Fredouille, Virginie Woisard
2020	Headword-Oriented Entity Linking: A Special Entity Linking Task with Dataset and Baseline. Mu Yang, Chi-Yen Chen, Yi-Hui Lee, Qian-hui Zeng, Wei-Yun Ma, Chen-Yang Shih, Wei-Jhih Chen
2020	Hedwig: A Named Entity Linker. Marcus Klang, Pierre Nugues
2020	High Quality ELMo Embeddings for Seven Less-Resourced Languages. Matej Ulcar, Marko Robnik-Sikonja
2020	HitzalMed: Anonymisation of Clinical Text in Spanish. Salvador Lima, Naiara Pérez, Laura García-Sardiña, Montse Cuadros
2020	HotelRec: a Novel Very Large-Scale Hotel Recommendation Dataset. Diego Antognini, Boi Faltings
2020	How Much Data Do You Need? About the Creation of a Ground Truth for Black Letter and the Effectiveness of Neural OCR. Phillip Ströbel, Simon Clematide, Martin Volk
2020	How Universal are Universal Dependencies? Exploiting Syntax for Multilingual Clause-level Sentiment Detection. Hiroshi Kanayama, Ran Iwamoto
2020	How Users React to Proactive Voice Assistant Behavior While Driving. Maria Schmidt, Wolfgang Minker, Steffen Werner
2020	How to Compare Automatically Two Phonological Strings: Application to Intelligibility Measurement in the Case of Atypical Speech. Alain Ghio, Muriel Lalain, Laurence Giusti, Corinne Fredouille, Virginie Woisard
2020	Humans Keep It One Hundred: an Overview of AI Journey. Tatiana Shavrina, Anton A. Emelyanov, Alena Fenogenova, Vadim Fomin, Vladislav Mikhailov, Andrey Evlampiev, Valentin Malykh, Vladimir Larin, Alex Natekin, Aleksandr Vatulin, Peter Romov, Daniil Anastasiev, Nikolai Zinov, Andrey Chertok
2020	HypoNLI: Exploring the Artificial Patterns of Hypothesis-only Bias in Natural Language Inference. Tianyu Liu, Xin Zheng, Baobao Chang, Zhifang Sui
2020	I Feel Offended, Don't Be Abusive! Implicit/Explicit Messages in Offensive and Abusive Language. Tommaso Caselli, Valerio Basile, Jelena Mitrovic, Inga Kartoziya, Michael Granitzer
2020	IIIT-H TEMD Semi-Natural Emotional Speech Database from Professional Actors and Non-Actors. Banothu Rambabu, Kishore Kumar Botsa, P. Gangamohan, Suryakanth V. Gangashetty
2020	Identification of Indigenous Knowledge Concepts through Semantic Networks, Spelling Tools and Word Embeddings. Renato Rocha Souza, Amelie Dorn, Barbara Piringer, Eveline Wandl-Vogt
2020	Identification of Primary and Collateral Tracks in Stuttered Speech. Rachid Riad, Anne-Catherine Bachoud-Lévi, Frank Rudzicz, Emmanuel Dupoux
2020	Identifying Cognates in English-Dutch and French-Dutch by means of Orthographic Information and Cross-lingual Word Embeddings. Els Lefever, Sofie Labat, Pranaydeep Singh
2020	Identifying Sentiments in Algerian Code-switched User-generated Comments. Wafia Adouane, Samia Touileb, Jean-Philippe Bernardy
2020	Image Position Prediction in Multimodal Documents. Masayasu Muraoka, Ryosuke Kohita, Etsuko Ishii
2020	Immersive Language Exploration with Object Recognition and Augmented Reality. Benny Platte, Anett Platte, Christian Roschke, Rico Thomanek, Tony Rolletschke, Frank Zimmer, Marc Ritter
2020	Implementation and Evaluation of an LFG-based Parser for Wolof. Cheikh M. Bamba Dione
2020	Implicit Knowledge in Argumentative Texts: An Annotated Corpus. Maria Becker, Katharina Korfhage, Anette Frank
2020	Improved Finite-State Morphological Analysis for St. Lawrence Island Yupik Using Paradigm Function Morphology. Emily Chen, Hyunji Hayley Park, Lane Schwartz
2020	Improving NMT Quality Using Terminology Injection. Duane K. Dougal, Deryle Lonsdale
2020	Improving Neural Metaphor Detection with Visual Datasets. Gitit Kehat, James Pustejovsky
2020	Improving Sentence Boundary Detection for Spoken Language Transcripts. Ines Rehbein, Josef Ruppenhofer, Thomas Schmidt
2020	Improving Speech Recognition for the Elderly: A New Corpus of Elderly Japanese Speech and Investigation of Acoustic Modeling for Speech Recognition. Meiko Fukuda, Hiromitsu Nishizaki, Yurie Iribe, Ryota Nishimura, Norihide Kitaoka
2020	Improving the Precision of Natural Textual Entailment Problem Datasets. Jean-Philippe Bernardy, Stergios Chatzikyriakidis
2020	Improving the Production Efficiency and Well-formedness of Automatically-Generated Multiple-Choice Cloze Vocabulary Questions. Ralph Rose
2020	Incorporating Politeness across Languages in Customer Care Responses: Towards building a Multi-lingual Empathetic Dialogue Agent. Mauajama Firdaus, Asif Ekbal, Pushpak Bhattacharyya
2020	IndicSpeech: Text-to-Speech Corpus for Indian Languages. Nimisha Srivastava, Rudrabha Mukhopadhyay, K. R. Prajwal, C. V. Jawahar
2020	Inducing Universal Semantic Tag Vectors. Da Huo, Gerard de Melo
2020	Inference Annotation of a Chinese Corpus for Opinion Mining. Liyun Yan, Danni E, Mei Gan, Cyril Grouin, Mathieu Valette
2020	Inferences for Lexical Semantic Resource Building with Less Supervision. Nadia Bebeshina, Mathieu Lafourcade
2020	Inferring Social Media Users' Mental Health Status from Multimodal Information. Zhentao Xu, Verónica Pérez-Rosas, Rada Mihalcea
2020	Infrastructure for Semantic Annotation in the Genomics Domain. Mahmoud El-Haj, Nathan Rutherford, Matthew Coole, Ignatius Ezeani, Sheryl Prentice, Nancy Ide, Jo Knight, Scott Piao, John Mariani, Paul Rayson, Keith Suderman
2020	Inherent Dependency Displacement Bias of Transition-Based Algorithms. Mark Anderson, Carlos Gómez-Rodríguez
2020	Integrating Disfluency-based and Prosodic Features with Acoustics in Automatic Fluency Evaluation of Spontaneous Speech. Huaijin Deng, Youchao Lin, Takehito Utsuro, Akio Kobayashi, Hiromitsu Nishizaki, Junichi Hoshino
2020	Intent Recognition in Doctor-Patient Interviews. Robin Rojowiec, Benjamin Roth, Maximilian Fink
2020	Interannotator Agreement for Lexico-Semantic Annotation of a Corpus. Elzbieta Hajnicz
2020	Interchange Formats for Visualization: LIF and MMIF. Kyeongmin Rim, Kelley Lynch, Marc Verhagen, Nancy Ide, James Pustejovsky
2020	Interoperability in an Infrastructure Enabling Multidisciplinary Research: The case of CLARIN. Franciska de Jong, Bente Maegaard, Darja Fiser, Dieter Van Uytvanck, Andreas Witt
2020	Introducing Lexical Masks: a New Representation of Lexical Entries for Better Evaluation and Exchange of Lexicons. Bruno Cartoni, Daniel Calvelo Aros, Denny Vrandecic, Saran Lertpradit
2020	Introducing MULAI: A Multimodal Database of Laughter during Dyadic Interactions. Michel-Pierre Jansen, Khiet P. Truong, Dirk K. J. Heylen, Deniece S. Nazareth
2020	Introducing RONEC - the Romanian Named Entity Corpus. Stefan Daniel Dumitrescu, Andrei-Marius Avram
2020	Introducing a Large-Scale Dataset for Vietnamese POS Tagging on Conversational Texts. Oanh Tran, Tu Pham, Vu Dang, Bang Nguyen
2020	Invisible to People but not to Machines: Evaluation of Style-aware HeadlineGeneration in Absence of Reliable Human Judgment. Lorenzo De Mattei, Michele Cafagna, Felice Dell'Orletta, Malvina Nissim
2020	Irony Detection in Persian Language: A Transfer Learning Approach Using Emoji Prediction. Preni Golazizian, Behnam Sabeti, Seyed Arad Ashrafi Asli, Zahra Majdabadi, Omid Momenzadeh, Reza Fahmi
2020	Is Language Modeling Enough? Evaluating Effective Embedding Combinations. Rudolf Schneider, Tom Oberhauser, Paul Grundmann, Felix A. Gers, Alexander Löser, Steffen Staab
2020	Issues and Perspectives from 10, 000 Annotated Financial Social Media Data. Chung-Chi Chen, Hen-Hsen Huang, Hsin-Hsi Chen
2020	JASS: Japanese-specific Sequence to Sequence Pre-training for Neural Machine Translation. Zhuoyuan Mao, Fabien Cromierès, Raj Dabre, Haiyue Song, Sadao Kurohashi
2020	JParaCrawl: A Large Scale Web-Based English-Japanese Parallel Corpus. Makoto Morishita, Jun Suzuki, Masaaki Nagata
2020	Jamo Pair Encoding: Subcharacter Representation-based Extreme Korean Vocabulary Compression for Efficient Subword Tokenization. Sangwhan Moon, Naoaki Okazaki
2020	Japanese Realistic Textual Entailment Corpus. Yuta Hayashibe
2020	Jejueo Datasets for Machine Translation and Speech Synthesis. Kyubyong Park, Yo Joong Choe, Jiyeon Ham
2020	Joint Learning of Syntactic Features Helps Discourse Segmentation. Takshak Desai, Parag Dakle, Dan I. Moldovan
2020	KGvec2go - Knowledge Graph Embeddings as a Service. Jan Portisch, Michael Hladik, Heiko Paulheim
2020	KORE 50 Kristian Noullet, Rico Mix, Michael Färber
2020	KOTONOHA: A Corpus Concordance System for Skewer-Searching NINJAL Corpora. Teruaki Oka, Yuichi Ishimoto, Yutaka Yagi, Takenori Nakamura, Masayuki Asahara, Kikuo Maekawa, Toshinobu Ogiso, Hanae Koiso, Kumiko Sakoda, Nobuko Kibe
2020	KidSpell: A Child-Oriented, Rule-Based, Phonetic Spellchecker. Brody Downs, Oghenemaro Anuyah, Aprajita Shukla, Jerry Alan Fails, Maria Soledad Pera, Katherine Landau Wright, Casey Kennington
2020	Know thy Corpus! Robust Methods for Digital Curation of Web corpora. Serge Sharoff
2020	KonText: Advanced and Flexible Corpus Query Interface. Tomás Machálek
2020	Korean-Specific Emotion Annotation Procedure Using N-Gram-Based Distant Supervision and Korean-Specific-Feature-Based Distant Supervision. Young-Jun Lee, Chae-Gyun Lim, Ho-Jin Choi
2020	Kvistur 2.0: a BiLSTM Compound Splitter for Icelandic. Jón Daðason, David Erik Mollberg, Hrafn Loftsson, Kristín Bjarnadóttir
2020	LEDGAR: A Large-Scale Multi-label Corpus for Text Classification of Legal Provisions in Contracts. Don Tuggener, Pius von Däniken, Thomas Peetz, Mark Cieliebak
2020	LSCP: Enhanced Large Scale Colloquial Persian Language Understanding. Hadi Abdi Khojasteh, Ebrahim Ansari, Mahdi Bohlouli
2020	LSF-ANIMAL: A Motion Capture Corpus in French Sign Language Designed for the Animation of Signing Avatars. Lucie Naert, Caroline Larboulette, Sylvie Gibet
2020	Language Agnostic Automatic Summarization Evaluation. Christopher Tauchmann, Margot Mieskes
2020	Language Data Sharing in European Public Services - Overcoming Obstacles and Creating Sustainable Data Sharing Infrastructures. Lilli Smal, Andrea Lösch, Josef van Genabith, Maria Giagkou, Thierry Declerck, Stephan Busemann
2020	Language Modeling with a General Second-Order RNN. Diego Maupomé, Marie-Jean Meurs
2020	Language Proficiency Scoring. Cristina Arhiliuc, Jelena Mitrovic, Michael Granitzer
2020	Language Resources for Historical Newspapers: the Impresso Collection. Maud Ehrmann, Matteo Romanello, Simon Clematide, Phillip Ströbel, Raphaël Barman
2020	Language Technology Programme for Icelandic 2019-2023. Anna Björk Nikulásdóttir, Jón Guðnason, Anton Karl Ingason, Hrafn Loftsson, Eiríkur Rögnvaldsson, Einar Freyr Sigurðsson, Steinþór Steingrímsson
2020	Language-Independent Tokenisation Rivals Language-Specific Tokenisation for Word Similarity Prediction. Danushka Bollegala, Ryuichi Kiryo, Kosuke Tsujino, Haruki Yukawa
2020	Languages Resources for Poorly Endowed Languages : The Case Study of Classical Armenian. Chahan Vidal-Gorène, Aliénor Decours-Perez
2020	Large Corpus of Czech Parliament Plenary Hearings. Jonás Kratochvíl, Peter Polak, Ondrej Bojar
2020	Large Vocabulary Read Speech Corpora for Four Ethiopian Languages: Amharic, Tigrigna, Oromo and Wolaytta. Solomon Teferra Abate, Martha Yifiru Tachbelie, Michael Melese, Hafte Abera, Tewodros Abebe, Wondwossen Mulugeta, Yaregal Assabie, Million Meshesha, Solomon Afnafu, Binyam Ephrem Seyoum
2020	Large-scale Cross-lingual Language Resources for Referencing and Framing. Piek Vossen, Filip Ilievski, Marten Postma, Antske Fokkens, Gosse Minnema, Levi Remijnse
2020	Learning Word Ratings for Empathy and Distress from Document-Level User Responses. João Sedoc, Sven Buechel, Yehonathan Nachmany, Anneke Buffone, Lyle H. Ungar
2020	Learning the Human Judgment for the Automatic Evaluation of Chatbot. Shih-Hung Wu, Sheng-Lun Chien
2020	Learnings from Technological Interventions in a Low Resource Language: A Case-Study on Gondi. Devansh Mehta, Sebastin Santy, Ramaravind Kommiya Mothilal, Brij Mohan Lal Srivastava, Alok Sharma, Anurag Shukla, Vishnu Prasad, Venkanna U, Amit Sharma, Kalika Bali
2020	Lemmatising Verbs in Middle English Corpora: The Benefit of Enriching the Penn-Helsinki Parsed Corpus of Middle English 2 (PPCME2), the Parsed Corpus of Middle English Poetry (PCMEP), and A Parsed Linguistic Atlas of Early Middle English (PLAEME). Carola Trips, Michael Percillier
2020	Leveraging Contextual Embeddings for Detecting Diachronic Semantic Shift. Matej Martinc, Petra Kralj Novak, Senja Pollak
2020	LexiDB: Patterns & Methods for Corpus Linguistic Database Management. Matthew Coole, Paul Rayson, John Mariani
2020	Lexical Tone Recognition in Mizo using Acoustic-Prosodic Features. Parismita Gogoi, Abhishek Dey, Wendy Lalhminghlui, Priyankoo Sarmah, S. R. Mahadeva Prasanna
2020	Lexicogrammatic translationese across two targets and competence levels. Maria Kunilovskaya, Ekaterina Lapshinova-Koltunski
2020	LiViTo: Linguistic and Visual Features Tool for Assisted Analysis of Historic Manuscripts. Klaus Müller, Aleksej Tikhonov, Roland Meyer
2020	LibriVoxDeEn: A Corpus for German-to-English Speech Translation and German Speech Recognition. Benjamin Beilharz, Xin Sun, Sariya Karimova, Stefan Riezler
2020	LifeQA: A Real-life Dataset for Video Question Answering. Santiago Castro, Mahmoud Azab, Jonathan C. Stroud, Cristina Noujaim, Ruoyao Wang, Jia Deng, Rada Mihalcea
2020	LinCE: A Centralized Benchmark for Linguistic Code-switching Evaluation. Gustavo Aguilar, Sudipta Kar, Thamar Solorio
2020	Linguistic Appropriateness and Pedagogic Usefulness of Reading Comprehension Questions. Andrea Horbach, Itziar Aldabe, Marie Bexte, Oier Lopez de Lacalle, Montse Maritxalar
2020	Linguistic, Kinematic and Gaze Information in Task Descriptions: The LKG-Corpus. Tim Reinboth, Stephanie Gross, Laura Bishop, Brigitte Krenn
2020	Linguistically Informed Hindi-English Neural Machine Translation. Vikrant Goyal, Pruthwik Mishra, Dipti Misra Sharma
2020	Linking the TUFS Basic Vocabulary to the Open Multilingual Wordnet. Francis Bond, Hiroki Nomoto, Luís Morgado da Costa, Arthur Bond
2020	Literary Machine Translation under the Magnifying Glass: Assessing the Quality of an NMT-Translated Detective Novel on Document Level. Margot Fonteyne, Arda Tezcan, Lieve Macken
2020	Localization of Fake News Detection via Multitask Transfer Learning. Jan Christian Blaise Cruz, Julianne Agatha Tan, Charibeth Cheng
2020	Love Me, Love Me, Say (and Write!) that You Love Me: Enriching the WASABI Song Corpus with Lyrics Annotations. Michael Fell, Elena Cabrio, Elmahdi Korfed, Michel Buffa, Fabien Gandon
2020	MAGPIE: A Large Corpus of Potentially Idiomatic Expressions. Hessel Haagsma, Johan Bos, Malvina Nissim
2020	MALT-IT2: A New Resource to Measure Text Difficulty in Light of CEFR Levels for Italian L2 Learning. Luciana Forti, Giuliana Grego Bolli, Filippo Santarelli, Valentino Santucci, Stefania Spina
2020	MASRI-HEADSET: A Maltese Corpus for Speech Recognition. Carlos Daniel Hernandez Mena, Albert Gatt, Andrea DeMarco, Claudia Borg, Lonneke van der Plas, Amanda Muscat, Ian Padovani
2020	MEDIAPI-SKEL - A 2D-Skeleton Video Database of French Sign Language With Aligned French Subtitles. Hannah Bull, Annelies Braffort, Michèle Gouiffès
2020	MEDLINE as a Parallel Corpus: a Survey to Gain Insight on French-, Spanish- and Portuguese-speaking Authors' Abstract Writing Practice. Aurélie Névéol, Antonio Jimeno-Yepes, Mariana L. Neves
2020	MPDD: A Multi-Party Dialogue Dataset for Analysis of Emotions and Interpersonal Relationships. Yi-Ting Chen, Hen-Hsen Huang, Hsin-Hsi Chen
2020	MSD-1030: A Well-built Multi-Sense Evaluation Dataset for Sense Representation Models. Ting-Yu Yen, Yang-Yin Lee, Yow-Ting Shiue, Hen-Hsen Huang, Hsin-Hsi Chen
2020	MTSI-BERT: A Session-aware Knowledge-based Conversational Agent. Matteo Antonio Senese, Giuseppe Rizzo, Mauro Dragoni, Maurizio Morisio
2020	MaSS: A Large and Clean Multilingual Corpus of Sentence-aligned Spoken Utterances Extracted from the Bible. Marcely Zanon Boito, William Havard, Mahault Garnerin, Éric Le Ferrand, Laurent Besacier
2020	Machine Learning and Deep Neural Network-Based Lemmatization and Morphosyntactic Tagging for Serbian. Ranka Stankovic, Branislava Sandrih, Cvetana Krstev, Milos Utvic, Mihailo Skoric
2020	Machine-Aided Annotation for Fine-Grained Proposition Types in Argumentation. Yohan Jo, Elijah Mayfield, Chris Reed, Eduard H. Hovy
2020	Making Metadata Fit for Next Generation Language Technology Platforms: The Metadata Schema of the European Language Grid. Penny Labropoulou, Katerina Gkirtzou, Maria Gavriilidou, Miltos Deligiannis, Dimitris Galanis, Stelios Piperidis, Georg Rehm, Maria Berger, Valérie Mapelli, Mickaël Rigault, Victoria Arranz, Khalid Choukri, Gerhard Backfried, José Manuél Gómez-Pérez, Andrés García-Silva
2020	Mandarinograd: A Chinese Collection of Winograd Schemas. Timothée Bernard, Ting Han
2020	Manovaad: A Novel Approach to Event Oriented Corpus Creation Capturing Subjectivity and Focus. Lalitha Kameswari, Radhika Mamidi
2020	Mapping the Dialog Act Annotations of the LEGO Corpus into ISO 24617-2 Communicative Functions. Eugénio Ribeiro, Ricardo Ribeiro, David Martins de Matos
2020	Marking Irony Activators in a Universal Dependencies Treebank: The Case of an Italian Twitter Corpus. Alessandra Teresa Cignarella, Manuela Sanguinetti, Cristina Bosco, Paolo Rosso
2020	Massive vs. Curated Embeddings for Low-Resourced Languages: the Case of Yorùbá and Twi. Jesujoba O. Alabi, Kwabena Amponsah-Kaakyire, David Ifeoluwa Adelani, Cristina España-Bonet
2020	Massively Multilingual Pronunciation Modeling with WikiPron. Jackson L. Lee, Lucas F. E. Ashby, M. Elizabeth Garza, Yeonju Lee-Sikka, Sean Miller, Alan Wong, Arya D. McCarthy, Kyle Gorman
2020	Material Philology Meets Digital Onomastic Lexicography: The NordiCon Database of Medieval Nordic Personal Names in Continental Sources. Michelle Waldispühl, Dana Dannélls, Lars Borin
2020	MathAlign: Linking Formula Identifiers to their Contextual Natural Language Descriptions. Maria Alexeeva, Rebecca Sharp, Marco Antonio Valenzuela-Escárcega, Jennifer Kadowaki, Adarsh Pyarelal, Clayton T. Morrison
2020	Measuring the Impact of Readability Features in Fake News Detection. Roney L. S. Santos, Gabriela Wick-Pedro, Sidney Evaldo Leal, Oto A. Vale, Thiago A. S. Pardo, Kalina Bontcheva, Carolina Scarton
2020	Metaphorical Expressions in Automatic Arabic Sentiment Analysis. Israa Alsiyat, Scott Piao
2020	Methodological Aspects of Developing and Managing an Etymological Lexical Resource: Introducing EtymDB-2.0. Clémentine Fourrier, Benoît Sagot
2020	Minority Positive Sampling for Switching Points - an Anecdote for the Code-Mixing Language Modeling. Arindam Chatterjere, Vineeth Guptha, Parul Chopra, Amitava Das
2020	Model-based Annotation of Coreference. Rahul Aralikatte, Anders Søgaard
2020	Modeling Dialogue in Conversational Cognitive Health Screening Interviews. Shahla Farzana, Mina Valizadeh, Natalie Parde
2020	Modeling Factual Claims with Semantic Frames. Fatma Arslan, Josue Caraballo, Damian Jimenez, Chengkai Li
2020	Modelling Etymology in LMF/TEI: The Grande Dicionário Houaiss da Língua Portuguesa Dictionary as a Use Case. Anas Fahad Khan, Laurent Romary, Ana Salgado, Jack Bowers, Mohamed Khemakhem, Toma Tasovac
2020	Modelling Narrative Elements in a Short Story: A Study on Annotation Schemes and Guidelines. Elena Mikhalkova, Timofei Protasov, Polina Sokolova, Anastasiia Bashmakova, Anastasiia Drozdova
2020	Morfessor EM+Prune: Improved Subword Segmentation with Expectation Maximization and Pruning. Stig-Arne Grönroos, Sami Virpioja, Mikko Kurimo
2020	MorphAGram, Evaluation and Framework for Unsupervised Morphological Segmentation. Ramy Eskander, Francesca Callejas, Elizabeth Nichols, Judith Klavans, Smaranda Muresan
2020	Morphological Analysis and Disambiguation for Gulf Arabic: The Interplay between Resources and Methods. Salam Khalifa, Nasser Zalmout, Nizar Habash
2020	Morphological Segmentation for Low Resource Languages. Justin Mott, Ann Bies, Stephanie M. Strassel, Jordan Kodner, Caitlin Richter, Hongzhi Xu, Mitchell Marcus
2020	Morphology-rich Alphasyllabary Embeddings. Amanuel Mersha, Stephen Wu
2020	MuDoCo: Corpus for Multidomain Coreference Resolution and Referring Expression Generation. Scott Martin, Shivani Poddar, Kartikeya Upasani
2020	MuSE: a Multimodal Dataset of Stressed Emotion. Mimansa Jaiswal, Cristian-Paul Bara, Yuanhang Luo, Mihai Burzo, Rada Mihalcea, Emily Mower Provost
2020	MuST-Cinema: a Speech-to-Subtitles corpus. Alina Karakanta, Matteo Negri, Marco Turchi
2020	MucLex: A German Lexicon for Surface Realisation. Kira Klimt, Daniel Braun, Daniela Schneider, Florian Matthes
2020	Much Ado About Nothing - Identification of Zero Copulas in Hungarian Using an NMT Model. Andrea Dömötör, Zijian Gyozo Yang, Attila Novák
2020	Multi-Staged Cross-Lingual Acoustic Model Adaption for Robust Speech Recognition in Real-World Applications - A Case Study on German Oral History Interviews. Michael Gref, Oliver Walter, Christoph Schmidt, Sven Behnke, Joachim Köhler
2020	Multi-class Hierarchical Question Classification for Multiple Choice Science Exams. Dongfang Xu, Peter A. Jansen, Jaycie Martin, Zhengnan Xie, Vikas Yadav, Harish Tayyar Madabushi, Oyvind Tafjord, Peter Clark
2020	Multi-class Multilingual Classification of Wikipedia Articles Using Extended Named Entity Tag Set. Hassan S. Shavarani, Satoshi Sekine
2020	Multi-domain Tweet Corpora for Sentiment Analysis: Resource Creation and Evaluation. Mamta, Asif Ekbal, Pushpak Bhattacharyya, Shikha Srivastava, Alka Kumar, Tista Saha
2020	Multi-lingual Mathematical Word Problem Generation using Long Short Term Memory Networks with Enhanced Input Features. Vijini Liyanage, Surangika Ranathunga
2020	MultiMWE: Building a Multi-lingual Multi-Word Expression (MWE) Parallel Corpora. Lifeng Han, Gareth J. F. Jones, Alan F. Smeaton
2020	MultiWOZ 2.1: A Consolidated Multi-Domain Dialogue Dataset with State Corrections and State Tracking Baselines. Mihail Eric, Rahul Goel, Shachi Paul, Abhishek Sethi, Sanchit Agarwal, Shuyang Gao, Adarsh Kumar, Anuj Kumar Goyal, Peter Ku, Dilek Hakkani-Tür
2020	Multilingual Corpus Creation for Multilingual Semantic Similarity Task. Mahtab Ahmed, Chahna Dixit, Robert E. Mercer, Atif Khan, Muhammad Rifayat Samee, Felipe Urra
2020	Multilingual Culture-Independent Word Analogy Datasets. Matej Ulcar, Kristiina Vaik, Jessica Lindström, Milda Dailidenaite, Marko Robnik-Sikonja
2020	Multilingual Dictionary Based Construction of Core Vocabulary. Winston Wu, Garrett Nicolai, David Yarowsky
2020	Multilingual Stance Detection in Tweets: The Catalonia Independence Corpus. Elena Zotova, Rodrigo Agerri, Manuel Núñez, German Rigau
2020	Multilingual Twitter Corpus and Baselines for Evaluating Demographic Bias in Hate Speech Recognition. Xiaolei Huang, Linzi Xing, Franck Dernoncourt, Michael J. Paul
2020	Multilingualization of Medical Terminology: Semantic and Structural Embedding Approaches. Long-Huei Chen, Kyo Kageura
2020	Multimodal Analysis of Cohesion in Multi-party Interactions. Reshmashree Bangalore Kantharaju, Caroline Langlet, Mukesh Barange, Chloé Clavel, Catherine Pelachaud
2020	Multimodal Corpus of Bidirectional Conversation of Human-human and Human-robot Interaction during fMRI Scanning. Birgit Rauchbauer, Youssef Hmamouche, Brigitte Bigi, Laurent Prévot, Magalie Ochs, Thierry Chaminade
2020	Multiple Knowledge GraphDB (MKGDB). Stefano Faralli, Paola Velardi, Farid Yusifli
2020	Multiword Expression aware Neural Machine Translation. Andrea Zaninello, Alexandra Birch
2020	Must Children be Vaccinated or not? Annotating Modal Verbs in the Vaccination Debate. Liza King, Roser Morante
2020	MyFixit: An Annotated Dataset, Annotation Tool, and Baseline Methods for Information Extraction from Repair Manuals. Nima Nabizadeh, Dorothea Kolossa, Martin Heckmann
2020	NLP Analytics in Finance with DoRe: A French 250M Tokens Corpus of Corporate Annual Reports. Corentin Masson, Patrick Paroubek
2020	NLP Scholar: A Dataset for Examining the State of NLP Research. Saif M. Mohammad
2020	NMT and PBSMT Error Analyses in English to Brazilian Portuguese Automatic Translations. Helena de Medeiros Caseli, Marcio Lima Inácio
2020	NUBes: A Corpus of Negation and Uncertainty in Spanish Clinical Texts. Salvador Lima, Naiara Pérez, Montse Cuadros, German Rigau
2020	Named Entities in Medical Case Reports: Corpus and Experiments. Sarah Schulz, Jurica Seva, Samuel Rodríguez, Malte Ostendorff, Georg Rehm
2020	Natural Language Premise Selection: Finding Supporting Statements for Mathematical Text. Deborah Ferreira, André Freitas
2020	Natural Language Processing Pipeline to Annotate Bulgarian Legislative Documents. Svetla Koeva, Nikola Obreshkov, Martin Yalamov
2020	NegBERT: A Transfer Learning Approach for Negation Detection and Scope Resolution. Aditya Khandelwal, Suraj Sawant
2020	Neural Disambiguation of Lemma and Part of Speech in Morphologically Rich Languages. José María Hoya Quecedo, Koppatz Maximilian, Roman Yangarber
2020	Neural Machine Translation for Low-Resourced Indian Languages. Himanshu Choudhary, Shivansh Rao, Rajesh Rohilla
2020	Neural Mention Detection. Juntao Yu, Bernd Bohnet, Massimo Poesio
2020	No Data to Crawl? Monolingual Corpus Creation from PDF Files of Truly low-Resource Languages in Peru. Gina Bustamante, Arturo Oncevay, Roberto Zariquiey
2020	NoEl: An Annotated Corpus for Noun Ellipsis in English. Payal Khullar, Kushal Majmundar, Manish Shrivastava
2020	Non-Linearity in Mapping Based Cross-Lingual Word Embeddings. Jiawei Zhao, Andrew Gilman
2020	NorNE: Annotating Named Entities for Norwegian. Fredrik Jørgensen, Tobias Aasmoe, Anne-Stine Ruud Husevåg, Lilja Øvrelid, Erik Velldal
2020	Norm It! Lexical Normalization for Italian and Its Downstream Effects for Dependency Parsing. Rob van der Goot, Alan Ramponi, Tommaso Caselli, Michele Cafagna, Lorenzo De Mattei
2020	ODIL_Syntax: a Free Spontaneous Spoken French Treebank Annotated with Constituent Trees. Ilaine Wang, Aurore Pelletier, Jean-Yves Antoine, Anaïs Lefeuvre-Halftermeyer
2020	OFrLex: A Computational Morphological and Syntactic Lexicon for Old French. Gaël Guibon, Benoît Sagot
2020	Object Naming in Language and Vision: A Survey and a New Dataset. Carina Silberer, Sina Zarrieß, Gemma Boleda
2020	Odi et Amo. Creating, Evaluating and Extending Sentiment Lexicons for Latin. Rachele Sprugnoli, Marco Passarotti, Daniela M. Corbetta, Andrea Peverelli
2020	Odinson: A Fast Rule-based Information Extraction Framework. Marco Antonio Valenzuela-Escárcega, Gus Hahn-Powell, Dane Bell
2020	Offensive Language Detection Using Brown Clustering. Zuoyu Tian, Sandra Kübler
2020	Offensive Language Identification in Greek. Zeses Pitenis, Marcos Zampieri, Tharindu Ranasinghe
2020	Offensive Language and Hate Speech Detection for Danish. Gudbjartur Ingi Sigurbergsson, Leon Derczynski
2020	Offensive Video Detection: Dataset and Baseline Results. Cleber Alcântara, Viviane Pereira Moreira, Diego de Vargas Feijó
2020	On Construction of the ASR-oriented Indian English Pronunciation Dictionary. Xian Huang, Xin Jin, Qike Li, Keliang Zhang
2020	On Context Span Needed for Machine Translation Evaluation. Sheila Castilho, Maja Popovic, Andy Way
2020	On The Performance of Time-Pooling Strategies for End-to-End Spoken Language Identification. João Monteiro, Jahangir Alam, Tiago H. Falk
2020	On the Correlation of Word Embedding Evaluation Metrics. François Torregrossa, Vincent Claveau, Nihel Kooli, Guillaume Gravier, Robin Allesiardo
2020	On the Creation of a Corpus for Coherence Evaluation of Discursive Units. Elham Mohammadi, Timothe Beiko, Leila Kosseim
2020	On the Formal Standardization of Terminology Resources: The Case Study of TriMED. Federica Vezzani, Giorgio Maria Di Nunzio
2020	On the Influence of Coreference Resolution on Word Embeddings in Lexical-semantic Evaluation Tasks. Alexander Henlein, Alexander Mehler
2020	On the Robustness of Unsupervised and Semi-supervised Cross-lingual Word Embedding Learning. Yerai Doval, José Camacho-Collados, Luis Espinosa Anke, Steven Schockaert
2020	One Classifier for All Ambiguous Words: Overcoming Data Sparsity by Utilizing Sense Correlations Across Words. Prafulla Kumar Choubey, Ruihong Huang
2020	Online Near-Duplicate Detection of News Articles. Simon Rodier, Dave Carter
2020	Ontology Matching Using Convolutional Neural Networks. Alexandre Bento, Amal Zouaq, Michel Gagnon
2020	Ontology-Style Relation Annotation: A Case Study. Savong Bou, Naoki Suzuki, Makoto Miwa, Yutaka Sasaki
2020	Open-source Multi-speaker Corpora of the English Accents in the British Isles. Isin Demirsahin, Oddur Kjartansson, Alexander Gutkin, Clara Rivera
2020	Open-source Multi-speaker Speech Corpora for Building Gujarati, Kannada, Malayalam, Marathi, Tamil and Telugu Speech Synthesis Systems. Fei He, Shan-Hui Cathy Chu, Oddur Kjartansson, Clara Rivera, Anna Katanova, Alexander Gutkin, Isin Demirsahin, Cibu Johny, Martin Jansche, Supheakmungkol Sarin, Knot Pipatsrisawat
2020	Opening the Romance Verbal Inflection Dataset 2.0: A CLDF lexicon. Sacha Beniamine, Martin Maiden, Erich R. Round
2020	Optimising Twitter-based Political Election Prediction with Relevance andSentiment Filters. Eric Sanders, Antal van den Bosch
2020	Optimizing Annotation Effort Using Active Learning Strategies: A Sentiment Analysis Case Study in Persian. Seyed Arad Ashrafi Asli, Behnam Sabeti, Zahra Majdabadi, Preni Golazizian, Reza Fahmi, Omid Momenzadeh
2020	OpusTools and Parallel Corpus Diagnostics. Mikko Aulamo, Umut Sulubacak, Sami Virpioja, Jörg Tiedemann
2020	Orchestrating NLP Services for the Legal Domain. Julián Moreno Schneider, Georg Rehm, Elena Montiel-Ponsoda, Víctor Rodríguez-Doncel, Artem Revenko, Sotirios Karampatakis, Maria Khvalchik, Christian Sageder, Jorge Gracia, Filippo Maganza
2020	Orthographic Codes and the Neighborhood Effect: Lessons from Information Theory. Stéphan Tulkens, Dominiek Sandra, Walter Daelemans
2020	Outbound Translation User Interface Ptakopet: A Pilot Study. Vilém Zouhar, Ondrej Bojar
2020	PACO: a Corpus to Analyze the Impact of Common Ground in Spontaneous Face-to-Face Interaction. Mary Amoyal, Béatrice Priego-Valverde, Stéphane Rauzy
2020	PATE: A Corpus of Temporal Expressions for the In-car Voice Assistant Domain. Alessandra Zarcone, Touhidul Alam, Zahra Kolagar
2020	PO-EMO: Conceptualization, Annotation, and Modeling of Aesthetic Emotions in German and English Poetry. Thomas N. Haider, Steffen Eger, Evgeny Kim, Roman Klinger, Winfried Menninghaus
2020	PST 2.0 - Corpus of Polish Spatial Texts. Michal Marcinczuk, Marcin Oleksy, Jan Wieczorek
2020	ParaPat: The Multi-Million Sentences Parallel Corpus of Patents Abstracts. Felipe Soares, Mark Stevenson, Diego Bartolomé, Anna Zaretskaya
2020	Parallel Corpus for Japanese Spoken-to-Written Style Conversion. Mana Ihori, Akihiko Takashima, Ryo Masumura
2020	Paraphrase Generation and Evaluation on Colloquial-Style Sentences. Eetu Sjöblom, Mathias Creutz, Yves Scherrer
2020	ParlVote: A Corpus for Sentiment Analysis of Political Debates. Gavin Abercrombie, Riza Batista-Navarro
2020	Parsing as Tagging. Robert Vacareanu, George Caique Gouveia Barbosa, Marco Antonio Valenzuela-Escárcega, Mihai Surdeanu
2020	PhonBank and Data Sharing: Recent Developments in European Portuguese. Ana Margarida Ramalho, Maria João Freitas, Yvan Rose
2020	PoKi: A Large Dataset of Poems by Children. Will E. Hipson, Saif M. Mohammad
2020	Populating Legal Ontologies using Semantic Role Labeling. Llio Humphreys, Guido Boella, Luigi Di Caro, Livio Robaldo, Leon van der Torre, Sepideh Ghanavati, Robert Muthuri
2020	Prague Dependency Treebank - Consolidated 1.0. Jan Hajic, Eduard Bejcek, Jaroslava Hlavácová, Marie Mikulová, Milan Straka, Jan Stepánek, Barbora Stepánková
2020	Predicting Item Survival for Multiple Choice Questions in a High-Stakes Medical Exam. Victoria Yaneva, Le An Ha, Peter Baldwin, Janet Mee
2020	Predicting Multidimensional Subjective Ratings of Children' Readings from the Speech Signals for the Automatic Assessment of Fluency. Gérard Bailly, Erika Godde, Anne-Laure Piat-Marchand, Marie-Line Bosse
2020	Predicting Ratings of Real Dialogue Participants from Artificial Data and Ratings of Human Dialogue Observers. Kallirroi Georgila, Carla Gordon, Volodymyr Yanov, David R. Traum
2020	Preparation of Bangla Speech Corpus from Publicly Available Audio & Text. Shafayat Ahmed, Nafis Sadeq, Sudipta Saha Shubha, Md. Nahidul Islam, Muhammad Abdullah Adnan, Mohammad Zuberul Islam
2020	Preserving Semantic Information from Old Dictionaries: Linking Senses of the 'Altfranzösisches Wörterbuch' to WordNet. Achim Stein
2020	Privacy by Design and Language Resources. Pawel Kamocki, Andreas Witt
2020	ProGene - A Large-scale, High-Quality Protein-Gene Annotated Benchmark Corpus. Erik Faessler, Luise Modersohn, Christina Lohr, Udo Hahn
2020	Proceedings of The 12th Language Resources and Evaluation Conference, LREC 2020, Marseille, France, May 11-16, 2020 Nicoletta Calzolari, Frédéric Béchet, Philippe Blache, Khalid Choukri, Christopher Cieri, Thierry Declerck, Sara Goggi, Hitoshi Isahara, Bente Maegaard, Joseph Mariani, Hélène Mazo, Asunción Moreno, Jan Odijk, Stelios Piperidis
2020	Processing Language Resources of Under-Resourced and Endangered Languages for the Generation of Augmentative Alternative Communication Boards. Anne Ferger
2020	Processing South Asian Languages Written in the Latin Script: the Dakshina Dataset. Brian Roark, Lawrence Wolf-Sonkin, Christo Kirov, Sabrina J. Mielke, Cibu Johny, Isin Demirsahin, Keith B. Hall
2020	Profiling-UD: a Tool for Linguistic Profiling of Texts. Dominique Brunato, Andrea Cimino, Felice Dell'Orletta, Giulia Venturi, Simonetta Montemagni
2020	Project PIAF: Building a Native French Question-Answering Dataset. Rachel Keraron, Guillaume Lancrenon, Mathilde Bras, Frédéric Allary, Gilles Moyse, Thomas Scialom, Edmundo-Pavel Soriano-Morales, Jacopo Staiano
2020	Propagate-Selector: Detecting Supporting Sentences for Question Answering via Graph Neural Networks. Seunghyun Yoon, Franck Dernoncourt, Doo Soon Kim, Trung Bui, Kyomin Jung
2020	Providing Semantic Knowledge to a Set of Pictograms for People with Disabilities: a Set of Links between WordNet and Arasaac: Arasaac-WN. Didier Schwab, Pauline Trial, Céline Vaschalde, Loïc Vial, Emmanuelle Esperança-Rodier, Benjamin Lecouteux
2020	PyVallex: A Processing System for Valency Lexicon Data. Jonathan Verner, Anna Vernerová
2020	Pártélet: A Hungarian Corpus of Propaganda Texts from the Hungarian Socialist Era. Zoltán Kmetty, Veronika Vincze, Dorottya Demszky, Orsolya Ring, Balázs Nagy, Martina Katalin Szabó
2020	Quality Estimation for Partially Subjective Classification Tasks via Crowdsourcing. Yoshinao Sato, Kouki Miyazawa
2020	Quality Focused Approach to a Learner Corpus Development. Roberts Dargis, Ilze Auzina, Kristine Levane-Petrova, Inga Kaija
2020	RDG-Map: A Multimodal Corpus of Pedagogical Human-Agent Spoken Interactions. Maike Paetzel, Deepthi Karkada, Ramesh R. Manuvinakurike
2020	REPROLANG 2020: Automatic Proficiency Scoring of Czech, English, German, Italian, and Spanish Learner Essays. Andrew Caines, Paula Buttery
2020	RKorAPClient: An R Package for Accessing the German Reference Corpus DeReKo via KorAP. Marc Kupietz, Nils Diewald, Eliza Margaretha
2020	RP-DNN: A Tweet Level Propagation Context Based Deep Neural Networks for Early Rumor Detection in Social Media. Jie Gao, Sooji Han, Xingyi Song, Fabio Ciravegna
2020	RSC: A Romanian Read Speech Corpus for Automatic Speech Recognition. Alexandru-Lucian Georgescu, Horia Cucu, Andi Buzo, Corneliu Burileanu
2020	Rad-SpatialNet: A Frame-based Resource for Fine-Grained Spatial Relations in Radiology Reports. Surabhi Datta, Morgan Ulinski, Jordan Godfrey-Stovall, Shekhar Khanpara, Roy Riascos-Castaneda, Kirk Roberts
2020	ReSiPC: a Tool for Complex Searches in Parallel Corpora. Antoni Oliver, Bojana Mikelenic
2020	Recent Developments for the Linguistic Linked Open Data Infrastructure. Thierry Declerck, John Philip McCrae, Matthias Hartung, Jorge Gracia, Christian Chiarcos, Elena Montiel-Ponsoda, Philipp Cimiano, Artem Revenko, Roser Saurí, Deirdre Lee, Stefania Racioppa, Jamal Abdul Nasir, Matthias Orlikowski, Marta Lanau-Coronas, Christian Fäth, Mariano Rico, Mohammad Fazleh Elahi, Maria Khvalchik, Meritxell González, Katharine Cooney
2020	Recognition of Implicit Geographic Movement in Text. Scott Pezanowski, Prasenjit Mitra
2020	Recognizing Semantic Relations by Combining Transformers and Fully Connected Models. Dmitri Roussinov, Serge Sharoff, Nadezhda Puchnina
2020	Recognizing Sentence-level Logical Document Structures with the Help of Context-free Grammars. Jonathan Hildebrand, Wahed Hemati, Alexander Mehler
2020	Recommendation Chart of Domains for Cross-Domain Sentiment Analysis: Findings of A 20 Domain Study. Akash Sheoran, Diptesh Kanojia, Aditya Joshi, Pushpak Bhattacharyya
2020	Reconstructing NER Corpora: a Case Study on Bulgarian. Iva Marinova, Laska Laskova, Petya Osenova, Kiril Simov, Alexander Popov
2020	RedDust: a Large Reusable Dataset of Reddit User Traits. Anna Tigunova, Paramita Mirza, Andrew Yates, Gerhard Weikum
2020	Related Works in the Linguistic Data Consortium Catalog. Daniel Jaquette, Christopher Cieri, Denise DiPersio
2020	Relation between Degree of Empathy for Narrative Speech and Type of Responsive Utterance in Attentive Listening. Koichiro Ito, Masaki Murata, Tomohiro Ohno, Shigeki Matsubara
2020	Representation Learning for Unseen Words by Bridging Subwords to Semantic Networks. Yeachan Kim, Kang-Min Kim, SangKeun Lee
2020	Representing Multiword Term Variation in a Terminological Knowledge Base: a Corpus-Based Study. Pilar León Araúz, Arianne Reimerink, Melania Cabezas-García
2020	Representing Verbs with Visual Argument Vectors. Irene Sucameli, Alessandro Lenci
2020	Reproducing Monolingual, Multilingual and Cross-Lingual CEFR Predictions. Yves Bestgen
2020	Reproducing Neural Ensemble Classifier for Semantic Relation Extraction inScientific Papers. Kyeongmin Rim, Jingxuan Tu, Kelley Lynch, James Pustejovsky
2020	Reproducing a Morphosyntactic Tagger with a Meta-BiLSTM Model over Context Sensitive Token Encodings. Yung Han Khoe
2020	Reproduction and Replication: A Case Study with Automatic Essay Scoring. Eva Huber, Çagri Çöltekin
2020	Reproduction and Revival of the Argument Reasoning Comprehension Task. João António Rodrigues, Ruben Branco, João Silva, António Branco
2020	Resources in Underrepresented Languages: Building a Representative Romanian Corpus. Ludmila Midrigan-Ciochina, Victoria Boyd, Lucila Sanchez-Ortega, Diana Malancea-Malac, Doina Midrigan, David P. Corina
2020	Rhythmic Proximity Between Natives And Learners Of French - Evaluation of a metric based on the CEFC corpus. Sylvain Coulange, Solange Rossato
2020	RiQuA: A Corpus of Rich Quotation Annotation for English Literary Text. Sean Papay, Sebastian Padó
2020	Rigor Mortis: Annotating MWEs with a Gamified Platform. Karën Fort, Bruno Guillaume, Yann-Alan Pilatte, Mathieu Constant, Nicolas Lefebvre
2020	SAPPHIRE: Simple Aligner for Phrasal Paraphrase with Hierarchical Representation. Masato Yoshinaka, Tomoyuki Kajiwara, Yuki Arase
2020	SC-CoMIcs: A Superconductivity Corpus for Materials Informatics. Kyosuke Yamaguchi, Ryoji Asahi, Yutaka Sasaki
2020	SEDAR: a Large Scale French-English Financial Domain Parallel Corpus. Abbas Ghaddar, Philippe Langlais
2020	SENCORPUS: A French-Wolof Parallel Corpus. Elhadji Mamadou Nguer, Alla Lo, Cheikh M. Bamba Dione, Sileye O. Ba, Moussa Lo
2020	SHR++: An Interface for Morpho-syntactic Annotation of Sanskrit Corpora. Amrith Krishna, Shiv Vidhyut, Dilpreet Chawla, Sruti Sambhavi, Pawan Goyal
2020	SLäNDa: An Annotated Corpus of Narrative and Dialogue in Swedish Literary Fiction. Sara Stymne, Carin Östman
2020	SMASH Corpus: A Spontaneous Speech Corpus Recording Third-person Audio Commentaries on Gameplay. Yuki Saito, Shinnosuke Takamichi, Hiroshi Saruwatari
2020	SOLO: A Corpus of Tweets for Examining the State of Being Alone. Svetlana Kiritchenko, Will E. Hipson, Robert J. Coplan, Saif M. Mohammad
2020	SQuAD2-CR: Semi-supervised Annotation for Cause and Rationales for Unanswerability in SQuAD 2.0. Gyeongbok Lee, Seung-won Hwang, Hyunsouk Cho
2020	Samrómur: Crowd-sourcing Data Collection for Icelandic Speech Recognition. David Erik Mollberg, Ólafur Helgi Jónsson, Sunneva THorsteinsdóttir, Steinþór Steingrímsson, Eydís Huld Magnúsdóttir, Jón Guðnason
2020	ScholarlyRead: A New Dataset for Scientific Article Reading Comprehension. Tanik Saikh, Asif Ekbal, Pushpak Bhattacharyya
2020	ScienceExamCER: A High-Density Fine-Grained Science-Domain Corpus for Common Entity Recognition. Hannah Smith, Zeyu Zhang, John Culnan, Peter Jansen
2020	Scientific Statement Classification over arXiv.org. Deyan Ginev, Bruce R. Miller
2020	SeCoDa: Sense Complexity Dataset. David Strohmaier, Sian Gooding, Shiva Taslimipoor, Ekaterina Kochmar
2020	Search Query Language Identification Using Weak Labeling. Ritiz Tambi, Ajinkya Kale, Tracy Holloway King
2020	Searching Brazilian Twitter for Signs of Mental Health Issues. Wesley Ramos dos Santos, Amanda M. M. Funabashi, Ivandré Paraboni
2020	SegBo: A Database of Borrowed Sounds in the World's Language. Eitan Grossman, Elad Eisen, Dmitry Nikolaev, Steven Moran
2020	Semantic Annotation for Improved Safety in Construction Work. Paul Thompson, Tim Yates, Emrah Inan, Sophia Ananiadou
2020	Semi-Automatic Construction and Refinement of an Annotated Corpus for a Deep Learning Framework for Emotion Classification. Jiajun Xu, Kyosuke Masuda, Hiromitsu Nishizaki, Fumiyo Fukumoto, Yoshimi Suzuki
2020	Semi-Supervised Tri-Training for Explicit Discourse Argument Expansion. René Knaebel, Manfred Stede
2020	Semi-supervised Deep Embedded Clustering with Anomaly Detection for Semantic Frame Induction. Zheng Xin Yong, Tiago Timponi Torrent
2020	Semi-supervised Development of ASR Systems for Multilingual Code-switched Speech in Under-resourced Languages. Astik Biswas, Emre Yilmaz, Febe de Wet, Ewald van der Westhuizen, Thomas Niesler
2020	Sense-Annotated Corpora for Word Sense Disambiguation in Multiple Languages and Domains. Bianca Scarlini, Tommaso Pasini, Roberto Navigli
2020	Sensitive Data Detection and Classification in Spanish Clinical Text: Experiments with BERT. Aitor García-Pablos, Naiara Pérez, Montse Cuadros
2020	Sentence Level Human Translation Quality Estimation with Attention-based Neural Networks. Yu Yuan, Serge Sharoff
2020	Seq2SeqPy: A Lightweight and Customizable Toolkit for Neural Sequence-to-Sequence Modeling. Raheel Qader, François Portet, Cyril Labbé
2020	Serial Speakers: a Dataset of TV Series. Xavier Bost, Vincent Labatut, Georges Linarès
2020	Seshat: a Tool for Managing and Verifying Annotation Campaigns of Audio Data. Hadrien Titeux, Rachid Riad, Xuan-Nga Cao, Nicolas Hamilakis, Kris Madden, Alejandrina Cristià, Anne-Catherine Bachoud-Lévi, Emmanuel Dupoux
2020	Shallow Discourse Annotation for Chinese TED Talks. Wanqiu Long, Xinyi Cai, James E. M. Reid, Bonnie Webber, Deyi Xiong
2020	Shallow Discourse Parsing for Under-Resourced Languages: Combining Machine Translation and Annotation Projection. Henny Sluyter-Gäthje, Peter Bourgonje, Manfred Stede
2020	SiBert: Enhanced Chinese Pre-trained Language Model with Sentence Insertion. Jiahao Chen, Chenjie Cao, Xiuyan Jiang
2020	SiNER: A Large Dataset for Sindhi Named Entity Recognition. Wazir Ali, Junyu Lu, Zenglin Xu
2020	SibLing Corpus of Russian Dialogue Speech Designed for Research on Speech Entrainment. Tatiana Kachkovskaia, Tatiana Chukaeva, Vera Evdokimova, Pavel Kholiavin, Natalia Kriakina, Daniil Kocharov, Anna Mamushina, Alla Menshikova, Svetlana Zimina
2020	Sign Language Recognition with Transformer Networks. Mathieu De Coster, Mieke Van Herreweghe, Joni Dambre
2020	SimplifyUR: Unsupervised Lexical Text Simplification for Urdu. Namoos Hayat Qasmi, Haris Bin Zia, Awais Athar, Agha Ali Raza
2020	Simplifying Coreference Chains for Dyslexic Children. Rodrigo Wilkens, Amalia Todirascu
2020	Small Town or Metropolis? Analyzing the Relationship between Population Size and Language. Amy Rechkemmer, Steven R. Wilson, Rada Mihalcea
2020	Social Web Observatory: A Platform and Method for Gathering Knowledge on Entities from Different Textual Sources. Leonidas Tsekouras, Georgios Petasis, George Giannakopoulos, Aris Kosmopoulos
2020	Some Issues with Building a Multilingual Wordnet. Francis Bond, Luís Morgado da Costa, Michael Wayne Goodman, John Philip McCrae, Ahti Lohk
2020	Spatial AMR: Expanded Spatial Annotation in the Context of a Grounded Minecraft Corpus. Julia Bonn, Martha Palmer, Zheng Cai, Kristin Wright-Bettner
2020	Spatial Multi-Arrangement for Clustering and Multi-way Similarity Dataset Construction. Olga Majewska, Diana McCarthy, Jasper J. F. van den Bosch, Nikolaus Kriegeskorte, Ivan Vulic, Anna Korhonen
2020	Speech Corpus of Ainu Folklore and End-to-end Speech Recognition for Ainu Language. Kohei Matsuura, Sei Ueno, Masato Mimura, Shinsuke Sakai, Tatsuya Kawahara
2020	SpiCE: A New Open-Access Corpus of Conversational Bilingual Speech in Cantonese and English. Khia A. Johnson, Molly Babel, Ivan Fong, Nancy Yiu
2020	Stigma Annotation Scheme and Stigmatized Language Detection in Health-Care Discussions on Social Media. Nadiya Straton, Hyeju Jang, Raymond T. Ng
2020	Stress Test Evaluation of Transformer-based Models in Natural Language Understanding Tasks. Carlos Aspillaga, Andrés Carvallo, Vladimir Araujo
2020	Stylometry in a Bilingual Setup. Silvie Cinková, Jan Rybicki
2020	Subjective Evaluation of Comprehensibility in Movie Interactions. Estelle I. S. Randria, Lionel Fontan, Maxime Le Coz, Isabelle Ferrané, Julien Pinquier
2020	Summarization Beyond News: The Automatically Acquired Fandom Corpora. Benjamin Hättasch, Nadja Geisler, Christian M. Meyer, Carsten Binnig
2020	Summarization Corpora of Wikipedia Articles. Dominik Frefel
2020	Swiss-AL: A Multilingual Swiss Web Corpus for Applied Linguistics. Julia Krasselt, Philipp Dressen, Matthias Fluor, Cerstin Mahlow, Klaus Rothenhäusler, Maren Runte
2020	Syntax and Semantics in a Treebank for Esperanto. Eckhard Bick
2020	Synthetic Data for English Lexical Normalization: How Close Can We Get to Manually Annotated Data? Kelly Dekker, Rob van der Goot
2020	TArC: Incrementally and Semi-Automatically Collecting a Tunisian Arabish Corpus. Elisa Gugliotta, Marco Dinarelli
2020	TDDC: Timely Disclosure Documents Corpus. Nobushige Doi, Yusuke Oda, Toshiaki Nakazawa
2020	TED-Q: TED Talks and the Questions they Evoke. Matthijs Westera, Laia Mayol, Hannah Rohde
2020	TIARA: A Tool for Annotating Discourse Relations and Sentence Reordering. Jan Wira Gotama Putra, Simone Teufel, Kana Matsumura, Takenobu Tokunaga
2020	TLT-school: a Corpus of Non Native Children Speech. Roberto Gretter, Marco Matassoni, Stefano Bannò, Daniele Falavigna
2020	TRANSLIT: A Large-scale Name Transliteration Resource. Fernando Benites, Gilbert François Duivesteijn, Pius von Däniken, Mark Cieliebak
2020	TRopBank: Turkish PropBank V2.0. Neslihan Kara, Deniz Baran Aslan, Büsra Marsan, Özge Bakay, Koray Ak, Olcay Taner Yildiz
2020	TV-AfD: An Imperative-Annotated Corpus from The Big Bang Theory and Wikipedia's Articles for Deletion Discussions. Yimin Xiao, Zong-Ying Slaton, Lu Xiao
2020	TaPaCo: A Corpus of Sentential Paraphrases for 73 Languages. Yves Scherrer
2020	TableBank: Table Benchmark for Image-based Table Detection and Recognition. Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou, Zhoujun Li
2020	Tag Me If You Can! Semantic Annotation of Biodiversity Metadata with the QEMP Corpus and the BiodivTagger. Felicitas Löffler, Nora Abdelmageed, Samira Babalou, Pawandeep Kaur, Birgitta König-Ries
2020	Tagging Location Phrases in Text. Paul McNamee, James Mayfield, Cash Costello, Caitlyn Bishop, Shelby Anderson
2020	Target-based Sentiment Annotation in Chinese Financial News. Chaofa Yuan, Yuhan Liu, Rongdi Yin, Jun Zhang, Qinling Zhu, Ruibin Mao, Ruifeng Xu
2020	Temporal Histories of Epidemic Events (THEE): A Case Study in Temporal Annotation for Public Health. Jingcheng Niu, Victoria Ng, Gerald Penn, Erin E. Rees
2020	Text and Speech-based Tunisian Arabic Sub-Dialects Identification. Najla Ben Abdallah, Saméh Kchaou, Fethi Bougares
2020	TextAnnotator: A UIMA Based Tool for the Simultaneous and Collaborative Annotation of Texts. Giuseppe Abrami, Manuel Stoeckel, Alexander Mehler
2020	ThaiLMCut: Unsupervised Pretraining for Thai Word Segmentation. Suteera Seeha, Ivan Bilan, Liliana Mamani Sánchez, Johannes Huber, Michael Matuschek, Hinrich Schütze
2020	The ACQDIV Corpus Database and Aggregation Pipeline. Anna Jancso, Steven Moran, Sabine Stoll
2020	The ACoLi Dictionary Graph. Christian Chiarcos, Christian Fäth, Maxim Ionov
2020	The AICO Multimodal Corpus - Data Collection and Preliminary Analyses. Kristiina Jokinen
2020	The Alice Datasets: fMRI & EEG Observations of Natural Language Comprehension. Shohini Bhattasali, Jonathan Brennan, Wen-Ming Luh, Berta Franzluebbers, John T. Hale
2020	The BDCamões Collection of Portuguese Literary Documents: a Research Resource for Digital Humanities and Language Technology. Sara Grilo, Márcia Bolrinha, João Silva, Rui Vaz, António Branco
2020	The Brain-IHM Dataset: a New Resource for Studying the Brain Basis of Human-Human and Human-Machine Conversations. Magalie Ochs, Roxane Bertrand, Aurélie Goujon, Deirdre Bolger, Anne Sophie Dubarry, Philippe Blache
2020	The CLARIN Knowledge Centre for Atypical Communication Expertise. Henk van den Heuvel, Nelleke Oostdijk, Caroline F. Rowland, Paul Trilsbeek
2020	The Competitiveness Analysis of the European Language Technology Market. Andrejs Vasiljevs, Inguna Skadina, Indra Samite, Kaspars Kaulins, Eriks Ajausks, Julija Melnika, Aivars Berzins
2020	The Connection between the Text and Images of News Articles: New Insights for Multimedia Analysis. Nelleke Oostdijk, Hans van Halteren, Erkan Basar, Martha A. Larson
2020	The DAPRECO Knowledge Base: Representing the GDPR in LegalRuleML. Livio Robaldo, Cesare Bartolini, Gabriele Lenzini
2020	The DReaM Corpus: A Multilingual Annotated Corpus of Grammars for the World's Languages. Shafqat Mumtaz Virk, Harald Hammarström, Markus Forsberg, Søren Wichmann
2020	The Design and Construction of a Chinese Sarcasm Dataset. Xiaochang Gong, Qin Zhao, Jun Zhang, Ruibin Mao, Ruifeng Xu
2020	The Discussion Tracker Corpus of Collaborative Argumentation. Christopher Olshefski, Luca Lugini, Ravneet Singh, Diane J. Litman, Amanda Godley
2020	The EDGeS Diachronic Bible Corpus. Gerlof Bouma, Evie Coussé, Trude Dijkstra, Nicoline van der Sijs
2020	The European Language Technology Landscape in 2020: Language-Centric and Human-Centric AI for Cross-Cultural Communication in Multilingual Europe. Georg Rehm, Katrin Marheinecke, Stefanie Hegele, Stelios Piperidis, Kalina Bontcheva, Jan Hajic, Khalid Choukri, Andrejs Vasiljevs, Gerhard Backfried, Christoph Prinz, José Manuél Gómez-Pérez, Luc Meertens, Paul Lukowicz, Josef van Genabith, Andrea Lösch, Philipp Slusallek, Morten Irgens, Patrick Gatellier, Joachim Köhler, Laure Le Bars, Dimitra Anastasiou, Albina Auksoriute, Núria Bel, António Branco, Gerhard Budin, Walter Daelemans, Koenraad De Smedt, Radovan Garabík, Maria Gavriilidou, Dagmar Gromann, Svetla Koeva, Simon Krek, Cvetana Krstev, Krister Lindén, Bernardo Magnini, Jan Odijk, Maciej Ogrodniczuk, Eiríkur Rögnvaldsson, Mike Rosner, Bolette S. Pedersen, Inguna Skadina, Marko Tadic, Dan Tufis, Tamás Váradi, Kadri Vider, Andy Way, François Yvon
2020	The FISKMÖ Project: Resources and Tools for Finnish-Swedish Machine Translation and Cross-Linguistic Research. Jörg Tiedemann, Tommi Nieminen, Mikko Aulamo, Jenna Kanerva, Akseli Leino, Filip Ginter, Niko Papula
2020	The ISO Standard for Dialogue Act Annotation, Second Edition. Harry Bunt, Volha Petukhova, Emer Gilmartin, Catherine Pelachaud, Alex Chengyu Fang, Simon Keizer, Laurent Prévot
2020	The JDDC Corpus: A Large-Scale Multi-Turn Chinese Dialogue Dataset for E-commerce Customer Service. Meng Chen, Ruixue Liu, Lei Shen, Shaozu Yuan, Jingyan Zhou, Youzheng Wu, Xiaodong He, Bowen Zhou
2020	The Johns Hopkins University Bible Corpus: 1600+ Tongues for Typological Exploration. Arya D. McCarthy, Rachel Wicks, Dylan Lewis, Aaron Mueller, Winston Wu, Oliver Adams, Garrett Nicolai, Matt Post, David Yarowsky
2020	The Language of Brain Signals: Natural Language Processing of Electroencephalography Reports. Ramón Maldonado, Sanda M. Harabagiu
2020	The Learnability of the Annotated Input in NMT Replicating (Vanmassenhove and Way, 2018) with OpenNMT. Nicolas Ballier, Nabil Amari, Laure Merat, Jean-Baptiste Yunès
2020	The MARCELL Legislative Corpus. Tamás Váradi, Svetla Koeva, Martin Yamalov, Marko Tadic, Bálint Sass, Bartlomiej Niton, Maciej Ogrodniczuk, Piotr Pezik, Verginica Barbu Mititelu, Radu Ion, Elena Irimia, Maria Mitrofan, Vasile Florian Pais, Dan Tufis, Radovan Garabík, Simon Krek, Andraz Repar, Matjaz Rihtar, Janez Brank
2020	The MWN.PT WordNet for Portuguese: Projection, Validation, Cross-lingual Alignment and Distribution. António Branco, Sara Grilo, Márcia Bolrinha, Chakaveh Saedi, Ruben Branco, João Silva, Andreia Querido, Rita de Carvalho, Rosa Del Gaudio, Mariana Avelãs, Clara Pinto
2020	The Margarita Dialogue Corpus: A Data Set for Time-Offset Interactions and Unstructured Dialogue Systems. Alberto Chierici, Nizar Habash, Margarita Bicec
2020	The Medical Scribe: Corpus Development and Model Performance Analyses. Izhak Shafran, Nan Du, Linh Tran, Amanda Perry, Lauren Keyes, Mark Knichel, Ashley Domin, Lei Huang, Yuhui Chen, Gang Li, Mingqiu Wang, Laurent El Shafey, Hagen Soltau, Justin S. Paul
2020	The Nisvai Corpus of Oral Narrative Practices from Malekula (Vanuatu) and its Associated Language Resources. Jocelyn Aznar, Núria Gala
2020	The Nunavut Hansard Inuktitut-English Parallel Corpus 3.0 with Preliminary Machine Translation Results. Eric Joanis, Rebecca Knowles, Roland Kuhn, Samuel Larkin, Patrick Littell, Chi-kiu Lo, Darlene A. Stewart, Jeffrey Micher
2020	The Objective and Subjective Sleepiness Voice Corpora. Vincent P. Martin, Jean-Luc Rouas, Jean-Arthur Micoulaud-Franchi, Pierre Philip
2020	The Ontology of Bulgarian Dialects - Architecture and Information Retrieval. Rositsa Dekova
2020	The POTUS Corpus, a Database of Weekly Addresses for the Study of Stance in Politics and Virtual Agents. Thomas Janssoone, Kévin Bailly, Gaël Richard, Chloé Clavel
2020	The Potsdam Commentary Corpus 2.2: Extending Annotations for Shallow Discourse Parsing. Peter Bourgonje, Manfred Stede
2020	The Royal Society Corpus 6.0: Providing 300+ Years of Scientific Writing for Humanistic Study. Stefan Fischer, Jörg Knappen, Katrin Menzel, Elke Teich
2020	The Russian PropBank. Sarah R. Moeller, Irina Wagner, Martha Palmer, Kathryn Conger, Skatje Myers
2020	The SAFE-T Corpus: A New Resource for Simulated Public Safety Communications. Dana Delgado, Kevin Walker, Stephanie M. Strassel, Karen Jones, Christopher Caruso, David Graff
2020	The STEM-ECR Dataset: Grounding Scientific Entity References in STEM Scholarly Content to Authoritative Encyclopedic and Lexicographic Sources. Jennifer D'Souza, Anett Hoppe, Arthur Brack, Mohamad Yaser Jaradeh, Sören Auer, Ralph Ewerth
2020	The Treebank of Vedic Sanskrit. Oliver Hellwig, Salvatore Scarlata, Elia Ackermann, Paul Widmer
2020	The Universal Decompositional Semantics Dataset and Decomp Toolkit. Aaron Steven White, Elias Stengel-Eskin, Siddharth Vashishtha, Venkata Subrahmanyan Govindarajan, Dee Ann Reisinger, Tim Vieira, Keisuke Sakaguchi, Sheng Zhang, Francis Ferraro, Rachel Rudinger, Kyle Rawlins, Benjamin Van Durme
2020	The rJokes Dataset: a Large Scale Humor Collection. Orion Weller, Kevin D. Seppi
2020	The xtsv Framework and the Twelve Virtues of Pipelines. Balázs Indig, Bálint Sass, Iván Mittelholcz
2020	TheRuSLan: Database of Russian Sign Language. Ildar Kagirov, Denis Ivanko, Dmitry Ryumin, Alexander A. Petrovsky, Alexey Karpov
2020	ThemePro: A Toolkit for the Analysis of Thematic Progression. Mónica Domínguez, Juan Soler Company, Leo Wanner
2020	Time-Aware Word Embeddings for Three Lebanese News Archives. Jad Doughman, Fatima Abu Salem, Shady Elbassuoni
2020	To Case or not to case: Evaluating Casing Methods for Neural Machine Translation. Thierry Etchegoyhen, Harritxu Gete
2020	TopicNet: Making Additive Regularisation for Topic Modelling Accessible. Victor Bulatov, Vasiliy Alekseev, Konstantin V. Vorontsov, Darya Polyudova, Eugenia Veselova, Alexey Goncharov, Evgeniy S. Egorov
2020	Toward Qualitative Evaluation of Embeddings for Arabic Sentiment Analysis. Amira Barhoumi, Nathalie Camelin, Chafik Aloulou, Yannick Estève, Lamia Hadrich Belguith
2020	Toward a Paradigm Shift in Collection of Learner Corpora. Anisia Katinskaia, Sardana Ivanova, Roman Yangarber
2020	Towards Building an Automatic Transcription System for Language Documentation: Experiences from Muyu. Alexander Zahrer, Andrej Zgank, Barbara Schuppler
2020	Towards Computational Resource Grammars for Runyankore and Rukiga. David Bamutura, Peter Ljunglöf, Peter Nebende
2020	Towards Data-driven Ontologies: a Filtering Approach using Keywords and Natural Language Constructs. Maaike de Boer, Jack P. C. Verhoosel
2020	Towards Entity Spaces. Marieke van Erp, Paul Groth
2020	Towards Few-Shot Event Mention Retrieval: An Evaluation Framework and A Siamese Network Approach. Bonan Min, Yee Seng Chan, Lingjun Zhao
2020	Towards Flexible Cross-Resource Exploitation of Heterogeneous Language Documentation Data. Daniel Jettka, Timm Lehmberg
2020	Towards Interactive Annotation for Hesitation in Conversational Speech. Jane Wottawa, Marie Tahon, Apolline Marin, Nicolas Audibert
2020	Towards a Corsican Basic Language Resource Kit. Laurent Kevers, Stella Retali-Medori
2020	Towards a Gold Standard for Evaluating Danish Word Embeddings. Nina Schneidermann, Rasmus Hvingelby, Bolette S. Pedersen
2020	Towards a Reliable and Robust Methodology for Crowd-Based Subjective Quality Assessment of Query-Based Extractive Text Summarization. Neslihan Iskender, Tim Polzehl, Sebastian Möller
2020	Towards a Semi-Automatic Detection of Reflexive and Reciprocal Constructions and Their Representation in a Valency Lexicon. Václava Kettnerová, Markéta Lopatková, Anna Vernerová, Petra Barancíková
2020	Towards a Spell Checker for Zamboanga Chavacano Orthography. Marcelo Yuji Himoro, Antonio Pareja-Lora
2020	Towards a Versatile Medical-Annotation Guideline Feasible Without Heavy Medical Knowledge: Starting From Critical Lung Diseases. Shuntaro Yada, Ayami Joh, Ribeka Tanaka, Fei Cheng, Eiji Aramaki, Sadao Kurohashi
2020	Towards the Conversion of National Corpus of Polish to Universal Dependencies. Alina Wróblewska
2020	Towards the Necessity for Debiasing Natural Language Inference Datasets. Mithun Paul Panenghat, Sandeep Suntwal, Faiz Rafique, Rebecca Sharp, Mihai Surdeanu
2020	Toxic, Hateful, Offensive or Abusive? What Are We Really Classifying? An Empirical Analysis of Hate Speech Datasets. Paula Fortuna, Juan Soler Company, Leo Wanner
2020	Training a Broad-Coverage German Sentiment Classification Model for Dialog Systems. Oliver Guhr, Anne-Kathrin Schumann, Frank Bahrmann, Hans-Joachim Böhme
2020	Training a Swedish Constituency Parser on Six Incompatible Treebanks. Richard Johansson, Yvonne Adesam
2020	Transfer Learning from Transformers to Fake News Challenge Stance Detection (FNC-1) Task. Valeriya Slovikovskaya, Giuseppe Attardi
2020	Treating Dialogue Quality Evaluation as an Anomaly Detection Problem. Rostislav Nedelchev, Ricardo Usbeck, Jens Lehmann
2020	Treebanking User-Generated Content: A Proposal for a Unified Representation in Universal Dependencies. Manuela Sanguinetti, Cristina Bosco, Lauren Cassidy, Özlem Çetinoglu, Alessandra Teresa Cignarella, Teresa Lynn, Ines Rehbein, Josef Ruppenhofer, Djamé Seddah, Amir Zeldes
2020	TutorialVQA: Question Answering Dataset for Tutorial Videos. Anthony M. Colas, Seokhwan Kim, Franck Dernoncourt, Siddhesh Gupte, Daisy Zhe Wang, Doo Soon Kim
2020	Twitter Trend Extraction: A Graph-based Approach for Tweet and Hashtag Ranking, Utilizing No-Hashtag Tweets. Zahra Majdabadi, Behnam Sabeti, Preni Golazizian, Seyed Arad Ashrafi Asli, Omid Momenzadeh, Reza Fahmi
2020	Two Huge Title and Keyword Generation Corpora of Research Articles. Erion Çano, Ondrej Bojar
2020	Typical Sentences as a Resource for Valence. Uwe Quasthoff, Lars Hellan, Erik Körner, Thomas Eckart, Dirk Goldhahn, Dorothee Beermann
2020	ULMFiT replication. Mohamed Abdellatif, Ahmed Elgammal
2020	Understanding Spatial Relations through Multiple Modalities. Soham Dan, Hangfeng He, Dan Roth
2020	Understanding User Utterances in a Dialog System for Caregiving. Yoshihiko Asao, Julien Kloetzer, Junta Mizuno, Dai Saiki, Kazuma Kadowaki, Kentaro Torisawa
2020	Understanding the Dynamics of Second Language Writing through Keystroke Logging and Complexity Contours. Elma Kerz, Fabio Pruneri, Daniel Wiechmann, Yu Qiao, Marcus Ströbel
2020	UniMorph 3.0: Universal Morphology. Arya D. McCarthy, Christo Kirov, Matteo Grella, Amrit Nidhi, Patrick Xia, Kyle Gorman, Ekaterina Vylomova, Sabrina J. Mielke, Garrett Nicolai, Miikka Silfverberg, Timofey Arkhangelskiy, Nataly Krizhanovsky, Andrew Krizhanovsky, Elena Klyachko, Alexey Sorokin, John Mansfield, Valts Ernstreits, Yuval Pinter, Cassandra L. Jacobs, Ryan Cotterell, Mans Hulden, David Yarowsky
2020	UniSent: Universal Adaptable Sentiment Lexica for 1000+ Languages. Ehsaneddin Asgari, Fabienne Braune, Benjamin Roth, Christoph Ringlstetter, Mohammad R. K. Mofrad
2020	Universal Dependencies v2: An Evergrowing Multilingual Treebank Collection. Joakim Nivre, Marie-Catherine de Marneffe, Filip Ginter, Jan Hajic, Christopher D. Manning, Sampo Pyysalo, Sebastian Schuster, Francis M. Tyers, Daniel Zeman
2020	Unsupervised Argumentation Mining in Student Essays. Isaac Persing, Vincent Ng
2020	Unsupervised Domain Adaptation of Language Models for Reading Comprehension. Kosuke Nishida, Kyosuke Nishida, Itsumi Saito, Hisako Asano, Junji Tomita
2020	Urban Dictionary Embeddings for Slang NLP Applications. Steven R. Wilson, Walid Magdy, Barbara McGillivray, Kiran Garimella, Gareth Tyson
2020	Urdu Pitch Accents and Intonation Patterns in Spontaneous Conversational Speech. Luca Rognoni, Judith Bishop, Miriam Corris, Jessica Fernando, Rosanna Smith
2020	Using Automatic Speech Recognition in Spoken Corpus Curation. Jan Gorisch, Michael Gref, Thomas Schmidt
2020	Using Crowdsourced Exercises for Vocabulary Training to Expand ConceptNet. Christos T. Rodosthenous, Verena Lyding, Federico Sangati, Alexander König, Umair ul Hassan, Lionel Nicolas, Jolita Horbacauskiene, Anisia Katinskaia, Lavinia Aparaschivei
2020	Using Deep Neural Networks with Intra- and Inter-Sentence Context to Classify Suicidal Behaviour. Xingyi Song, Johnny Downs, Sumithra Velupillai, Rachel Holden, Maxim Kikoler, Kalina Bontcheva, Rina Dutta, Angus Roberts
2020	Using Distributional Thesaurus Embedding for Co-hyponymy Detection. Abhik Jana, Nikhil Reddy Varimalla, Pawan Goyal
2020	Using Multilingual Resources to Evaluate CEFRLex for Learner Applications. Johannes Graën, David Alfter, Gerold Schneider
2020	Using the RUPEX Multichannel Corpus in a Pilot fMRI Study on Speech Disfluencies. Katerina Smirnova, Nikolay Korotaev, Yana Panikratova, Irina Lebedeva, Ekaterina Pechenkova, Olga Fedorova
2020	VICTOR: a Dataset for Brazilian Legal Documents Classification. Pedro Henrique Luz de Araujo, Teófilo Emídio de Campos, Fabricio Ataides Braz, Nilton Correia da Silva
2020	VROAV: Using Iconicity to Visually Represent Abstract Verbs. Simone Scicluna, Carlo Strapparava
2020	Variants of Vector Space Reductions for Predicting the Compositionality of English Noun Compounds. Pegah Alipoor, Sabine Schulte im Walde
2020	Varying Vector Representations and Integrating Meaning Shifts into a PageRank Model for Automatic Term Extraction. Anurag Nigam, Anna Hätty, Sabine Schulte im Walde
2020	Video Caption Dataset for Describing Human Actions in Japanese. Yutaro Shigeto, Yuya Yoshikawa, Jiaqing Lin, Akikazu Takeuchi
2020	Visual Grounding Annotation of Recipe Flow Graph. Taichi Nishimura, Suzushi Tomori, Hayato Hashimoto, Atsushi Hashimoto, Yoko Yamakata, Jun Harashima, Yoshitaka Ushiku, Shinsuke Mori
2020	Visual Modeling of Turkish Morphology. Berke Özenç, Ercan Solak
2020	WAC: A Corpus of Wikipedia Conversations for Online Abuse Detection. Noé Cecillon, Vincent Labatut, Richard Dufour, Georges Linarès
2020	WEXEA: Wikipedia EXhaustive Entity Annotation. Michael Strobl, Amine Trabelsi, Osmar R. Zaïane
2020	WIKIR: A Python Toolkit for Building a Large-scale Wikipedia-based English Information Retrieval Dataset. Jibril Frej, Didier Schwab, Jean-Pierre Chevallet
2020	WN-Salience: A Corpus of News Articles with Entity Salience Annotations. Chuan Wu, Evangelos Kanoulas, Maarten de Rijke, Wei Lu
2020	WeDH - a Friendly Tool for Building Literary Corpora Enriched with Encyclopedic Metadata. Mattia Egloff, Davide Picca
2020	What Comes First: Combining Motion Capture and Eye Tracking Data to Study the Order of Articulators in Constructed Action in Sign Language Narratives. Tommi Jantunen, Anna Puupponen, Birgitta Burger
2020	What Speakers really Mean when they Ask Questions: Classification of Intentions with a Supervised Approach. Angèle Barbedette, Iris Eshkol-Taravella
2020	When Collaborative Treebank Curation Meets Graph Grammars. Gaël Guibon, Marine Courtin, Kim Gerdes, Bruno Guillaume
2020	When Shallow is Good Enough: Automatic Assessment of Conceptual Text Complexity using Shallow Semantic Features. Sanja Stajner, Ioana Hulpus
2020	Where are we in Named Entity Recognition from Speech? Antoine Caubrière, Sophie Rosset, Yannick Estève, Antoine Laurent, Emmanuel Morin
2020	Which Evaluations Uncover Sense Representations that Actually Make Sense? Jordan L. Boyd-Graber, Fenfei Guo, Leah Findlater, Mohit Iyyer
2020	Which Model Should We Use for a Real-World Conversational Dialogue System? a Cross-Language Relevance Model or a Deep Neural Net? Seyed Hossein Alavi, Anton Leuski, David R. Traum
2020	Why Attention is Not Explanation: Surgical Intervention and Causal Reasoning about Neural Models. Christopher Grimsley, Elijah Mayfield, Julia R. S. Bursten
2020	Wiki-40B: Multilingual Language Model Dataset. Mandy Guo, Zihang Dai, Denny Vrandecic, Rami Al-Rfou
2020	WikiBank: Using Wikidata to Improve Multilingual Frame-Semantic Parsing. Cezar Sas, Meriem Beloucif, Anders Søgaard
2020	WikiPossessions: Possession Timeline Generation as an Evaluation Benchmark for Machine Reading Comprehension of Long Texts. Dhivya Chinnappa, Alexis Palmer, Eduardo Blanco
2020	Wikinflection Corpus: A (Better) Multilingual, Morpheme-Annotated Inflectional Corpus. Eleni Metheniti, Guenter Neumann
2020	Word Attribute Prediction Enhanced by Lexical Entailment Tasks. Mika Hasegawa, Tetsunori Kobayashi, Yoshihiko Hayashi
2020	Word Complexity Estimation for Japanese Lexical Simplification. Daiki Nishihara, Tomoyuki Kajiwara
2020	Word Embedding Evaluation for Sinhala. Dimuthu Lakmal, Surangika Ranathunga, Saman Peramuna, Indu Herath
2020	Word Embedding Evaluation in Downstream Tasks and Semantic Analogies. Joaquim Santos, Bernardo Scapini Consoli, Renata Vieira
2020	Word Sense Disambiguation for 158 Languages using Word Embeddings Only. Varvara Logacheva, Denis Teslenko, Artem Shelmanov, Steffen Remus, Dmitry Ustalov, Andrey Kutuzov, Ekaterina Artemova, Chris Biemann, Simone Paolo Ponzetto, Alexander Panchenko
2020	Word at a Glance: Modular Word Profile Aggregator. Tomás Machálek
2020	WordWars: A Dataset to Examine the Natural Selection of Words. Saif M. Mohammad
2020	World Class Language Technology - Developing a Language Technology Strategy for Danish. Sabine Kirchmeier, Bolette S. Pedersen, Sanni Nimb, Philip Diderichsen, Peter Juel Henrichsen
2020	WorldTree V2: A Corpus of Science-Domain Structured Explanations and Inference Patterns supporting Multi-Hop Inference. Zhengnan Xie, Sebastian Thiem, Jaycie Martin, Elizabeth Wainwright, Steven Marmorstein, Peter A. Jansen
2020	Yorùbá Dependency Treebank (YTB). Olájídé Ishola, Daniel Zeman
2020	ZuCo 2.0: A Dataset of Physiological Recordings During Natural Reading and Annotation. Nora Hollenstein, Marius Troendle, Ce Zhang, Nicolas Langer
2020	wikiHowToImprove: A Resource and Analyses on Edits in Instructional Texts. Talita Anthonio, Irshad Bhat, Michael Roth
2020	word2word: A Collection of Bilingual Lexicons for 3, 564 Language Pairs. Yo Joong Choe, Kyubyong Park, Dongwoo Kim
2020	ÆTHEL: Automatically Extracted Typelogical Derivations for Dutch. Konstantinos Kogkalidis, Michael Moortgat, Richard Moot