LREC - RankMe – RankMe

729 papers

Year	Title / Authors
2018	'Aye' or 'No'? Speech-level Sentiment Analysis of Hansard UK Parliamentary Debate Transcripts. Gavin Abercrombie, Riza Batista-Navarro
2018	A 2nd Longitudinal Corpus for Children's Writing with Enhanced Output for Specific Spelling Patterns. Kay Berkling
2018	A Bird's-eye View of Language Processing Projects at the Romanian Academy. Dan Tufis, Dan Cristea
2018	A Chinese Dataset with Negative Full Forms for General Abbreviation Prediction. Yi Zhang, Xu Sun
2018	A Comparative Study of Extremely Low-Resource Transliteration of the World's Languages. Winston Wu, David Yarowsky
2018	A Comparison Of Emotion Annotation Schemes And A New Annotated Data Set. Ian D. Wood, John Philip McCrae, Vladimir Andryushechkin, Paul Buitelaar
2018	A Computational Architecture for the Morphology of Upper Tanana. Olga Lovick, Christopher Cox, Miikka Silfverberg, Antti Arppe, Mans Hulden
2018	A Context-based Approach for Dialogue Act Recognition using Simple Recurrent Neural Networks. Chandrakant Bothe, Cornelius Weber, Sven Magg, Stefan Wermter
2018	A Corpus Study and Annotation Schema for Named Entity Recognition and Relation Extraction of Business Products. Saskia Schön, Veselina Mironova, Aleksandra Gabryszak, Leonhard Hennig
2018	A Corpus for Modeling Word Importance in Spoken Dialogue Transcripts. Sushant Kafle, Matt Huenerfauth
2018	A Corpus for Multilingual Document Classification in Eight Languages. Holger Schwenk, Xian Li
2018	A Corpus of Drug Usage Guidelines Annotated with Type of Advice. Sarah Masud Preum, Md. Rizwan Parvez, Kai-Wei Chang, John A. Stankovic
2018	A Corpus of Metaphor Novelty Scores for Syntactically-Related Word Pairs. Natalie Parde, Rodney D. Nielsen
2018	A Corpus of Natural Multimodal Spatial Scene Descriptions. Ting Han, David Schlangen
2018	A Corpus of eRulemaking User Comments for Measuring Evaluability of Arguments. Joonsuk Park, Claire Cardie
2018	A Corpus to Learn Refer-to-as Relations for Nominals. Wasi Uddin Ahmad, Kai-Wei Chang
2018	A Danish FrameNet Lexicon and an Annotated Corpus Used for Training and Evaluating a Semantic Frame Classifier. Bolette S. Pedersen, Sanni Nimb, Anders Søgaard, Mareike Hartmann, Sussi Olsen
2018	A Dataset for Inter-Sentence Relation Extraction using Distant Supervision. Angrosh Mandya, Danushka Bollegala, Frans Coenen, Katie Atkinson
2018	A Deep Neural Network based Approach for Entity Extraction in Code-Mixed Indian Social Media Text. Deepak Gupta, Asif Ekbal, Pushpak Bhattacharyya
2018	A Detailed Evaluation of Neural Sequence-to-Sequence Models for In-domain and Cross-domain Text Simplification. Sanja Stajner, Sergiu Nisioi
2018	A Diachronic Corpus for Literary Style Analysis. Carmen Klaussner, Carl Vogel
2018	A Fast and Accurate Vietnamese Word Segmenter. Dat Quoc Nguyen, Dai Quoc Nguyen, Thanh Vu, Mark Dras, Mark Johnson
2018	A Fast and Flexible Webinterface for Dialect Research in the Low Countries. Roeland van Hout, Nicoline van der Sijs, Erwin Komen, Henk van den Heuvel
2018	A First South African Corpus of Multilingual Code-switched Soap Opera Speech. Ewald van der Westhuizen, Thomas Niesler
2018	A FrameNet for Cancer Information in Clinical Narratives: Schema and Annotation. Kirk Roberts, Yuqi Si, Anshul Gandhi, Elmer V. Bernstam
2018	A Framework for Multi-Language Service Design with the Language Grid. Donghui Lin, Yohei Murakami, Toru Ishida
2018	A Framework for the Needs of Different Types of Users in Multilingual Semantic Enrichment. Jan Nehring, Felix Sasaki
2018	A German Corpus for Fine-Grained Named Entity Recognition and Relation Extraction of Traffic and Industry Events. Martin Schiersch, Veselina Mironova, Maximilian Schmitt, Philippe Thomas, Aleksandra Gabryszak, Leonhard Hennig
2018	A Gold Anaphora Annotation Layer on an Eye Movement Corpus. Olga Seminck, Pascal Amsili
2018	A Gold Standard for Multilingual Automatic Term Extraction from Comparable Corpora: Term Structure and Translation Equivalents. Ayla Rigouts Terryn, Véronique Hoste, Els Lefever
2018	A High-Quality Gold Standard for Citation-based Tasks. Michael Färber, Alexander Thiemann, Adam Jatowt
2018	A Hybrid Approach for Automatic Extraction of Bilingual Multiword Expressions from Parallel Corpora. Nasredine Semmar
2018	A Japanese Corpus for Analyzing Customer Loyalty Information. Yiou Wang, Takuji Tahara
2018	A Large Automatically-Acquired All-Words List of Multiword Expressions Scored for Compositionality. Will Roberts, Markus Egg
2018	A Large Multilingual and Multi-domain Dataset for Recommender Systems. Giorgia Di Tommaso, Stefano Faralli, Paola Velardi
2018	A Large Parallel Corpus of Full-Text Scientific Articles. Felipe Soares, Viviane Pereira Moreira, Karin Becker
2018	A Large Resource of Patterns for Verbal Paraphrases. Octavian Popescu, Ngoc Phuoc An Vo, Vadim Sheinin
2018	A Large Self-Annotated Corpus for Sarcasm. Mikhail Khodak, Nikunj Saunshi, Kiran Vodrahalli
2018	A Legal Perspective on Training Models for Natural Language Processing. Richard Eckart de Castilho, Giulia Dore, Thomas Margoni, Penny Labropoulou, Iryna Gurevych
2018	A Leveled Reading Corpus of Modern Standard Arabic. Muhamed Al-Khalil, Hind Saddiki, Nizar Habash, Latifa Al-Sulaiti
2018	A Lexical Tool for Academic Writing in Spanish based on Expert and Novice Corpora. Marcos García-Salido, Marcos García, Milka Villayandre-Llamazares, Margarita Alonso Ramos
2018	A Lexicon of Discourse Markers for Portuguese - LDM-PT. Amália Mendes, Iria del Río Gayo, Manfred Stede, Felix Dombek
2018	A Lightweight Modeling Middleware for Corpus Processing. Markus Gärtner, Jonas Kuhn
2018	A Morphological Analyzer for St. Lawrence Island / Central Siberian Yupik. Emily Chen, Lane Schwartz
2018	A Morphologically Annotated Corpus of Emirati Arabic. Salam Khalifa, Nizar Habash, Fadhl Eryani, Ossama Obeid, Dana Abdulrahim, Meera Al Kaabi
2018	A Multi- versus a Single-classifier Approach for the Identification of Modality in the Portuguese Language. João Sequeira, Teresa Gonçalves, Paulo Quaresma, Amália Mendes, Iris Hendrickx
2018	A Multi-Domain Framework for Textual Similarity. A Case Study on Question-to-Question and Question-Answering Similarity Tasks. Amir Hazem, Basma El Amel Boussaha, Nicolas Hernandez
2018	A Multi-layer Annotated Corpus of Argumentative Text: From Argument Schemes to Discourse Relations. Elena Musi, Manfred Stede, Leonard Kriese, Smaranda Muresan, Andrea Rocci
2018	A Multilingual Approach to Question Classification. Aikaterini-Lida Kalouli, Katharina Kaiser, Annette Hautli-Janisz, Georg A. Kaiser, Miriam Butt
2018	A Multilingual Dataset for Evaluating Parallel Sentence Extraction from Comparable Corpora. Pierre Zweigenbaum, Serge Sharoff, Reinhard Rapp
2018	A Multilingual Test Collection for the Semantic Search of Entity Categories. Juliano Efson Sales, Siamak Barzegar, Wellington Franco, Bernhard Bermeitinger, Tiago Cunha, Brian Davis, André Freitas, Siegfried Handschuh
2018	A Multilingual Wikified Data Set of Educational Material. Iris Hendrickx, Eirini Takoulidou, Thanasis Naskos, Katia Lida Kermanidis, Vilelmini Sosoni, Hugo De Vos, Maria Stasimioti, Menno van Zaanen, Panayota Georgakopoulou, Valia Kordoni, Maja Popovic, Markus Egg, Antal van den Bosch
2018	A Multimodal Corpus for Mutual Gaze and Joint Attention in Multiparty Situated Interaction. Dimosthenis Kontogiorgos, Vanya Avramova, Simon Alexandersson, Patrik Jonell, Catharine Oertel, Jonas Beskow, Gabriel Skantze, Joakim Gustafson
2018	A Multimodal Corpus of Expert Gaze and Behavior during Phonetic Segmentation Tasks. Arif Khan, Ingmar Steiner, Yusuke Sugano, Andreas Bulling, Ross G. MacDonald
2018	A Neural Network Based Model for Loanword Identification in Uyghur. Chenggang Mi, Yating Yang, Lei Wang, Xi Zhou, Tonghai Jiang
2018	A Neural Network Model for Part-Of-Speech Tagging of Social Media Texts. Sara Meftah, Nasredine Semmar
2018	A New Annotated Portuguese/Spanish Corpus for the Multi-Sentence Compression Task. Elvys Linhares Pontes, Juan-Manuel Torres-Moreno, Stéphane Huet, Andréa Carneiro Linhares
2018	A New Corpus to Support Text Mining for the Curation of Metabolites in the ChEBI Database. Matthew Shardlow, Nhung T. H. Nguyen, Gareth I. Owen, Claire O'Donovan, Andrew Leach, John McNaught, Steve Turner, Sophia Ananiadou
2018	A New Version of the Składnica Treebank of Polish Harmonised with the Walenty Valency Dictionary. Marcin Wolinski, Elzbieta Hajnicz, Tomasz Bartosiak
2018	A Parallel Corpus of Arabic-Japanese News Articles. Go Inoue, Nizar Habash, Yuji Matsumoto, Hiroyuki Aoyama
2018	A Parser for LTAG and Frame Semantics. David Arps, Simon Petitjean
2018	A Pragmatic Approach for Classical Chinese Word Segmentation. Shilei Huang, Jiangqin Wu
2018	A Real-life, French-accented Corpus of Air Traffic Control Communications. Estelle Delpech, Marion Laignelet, Christophe Pimm, Céline Raynal, Michal Trzos, Alexandre Arnold, Dominique Pronto
2018	A Recorded Debating Dataset. Shachar Mirkin, Michal Jacovi, Tamar Lavee, Hong-Kwang Kuo, Samuel Thomas, Leslie Sager, Lili Kotlerman, Elad Venezian, Noam Slonim
2018	A Repository of Corpora for Summarization. Franck Dernoncourt, Mohammad Ghassemi, Walter Chang
2018	A Semi-autonomous System for Creating a Human-Machine Interaction Corpus in Virtual Reality: Application to the ACORFORMed System for Training Doctors to Break Bad News. Magalie Ochs, Philippe Blache, Grégoire de Montcheuil, Jean-Marie Pergandi, Jorane Saubesty, Daniel Francon, Daniel Mestre
2018	A Speaking Atlas of the Regional Languages of France. Philippe Boula de Mareüil, Albert Rilliard, Frédéric Vernier
2018	A Survey on Automatically-Constructed WordNets and their Evaluation: Lexical and Word Embedding-based Approaches. Steven Neale
2018	A Swedish Cookie-Theft Corpus. Dimitrios Kokkinakis, Kristina Lundholm Fors, Kathleen C. Fraser, Arto Nordlund
2018	A Taxonomy for In-depth Evaluation of Normalization for User Generated Content. Rob van der Goot, Rik van Noord, Gertjan van Noord
2018	A UIMA Database Interface for Managing NLP-related Text Annotations. Giuseppe Abrami, Alexander Mehler
2018	A Very Low Resource Language Speech Corpus for Computational Language Documentation Experiments. Pierre Godard, Gilles Adda, Martine Adda-Decker, Juan Benjumea, Laurent Besacier, Jamison Cooper-Leavitt, Guy-Noël Kouarata, Lori Lamel, Hélène Maynard, Markus Müller, Annie Rialland, Sebastian Stüker, François Yvon, Marcely Zanon Boito
2018	A Vietnamese Dialog Act Corpus Based on ISO 24617-2 standard. Thi-Lan Ngo, Khac Linh Pham, Hideaki Takeda
2018	A Web Service for Pre-segmenting Very Long Transcribed Speech Recordings. Nina Pörner, Florian Schiel
2018	A Web-based System for Crowd-in-the-Loop Dependency Treebanking. Stephen Tratz, Nhien Phan
2018	A Workbench for Rapid Generation of Cross-Lingual Summaries. Nisarg Jhaveri, Manish Gupta, Vasudeva Varma
2018	A corpus of German political speeches from the 21st century. Adrien Barbaresi
2018	A database of German definitory contexts from selected web sources. Adrien Barbaresi, Lothar Lemnitzer, Alexander Geyken
2018	A fine-grained error analysis of NMT, SMT and RBMT output for English-to-Dutch. Laura Van Brussel, Arda Tezcan, Lieve Macken
2018	A multilingual collection of CoNLL-U-compatible morphological lexicons. Benoît Sagot
2018	A supervised approach to taxonomy extraction using word embeddings. Rajdeep Sarkar, John Philip McCrae, Paul Buitelaar
2018	A vision-grounded dataset for predicting typical locations for verbs. Nelson Mukuze, Anna Rohrbach, Vera Demberg, Bernt Schiele
2018	A «Portrait» Approach to Multichannel Discourse. Andrej Kibrik, Olga Fedorova
2018	AET: Web-based Adjective Exploration Tool for German. Tatiana Bladier, Esther Seyffarth, Oliver Hellwig, Wiebke Petersen
2018	ANCOR-AS: Enriching the ANCOR Corpus with Syntactic Annotations. Loïc Grobol, Isabelle Tellier, Éric Villemonte de la Clergerie, Marco Dinarelli, Frédéric Landragin
2018	ASAP++: Enriching the ASAP Automated Essay Grading Dataset with Essay Attribute Scores. Sandeep Mathias, Pushpak Bhattacharyya
2018	ASR for Documenting Acutely Under-Resourced Indigenous Languages. Robert Jimerson, Emily Prud'hommeaux
2018	Abstract Meaning Representation of Constructions: The More We Include, the Better the Representation. Claire Bonial, Bianca Badarau, Kira Griffitt, Ulf Hermjakob, Kevin Knight, Tim O'Gorman, Martha Palmer, Nathan Schneider
2018	Academic-Industrial Perspective on the Development and Deployment of a Moderation System for a Newspaper Website. Dietmar Schabus, Marcin Skowron
2018	Acquiring Verb Classes Through Bottom-Up Semantic Verb Clustering. Olga Majewska, Diana McCarthy, Ivan Vulic, Anna Korhonen
2018	Action Verb Corpus. Stephanie Gross, Matthias Hirschmanner, Brigitte Krenn, Friedrich Neubarth, Michael Zillich
2018	Adapting Serious Game for Fallacious Argumentation to German: Pitfalls, Insights, and Best Practices. Ivan Habernal, Patrick Pauli, Iryna Gurevych
2018	Adding Syntactic Annotations to Flickr30k Entities Corpus for Multimodal Ambiguous Prepositional-Phrase Attachment Resolution. Sebastien Delecraz, Alexis Nasr, Frédéric Béchet, Benoît Favre
2018	Advances in Pre-Training Distributed Word Representations. Tomás Mikolov, Edouard Grave, Piotr Bojanowski, Christian Puhrsch, Armand Joulin
2018	Aggression-annotated Corpus of Hindi-English Code-mixed Data. Ritesh Kumar, Aishwarya N. Reganti, Akshit Bhatia, Tushar Maheshwari
2018	Albanian Part-of-Speech Tagging: Gold Standard and Evaluation. Besim Kabashi, Thomas Proisl
2018	All-words Word Sense Disambiguation Using Concept Embeddings. Rui Suzuki, Kanako Komiya, Masayuki Asahara, Minoru Sasaki, Hiroyuki Shinnou
2018	An Annotation Language for Semantic Search of Legal Sources. Adeline Nazarenko, François Lévy, Adam Z. Wyner
2018	An Application for Building a Polish Telephone Speech Corpus. Bartosz Ziólko, Piotr Zelasko, Ireneusz Gawlik, Tomasz Pedzimaz, Tomasz Jadczyk
2018	An Assessment of Explicit Inter- and Intra-sentential Discourse Connectives in Turkish Discourse Bank. Deniz Zeyrek, Murathan Kurfali
2018	An Attribution Relations Corpus for Political News. Edward Newell, Drew Margolin, Derek Ruths
2018	An Automatic Learning of an Algerian Dialect Lexicon by using Multilingual Word Embeddings. Karima Abidi, Kamel Smaïli
2018	An Evaluation Framework for Multimodal Interaction. Nikhil Krishnaswamy, James Pustejovsky
2018	An Information-Providing Closed-Domain Human-Agent Interaction Corpus. Jelte van Waterschoot, Guillaume Dubuisson Duplessis, Lorenzo Gatti, Merijn Bruijnes, Dirk Heylen
2018	An Initial Test Collection for Ranked Retrieval of SMS Conversations. Rashmi Sankepally, Douglas W. Oard
2018	An Integrated Formal Representation for Terminological and Lexical Data included in Classification Schemes. Thierry Declerck, Kseniya Egorova, Eileen Schnur
2018	An Integrated Representation of Linguistic and Social Functions of Code-Switching. Silvana Hartmann, Monojit Choudhury, Kalika Bali
2018	An Italian Twitter Corpus of Hate Speech against Immigrants. Manuela Sanguinetti, Fabio Poletto, Cristina Bosco, Viviana Patti, Marco Stranisci
2018	An SLA Corpus Annotated with Pedagogically Relevant Grammatical Structures. Leonardo Zilio, Rodrigo Wilkens, Cédrick Fairon
2018	An Unsupervised Word Sense Disambiguation System for Under-Resourced Languages. Dmitry Ustalov, Denis Teslenko, Alexander Panchenko, Mikhail Chernoskutov, Chris Biemann, Simone Paolo Ponzetto
2018	Analysis of Implicit Conditions in Database Search Dialogues. Shun-ya Fukunaga, Hitoshi Nishikawa, Takenobu Tokunaga, Hikaru Yokono, Tetsuro Takahashi
2018	Analyzing Citation-Distance Networks for Evaluating Publication Impact. Drahomira Herrmannova, Petr Knoth, Robert M. Patton
2018	Analyzing Middle High German Syntax with RDF and SPARQL. Christian Chiarcos, Benjamin Kosmehl, Christian Fäth, Maria Sukhareva
2018	Analyzing Vocabulary Commonality Index Using Large-scaled Database of Child Language Development. Yan Cao, Yasuhiro Minami, Yuko Okumura, Tessei Kobayashi
2018	Analyzing the Quality of Counseling Conversations: the Tell-Tale Signs of High-quality Counseling. Verónica Pérez-Rosas, Xuetong Sun, Christy Li, Yuchen Wang, Kenneth Resnicow, Rada Mihalcea
2018	Annotated Corpus of Scientific Conference's Homepages for Information Extraction. Piotr Andruszkiewicz, Rafal Hazan
2018	Annotating Abstract Meaning Representations for Spanish. Noelia Migueles-Abraira, Rodrigo Agerri, Arantza Díaz de Ilarraza
2018	Annotating Attribution Relations in Arabic. Amal Alsaif, Tasniem Alyahya, Madawi Alotaibi, Huda Abdulrahman Almuzaini, Abeer Algahtani
2018	Annotating Chinese Light Verb Constructions according to PARSEME guidelines. Menghan Jiang, Natalia Klyueva, Hongzhi Xu, Chu-Ren Huang
2018	Annotating Educational Questions for Student Response Analysis. Andreea Godea, Rodney Nielsen
2018	Annotating High-Level Structures of Short Stories and Personal Anecdotes. Boyang Li, Beth Cardier, Tong Wang, Florian Metze
2018	Annotating If the Authors of a Tweet are Located at the Locations They Tweet About. Vivek Reddy Doudagiri, Alakananda Vempala, Eduardo Blanco
2018	Annotating Modality Expressions and Event Factuality for a Japanese Chess Commentary Corpus. Suguru Matsuyoshi, Hirotaka Kameko, Yugo Murawaki, Shinsuke Mori
2018	Annotating Opinions and Opinion Targets in Student Course Feedback. Janaka Chathuranga, Shanika Ediriweera, Ravindu Hasantha, Pranidhith Munasinghe, Surangika Ranathunga
2018	Annotating Reflections for Health Behavior Change Therapy. Nishitha Guntakandla, Rodney Nielsen
2018	Annotating Spin in Biomedical Scientific Publications : the case of Random Controlled Trials (RCTs). Anna Koroleva, Patrick Paroubek
2018	Annotating Temporally-Anchored Spatial Knowledge by Leveraging Syntactic Dependencies. Alakananda Vempala, Eduardo Blanco
2018	Annotating Zero Anaphora for Question Answering. Yoshihiko Asao, Ryu Iida, Kentaro Torisawa
2018	Annotation and Analysis of Extractive Summaries for the Kyutech Corpus. Takashi Yamamura, Kazutaka Shimada
2018	Annotation and Quantitative Analysis of Speaker Information in Novel Conversation Sentences in Japanese. Makoto Yamazaki, Yumi Miyazaki, Wakako Kashino
2018	Application and Analysis of a Multi-layered Scheme for Irony on the Italian Twitter Corpus TWITTIRÒ. Alessandra Teresa Cignarella, Cristina Bosco, Viviana Patti, Mirko Lai
2018	Arabic Data Science Toolkit: An API for Arabic Language Feature Extraction. Paul Rodrigues, Valerie Novak, C. Anton Rytting, Julie Yelle, Jennifer Boutz
2018	Arabic Dialect Identification in the Context of Bivalency and Code-Switching. Mahmoud El-Haj, Paul Rayson, Mariam Aboelezz
2018	Arap-Tweet: A Large Multi-Dialect Twitter Corpus for Gender, Age and Language Variety Identification. Wajdi Zaghouani, Anis Charfi
2018	Attention for Implicit Discourse Relation Recognition. Andre Cianflone, Leila Kosseim
2018	Augmenting Image Question Answering Dataset by Exploiting Image Captions. Masashi Yokota, Hideki Nakayama
2018	Augmenting Librispeech with French Translations: A Multimodal Corpus for Direct Speech Translation Evaluation. Ali Can Kocabiyikoglu, Laurent Besacier, Olivier Kraif
2018	Author Profiling from Facebook Corpora. Fernando Hsieh, Rafael Dias, Ivandré Paraboni
2018	Auto-hMDS: Automatic Construction of a Large Heterogeneous Multilingual Multi-Document Summarization Corpus. Markus Zopf
2018	Automated Evaluation of Out-of-Context Errors. Patrick Huber, Jan Niehues, Alex Waibel
2018	Automatic Annotation of Semantic Term Types in the Complete ACL Anthology Reference Corpus. Anne-Kathrin Schumann, Héctor Martínez Alonso
2018	Automatic Enrichment of Terminological Resources: the IATE RDF Example. Mihael Arcan, Elena Montiel-Ponsoda, John Philip McCrae, Paul Buitelaar
2018	Automatic Identification of Maghreb Dialects Using a Dictionary-Based Approach. Houda Saadane, Hosni Seffih, Christian Fluhr, Khalid Choukri, Nasredine Semmar
2018	Automatic Identification of Research Fields in Scientific Papers. Eric Kergosien, Amin Farvardin, Maguelonne Teisseire, Marie-Noëlle Bessagnet, Joachim Schöpfel, Stéphane Chaudiron, Bernard Jacquemin, Annig Lacayrelle, Mathieu Roche, Christian Sallaberry, Jean-Philippe Tonneau
2018	Automatic Labeling of Problem-Solving Dialogues for Computational Microgenetic Learning Analytics. Yuanliang Meng, Anna Rumshisky, Florence R. Sullivan
2018	Automatic Prediction of Discourse Connectives. Eric Malmi, Daniele Pighin, Sebastian Krause, Mikhail Kozhevnikov
2018	Automatic Thesaurus Construction for Modern Hebrew. Chaya Liebeskind, Ido Dagan, Jonathan Schler
2018	Automatic Wordnet Mapping: from CoreNet to Princeton WordNet. Jiseong Kim, Younggyun Hahm, Sunggoo Kwon, Key-Sun Choi
2018	Automatic and Manual Web Annotations in an Infrastructure to handle Fake News and other Online Media Phenomena. Georg Rehm, Julián Moreno Schneider, Peter Bourgonje
2018	Automating Document Discovery in the Systematic Review Process: How to Use Chaff to Extract Wheat. Christopher R. Norman, Mariska M. G. Leeflang, Pierre Zweigenbaum, Aurélie Névéol
2018	BASHI: A Corpus of Wall Street Journal Articles Annotated with Bridging Links. Ina Rösiger
2018	BDPROTO: A Database of Phonological Inventories from Ancient and Reconstructed Languages. Egidio Marsico, Sébastien Flavier, Annemarie Verkerk, Steven Moran
2018	BKTreebank: Building a Vietnamese Dependency Treebank. Kiem-Hieu Nguyen
2018	BPEmb: Tokenization-free Pre-trained Subword Embeddings in 275 Languages. Benjamin Heinzerling, Michael Strube
2018	BULBasaa: A Bilingual Basaa-French Speech Corpus for the Evaluation of Language Documentation Tools. Fatima Hamlaoui, Emmanuel-Moselly Makasso, Markus Müller, Jonas Engelmann, Gilles Adda, Alex Waibel, Sebastian Stüker
2018	BabyCloud, a Technological Platform for Parents and Researchers. Xuan-Nga Cao, Cyrille Dakhlia, Patricia Del Carmen, Mohamed-Amine Jaouani, Malik Ould-Arbi, Emmanuel Dupoux
2018	Baselines and Test Data for Cross-Lingual Inference. Zeljko Agic, Natalie Schluter
2018	Beyond Generic Summarization: A Multi-faceted Hierarchical Summarization Corpus of Large Heterogeneous Data. Christopher Tauchmann, Thomas Arnold, Andreas Hanselowski, Christian M. Meyer, Margot Mieskes
2018	BiLSTM-CRF for Persian Named-Entity Recognition ArmanPersoNERCorpus: the First Entity-Annotated Persian Dataset. Hanieh Poostchi, Ehsan Zare Borzeshi, Massimo Piccardi
2018	BioRead: A New Dataset for Biomedical Reading Comprehension. Dimitris Pappas, Ion Androutsopoulos, Haris Papageorgiou
2018	BioRo: The Biomedical Corpus for the Romanian Language. Maria Mitrofan, Dan Tufis
2018	Biomedical term normalization of EHRs with UMLS. Naiara Pérez, Montse Cuadros, German Rigau
2018	BlogSet-BR: A Brazilian Portuguese Blog Corpus. Henrique D. P. dos Santos, Vinicius Woloszyn, Renata Vieira
2018	Bootstrapping Polar-Opposite Emotion Dimensions from Online Reviews. Luwen Huangfu, Mihai Surdeanu
2018	Bridging the LAPPS Grid and CLARIN. Erhard W. Hinrichs, Nancy Ide, James Pustejovsky, Jan Hajic, Marie Hinrichs, Mohammad Fazleh Elahi, Keith Suderman, Marc Verhagen, Kyeongmin Rim, Pavel Stranák, Jozef Misutka
2018	Bringing Order to Chaos: A Non-Sequential Approach for Browsing Large Sets of Found Audio Data. Per Fallgren, Zofia Malisz, Jens Edlund
2018	Browsing and Supporting Pluricentric Global Wordnet, or just your Wordnet of Interest. António Branco, Ruben Branco, Chakaveh Saedi, João Silva
2018	Browsing the Terminological Structure of a Specialized Domain: A Method Based on Lexical Functions and their Classification. Marie-Claude L'Homme, Benoît Robichaud, Nathalie Prévil
2018	Build Fast and Accurate Lemmatization for Arabic. Hamdy Mubarak
2018	Building A Handwritten Cuneiform Character Imageset. Kenji Yamauchi, Hajime Yamamoto, Wakaha Mori
2018	Building Evaluation Datasets for Cultural Microblog Retrieval. Lorraine Goeuriot, Josiane Mothe, Philippe Mulhem, Eric SanJuan
2018	Building Literary Corpora for Computational Literary Analysis - A Prototype to Bridge the Gap between CL and DH. Andrew U. Frank, Christine Ivanovic
2018	Building Named Entity Recognition Taggers via Parallel Corpora. Rodrigo Agerri, Yiling Chung, Itziar Aldabe, Nora Aranberri, Gorka Labaka, German Rigau
2018	Building Open Javanese and Sundanese Corpora for Multilingual Text-to-Speech. Jaka Aris Eko Wibawa, Supheakmungkol Sarin, Chenfang Li, Knot Pipatsrisawat, Keshan Sodimana, Oddur Kjartansson, Alexander Gutkin, Martin Jansche, Linne Ha
2018	Building Parallel Monolingual Gan Chinese Dialects Corpus. Fan Xu, Mingwen Wang, Maoxi Li
2018	Building Universal Dependency Treebanks in Korean. Jayeol Chun, Na-Rae Han, Jena D. Hwang, Jinho D. Choi
2018	Building a Constraint Grammar Parser for Plains Cree Verbs and Arguments. Katherine Schmirler, Antti Arppe, Trond Trosterud, Lene Antonsen
2018	Building a Corpus for Personality-dependent Natural Language Understanding and Generation. Ricelli Moreira Silva Ramos, Georges Basile Stavracas Neto, Bárbara Barbosa Claudino da Silva, Danielle Sampaio Monteiro, Ivandré Paraboni, Rafael Dias
2018	Building a Corpus from Handwritten Picture Postcards: Transcription, Annotation and Part-of-Speech Tagging. Kyoko Sugisaki, Nicolas Wiedmer, Heiko Hausendorf
2018	Building a Knowledge Graph from Natural Language Definitions for Interpretable Text Entailment Recognition. Vivian Dos Santos Silva, André Freitas, Siegfried Handschuh
2018	Building a List of Synonymous Words and Phrases of Japanese Compound Verbs. Kyoko Kanzaki, Hitoshi Isahara
2018	Building a Macro Chinese Discourse Treebank. Xiaomin Chu, Feng Jiang, Sheng Xu, Qiaoming Zhu
2018	Building a Morphological Treebank for German from a Linguistic Database. Petra Steiner, Josef Ruppenhofer
2018	Building a Sentiment Corpus of Tweets in Brazilian Portuguese. Henrico Bertini Brum, Maria das Graças Volpe Nunes
2018	Building a TOCFL Learner Corpus for Chinese Grammatical Error Diagnosis. Lung-Hao Lee, Yuen-Hsien Tseng, Li-Ping Chang
2018	Building a Web-Scale Dependency-Parsed Corpus from CommonCrawl. Alexander Panchenko, Eugen Ruppert, Stefano Faralli, Simone Paolo Ponzetto, Chris Biemann
2018	Building a Word Segmenter for Sanskrit Overnight. Vikas Reddy, Amrith Krishna, Vishnu Dutt Sharma, Prateek Gupta, Vineeth M. R, Pawan Goyal
2018	Building an Ellipsis-aware Chinese Dependency Treebank for Web Text. Xuancheng Ren, Xu Sun, Ji Wen, Bingzhen Wei, Weidong Zhan, Zhiyuan Zhang
2018	Building an English Vocabulary Knowledge Dataset of Japanese English-as-a-Second-Language Learners Using Crowdsourcing. Yo Ehara
2018	C-HTS: A Concept-based Hierarchical Text Segmentation approach. Mostafa Bayomi, Séamus Lawless
2018	CATS: A Tool for Customized Alignment of Text Simplification Corpora. Sanja Stajner, Marc Franco-Salvador, Paolo Rosso, Simone Paolo Ponzetto
2018	CBFC: a parallel L2 speech corpus for Korean and French learners. Hiyon Yoo, Inyoung Kim
2018	CEFR-based Lexical Simplification Dataset. Satoru Uchida, Shohei Takada, Yuki Arase
2018	CLARIN's Key Resource Families. Darja Fiser, Jakob Lenardic, Tomaz Erjavec
2018	CLARIN: Towards FAIR and Responsible Data Science Using Language Resources. Franciska de Jong, Bente Maegaard, Koenraad De Smedt, Darja Fiser, Dieter Van Uytvanck
2018	CONDUCT: An Expressive Conducting Gesture Dataset for Sound Control. Lei Chen, Sylvie Gibet, Camille Marteau
2018	CPJD Corpus: Crowdsourced Parallel Speech Corpus of Japanese Dialects. Shinnosuke Takamichi, Hiroshi Saruwatari
2018	Can Domain Adaptation be Handled as Analogies? Núria Bel, Joel Pocostales
2018	Candidate Ranking for Maintenance of an Online Dictionary. Claire Broad, Helen Langone, David Guy Brizan
2018	Carcinologic Speech Severity Index Project: A Database of Speech Disorder Productions to Assess Quality of Life Related to Speech After Cancer. Corine Astésano, Mathieu Balaguer, Jérôme Farinas, Corinne Fredouille, Pascal Gaillard, Alain Ghio, Imed Laaridh, Muriel Lalain, Benoît Lepage, Julie Mauclair, Olivier Nocaudie, Julien Pinquier, Oriol Pont, Gilles Pouchoulin, Michèle Puech, Danièle Robert, Etienne Sicard, Virginie Woisard
2018	ChAnot: An Intelligent Annotation Tool for Indigenous and Highly Agglutinative Languages in Peru. Rodolfo Mercado-Gonzales, José Pereira-Noriega, Marco Antonio Sobrevilla Cabezudo, Arturo Oncevay-Marcos
2018	Chahta Anumpa: A multimodal corpus of the Choctaw Language. Jacqueline Brixey, Eli Pincus, Ron Artstein
2018	Chats and Chunks: Annotation and Analysis of Multiparty Long Casual Conversations. Emer Gilmartin, Carl Vogel, Nick Campbell
2018	Cheating a Parser to Death: Data-driven Cross-Treebank Annotation Transfer. Djamé Seddah, Éric Villemonte de la Clergerie, Benoît Sagot, Héctor Martínez Alonso, Marie Candito
2018	Chemical Compounds Knowledge Visualization with Natural Language Processing and Linked Data. Kazunari Tanaka, Tomoya Iwakura, Yusuke Koyanagi, Noriko Ikeda, Hiroyuki Shindo, Yuji Matsumoto
2018	Chinese Relation Classification using Long Short Term Memory Networks. Linrui Zhang, Dan Moldovan
2018	Chinese-Portuguese Machine Translation: A Study on Building Parallel Corpora from Comparable Texts. Siyou Liu, Longyue Wang, Chao-Hong Liu
2018	Classification of Closely Related Sub-dialects of Arabic Using Support-Vector Machines. Samantha Wray
2018	Classifier-based Polarity Propagation in a WordNet. Jan Kocon, Arkadiusz Janz, Maciej Piasecki
2018	Classifying Sluice Occurrences in Dialogue. Austin Baird, Anissa Hamza, Daniel Hardt
2018	Classifying the Informative Behaviour of Emoji in Microblogs. Giulia Donato, Patrizia Paggio
2018	CoLoSS: Cognitive Load Corpus with Speech and Performance Data from a Symbol-Digit Dual-Task. Robert Herms, Maria Wirzberger, Maximilian Eibl, Günter Daniel Rey
2018	CoNLL-UL: Universal Morphological Lattices for Universal Dependency Parsing. Amir More, Özlem Çetinoglu, Çagri Çöltekin, Nizar Habash, Benoît Sagot, Djamé Seddah, Dima Taji, Reut Tsarfaty
2018	CogCompNLP: Your Swiss Army Knife for NLP. Daniel Khashabi, Mark Sammons, Ben Zhou, Tom Redman, Christos Christodoulopoulos, Vivek Srikumar, Nicholas Rizzolo, Lev-Arie Ratinov, Guanheng Luo, Quang Do, Chen-Tse Tsai, Subhro Roy, Stephen Mayhew, Zhili Feng, John Wieting, Xiaodong Yu, Yangqiu Song, Shashank Gupta, Shyam Upadhyay, Naveen Arivazhagan, Qiang Ning, Shaoshi Ling, Dan Roth
2018	Collecting Code-Switched Data from Social Media. Gideon Mendels, Victor Soto, Aaron Jaech, Julia Hirschberg
2018	Collecting Language Resources from Public Administrations in the Nordic and Baltic Countries. Andrejs Vasiljevs, Rihards Kalnins, Roberts Rozis, Aivars Berzins
2018	Collection and Analysis of Code-switch Egyptian Arabic-English Speech Corpus. Injy Hamed, Mohamed Elmahdy, Slim Abdennadher
2018	Collection of Multimodal Dialog Data and Analysis of the Result of Annotation of Users' Interest Level. Masahiro Araki, Sayaka Tomimasu, Mikio Nakano, Kazunori Komatani, Shogo Okada, Shinya Fujie, Hiroaki Sugiyama
2018	Combining Concepts and Their Translations from Structured Dictionaries of Uralic Minority Languages. Mika Hämäläinen, Liisa Lotta Tarvainen, Jack Rueter
2018	Combining rule-based and embedding-based approaches to normalize textual entities with an ontology. Arnaud Ferré, Louise Deléger, Pierre Zweigenbaum, Claire Nédellec
2018	Community-Driven Crowdsourcing: Data Collection with Local Developers. Christina Funk, Michael Tseng, Ravindran Rajakumar, Linne Ha
2018	Comparing Pretrained Multilingual Word Embeddings on an Ontology Alignment Task. Dagmar Gromann, Thierry Declerck
2018	Comparison of Pun Detection Methods Using Japanese Pun Corpus. Motoki Yatsu, Kenji Araki
2018	Compilation of Corpora for the Study of the Information Structure-Prosody Interface. Alicia Burga, Mónica Domínguez, Mireia Farrús, Leo Wanner
2018	Complex and Precise Movie and Book Annotations in French Language for Aspect Based Sentiment Analysis. Stefania Pecore, Jeanne Villaneau
2018	Comprehensive Annotation of Various Types of Temporal Information on the Time Axis. Tomohiro Sakaguchi, Daisuke Kawahara, Sadao Kurohashi
2018	Computer-assisted Speaker Diarization: How to Evaluate Human Corrections. Pierre-Alexandre Broux, David Doukhan, Simon Petitrenaud, Sylvain Meignier, Jean Carrive
2018	Constructing High Quality Sense-specific Corpus and Word Embedding via Unsupervised Elimination of Pseudo Multi-sense. Haoyue Shi, Xihao Wang, Yuqi Sun, Junfeng Hu
2018	Constructing a Chinese Medical Conversation Corpus Annotated with Conversational Structures and Actions. Nan Wang, Yan Song, Fei Xia
2018	Constructing a Lexicon of Relational Nouns. Edward Newell, Jackie Chi Kit Cheung
2018	Construction of English-French Multimodal Affective Conversational Corpus from TV Dramas. Sashi Novitasari, Quoc Truong Do, Sakriani Sakti, Dessi Puji Lestari, Satoshi Nakamura
2018	Construction of Large-scale English Verbal Multiword Expression Annotated Corpus. Akihiko Kato, Hiroyuki Shindo, Yuji Matsumoto
2018	Construction of a Japanese Word Similarity Dataset. Yuya Sakaizawa, Mamoru Komachi
2018	Construction of the Corpus of Everyday Japanese Conversation: An Interim Report. Hanae Koiso, Yasuharu Den, Yuriko Iseki, Wakako Kashino, Yoshiko Kawabata, Ken'ya Nishikawa, Yayoi Tanaka, Yasuyuki Usuda
2018	Content-Based Conflict of Interest Detection on Wikipedia. Orizu Udochukwu, Yulan He
2018	Contextual Dependencies in Time-Continuous Multidimensional Affect Recognition. Dmitrii Fedotov, Denis Ivanko, Maxim Sidorov, Wolfgang Minker
2018	Contextualized Usage-Based Material Selection. Dirk De Hertog, Piet Desmet
2018	Coreference Resolution in FreeLing 4.0. Montserrat Marimon, Lluís Padró, Jordi Turmo
2018	Corpora of Typical Sentences. Lydia Müller, Uwe Quasthoff, Maciej Sumalvico
2018	Corpora with Part-of-Speech Annotations for Three Regional Languages of France: Alsatian, Occitan and Picard. Delphine Bernhard, Anne-Laure Ligozat, Fanny Martin, Myriam Bras, Pierre Magistry, Marianne Vergez-Couret, Lucie Steiblé, Pascale Erhart, Nabil Hathout, Dominique Huck, Christophe Rey, Philippe Reynes, Sophie Rosset, Jean Sibille, Thomas Lavergne
2018	Corpus Building and Evaluation of Aspect-based Opinion Summaries from Tweets in Spanish. Daniel Peñaloza, Juanjosé Tenorio Peña, Rodrigo López, Héctor Gómez, Arturo Oncevay-Marcos, Marco Antonio Sobrevilla Cabezudo
2018	Correction of OCR Word Segmentation Errors in Articles from the ACL Collection through Neural Machine Translation Methods. Vivi Nastase, Julian Hitschler
2018	Creating Large-Scale Argumentation Structures for Dialogue Systems. Kazuki Sakai, Akari Inago, Ryuichiro Higashinaka, Yuichiro Yoshikawa, Hiroshi Ishiguro, Junji Tomita
2018	Creating Large-Scale Multilingual Cognate Tables. Winston Wu, David Yarowsky
2018	Creating Lithuanian and Latvian Speech Corpora from Inaccurately Annotated Web Data. Askars Salimbajevs
2018	Creating New Language and Voice Components for the Updated MaryTTS Text-to-Speech Synthesis Platform. Ingmar Steiner, Sébastien Le Maguer
2018	Creating a Translation Matrix of the Bible's Names Across 591 Languages. Winston Wu, Nidhi Vyas, David Yarowsky
2018	Creating a Verb Synonym Lexicon Based on a Parallel Corpus. Zdenka Uresová, Eva Fucíková, Eva Hajicová, Jan Hajic
2018	Creating dialect sub-corpora by clustering: a case in Japanese for an adaptive method. Yo Sato, Kevin Heffernan
2018	Creation of a Balanced State-of-the-Art Multilayer Corpus for NLU. Normunds Gruzitis, Lauma Pretkalnina, Baiba Saulite, Laura Rituma, Gunta Nespore-Berzkalne, Arturs Znotins, Peteris Paikens
2018	Cross-Document, Cross-Language Event Coreference Annotation Using Event Hoppers. Zhiyi Song, Ann Bies, Justin Mott, Xuansong Li, Stephanie M. Strassel, Christopher Caruso
2018	Cross-Lingual Generation and Evaluation of a Wide-Coverage Lexical Semantic Resource. Attila Novák, Borbála Novák
2018	Cross-checking WordNet and SUMO Using Meronymy. Javier Álvez, Itziar Gonzalez-Dios, German Rigau
2018	Cross-lingual Terminology Extraction for Translation Quality Estimation. Yu Yuan, Yuze Gao, Yue Zhang, Serge Sharoff
2018	Cross-linguistically Small World Networks are Ubiquitous in Child-directed Speech. Steven Moran, Danica Pajovic, Sabine Stoll
2018	Crowdsourced Corpus of Sentence Simplification with Core Vocabulary. Akihiro Katsuta, Kazuhide Yamamoto
2018	Crowdsourced Multimodal Corpora Collection Tool. Patrik Jonell, Catharine Oertel, Dimosthenis Kontogiorgos, Jonas Beskow, Joakim Gustafson
2018	Crowdsourcing Regional Variation Data and Automatic Geolocalisation of Speakers of European French. Jean-Philippe Goldman, Yves Scherrer, Julie Glikman, Mathieu Avanzi, Christophe Benzitoun, Philippe Boula de Mareüil
2018	Crowdsourcing-based Annotation of the Accounting Registers of the Italian Comedy. Adeline Granet, Benjamin Hervy, Geoffrey Roman-Jimenez, Marouane Hachicha, Emmanuel Morin, Harold Mouchère, Solen Quiniou, Guillaume Raschia, Françoise Rubellin, Christian Viard-Gaudin
2018	Czech Legal Text Treebank 2.0. Vincent Kríz, Barbora Hladká
2018	Czech Text Document Corpus v 2.0. Pavel Král, Ladislav Lenc
2018	DART: A Large Dataset of Dialectal Arabic Tweets. Israa Alsarsour, Esraa Mohamed, Reem Suwaileh, Tamer Elsayed
2018	Data Anonymization for Requirements Quality Analysis: a Reproducible Automatic Error Detection Task. Juyeon Kang, Jungyeul Park
2018	Data Management Plan (DMP) for Language Data under the New General Da-ta Protection Regulation (GDPR). Pawel Kamocki, Valérie Mapelli, Khalid Choukri
2018	Data-Driven Pronunciation Modeling of Swiss German Dialectal Speech for Automatic Speech Recognition. Michael Stadtschnitzer, Christoph Schmidt
2018	Dataset for the First Evaluation on Chinese Machine Reading Comprehension. Yiming Cui, Ting Liu, Zhipeng Chen, Wentao Ma, Shijin Wang, Guoping Hu
2018	DeModify: A Dataset for Analyzing Contextual Constraints on Modifier Deletion. Vivi Nastase, Devon Fritz, Anette Frank
2018	Deep JSLC: A Multimodal Corpus Collection for Data-driven Generation of Japanese Sign Language Expressions. Heike Brock, Kazuhiro Nakadai
2018	Deep Neural Networks for Coreference Resolution for Polish. Bartlomiej Niton, Pawel Morawiecki, Maciej Ogrodniczuk
2018	DeepTC - An Extension of DKPro Text Classification for Fostering Reproducibility of Deep Learning Experiments. Tobias Horsmann, Torsten Zesch
2018	Definite Description Lexical Choice: taking Speaker's Personality into account. Alex Lan, Ivandré Paraboni
2018	Delta vs. N-Gram Tracing: Evaluating the Robustness of Authorship Attribution Methods. Thomas Proisl, Stefan Evert, Fotis Jannidis, Christof Schöch, Leonard Konle, Steffen Pielström
2018	Design and Development of Speech Corpora for Air Traffic Control Training. Lubos Smídl, Jan Svec, Daniel Tihelka, Jindrich Matousek, Jan Romportl, Pavel Ircing
2018	Designing a Collaborative Process to Create Bilingual Dictionaries of Indonesian Ethnic Languages. Arbi Haza Nasution, Yohei Murakami, Toru Ishida
2018	Designing a Russian Idiom-Annotated Corpus. Katsiaryna Aharodnik, Anna Feldman, Jing Peng
2018	Developing New Linguistic Resources and Tools for the Galician Language. Rodrigo Agerri, Xavier Gómez Guinovart, German Rigau, Miguel Anxo Solla Portela
2018	Developing the Bangla RST Discourse Treebank. Debopam Das, Manfred Stede
2018	Development of a Mobile Observation Support System for Students: FishWatchr Mini. Masaya Yamaguchi, Masanori Kitamura, Naomi Yanagida
2018	Development of an Annotated Multimodal Dataset for the Investigation of Classification and Summarisation of Presentations using High-Level Paralinguistic Features. Keith Curtis, Nick Campbell, Gareth J. F. Jones
2018	Diacritics Restoration Using Neural Networks. Jakub Náplava, Milan Straka, Pavel Stranák, Jan Hajic
2018	Dialog Intent Structure: A Hierarchical Schema of Linked Dialog Acts. Silvia Pareti, Tatiana Lando
2018	Dialogue Scenario Collection of Persuasive Dialogue with Emotional Expressions via Crowdsourcing. Koichiro Yoshino, Yoko Ishikawa, Masahiro Mizukami, Yu Suzuki, Sakriani Sakti, Satoshi Nakamura
2018	Dialogue Structure Annotation for Multi-Floor Interaction. David R. Traum, Cassidy Henry, Stephanie M. Lukin, Ron Artstein, Felix Gervits, Kimberly A. Pollard, Claire Bonial, Su Lei, Clare R. Voss, Matthew Marge, Cory J. Hayes, Susan G. Hill
2018	Disambiguation of Verbal Shifters. Michael Wiegand, Sylvette Loda, Josef Ruppenhofer
2018	Discourse Coherence Through the Lens of an Annotated Text Corpus: A Case Study. Eva Hajicová, Jirí Mírovský
2018	Discovering Canonical Indian English Accents: A Crowdsourcing-based Approach. Sunayana Sitaram, Varun Manjunath, Varun Bharadwaj, Monojit Choudhury, Kalika Bali, Michael Tjalve
2018	Discovering Parallel Language Resources for Training MT Engines. Vassilis Papavassiliou, Prokopis Prokopidis, Stelios Piperidis
2018	Discovering the Language of Wine Reviews: A Text Mining Account. Els Lefever, Iris Hendrickx, Ilja Croijmans, Antal van den Bosch, Asifa Majid
2018	Discriminating between Similar Languages on Imbalanced Conversational Texts. Junqing He, Xian Huang, Xuemin Zhao, Yan Zhang, Yonghong Yan
2018	Distribution of Emotional Reactions to News Articles in Twitter. Omar Juárez-Gambino, Hiram Calvo, Consuelo Varinia García Mendoza
2018	Distributional Term Set Expansion. Amaru Cuba Gyllensten, Magnus Sahlgren
2018	Don't Annotate, but Validate: a Data-to-Text Method for Capturing Event Data. Piek Vossen, Filip Ilievski, Marten Postma, Roxane Segers
2018	Dynamic Oracle for Neural Machine Translation in Decoding Phase. Zi-Yi Dou, Hao Zhou, Shujian Huang, Xin-Yu Dai, Jiajun Chen
2018	Dysarthric speech evaluation: automatic and perceptual approaches. Imed Laaridh, Christine Meunier, Corinne Fredouille
2018	E-magyar - A Digital Language Processing System. Tamás Váradi, Eszter Simon, Bálint Sass, Iván Mittelholcz, Attila Novák, Balázs Indig, Richárd Farkas, Veronika Vincze
2018	EFLLex: A Graded Lexical Resource for Learners of English as a Foreign Language. Luise Dürlich, Thomas François
2018	EMO&LY (EMOtion and AnomaLY) : A new corpus for anomaly detection in an audiovisual stream with emotional context. Cédric Fayet, Arnaud Delhay, Damien Lolive, Pierre-François Marteau
2018	EMTC: Multilabel Corpus in Movie Domain for Emotion Analysis in Conversational Text. Duc Anh Phan, Yuji Matsumoto
2018	ES-Port: a Spontaneous Spoken Human-Human Technical Support Corpus for Dialogue Research in Spanish. Laura García-Sardiña, Manex Serras, Arantza del Pozo
2018	ESCAPE: a Large-scale Synthetic Corpus for Automatic Post-Editing. Matteo Negri, Marco Turchi, Rajen Chatterjee, Nicola Bertoldi
2018	ESCRITO - An NLP-Enhanced Educational Scoring Toolkit. Torsten Zesch, Andrea Horbach
2018	ETPC - A Paraphrase Identification Corpus Annotated with Extended Paraphrase Typology and Negation. Venelin Kovatchev, Toni Martí, Maria Salamó
2018	Edit me: A Corpus and a Framework for Understanding Natural Language Image Editing. Ramesh R. Manuvinakurike, Jacqueline Brixey, Trung Bui, Walter Chang, Doo Soon Kim, Ron Artstein, Kallirroi Georgila
2018	Effects of Gender Stereotypes on Trust and Likability in Spoken Human-Robot Interaction. Matthias Kraus, Johannes Kraus, Martin Baumann, Wolfgang Minker
2018	Elicitation protocol and material for a corpus of long prepared monologues in Sign Language. Michael Filhol, Mohamed Nassime Hadjadj
2018	EmotionLines: An Emotion Corpus of Multi-Party Conversations. Chao-Chun Hsu, Sheng-Yeh Chen, Chuan-Chun Kuo, Ting-Hao K. Huang, Lun-Wei Ku
2018	English-Basque Statistical and Neural Machine Translation. Inigo Jauregi Unanue, Lierni Garmendia Arratibel, Ehsan Zare Borzeshi, Massimo Piccardi
2018	Enhancing Modern Supervised Word Sense Disambiguation Models by Semantic Lexical Resources. Stefano Melacci, Achille Globo, Leonardo Rigutini
2018	Enhancing the AI2 Diagrams Dataset Using Rhetorical Structure Theory. Tuomo Hiippala, Serafina Orekhova
2018	Enriching Frame Representations with Distributionally Induced Senses. Stefano Faralli, Alexander Panchenko, Chris Biemann, Simone Paolo Ponzetto
2018	Enriching a Lexicon of Discourse Connectives with Corpus-based Data. Anna Feltracco, Elisabetta Jezek, Bernardo Magnini
2018	Ensemble Romanian Dependency Parsing with Neural Networks. Radu Ion, Elena Irimia, Verginica Barbu Mititelu
2018	Epitran: Precision G2P for Many Languages. David R. Mortensen, Siddharth Dalmia, Patrick Littell
2018	Errator: a Tool to Help Detect Annotation Errors in the Universal Dependencies Project. Guillaume Wisniewski
2018	Error Analysis of Uyghur Name Tagging: Language-specific Techniques and Remaining Challenges. Halidanmu Abudukelimu, Abudoukelimu Abulizi, Boliang Zhang, Xiaoman Pan, Di Lu, Heng Ji, Yang Liu
2018	Error annotation in a Learner Corpus of Portuguese. Iria del Río Gayo, Amália Mendes
2018	EuroGames16: Evaluating Change Detection in Online Conversation. Cyril Goutte, Yunli Wang, FangMing Liao, Zachary Zanussi, Samuel Larkin, Yuri Grinberg
2018	European Language Resource Coordination: Collecting Language Resources for Public Sector Multilingual Information Management. Andrea Lösch, Valérie Mapelli, Stelios Piperidis, Andrejs Vasiljevs, Lilli Smal, Thierry Declerck, Eileen Schnur, Khalid Choukri, Josef van Genabith
2018	Evaluating Domain Adaptation for Machine Translation Across Scenarios. Thierry Etchegoyhen, Anna Fernández Torné, Andoni Azpeitia, Eva Martínez Garcia, Anna Matamala
2018	Evaluating EcoLexiCAT: a Terminology-Enhanced CAT Tool. Pilar León Araúz, Arianne Reimerink
2018	Evaluating Inflectional Complexity Crosslinguistically: a Processing Perspective. Claudia Marzi, Marcello Ferro, Ouafae Nahli, Patrizia Belik, Stavros Bompolas, Vito Pirrelli
2018	Evaluating Machine Translation Performance on Chinese Idioms with a Blacklist Method. Yutong Shao, Rico Sennrich, Bonnie L. Webber, Federico Fancellu
2018	Evaluating Scoped Meaning Representations. Rik van Noord, Lasha Abzianidze, Hessel Haagsma, Johan Bos
2018	Evaluating the WordsEye Text-to-Scene System: Imaginative and Realistic Sentences. Morgan Ulinski, Bob Coyne, Julia Hirschberg
2018	Evaluation Phonemic Transcription of Low-Resource Tonal Languages for Language Documentation. Oliver Adams, Trevor Cohn, Graham Neubig, Hilaria Cruz, Steven Bird, Alexis Michaud
2018	Evaluation of Automatic Formant Trackers. Florian Schiel, Thomas Zitzelsberger
2018	Evaluation of Croatian Word Embeddings. Lukás Svoboda, Slobodan Beliga
2018	Evaluation of Dictionary Creating Methods for Finno-Ugric Minority Languages. Zsanett Ferenczi, Iván Mittelholcz, Eszter Simon, Tamás Váradi
2018	Evaluation of Domain-specific Word Embeddings using Knowledge Resources. Farhad Nooralahzadeh, Lilja Øvrelid, Jan Tore Lønning
2018	Evaluation of Feature-Space Speaker Adaptation for End-to-End Acoustic Models. Natalia A. Tomashenko, Yannick Estève
2018	Evaluation of Machine Translation Performance Across Multiple Genres and Languages. Marlies van der Wees, Arianna Bisazza, Christof Monz
2018	EventWiki: A Knowledge Base of Major Events. Tao Ge, Lei Cui, Baobao Chang, Zhifang Sui, Furu Wei, Ming Zhou
2018	Examining the Tip of the Iceberg: A Data Set for Idiom Translation. Marzieh Fadaee, Arianna Bisazza, Christof Monz
2018	Expanding Abbreviations in a Strongly Inflected Language: Are Morphosyntactic Tags Sufficient? Piotr Zelasko
2018	Experiments with Convolutional Neural Networks for Multi-Label Authorship Attribution. Dainis Boumber, Yifan Zhang, Arjun Mukherjee
2018	Expert Evaluation of a Spoken Dialogue System in a Clinical Operating Room. Juliana Miehle, Nadine Gerstenlauer, Daniel Ostler, Hubertus Feußner, Wolfgang Minker, Stefan Ultes
2018	Exploiting Pre-Ordering for Neural Machine Translation. Yang Zhao, Jiajun Zhang, Chengqing Zong
2018	Exploring Conversational Language Generation for Rich Content about Hotels. Marilyn A. Walker, Albry Smither, Shereen Oraby, Vrindavan Harrison, Hadar Shemtov
2018	Extended HowNet 2.0 - An Entity-Relation Common-Sense Representation Model. Wei-Yun Ma, Yueh-Yin Shih
2018	Extending Search System based on Interactive Visualization for Speech Corpora. Tomoko Ohsuga, Yuichi Ishimoto, Tomoko Kajiyama, Shunsuke Kozawa, Kiyotaka Uchimoto, Shuichi Itahashi
2018	Extending the gold standard for a lexical substitution task: is it worth it? Ludovic Tanguy, Cécile Fabre, Laura Rivière
2018	Extracting an English-Persian Parallel Corpus from Comparable Corpora. Akbar Karimi, Ebrahim Ansari, Bahram Sadeghi Bigham
2018	FARMI: A FrAmework for Recording Multi-Modal Interactions. Patrik Jonell, Mattias Bystedt, Per Fallgren, Dimosthenis Kontogiorgos, José Lopes, Zofia Malisz, Samuel Mascarenhas, Catharine Oertel, Eran Raveh, Todd Shore
2018	FEIDEGGER: A Multi-modal Corpus of Fashion Images and Descriptions in German. Leonidas Lefakis, Alan Akbik, Roland Vollgraf
2018	Face2Text: Collecting an Annotated Image Description Corpus for the Generation of Rich Face Descriptions. Albert Gatt, Marc Tanti, Adrian Muscat, Patrizia Paggio, Reuben A. Farrugia, Claudia Borg, Kenneth P. Camilleri, Mike Rosner, Lonneke van der Plas
2018	FastSense: An Efficient Word Sense Disambiguation Classifier. Tolga Uslu, Alexander Mehler, Daniel Baumartz, Alexander Henlein, Wahed Hemati
2018	Fine-grained Semantic Textual Similarity for Serbian. Vuk Batanovic, Milos Cvetanovic, Bosko Nikolic
2018	Finely Tuned, 2 Billion Token Based Word Embeddings for Portuguese. João Rodrigues, António Branco
2018	Finite-state morphological analysis for Gagauz. Francis M. Tyers, Sevilay Bayatli, Güllü Karanfil, Memduh Gokirmak
2018	Fluid Annotation: A Granularity-aware Annotation Tool for Chinese Word Fluidity. Shu-Kai Hsieh, Yu-Hsiang Tseng, Chih-yao Lee, Chiung-Yu Chiang
2018	FonBund: A Library for Combining Cross-lingual Phonological Segment Data. Alexander Gutkin, Martin Jansche, Tatiana Merkulova
2018	FontLex: A Typographical Lexicon based on Affective Associations. Tugba Kulahcioglu, Gerard de Melo
2018	FooTweets: A Bilingual Parallel Corpus of World Cup Tweets. Henny Sluyter-Gäthje, Pintu Lohar, Haithem Afli, Andy Way
2018	ForFun 1.0: Prague Database of Forms and Functions - An Invaluable Resource for Linguistic Research. Marie Mikulová, Eduard Bejcek
2018	FrNewsLink : a corpus linking TV Broadcast News Segments and Press Articles. Nathalie Camelin, Géraldine Damnati, Abdessalam Bouchekif, Anaïs Landeau, Delphine Charlet, Yannick Estève
2018	Framing Named Entity Linking Error Types. Adrian Brasoveanu, Giuseppe Rizzo, Philipp Kuntschik, Albert Weichselbraun, Lyndon J. B. Nixon
2018	From 'Solved Problems' to New Challenges: A Report on LDC Activities. Christopher Cieri, Mark Y. Liberman, Stephanie M. Strassel, Denise DiPersio, Jonathan Wright, Andrea Mazzucchi
2018	From Manuscripts to Archetypes through Iterative Clustering. Armin Hoenen
2018	From analysis to modeling of engagement as sequences of multimodal behaviors. Soumia Dermouche, Catherine Pelachaud
2018	Gaining and Losing Influence in Online Conversation. Arun Sharma, Tomek Strzalkowski
2018	GeCoTagger: Annotation of German Verb Complements with Conditional Random Fields. Roman Schneider, Monica Fürbacher
2018	GenDR: A Generic Deep Realizer with Complex Lexicalization. François Lareau, Florie Lambrey, Ieva Dubinskaite, Daniel Galarreta-Piquette, Maryam Nejat
2018	Generating a Gold Standard for a Swedish Sentiment Lexicon. Jacobo Rouces, Nina Tahmasebi, Lars Borin, Stian Rødven Eide
2018	Generation of a Spanish Artificial Collocation Error Corpus. Sara Rodríguez-Fernández, Roberto Carlini, Leo Wanner
2018	German Radio Interviews: The GRAIN Release of the SFB732 Silver Standard Collection. Katrin Schweitzer, Kerstin Eckart, Markus Gärtner, Agnieszka Falenska, Arndt Riester, Ina Rösiger, Antje Schweitzer, Sabrina Stehwien, Jonas Kuhn
2018	Graph Based Semi-Supervised Learning Approach for Tamil POS tagging. Mokanarangan Thayaparan, Surangika Ranathunga, Uthayasanker Thayasivam
2018	Grapheme-level Awareness in Word Embeddings for Morphologically Rich Languages. Suzi Park, Hyopil Shin
2018	Grounding Gradable Adjectives through Crowdsourcing. Rebecca Sharp, Mithun Paul, Ajay Nagesh, Dane Bell, Mihai Surdeanu
2018	Handling Big Data and Sensitive Data Using EUDAT's Generic Execution Framework and the WebLicht Workflow Engine. Claus Zinn, Wei Qui, Marie Hinrichs, Emanuel Dima, Alexandr Chernov
2018	Handling Normalization Issues for Part-of-Speech Tagging of Online Conversational Text. Géraldine Damnati, Jérémy Auguste, Alexis Nasr, Delphine Charlet, Johannes Heinecke, Frédéric Béchet
2018	Handling Rare Word Problem using Synthetic Training Data for Sinhala and Tamil Neural Machine Translation. Pasindu Tennage, Prabath Sandaruwan, Malith Thilakarathne, Achini Herath, Surangika Ranathunga
2018	HappyDB: A Corpus of 100, 000 Crowdsourced Happy Moments. Akari Asai, Sara Evensen, Behzad Golshan, Alon Y. Halevy, Vivian Li, Andrei Lopatenko, Daniela Stepanov, Yoshihiko Suhara, Wang-Chiew Tan, Yinzhan Xu
2018	HiNTS: A Tagset for Middle Low German. Fabian Barteld, Sarah Ihden, Katharina Dreessen, Ingrid Schröder
2018	Huge Automatically Extracted Training-Sets for Multilingual Word SenseDisambiguation. Tommaso Pasini, Francesco Elia, Roberto Navigli
2018	Humor Detection in English-Hindi Code-Mixed Social Media Content : Corpus and Baseline System. Ankush Khandelwal, Sahil Swami, Syed Sarfaraz Akhtar, Manish Shrivastava
2018	ILCM - A Virtual Research Infrastructure for Large-Scale Qualitative Data. Andreas Niekler, Arnim Bleier, Christian Kahmann, Lisa Posch, Gregor Wiedemann, Kenan Erdogan, Gerhard Heyer, Markus Strohmaier
2018	IPSL: A Database of Iconicity Patterns in Sign Languages. Creation and Use. Vadim Kimmelman, Anna Klezovich, George Moroz
2018	Identification of Personal Information Shared in Chat-Oriented Dialogue. Sarah Fillwock, David R. Traum
2018	Identifying Speakers and Addressees in Dialogues Extracted from Literary Fiction. Adam Ek, Mats Wirén, Robert Östling, Kristina Nilsson Björkenstam, Gintare Grigonyte, Sofia Gustafson-Capková
2018	Improved Transcription and Indexing of Oral History Interviews for Digital Humanities Research. Michael Gref, Joachim Köhler, Almut Leh
2018	Improving Crowdsourcing-Based Annotation of Japanese Discourse Relations. Yudai Kishimoto, Shinnosuke Sawada, Yugo Murawaki, Daisuke Kawahara, Sadao Kurohashi
2018	Improving Dialogue Act Classification for Spontaneous Arabic Speech and Instant Messages at Utterance Level. AbdelRahim A. Elmadany, Sherif M. Abdou, Mervat Gheith
2018	Improving Hate Speech Detection with Deep Learning Ensembles. Steven Zimmerman, Udo Kruschwitz, Chris Fox
2018	Improving Hypernymy Extraction with Distributional Semantic Classes. Alexander Panchenko, Dmitry Ustalov, Stefano Faralli, Simone Paolo Ponzetto, Chris Biemann
2018	Improving Machine Translation of Educational Content via Crowdsourcing. Maximiliana Behnke, Antonio Valerio Miceli Barone, Rico Sennrich, Vilelmini Sosoni, Thanasis Naskos, Eirini Takoulidou, Maria Stasimioti, Menno van Zaanen, Sheila Castilho, Federico Gaspari, Panayota Georgakopoulou, Valia Kordoni, Markus Egg, Katia Lida Kermanidis
2018	Improving Unsupervised Keyphrase Extraction using Background Knowledge. Yang Yu, Vincent Ng
2018	Improving a Multi-Source Neural Machine Translation Model with Corpus Extension for Low-Resource Languages. Gyu-Hyeon Choi, Jong-Hun Shin, Young Kil Kim
2018	Improving a Neural-based Tagger for Multiword Expressions Identification. Dusan Varis, Natalia Klyueva
2018	Improving domain-specific SMT for low-resourced languages using data from different domains. Fathima Farhath, Pranavan Theivendiram, Surangika Ranathunga, Sanath Jayasena, Gihan Dias
2018	Improving homograph disambiguation with supervised machine learning. Kyle Gorman, Gleb Mazovetskiy, Vitaly Nikolaev
2018	Incorporating Contextual Information for Language-Independent, Dynamic Disambiguation Tasks. Tobias Staron, Özge Alaçam, Wolfgang Menzel
2018	Incorporating Global Contexts into Sentence Embedding for Relational Extraction at the Paragraph Level with Distant Supervision. Eun-Kyung Kim, Key-Sun Choi
2018	Incorporating Semantic Attention in Video Description Generation. Natsuda Laokulrat, Naoaki Okazaki, Hideki Nakayama
2018	Increasing Argument Annotation Reproducibility by Using Inter-annotator Agreement to Improve Guidelines. Milagro Teruel, Cristian Cardellino, Fernando Cardellino, Laura Alonso Alemany, Serena Villata
2018	Increasing the Accessibility of Time-Aligned Speech Corpora with Spokes Mix. Piotr Pezik
2018	Indian Language Wordnets and their Linkages with Princeton WordNet. Diptesh Kanojia, Kevin Patel, Pushpak Bhattacharyya
2018	Indra: A Word Embedding and Semantic Relatedness Server. Juliano Efson Sales, Leonardo Souza, Siamak Barzegar, Brian Davis, André Freitas, Siegfried Handschuh
2018	Infant Word Comprehension-to-Production Index Applied to Investigation of Noun Learning Predominance Using Cross-lingual CDI database. Yasuhiro Minami, Tessei Kobayashi, Yuko Okumura
2018	Integrating Generative Lexicon Event Structures into VerbNet. Susan Windisch Brown, James Pustejovsky, Annie Zaenen, Martha Palmer
2018	Interoperability of Language-related Information: Mapping the BLL Thesaurus to Lexvo and Glottolog. Vanya Dimitrova, Christian Fäth, Christian Chiarcos, Heike Renner-Westermann, Frank Abromeit
2018	Interpersonal Relationship Labels for the CALLHOME Corpus. Denys Katerenchuk, David Guy Brizan, Andrew Rosenberg
2018	Intertextual Correspondence for Integrating Corpora. Jacky Visser, Rory Duthie, John Lawrence, Chris Reed
2018	Introducing NIEUW: Novel Incentives and Workflows for Eliciting Linguistic Data. Christopher Cieri, James Fiumara, Mark Y. Liberman, Chris Callison-Burch, Jonathan Wright
2018	Introducing a Lexicon of Verbal Polarity Shifters for English. Marc Schulder, Michael Wiegand, Josef Ruppenhofer, Stephanie Köser
2018	Introducing the CLARIN Knowledge Centre for Linguistic Diversity and Language Documentation. Hanna Hedeland, Timm Lehmberg, Felix Rau, Sophie Salffner, Mandana Seyfeddinipur, Andreas Witt
2018	Investigating the Influence of Bilingual MWU on Trainee Translation Quality. Yu Yuan, Serge Sharoff
2018	Is it worth it? Budget-related evaluation metrics for model selection. Filip Klubicka, Giancarlo D. Salton, John D. Kelleher
2018	J-MeDic: A Japanese Disease Name Dictionary based on Real Clinical Usage. Kaoru Ito, Hiroyuki Nagai, Taro Okahisa, Shoko Wakamiya, Tomohide Iwao, Eiji Aramaki
2018	JAIST Annotated Corpus of Free Conversation. Kiyoaki Shirai, Tomotaka Fukuoka
2018	JDCFC: A Japanese Dialogue Corpus with Feature Changes. Tetsuaki Nakamura, Daisuke Kawahara
2018	JESC: Japanese-English Subtitle Corpus. Reid Pryzant, Youngjoo Chung, Dan Jurafsky, Denny Britz
2018	JFCKB: Japanese Feature Change Knowledge Base. Tetsuaki Nakamura, Daisuke Kawahara
2018	Japanese Dialogue Corpus of Information Navigation and Attentive Listening Annotated with Extended ISO-24617-2 Dialogue Act Tags. Koichiro Yoshino, Hiroki Tanaka, Kyoshiro Sugiyama, Makoto Kondo, Satoshi Nakamura
2018	Joint Learning of Sense and Word Embeddings. Mohammed Alsuhaibani, Danushka Bollegala
2018	KIT-Multi: A Translation-Oriented Multilingual Embedding Corpus. Thanh-Le Ha, Jan Niehues, Matthias Sperber, Ngoc-Quan Pham, Alexander Waibel
2018	KRAUTS: A German Temporally Annotated News Corpus. Jannik Strötgen, Anne-Lyse Minard, Lukas Lange, Manuela Speranza, Bernardo Magnini
2018	KTH Tangrams: A Dataset for Research on Alignment and Conceptual Pacts in Task-Oriented Dialogue. Todd Shore, Theofronia Androulakaki, Gabriel Skantze
2018	Knowing the Author by the Company His Words Keep. Armin Hoenen, Niko Schenk
2018	Konbitzul: an MWE-specific database for Spanish-Basque. Uxoa Iñurrieta Urmeneta, Itziar Aduriz, Arantza Díaz de Ilarraza, Gorka Labaka, Kepa Sarasola
2018	Korean L2 Vocabulary Prediction: Can a Large Annotated Corpus be Used to Train Better Models for Predicting Unknown Words? Kevin P. Yancey, Yves Lepage
2018	Korean TimeBank Including Relative Temporal Information. Chae-Gyun Lim, Young-Seob Jeong, Ho-Jin Choi
2018	L1-L2 Parallel Treebank of Learner Chinese: Overused and Underused Syntactic Structures. Keying Li, John Lee
2018	LIdioms: A Multilingual Linked Idioms Data Set. Diego Moussallem, Mohamed Ahmed Sherif, Diego Esteves, Marcos Zampieri, Axel-Cyrille Ngonga Ngomo
2018	LREMap, a Song of Resources and Evaluation. Riccardo Del Gratta, Sara Goggi, Gabriella Pardelli, Nicoletta Calzolari
2018	Language Technology for Multilingual Europe: An Analysis of a Large-Scale Survey regarding Challenges, Demands, Gaps and Needs. Georg Rehm, Stefanie Hegele
2018	Language adaptation experiments via cross-lingual embeddings for related languages. Serge Sharoff
2018	Laying the Groundwork for Knowledge Base Population: Nine Years of Linguistic Resources for TAC KBP. Jeremy Getman, Joe Ellis, Stephanie M. Strassel, Zhiyi Song, Jennifer Tracey
2018	Learning Word Vectors for 157 Languages. Edouard Grave, Piotr Bojanowski, Prakhar Gupta, Armand Joulin, Tomás Mikolov
2018	Learning to Map Natural Language Statements into Knowledge Base Representations for Knowledge Base Construction. Chinho Lin, Hen-Hsen Huang, Hsin-Hsi Chen
2018	Lessons Learned: On the Challenges of Migrating a Research Data Repository from a Research Institution to a University Library. Thorsten Trippel, Claus Zinn
2018	Leveraging Lexical Resources and Constraint Grammar for Rule-Based Part-of-Speech Tagging in Welsh. Steven Neale, Kevin Donnelly, Gareth Watkins, Dawn Knight
2018	Lexical Profiling of Environmental Corpora. Patrick Drouin, Marie-Claude L'Homme, Benoît Robichaud
2018	Lexical and Semantic Features for Cross-lingual Text Reuse Classification: an Experiment in English and Latin Paraphrases. Maria Moritz, David Steding
2018	LiDo RDF: From a Relational Database to a Linked Data Graph of Linguistic Terms and Bibliographic Data. Bettina Klimek, Robert Schädlich, Dustin Kröger, Edwin Knese, Benedikt Elßmann
2018	Lightweight Grammatical Annotation in the TEI: New Perspectives. Piotr Banski, Susanne Haaf, Martin Mueller
2018	Lingmotif-lex: a Wide-coverage, State-of-the-art Lexicon for Sentiment Analysis. Antonio Moreno-Ortiz, Chantal Pérez Hernández
2018	Linguistic and Sociolinguistic Annotation of 17th Century Dutch Letters. Marijn Schraagen, Feike Dietz, Marjo van Koppen
2018	Linguistically-driven Framework for Computationally Efficient and Scalable Sign Recognition. Dimitris N. Metaxas, Mark Dilsizian, Carol Neidle
2018	Linking, Searching, and Visualizing Entities in Wikipedia. Marcus Klang, Pierre Nugues
2018	Literality and cognitive effort: Japanese and Spanish. Isabel Lacruz, Michael Carl, Masaru Yamada
2018	Live Blog Corpus for Summarization. Avinesh P. V. S., Maxime Peyrard, Christian M. Meyer
2018	Low Resource Methods for Medieval Document Sections Analysis. Petra Galuscáková, Lucie Neuzilova
2018	Low-resource Post Processing of Noisy OCR Output for Historical Corpus Digitisation. Caitlin Richter, Matthew Wickes, Deniz Beser, Mitchell Marcus
2018	M-CNER: A Corpus for Chinese Named Entity Recognition in Multi-Domains. Qi Lu, YaoSheng Yang, Zhenghua Li, Wenliang Chen, Min Zhang
2018	MADARi: A Web Interface for Joint Arabic Morphological Annotation and Spelling Correction. Ossama Obeid, Salam Khalifa, Nizar Habash, Houda Bouamor, Wajdi Zaghouani, Kemal Oflazer
2018	MCScript: A Novel Dataset for Assessing Machine Comprehension Using Script Knowledge. Simon Ostermann, Ashutosh Modi, Michael Roth, Stefan Thater, Manfred Pinkal
2018	MGAD: Multilingual Generation of Analogy Datasets. Mostafa Abdou, Artur Kulmizev, Vinit Ravishankar
2018	MIAPARLE: Online training for the discrimination of stress contrasts. Jean-Philippe Goldman, Sandra Schwab
2018	MIsA: Multilingual "IsA" Extraction from Corpora. Stefano Faralli, Els Lefever, Simone Paolo Ponzetto
2018	MMQA: A Multi-domain Multi-lingual Question-Answering Framework for English and Hindi. Deepak Gupta, Surabhi Kumari, Asif Ekbal, Pushpak Bhattacharyya
2018	MOCCA: Measure of Confidence for Corpus Analysis - Automatic Reliability Check of Transcript and Automatic Segmentation. Thomas Kisler, Florian Schiel
2018	MPST: A Corpus of Movie Plot Synopses with Tags. Sudipta Kar, Suraj Maharjan, Adrián Pastor López-Monroy, Thamar Solorio
2018	MYCanCor: A Video Corpus of spoken Malaysian Cantonese. Andreas Liesenfeld
2018	Machine Translation of Low-Resource Spoken Dialects: Strategies for Normalizing Swiss German. Pierre-Edouard Honnet, Andrei Popescu-Belis, Claudiu Musat, Michael Baeriswyl
2018	Managing Public Sector Data for Multilingual Applications Development. Stelios Piperidis, Penny Labropoulou, Miltos Deligiannis, Maria Giagkou
2018	Manual vs Automatic Bitext Extraction. Aibek Makazhanov, Bagdat Myrzakhmetov, Zhenisbek Assylbekov
2018	Manually Annotated Corpus of Polish Texts Published between 1830 and 1918. Witold Kieras, Marcin Wolinski
2018	Manzanilla: An Image Annotation Tool for TKB Building. Arianne Reimerink, Pilar León Araúz
2018	Mapping Texts to Scripts: An Entailment Study. Simon Ostermann, Hannah Seitz, Stefan Thater, Manfred Pinkal
2018	Massively Translingual Compound Analysis and Translation Discovery. Winston Wu, David Yarowsky
2018	Matics Software Suite: New Tools for Evaluation and Data Exploration. Olivier Galibert, Guillaume Bernard, Agnès Delaborde, Sabrina Lecadre, Juliette Kahn
2018	Measuring Innovation in Speech and Language Processing Publications. Joseph Mariani, Gil Francopoulo, Patrick Paroubek
2018	Medical Entity Corpus with PICO elements and Sentiment Analysis. Markus Zlabinger, Linda Andersson, Allan Hanbury, Michael Andersson, Vanessa Quasnik, Jon Brassey
2018	Medical Sentiment Analysis using Social Media: Towards building a Patient Assisted System. Shweta Yadav, Asif Ekbal, Sriparna Saha, Pushpak Bhattacharyya
2018	Metadata Collection Records for Language Resources. Henk van den Heuvel, Erwin Komen, Nelleke Oostdijk
2018	Metaphor Suggestions based on a Semantic Metaphor Repository. Gerard de Melo
2018	Mining Biomedical Publications With The LAPPS Grid. Nancy Ide, Keith Suderman, Jin-Dong Kim
2018	MirasText: An Automatically Generated Text Corpus for Persian. Behnam Sabeti, Hossein Abedi Firouzjaee, Ali Janalizadeh Choobbasti, S. H. E. Mortazavi Najafabadi, Amir Vaheb
2018	MirasVoice: A bilingual (English-Persian) speech corpus. Amir Vaheb, Ali Janalizadeh Choobbasti, Mahdi Mortazavi, Saeid Safavi, Behnam Sabeti
2018	Modeling Collaborative Multimodal Behavior in Group Dialogues: The MULTISIMO Corpus. Maria Koutsombogera, Carl Vogel
2018	Modeling French Sign Language: a proposal for a semantically compositional system. Mohamed Nassime Hadjadj, Michael Filhol, Annelies Braffort
2018	Modeling Northern Haida Verb Morphology. Jordan Lachler, Lene Antonsen, Trond Trosterud, Sjur N. Moshagen, Antti Arppe
2018	Modeling Trolling in Social Media Conversations. Luis Gerardo Mojica de la Vega, Vincent Ng
2018	Morphology Injection for English-Malayalam Statistical Machine Translation. Sreelekha S, Pushpak Bhattacharyya
2018	Moving TIGER beyond Sentence-Level. Agnieszka Falenska, Kerstin Eckart, Jonas Kuhn
2018	Multi Modal Distance - An Approach to Stemma Generation With Weighting. Armin Hoenen
2018	Multi-Dialect Arabic POS Tagging: A CRF Approach. Kareem Darwish, Hamdy Mubarak, Ahmed Abdelali, Mohamed Eldesouki, Younes Samih, Randah Alharbi, Mohammed Attia, Walid Magdy, Laura Kallmeyer
2018	Multi-layer Annotation of the Rigveda. Oliver Hellwig, Heinrich Hettrich, Ashutosh Modi, Manfred Pinkal
2018	Multi-lingual Argumentative Corpora in English, Turkish, Greek, Albanian, Croatian, Serbian, Macedonian, Bulgarian, Romanian and Arabic. Alfred Sliwa, Yuan Man, Ruishen Liu, Niravkumar Borad, Seyedeh Ziyaei, Mina Ghobadi, Firas Sabbah, Ahmet Aker
2018	MultiBooked: A Corpus of Basque and Catalan Hotel Reviews Annotated for Aspect-level Sentiment Classification. Jeremy Barnes, Toni Badia, Patrik Lambert
2018	Multilingual Dependency Parsing for Low-Resource Languages: Case Studies on North Saami and Komi-Zyrian. Kyungtae Lim, Niko Partanen, Thierry Poibeau
2018	Multilingual Extension of PDTB-Style Annotation: The Case of TED Multilingual Discourse Bank. Deniz Zeyrek, Amália Mendes, Murathan Kurfali
2018	Multilingual Multi-class Sentiment Classification Using Convolutional Neural Networks. Mohammed Attia, Younes Samih, Ali El-Kahky, Laura Kallmeyer
2018	Multilingual Parallel Corpus for Global Communication Plan. Kenji Imamura, Eiichiro Sumita
2018	Multilingual Word Segmentation: Training Many Language-Specific Tokenizers Smoothly Thanks to the Universal Dependencies Corpus. Erwan Moreau, Carl Vogel
2018	Multimodal Lexical Translation. Chiraag Lala, Lucia Specia
2018	NL2Bash: A Corpus and Semantic Parser for Natural Language Interface to the Linux Operating System. Xi Victoria Lin, Chenglong Wang, Luke Zettlemoyer, Michael D. Ernst
2018	NegPar: A parallel corpus annotated for negation. Qianchu Liu, Federico Fancellu, Bonnie L. Webber
2018	Network Features Based Co-hyponymy Detection. Abhik Jana, Pawan Goyal
2018	Neural Caption Generation for News Images. Vishwash Batra, Yulan He, George Vogiatzis
2018	Neural Models of Selectional Preferences for Implicit Semantic Role Labeling. Minh Le, Antske Fokkens
2018	New directions in ELRA activities. Valérie Mapelli, Victoria Arranz, Hélène Mazo, Pawel Kamocki, Vladimir Popescu
2018	No more beating about the bush : A Step towards Idiom Handling for Indian Language NLP. Ruchit Agrawal, Vighnesh Chenthil Kumar, Vigneshwaran Muralidaran, Dipti Misra Sharma
2018	NoReC: The Norwegian Review Corpus. Erik Velldal, Lilja Øvrelid, Eivind Alexander Bergem, Cathrine Stadsnes, Samia Touileb, Fredrik Jørgensen
2018	On the Vector Representation of Utterances in Dialogue Context. Louisa Pragst, Niklas Rach, Wolfgang Minker, Stefan Ultes
2018	One Language to rule them all: modelling Morphological Patterns in a Large Scale Italian Lexicon with SWRL. Anas Fahad Khan, Andrea Bellandi, Francesca Frontini, Monica Monachini
2018	One Sentence One Model for Neural Machine Translation. Xiaoqing Li, Jiajun Zhang, Chengqing Zong
2018	One event, many representations. Mapping action concepts through visual features. Alessandro Panunzi, Lorenzo Gregori, Andrea Amelio Ravelli
2018	Open ASR for Icelandic: Resources and a Baseline System. Anna Björk Nikulásdóttir, Inga Rún Helgadóttir, Matthías Pétursson, Jón Guðnason
2018	Open Subtitles Paraphrase Corpus for Six Languages. Mathias Creutz
2018	OpenSubtitles2018: Statistical Rescoring of Sentence Alignments in Large, Noisy Parallel Corpora. Pierre Lison, Jörg Tiedemann, Milen Kouylekov
2018	Overcoming the Long Tail Problem: A Case Study on CO2-Footprint Estimation of Recipes using Information Retrieval. Melanie Geiger, Martin Braschler
2018	PDF-to-Text Reanalysis for Linguistic Data Mining. Michael Wayne Goodman, Ryan Georgi, Fei Xia
2018	PDFAnno: a Web-based Linguistic Annotation Tool for PDF Documents. Hiroyuki Shindo, Yohei Munesada, Yuji Matsumoto
2018	PDFdigest: an Adaptable Layout-Aware PDF-to-XML Textual Content Extractor for Scientific Articles. Daniel Ferrés, Horacio Saggion, Francesco Ronzano, Àlex Bravo
2018	PMKI: an European Commission action for the interoperability, maintainability and sustainability of Language Resources. Peter Schmitz, Enrico Francesconi, Najeh Hajlaoui, Brahim Batouche
2018	Page Stream Segmentation with Convolutional Neural Nets Combining Textual and Visual Features. Gregor Wiedemann, Gerhard Heyer
2018	Palmyra: A Platform Independent Dependency Annotation Tool for Morphologically Rich Languages. Talha Javed, Nizar Habash, Dima Taji
2018	ParCorFull: a Parallel Corpus Annotated with Full Coreference. Ekaterina Lapshinova-Koltunski, Christian Hardmeier, Pauline Krielke
2018	Parallel Corpora for the Biomedical Domain. Aurélie Névéol, Antonio Jimeno-Yepes, Mariana L. Neves, Karin Verspoor
2018	Parallel Corpora in Mboshi (Bantu C25, Congo-Brazzaville). Annie Rialland, Martine Adda-Decker, Guy-Noël Kouarata, Gilles Adda, Laurent Besacier, Lori Lamel, Elodie Gauthier, Pierre Godard, Jamison Cooper-Leavitt
2018	Parse Me if You Can: Artificial Treebanks for Parsing Experiments on Elliptical Constructions. Kira Droganova, Daniel Zeman, Jenna Kanerva, Filip Ginter
2018	Parser combinators for Tigrinya and Oromo morphology. Patrick Littell, Tom McCoy, Na-Rae Han, Shruti Rijhwani, Zaid Sheikh, David R. Mortensen, Teruko Mitamura, Lori S. Levin
2018	Parsivar: A Language Processing Toolkit for Persian. Salar Mohtaj, Behnam Roshanfekr, Atefeh Zafarian, Habibollah Asghari
2018	Part-of-Speech Tagging for Arabic Gulf Dialect Using Bi-LSTM. Randah Alharbi, Walid Magdy, Kareem Darwish, Ahmed Abdelali, Hamdy Mubarak
2018	Performance Impact Caused by Hidden Bias of Training Data for Recognizing Textual Entailment. Masatoshi Tsuchiya
2018	Persian Discourse Treebank and coreference corpus. Azadeh Mirzaei, Pegah Safari
2018	Phonetically Balanced Code-Mixed Speech Corpus for Hindi-English Automatic Speech Recognition. Ayushi Pandey, Brij Mohan Lal Srivastava, Rohit Kumar, Bhanu Teja Nellore, Kasi Sai Teja, Suryakanth V. Gangashetty
2018	PhotoshopQuiA: A Corpus of Non-Factoid Questions and Answers for Why-Question Answering. Andrei Dulceanu, Thang Le Dinh, Walter Chang, Trung Bui, Doo Soon Kim, Manh-Chiên Vu, Seokhwan Kim
2018	PoSTWITA-UD: an Italian Twitter Treebank in Universal Dependencies. Manuela Sanguinetti, Cristina Bosco, Alberto Lavelli, Alessandro Mazzei, Oronzo Antonelli, Fabio Tamburini
2018	Polish Corpus of Annotated Descriptions of Images. Alina Wróblewska
2018	Portable Spelling Corrector for a Less-Resourced Language: Amharic. Andargachew Mekonnen Gezmu, Andreas Nürnberger, Binyam Ephrem Seyoum
2018	Portuguese Named Entity Recognition using Conditional Random Fields and Local Grammars. Juliana P. C. Pirovani, Elias de Oliveira
2018	Predicting Nods by using Dialogue Acts in Dialogue. Ryo Ishii, Ryuichiro Higashinaka, Junji Tomita
2018	Preliminary Analysis of Embodied Interactions between Science Communicators and Visitors Based on a Multimodal Corpus of Japanese Conversations in a Science Museum. Rui Sakaida, Ryosaku Makino, Mayumi Bono
2018	Preparation and Usage of Xhosa Lexicographical Data for a Multilingual, Federated Environment. Sonja Bosch, Thomas Eckart, Bettina Klimek, Dirk Goldhahn, Uwe Quasthoff
2018	Preparing Data from Psychotherapy for Natural Language Processing. Margot Mieskes, Andreas Stiegelmayr
2018	Preserving Workflow Reproducibility: The RePlay-DH Client as a Tool for Process Documentation. Markus Gärtner, Uli Hahn, Sibylle Hermann
2018	Proceedings of the Eleventh International Conference on Language Resources and Evaluation, LREC 2018, Miyazaki, Japan, May 7-12, 2018. Nicoletta Calzolari, Khalid Choukri, Christopher Cieri, Thierry Declerck, Sara Goggi, Kôiti Hasida, Hitoshi Isahara, Bente Maegaard, Joseph Mariani, Hélène Mazo, Asunción Moreno, Jan Odijk, Stelios Piperidis, Takenobu Tokunaga
2018	Profiling Medical Journal Articles Using a Gene Ontology Semantic Tagger. Mahmoud El-Haj, Paul Rayson, Scott Piao, Jo Knight
2018	PronouncUR: An Urdu Pronunciation Lexicon Generator. Haris Bin Zia, Agha Ali Raza, Awais Athar
2018	Pronunciation Dictionaries for the Alsatian Dialects to Analyze Spelling and Phonetic Variation. Lucie Steiblé, Delphine Bernhard
2018	Pronunciation Variants and ASR of Colloquial Speech: A Case Study on Czech. David Lukes, Marie Koprivová, Zuzana Komrsková, Petra Klimesová
2018	PyRATA, Python Rule-based feAture sTructure Analysis. Nicolas Hernandez, Amir Hazem
2018	PyrEval: An Automated Method for Summary Content Analysis. Yanjun Gao, Andrew Warner, Rebecca J. Passonneau
2018	QUD-Based Annotation of Discourse Structure and Information Structure: Tool and Evaluation. Kordula De Kuthy, Nils Reiter, Arndt Riester
2018	QUEST: A Natural Language Interface to Relational Databases. Vadim Sheinin, Elahe Khorasani, Hangu Yeo, Kun Xu, Ngoc Phuoc An Vo, Octavian Popescu
2018	Quantifying Qualitative Data for Understanding Controversial Issues. Michael Wojatzki, Saif M. Mohammad, Torsten Zesch, Svetlana Kiritchenko
2018	RDF2PT: Generating Brazilian Portuguese Texts from RDF Data. Diego Moussallem, Thiago Castro Ferreira, Marcos Zampieri, Maria Cláudia Cavalcanti, Geraldo Xexéo, Mariana L. Neves, Axel-Cyrille Ngonga Ngomo
2018	Recognizing Behavioral Factors while Driving: A Real-World Multimodal Corpus to Monitor the Driver's Affective State. Alicia Flores Lotz, Klas Ihme, Audrey Charnoz, Pantelis Maroudis, Ivan Dmitriev, Andreas Wendemuth
2018	Reference production in human-computer interaction: Issues for Corpus-based Referring Expression Generation. Danillo da Silva Rocha, Ivandré Paraboni
2018	Referring Expression Generation in time-constrained communication. André Mariotti, Ivandré Paraboni
2018	Representation Mapping: A Novel Approach to Generate High-Quality Multi-Lingual Emotion Lexicons. Sven Buechel, Udo Hahn
2018	Researching Less-Resourced Languages - the DigiSami Corpus. Kristiina Jokinen
2018	Resource Creation Towards Automated Sentiment Analysis in Telugu (a low resource language) and Integrating Multiple Domain Sources to Enhance Sentiment Prediction. Rama Rohit Reddy Gangula, Radhika Mamidi
2018	Resource Interoperability for Sustainable Benchmarking: The Case of Events. Chantal van Son, Oana Inel, Roser Morante, Lora Aroyo, Piek Vossen
2018	Retrieving Information from the French Lexical Network in RDF/OWL Format. Alexsandro Fonseca, Fatiha Sadat, François Lareau
2018	Retrofitting Word Representations for Unsupervised Sense Aware Word Similarities. Steffen Remus, Chris Biemann
2018	Reusable workflows for gender prediction. Matej Martinc, Senja Pollak
2018	Revisiting Distant Supervision for Relation Extraction. Tingsong Jiang, Jing Liu, Chin-Yew Lin, Zhifang Sui
2018	Revisiting the Task of Scoring Open IE Relations. William Léchelle, Philippe Langlais
2018	Revita: a Language-learning Platform at the Intersection of ITS and CALL. Anisia Katinskaia, Javad Nouri, Roman Yangarber
2018	Risamálheild: A Very Large Icelandic Text Corpus. Steinþór Steingrímsson, Sigrún Helgadóttir, Eiríkur Rögnvaldsson, Starkaður Barkarson, Jón Guðnason
2018	Rollenwechsel-English: a large-scale semantic role corpus. Asad B. Sayeed, Pavel Shkadzko, Vera Demberg
2018	RtGender: A Corpus for Studying Differential Responses to Gender. Rob Voigt, David Jurgens, Vinodkumar Prabhakaran, Dan Jurafsky, Yulia Tsvetkov
2018	SACR: A Drag-and-Drop Based Tool for Coreference Annotation. Bruno Oberle
2018	SB-CH: A Swiss German Corpus with Sentiment Annotations. Ralf Grubenmann, Don Tuggener, Pius von Däniken, Jan Deriu, Mark Cieliebak
2018	SLIDE - a Sentiment Lexicon of Common Idioms. Charles Jochim, Francesca Bonin, Roy Bar-Haim, Noam Slonim
2018	SMILE Swiss German Sign Language Dataset. Sarah Ebling, Necati Cihan Camgöz, Penny Boyes Braem, Katja Tissi, Sandra Sidler-Miserez, Stephanie Stoll, Simon Hadfield, Tobias Haug, Richard Bowden, Sandrine Tornay, Marzieh Razavi, Mathew Magimai-Doss
2018	SPADE: Evaluation Dataset for Monolingual Phrase Alignment. Yuki Arase, Jun'ichi Tsujii
2018	SW4ALL: a CEFR Classified and Aligned Corpus for Language Learning. Rodrigo Wilkens, Leonardo Zilio, Cédrick Fairon
2018	Sanaphor++: Combining Deep Neural Networks with Semantics for Coreference Resolution. Julien Plu, Roman Prokofyev, Alberto Tonon, Philippe Cudré-Mauroux, Djellel Eddine Difallah, Raphaël Troncy, Giuseppe Rizzo
2018	SandhiKosh: A Benchmark Corpus for Evaluating Sanskrit Sandhi Tools. Shubham Bhardwaj, Neelamadhav Gantayat, Nikhil Chaturvedi, Rahul Garg, Sumeet Agarwal
2018	Sarcasm Target Identification: Dataset and An Introductory Approach. Aditya Joshi, Pranav Goel, Pushpak Bhattacharyya, Mark J. Carman
2018	Scalable Visualisation of Sentiment and Stance. Jon Chamberlain, Udo Kruschwitz, Orland Hoeber
2018	ScholarGraph: a Chinese Knowledge Graph of Chinese Scholars. Shuo Wang, Zehui Hao, Xiaofeng Meng, Qiuyue Wang
2018	SemR-11: A Multi-Lingual Gold-Standard for Semantic Similarity and Relatedness for Eleven Languages. Siamak Barzegar, Brian Davis, Manel Zarrouk, Siegfried Handschuh, André Freitas
2018	Semantic Equivalence Detection: Are Interrogatives Harder than Declaratives? João Rodrigues, Chakaveh Saedi, António Branco, João Silva
2018	Semantic Frame Parsing for Information Extraction : the CALOR corpus. Gabriel Marzinotto, Jérémy Auguste, Frédéric Béchet, Géraldine Damnati, Alexis Nasr
2018	Semantic Relatedness of Wikipedia Concepts - Benchmark Data and a Working Solution. Liat Ein-Dor, Alon Halfon, Yoav Kantor, Ran Levy, Yosi Mass, Ruty Rinott, Eyal Shnarch, Noam Slonim
2018	Semantic Supersenses for English Possessives. Austin Blodgett, Nathan Schneider
2018	Semi-Automatic Construction of Word-Formation Networks (for Polish and Spanish). Mateusz Lango, Magda Sevcíková, Zdenek Zabokrtský
2018	Semi-Supervised Clustering for Short Answer Scoring. Andrea Horbach, Manfred Pinkal
2018	Semi-automatic Korean FrameNet Annotation over KAIST Treebank. Younggyun Hahm, Jiseong Kim, Sunggoo Kwon, Key-Sun Choi
2018	Semi-supervised Training Data Generation for Multilingual Question Answering. Kyungjae Lee, Kyoungho Yoon, Sunghyun Park, Seung-won Hwang
2018	SenSALDO: Creating a Sentiment Lexicon for Swedish. Jacobo Rouces, Nina Tahmasebi, Lars Borin, Stian Rødven Eide
2018	SentEval: An Evaluation Toolkit for Universal Sentence Representations. Alexis Conneau, Douwe Kiela
2018	Sentence Level Temporality Detection using an Implicit Time-sensed Resource. Sabyasachi Kamila, Asif Ekbal, Pushpak Bhattacharyya
2018	Sentence and Clause Level Emotion Annotation, Detection, and Classification in a Multi-Genre Corpus. Shabnam Tafreshi, Mona T. Diab
2018	SentiArabic: A Sentiment Analyzer for Standard Arabic. Ramy Eskander
2018	Sentiment-Stance-Specificity (SSS) Dataset: Identifying Support-based Entailment among Opinions. Pavithra Rajendran, Danushka Bollegala, Simon Parsons
2018	Shami: A Corpus of Levantine Arabic Dialects. Chatrine Qwaider, Motaz Saad, Stergios Chatzikyriakidis, Simon Dobnik
2018	Sharing Copies of Synthetic Clinical Corpora without Physical Distribution - A Case Study to Get Around IPRs and Privacy Constraints Featuring the German JSYNCC Corpus. Christina Lohr, Sven Buechel, Udo Hahn
2018	Sign Languages and the Online World Online Dictionaries & Lexicostatistics. Shi Yu, Carlo Geraci, Natasha Abner
2018	Signbank: Software to Support Web Based Dictionaries of Sign Language. Steve Cassidy, Onno Crasborn, Henri Nieminen, Wessel Stoop, Micha Hulsbosch, Susan Even, Erwin Komen, Trevor Johnson
2018	SimLex-999 for Polish. Agnieszka Mykowiecka, Malgorzata Marciniak, Piotr Rychlik
2018	SimPA: A Sentence-Level Simplification Corpus for the Public Administration Domain. Carolina Scarton, Gustavo Paetzold, Lucia Specia
2018	Simple Large-scale Relation Extraction from Unstructured Text. Christos Christodoulopoulos, Arpit Mittal
2018	Simple Semantic Annotation and Situation Frames: Two Approaches to Basic Text Understanding in LORELEI. Kira Griffitt, Jennifer Tracey, Ann Bies, Stephanie M. Strassel
2018	Simplified Corpus with Core Vocabulary. Takumi Maruyama, Kazuhide Yamamoto
2018	Simulating ASR errors for training SLU systems. Edwin Simonnet, Sahar Ghannay, Nathalie Camelin, Yannick Estève
2018	SlugNERDS: A Named Entity Recognition Tool for Open Domain Dialogue Systems. Kevin Bowden, JiaQi Wu, Shereen Oraby, Amita Misra, Marilyn A. Walker
2018	SoMeWeTa: A Part-of-Speech Tagger for German Social Media and Web Texts. Thomas Proisl
2018	Social Image Tags as a Source of Word Embeddings: A Task-oriented Evaluation. Mika Hasegawa, Tetsunori Kobayashi, Yoshihiko Hayashi
2018	Sound Signal Processing with Seq2Tree Network. Weicheng Ma, Kai Cao, Zhaoheng Ni, Peter Chin, Xiang Li
2018	Spanish HPSG Treebank based on the AnCora Corpus. Luis Chiruzzo, Dina Wonsever
2018	Speech Rate Calculations with Short Utterances: A Study from a Speech-to-Speech, Machine Translation Mediated Map Task. Hayakawa Akira, Carl Vogel, Saturnino Luz, Nick Campbell
2018	Statistical Analysis of Missing Translation in Simultaneous Interpretation Using A Large-scale Bilingual Speech Corpus. Zhongxi Cai, Koichiro Ryu, Shigeki Matsubara
2018	Strategies and Challenges for Crowdsourcing Regional Dialect Perception Data for Swiss German and Swiss French. Jean-Philippe Goldman, Simon Clematide, Mathieu Avanzi, Raphaël Tandler
2018	Structured Interpretation of Temporal Relations. Yuchen Zhang, Nianwen Xue
2018	Studying Muslim Stereotyping through Microportrait Extraction. Antske Fokkens, Nel Ruigrok, Camiel J. Beukeboom, Gagestein Sarah, Wouter van Atteveldt
2018	Sudachi: a Japanese Tokenizer for Business. Kazuma Takaoka, Sorami Hisamoto, Noriko Kawahara, Miho Sakamoto, Yoshitaka Uchida, Yuji Matsumoto
2018	SumeCzech: Large Czech News-Based Summarization Dataset. Milan Straka, Nikita Mediankin, Tom Kocmi, Zdenek Zabokrtský, Vojtech Hudecek, Jan Hajic
2018	SynPaFlex-Corpus: An Expressive French Audiobooks Corpus dedicated to expressive speech synthesis. Aghilas Sini, Damien Lolive, Gaëlle Vidal, Marie Tahon, Elisabeth Delais-Roussarie
2018	Systems' Agreements and Disagreements in Temporal Processing: An Extensive Error Analysis of the TempEval-3 Task. Tommaso Caselli, Roser Morante
2018	SzegedKoref: A Hungarian Coreference Corpus. Veronika Vincze, Klára Hegedüs, Alex Sliz-Nagy, Richárd Farkas
2018	T-REx: A Large Scale Alignment of Natural Language with Knowledge Base Triples. Hady Elsahar, Pavlos Vougiouklis, Arslen Remaci, Christophe Gravier, Jonathon S. Hare, Frédérique Laforest, Elena Simperl
2018	TAP-DLND 1.0 : A Corpus for Document Level Novelty Detection. Tirthankar Ghosal, Amitra Salam, Swati Tiwary, Asif Ekbal, Pushpak Bhattacharyya
2018	TF-LM: TensorFlow-based Language Modeling Toolkit. Lyan Verwimp, Hugo Van hamme, Patrick Wambacq
2018	TQ-AutoTest - An Automated Test Suite for (Machine) Translation Quality. Vivien Macketanz, Renlong Ai, Aljoscha Burchardt, Hans Uszkoreit
2018	TSix: A Human-involved-creation Dataset for Tweet Summarization. Minh-Tien Nguyen, Viet Dac Lai, Huy-Tien Nguyen, Minh-Le Nguyen
2018	Teanga: A Linked Data based platform for Natural Language Processing. Housam Ziad, John Philip McCrae, Paul Buitelaar
2018	Tel(s)-Telle(s)-Signs: Highly Accurate Automatic Crosslingual Hypernym Discovery. Ada Wan
2018	Test Sets for Chinese Nonlocal Dependency Parsing. Manjuan Duan, William Schuler
2018	Text Annotation Graphs: Annotating Complex Natural Language Phenomena. Angus G. Forbes, Kristine Lee, Gus Hahn-Powell, Marco Antonio Valenzuela-Escárcega, Mihai Surdeanu
2018	Text Mining for History: first steps on building a large dataset. Suemi Higuchi, Cláudia Freitas, Bruno Cuconato, Alexandre Rademaker
2018	Text Normalization Infrastructure that Scales to Hundreds of Language Varieties. Mason Chua, Daan van Esch, Noah Coccaro, Eunjoon Cho, Sujeet Bhandari, Libin Jia
2018	Text Simplification from Professionally Produced Corpora. Carolina Scarton, Gustavo Paetzold, Lucia Specia
2018	The ACoLi CoNLL Libraries: Beyond Tab-Separated Values. Christian Chiarcos, Niko Schenk
2018	The ADELE Corpus of Dyadic Social Text Conversations: Dialog Act Annotation with ISO 24617-2. Emer Gilmartin, Christian Saam, Brendan Spillane, Maria O'Reilly, Ketong Su, Arturo Calvo, Loredana Cerrato, Killian Levacher, Nick Campbell, Vincent Wade
2018	The Abkhaz National Corpus. Paul Meurer
2018	The AnnCor CHILDES Treebank. Jan Odijk, Alexis Dimitriadis, Martijn van der Klis, Marjo van Koppen, Meie Otten, Remco van der Veen
2018	The Automatic Annotation of the Semiotic Type of Hand Gestures in Obama' s Humorous Speeches. Costanza Navarretta
2018	The Boarnsterhim Corpus: A Bilingual Frisian-Dutch Panel and Trend Study. Marjoleine Sloos, Eduard Drenth, Wilbert Heeringa
2018	The Circumstantial Event Ontology (CEO) and ECB+/CEO: an Ontology and Corpus for Implicit Causal Relations between Events. Roxane Segers, Tommaso Caselli, Piek Vossen
2018	The DLDP Survey on Digital Use and Usability of EU Regional and Minority Languages. Claudia Soria, Valeria Quochi, Irene Russo
2018	The Distribution and Prosodic Realization of Verb Forms in German Infant-Directed Speech. Bettina Braun, Katharina Zahner
2018	The Effects of Unimodal Representation Choices on Multimodal Learning. Fernando Tadao Ito, Helena de Medeiros Caseli, Jander Moreira
2018	The First 100 Days: A Corpus Of Political Agendas on Twitter. Nathan Green, Septina Dian Larasati
2018	The French-Algerian Code-Switching Triggered audio corpus (FACST). Djegdjiga Amazouz, Martine Adda-Decker, Lori Lamel
2018	The GermaParl Corpus of Parliamentary Protocols. Andreas Blätte, André Blessing
2018	The German Reference Corpus DeReKo: New Developments - New Opportunities. Marc Kupietz, Harald Lüngen, Pawel Kamocki, Andreas Witt
2018	The ICoN Corpus of Academic Written Italian (L1 and L2). Mirko Tavosanis, Federica Cominetti
2018	The IIT Bombay English-Hindi Parallel Corpus. Anoop Kunchukuttan, Pratik Mehta, Pushpak Bhattacharyya
2018	The LIA Treebank of Spoken Norwegian Dialects. Lilja Øvrelid, Andre Kåsen, Kristin Hagen, Anders Nøklestad, Per Erik Solberg, Janne Bondi Johannessen
2018	The LODeXporter: Flexible Generation of Linked Open Data Triples from NLP Frameworks for Automatic Knowledge Base Construction. René Witte, Bahar Sateli
2018	The LREC Workshops Map. Roberto Bartolini, Sara Goggi, Monica Monachini, Gabriella Pardelli
2018	The Linguistic Category Model in Polish (LCM-PL). Aleksander Wawer, Justyna Sarzynska
2018	The MADAR Arabic Dialect Corpus and Lexicon. Houda Bouamor, Nizar Habash, Mohammad Salameh, Wajdi Zaghouani, Owen Rambow, Dana Abdulrahim, Ossama Obeid, Salam Khalifa, Fadhl Eryani, Alexander Erdmann, Kemal Oflazer
2018	The Metalogue Debate Trainee Corpus: Data Collection and Annotations. Volha Petukhova, Andrei Malchanau, Youssef Oualil, Dietrich Klakow, Saturnino Luz, Fasih Haider, Nick Campbell, Dimitris Koryzis, Dimitris Spiliotopoulos, Pierre Albert, Nicklas Linz, Jan Alexandersson
2018	The MonPaGe_HA Database for the Documentation of Spoken French Throughout Adulthood. Cécile Fougeron, Véronique Delvaux, Lucie Ménard, Marina Laganaro
2018	The Morpho-syntactic Annotation of Animacy for a Dependency Parser. Mohammed Attia, Vitaly Nikolaev, Ali El-Kahky
2018	The Natural Stories Corpus. Richard Futrell, Edward Gibson, Harry J. Tily, Idan A. Blank, Anastasia Vishnevetsky, Steven T. Piantadosi, Evelina Fedorenko
2018	The Nautilus Speaker Characterization Corpus: Speech Recordings and Labels of Speaker Characteristics and Voice Descriptions. Laura Fernández Gallardo, Benjamin Weiss
2018	The New Propbank: Aligning Propbank with AMR through POS Unification. Tim O'Gorman, Sameer Pradhan, Martha Palmer, Julia Bonn, Kathryn Conger, James Gung
2018	The Niki and Julie Corpus: Collaborative Multimodal Dialogues between Humans, Robots, and Virtual Agents. Ron Artstein, Jill Boberg, Alesia Gainer, Jonathan Gratch, Emmanuel Johnson, Anton Leuski, Gale M. Lucas, David R. Traum
2018	The Reference Corpus of the Contemporary Romanian Language (CoRoLa). Verginica Barbu Mititelu, Dan Tufis, Elena Irimia
2018	The SSIX Corpora: Three Gold Standard Corpora for Sentiment Analysis in English, Spanish and German Financial Microblogs. Thomas Gaillat, Manel Zarrouk, André Freitas, Brian Davis
2018	The Spot the Difference corpus: a multi-modal corpus of spontaneous task oriented spoken interactions. José Lopes, Nils Hemmingsson, Oliver Åstrand
2018	The UIR Uncertainty Corpus for Chinese: Annotating Chinese Microblog Corpus for Uncertainty Identification from Social Media. Binyang Li, Jun Xiang, Le Chen, Xu Han, Xiaoyan Yu, Ruifeng Xu, Tengjiao Wang, Kam-Fai Wong
2018	The Use of Text Alignment in Semi-Automatic Error Analysis: Use Case in the Development of the Corpus of the Latvian Language Learners. Roberts Dargis, Ilze Auzina, Kristine Levane-Petrova
2018	The WAW Corpus: The First Corpus of Interpreted Speeches and their Translations for English and Arabic. Ahmed Abdelali, Irina P. Temnikova, Samy Hedaya, Stephan Vogel
2018	The brWaC Corpus: A New Open Resource for Brazilian Portuguese. Jorge A. Wagner Filho, Rodrigo Wilkens, Marco Idiart, Aline Villavicencio
2018	Three Dimensions of Reproducibility in Natural Language Processing. K. Bretonnel Cohen, Jingbo Xia, Pierre Zweigenbaum, Tiffany Callahan, Orin Hargraves, Foster R. Goss, Nancy Ide, Aurélie Névéol, Cyril Grouin, Lawrence E. Hunter
2018	Tilde MT Platform for Developing Client Specific MT Solutions. Marcis Pinnis, Andrejs Vasiljevs, Rihards Kalnins, Roberts Rozis, Raivis Skadins, Valters Sics
2018	Tools for Building an Interlinked Synonym Lexicon Network. Zdenka Uresová, Eva Fucíková, Eva Hajicová, Jan Hajic
2018	Tools for The Production of Analogical Grids and a Resource of N-gram Analogical Grids in 11 Languages. Rashel Fam, Yves Lepage
2018	Toward An Epic Epigraph Graph. Francis Bond, Graham Matthews
2018	Toward a Lightweight Solution for Less-resourced Languages: Creating a POS Tagger for Alsatian Using Voluntary Crowdsourcing. Alice Millour, Karën Fort
2018	Towards AMR-BR: A SemBank for Brazilian Portuguese Language. Rafael T. Anchiêta, Thiago A. S. Pardo
2018	Towards Continuous Dialogue Corpus Creation: writing to corpus and generating from it. Andrei Malchanau, Volha Petukhova, Harry Bunt
2018	Towards Language Technology for Mi'kmaq. Anant Maheshwari, Léo Bouscarrat, Paul Cook
2018	Towards Neural Speaker Modeling in Multi-Party Conversation: The Task, Dataset, and Models. Zhao Meng, Lili Mou, Zhi Jin
2018	Towards Processing of the Oral History Interviews and Related Printed Documents. Zbynek Zajíc, Lucie Skorkovská, Petr Neduchal, Pavel Ircing, Josef V. Psutka, Marek Hrúz, Ales Prazák, Daniel Soutner, Jan Svec, Lukás Bures, Ludek Müller
2018	Towards a Conversation-Analytic Taxonomy of Speech Overlap. Felix Gervits, Matthias Scheutz
2018	Towards a Diagnosis of Textual Difficulties for Children with Dyslexia. Solen Quiniou, Béatrice Daille
2018	Towards a Gold Standard Corpus for Variable Detection and Linking in Social Science Publications. Andrea Zielinski, Peter Mutschke
2018	Towards a Linked Open Data Edition of Sumerian Corpora. Christian Chiarcos, Émilie Pagé-Perron, Ilya Khait, Niko Schenk, Lucas Reckling
2018	Towards a Standardized Dataset for Noun Compound Interpretation. Girishkumar Ponkiya, Kevin Patel, Pushpak Bhattacharyya, Girish K. Palshikar
2018	Towards a Welsh Semantic Annotation System. Scott Piao, Paul Rayson, Dawn Knight, Gareth Watkins
2018	Towards a music-language mapping. Michele Berlingerio, Francesca Bonin
2018	Towards an Automatic Assessment of Crowdsourced Data for NLU. Patricia Braunger, Wolfgang Maier, Jan Wessling, Maria Schmidt
2018	Towards an ISO Standard for the Annotation of Quantification. Harry Bunt, James Pustejovsky, Kiyong Lee
2018	Towards faithfully visualizing global linguistic diversity. Garland McNew, Curdin Derungs, Steven Moran
2018	Towards the Inference of Semantic Relations in Complex Nominals: a Pilot Study. Melania Cabezas-García, Pilar León Araúz
2018	Training and Adapting Multilingual NMT for Less-resourced and Morphologically Rich Languages. Matiss Rikters, Marcis Pinnis, Rihards Krislauks
2018	Transc&Anno: A Graphical Tool for the Transcription and On-the-Fly Annotation of Handwritten Documents. Nadezda Okinina, Lionel Nicolas, Verena Lyding
2018	Transfer Learning for Named-Entity Recognition with Neural Networks. Ji Young Lee, Franck Dernoncourt, Peter Szolovits
2018	Transfer of Frames from English FrameNet to Construct Chinese FrameNet: A Bilingual Corpus-Based Approach. Tsung-Han Yang, Hen-Hsen Huang, An-Zi Yen, Hsin-Hsi Chen
2018	Transforming Wikipedia into a Large-Scale Fine-Grained Entity Type Corpus. Abbas Ghaddar, Philippe Langlais
2018	Translating Web Search Queries into Natural Language Questions. Adarsh Kumar, Sandipan Dandapat, Sushil Chordia
2018	Translation Crowdsourcing: Creating a Multilingual Corpus of Online Educational Content. Vilelmini Sosoni, Katia Lida Kermanidis, Maria Stasimioti, Thanasis Naskos, Eirini Takoulidou, Menno van Zaanen, Sheila Castilho, Panayota Georgakopoulou, Valia Kordoni, Markus Egg
2018	TreeAnnotator: Versatile Visual Annotation of Hierarchical Text Relations. Philipp Helfrich, Elias Rieb, Giuseppe Abrami, Andy Lücking, Alexander Mehler
2018	TriMED: A Multilingual Terminological Database. Federica Vezzani, Giorgio Maria Di Nunzio, Geneviève Henrot
2018	Two Multilingual Corpora Extracted from the Tenders Electronic Daily for Machine Learning and Machine Translation Applications. Oussama Ahmia, Nicolas Béchet, Pierre-François Marteau
2018	UFSAC: Unification of Sense Annotated Corpora and Tools. Loïc Vial, Benjamin Lecouteux, Didier Schwab
2018	Undersampling Improves Hypernymy Prototypicality Learning. Koki Washio, Tsuneaki Kato
2018	Understanding Emotions: A Dataset of Tweets to Study Interactions between Affect Categories. Saif M. Mohammad, Svetlana Kiritchenko
2018	Unfolding the External Behavior and Inner Affective State of Teammates through Ensemble Learning: Experimental Evidence from a Dyadic Team Corpus. Aggeliki Vlachostergiou, Mark Dennison, Catherine Neubauer, Stefan Scherer, Peter Khooshabeh, Andre Harrison
2018	UniMorph 2.0: Universal Morphology. Christo Kirov, Ryan Cotterell, John Sylak-Glassman, Géraldine Walther, Ekaterina Vylomova, Patrick Xia, Manaal Faruqui, S. J. Mielke, Arya McCarthy, Sandra Kübler, David Yarowsky, Jason Eisner, Mans Hulden
2018	Unified Guidelines and Resources for Arabic Dialect Orthography. Nizar Habash, Fadhl Eryani, Salam Khalifa, Owen Rambow, Dana Abdulrahim, Alexander Erdmann, Reem Faraj, Wajdi Zaghouani, Houda Bouamor, Nasser Zalmout, Sara Hassan, Faisal Al-Shargi, Sakhar B. Alkhereyf, Basma Abdulkareem, Ramy Eskander, Mohammad Salameh, Hind Saddiki
2018	Universal Dependencies Version 2 for Japanese. Masayuki Asahara, Hiroshi Kanayama, Takaaki Tanaka, Yusuke Miyao, Sumire Uematsu, Shinsuke Mori, Yuji Matsumoto, Mai Omura, Yugo Murawaki
2018	Universal Dependencies and Quantitative Typological Trends. A Case Study on Word Order. Chiara Alzetta, Felice Dell'Orletta, Simonetta Montemagni, Giulia Venturi
2018	Universal Dependencies for Ainu. Hajime Senuma, Akiko Aizawa
2018	Universal Dependencies for Amharic. Binyam Ephrem Seyoum, Yusuke Miyao, Baye Yimam Mekonnen
2018	Universal Morphologies for the Caucasus region. Christian Chiarcos, Kathrin Donandt, Maxim Ionov, Monika Rind-Pawlowski, Hasmik Sargsian, Jesse Wichers Schreur, Frank Abromeit, Christian Fäth
2018	Unsupervised Korean Word Sense Disambiguation using CoreNet. Kijong Han, Sangha Nam, Jiseong Kim, Younggyun Hahm, Key-Sun Choi
2018	Up-cycling Data for Natural Language Generation. Amy Isard, Jon Oberlander, Claire Grover
2018	Upping the Ante: Towards a Better Benchmark for Chinese-to-English Machine Translation. Christian Hadiwinoto, Hwee Tou Ng
2018	Urdu Word Embeddings. Samar Haider
2018	Using Adversarial Examples in Natural Language Processing. Petr Belohlávek, Ondrej Plátek, Zdenek Zabokrtský, Milan Straka
2018	Using Crowd Agreement for Wordnet Localization. Amarsanaa Ganbold, Altangerel Chagnaa, Gábor Bella
2018	Using Discourse Information for Education with a Spanish-Chinese Parallel Corpus. Shuyuan Cao, Harritxu Gete
2018	Using English Baits to Catch Serbian Multi-Word Terminology. Cvetana Krstev, Branislava Sandrih, Ranka Stankovic, Miljana Mladenovic
2018	Using a Corpus of English and Chinese Political Speeches for Metaphor Analysis. Kathleen Ahrens, Huiheng Zeng, Shun Han Rebekah Wong
2018	Utilizing Large Twitter Corpora to Create Sentiment Lexica. Valerij Fredriksen, Brage Ekroll Jahren, Björn Gambäck
2018	VAST: A Corpus of Video Annotation for Speech Technologies. Jennifer Tracey, Stephanie M. Strassel
2018	Very Large-Scale Lexical Resources to Enhance Chinese and Japanese Machine Translation. Jack Halpern
2018	Visual Choice of Plausible Alternatives: An Evaluation of Image-based Commonsense Causal Reasoning. Jinyoung Yeo, Gyeongbok Lee, Gengyu Wang, Seungtaek Choi, Hyunsouk Cho, Reinald Kim Amplayo, Seung-won Hwang
2018	Visualization of the occurrence trend of infectious diseases using Twitter. Ryusei Matsumoto, Minoru Yoshida, Kazuyuki Matsumoto, Hironobu Matsuda, Kenji Kita
2018	Visualizing the "Dictionary of Regionalisms of France" (DRF). Ada Wan
2018	Voice Builder: A Tool for Building Text-To-Speech Voices. Pasindu De Silva, Theeraphol Wattanavekin, Tang Hao, Knot Pipatsrisawat
2018	WASA: A Web Application for Sequence Annotation. Fahad AlGhamdi, Mona T. Diab
2018	We Are Depleting Our Research Subject as We Are Investigating It: In Language Technology, more Replication and Diversity Are Needed. António Branco
2018	Web-based Annotation Tool for Inflectional Language Resources. Abdulrahman Alosaimy, Eric Atwell
2018	What Causes the Differences in Communication Styles? A Multicultural Study on Directness and Elaborateness. Juliana Miehle, Wolfgang Minker, Stefan Ultes
2018	What's Wrong, Python? - A Visual Differ and Graph Library for NLP in Python. Balázs Indig, András Simonyi, Noémi Ligeti-Nagy
2018	When ACE met KBP: End-to-End Evaluation of Knowledge Base Population with Component-level Annotation. Bonan Min, Marjorie Freedman, Roger Bock, Ralph M. Weischedel
2018	WikiArt Emotions: An Annotated Dataset of Emotions Evoked by Art. Saif M. Mohammad, Svetlana Kiritchenko
2018	WikiDragon: A Java Framework For Diachronic Content And Network Analysis Of MediaWikis. Rüdiger Gleim, Alexander Mehler, Sung Y. Song
2018	Word Affect Intensities. Saif M. Mohammad
2018	Word Embedding Approach for Synonym Extraction of Multi-Word Terms. Amir Hazem, Béatrice Daille
2018	Word Embedding Evaluation Datasets and Wikipedia Title Embedding for Chinese. Chi-Yen Chen, Wei-Yun Ma
2018	WordKit: a Python Package for Orthographic and Phonological Featurization. Stéphan Tulkens, Dominiek Sandra, Walter Daelemans
2018	WordNet-Shp: Towards the Building of a Lexical Database for a Peruvian Minority Language. Diego Maguiño Valencia, Arturo Oncevay-Marcos, Marco Antonio Sobrevilla Cabezudo
2018	World Knowledge for Abstract Meaning Representation Parsing. Charles Welch, Jonathan K. Kummerfeld, Song Feng, Rada Mihalcea
2018	WorldTree: A Corpus of Explanation Graphs for Elementary Science Questions supporting Multi-hop Inference. Peter A. Jansen, Elizabeth Wainwright, Steven Marmorstein, Clayton T. Morrison
2018	You Tweet What You Speak: A City-Level Dataset of Arabic Dialects. Muhammad Abdul-Mageed, Hassan Alhuzali, Mohamed Elaraby
2018	ZAP: An Open-Source Multilingual Annotation Projection Framework. Alan Akbik, Roland Vollgraf