LREC - RankMe – RankMe

743 papers

Year	Title / Authors
2014	#mygoal: Finding Motivations on Twitter. Marc T. Tomlinson, David B. Bracewell, Wayne Krug, David Hinote
2014	'interHist' Ì¶ an interactive visual interface for corpus exploration. Verena Lyding, Lionel Nicolas, Egon Stemle
2014	3D Face Tracking and Multi-Scale, Spatio-temporal Analysis of Linguistically Significant Facial Expressions and Head Positions in ASL. Bo Liu, Jingjing Liu, Xiang Yu, Dimitris N. Metaxas, Carol Neidle
2014	4FX: Light Verb Constructions in a Multilingual Parallel Corpus. Anita Rácz, István Nagy T., Veronika Vincze
2014	A 500 Million Word POS-Tagged Icelandic Corpus. Thomas Eckart, Erla Hallsteinsdóttir, Sigrún Helgadóttir, Uwe Quasthoff, Dirk Goldhahn
2014	A Benchmark Database of Phonetic Alignments in Historical Linguistics and Dialectology. Johann-Mattis List, Jelena Prokic
2014	A Character-based Approach to Distributional Semantic Models: Exploiting Kanji Characters for Constructing JapaneseWord Vectors. Akira Utsumi
2014	A Collection of Scholarly Book Reviews from the Platforms of electronic sources in Humanities and Social Sciences OpenEdition.org. Chahinez Benkoussas, Hussam Hamdan, Patrice Bellot, Frédéric Béchet, Elodie Faath
2014	A Colloquial Corpus of Japanese Sign Language: Linguistic Resources for Observing Sign Language Conversations. Mayumi Bono, Kouhei Kikuchi, Paul Cibulka, Yutaka Osugi
2014	A Compact Interactive Visualization of Dependency Treebank Query Results. Chris Culy, Marco Passarotti, Ulla König-Cardanobile
2014	A Comparative Evaluation Methodology for NLG in Interactive Systems. Helen F. Hastie, Anja Belz
2014	A Comparison of MT Errors and ESL Errors. Homa B. Hashemi, Rebecca Hwa
2014	A Conventional Orthography for Tunisian Arabic. Inès Zribi, Rahma Boujelbane, Abir Masmoudi, Mariem Ellouze, Lamia Hadrich Belguith, Nizar Habash
2014	A Corpus and Phonetic Dictionary for Tunisian Arabic Speech Recognition. Abir Masmoudi, Mariem Ellouze Khmekhem, Yannick Estève, Lamia Hadrich Belguith, Nizar Habash
2014	A Corpus of Comparisons in Product Reviews. Wiltrud Kessler, Jonas Kuhn
2014	A Corpus of Machine Translation Errors Extracted from Translation Students Exercises. Guillaume Wisniewski, Natalie Kübler, François Yvon
2014	A Corpus of Participant Roles in Contentious Discussions. Siddharth Jain, Archna Bhatia, Angelique Rein, Eduard H. Hovy
2014	A Corpus of Spontaneous Speech in Lectures: The KIT Lecture Corpus for Spoken Language Processing and Translation. Eunah Cho, Sarah Fünfer, Sebastian Stüker, Alex Waibel
2014	A Cross-language Corpus for Studying the Phonetics and Phonology of Prominence. Bistra Andreeva, William J. Barry, Jacques C. Koreman
2014	A Crowdsourcing Smartphone Application for Swiss German: Putting Language Documentation in the Hands of the Users. Jean-Philippe Goldman, Adrian Leemann, Marie-José Kolly, Ingrid Hove, Ibrahim Almajai, Volker Dellwo, Steven Moran
2014	A Database for Measuring Linguistic Information Content. Richard Sproat, Bruno Cartoni, HyunJeong Choe, David Huynh, Linne Ha, Ravindran Rajakumar, Evelyn Wenzel-Grondie
2014	A Database of Freely Written Texts of German School Students for the Purpose of Automatic Spelling Error Classification. Kay Berkling, Johanna Fay, Masood Ghayoomi, Katrin Hein, Rémi Lavalley, Ludwig Linhuber, Sebastian Stüker
2014	A Database of Full Body Virtual Interactions Annotated with Expressivity Scores. Virginie Demulier, Elisabetta Bevacqua, Florian Focone, Tom Giraud, Pamela Carreno, Brice Isableu, Sylvie Gibet, Pierre De Loor, Jean-Claude Martin
2014	A Deep Context Grammatical Model For Authorship Attribution. Simon Fuller, Phil Maguire, Philippe Moser
2014	A Framework for Compiling High Quality Knowledge Resources From Raw Corpora. Gongye Jin, Daisuke Kawahara, Sadao Kurohashi
2014	A Framework for Public Health Surveillance. Andrew Yates, Jon Parker, Nazli Goharian, Ophir Frieder
2014	A German Twitter Snapshot. Tatjana Scheffler
2014	A Gold Standard Dependency Corpus for English. Natalia Silveira, Timothy Dozat, Marie-Catherine de Marneffe, Samuel R. Bowman, Miriam Connor, John Bauer, Christopher D. Manning
2014	A Gold Standard for CLIR evaluation in the Organic Agriculture Domain. Alessio Bosca, Matteo Casu, Mauro Dragoni, Nikolaos Marianos
2014	A Graph-Based Approach for Computing Free Word Associations. Gemma Bel Enguix, Reinhard Rapp, Michael Zock
2014	A Hindi-English Code-Switching Corpus. Anik Dey, Pascale Fung
2014	A Japanese Word Dependency Corpus. Shinsuke Mori, Hideki Ogura, Tetsuro Sasada
2014	A LDA-based Topic Classification Approach from highly Imperfect Automatic Transcriptions. Mohamed Morchid, Richard Dufour, Georges Linarès
2014	A Language-independent Approach to Extracting Derivational Relations from an Inflectional Lexicon. Marion Baranes, Benoît Sagot
2014	A Large Corpus of Product Reviews in Portuguese: Tackling Out-Of-Vocabulary Words. Nathan Hartmann, Lucas Avanço, Pedro Paulo Balage Filho, Magali Sanches Duran, Maria das Graças Volpe Nunes, Thiago Alexandre Salgueiro Pardo, Sandra M. Aluísio
2014	A Large Scale Database of Strongly-related Events in Japanese. Tomohide Shibata, Shotaro Kohama, Sadao Kurohashi
2014	A Large-Scale Evaluation of Pre-editing Strategies for Improving User-Generated Content Translation. Violeta Seretan, Pierrette Bouillon, Johanna Gerlach
2014	A Meta-data Driven Platform for Semi-automatic Configuration of Ontology Mediators. Manuel Fiorelli, Maria Teresa Pazienza, Armando Stellato
2014	A Method for Building Burst-Annotated Co-Occurrence Networks for Analysing Trends in Textual Data. Yutaka Mitsuishi, Vít Novácek, Pierre-Yves Vandenbussche
2014	A Model for Processing Illocutionary Structures and Argumentation in Debates. Katarzyna Budzynska, Mathilde Janier, Chris Reed, Patrick Saint-Dizier, Manfred Stede, Olena Yaskorska
2014	A Multi-Cultural Repository of Automatically Discovered Linguistic and Conceptual Metaphors. Samira Shaikh, Tomek Strzalkowski, Ting Liu, George Aaron Broadwell, Boris Yamrom, Sarah M. Taylor, Laurie Feldman, Kit Cho, Umit Boz, Ignacio Cases, Yuliya Peshkova, Ching-Sheng Lin
2014	A Multi-Dialect, Multi-Genre Corpus of Informal Written Arabic. Ryan Cotterell, Chris Callison-Burch
2014	A Multidialectal Parallel Corpus of Arabic. Houda Bouamor, Nizar Habash, Kemal Oflazer
2014	A Multimodal Corpus of Rapid Dialogue Games. Maike Paetzel, David Nicolas Racca, David DeVault
2014	A Multimodal Dataset for Deception Detection. Verónica Pérez-Rosas, Rada Mihalcea, Alexis Narvaez, Mihai Burzo
2014	A New Form of Humor ― Mapping Constraint-Based Computational Morphologies to a Finite-State Representation. Attila Novák
2014	A New Framework for Sign Language Recognition based on 3D Handshape Identification and Linguistic Modeling. Mark Dilsizian, Polina Yanovich, Shu Wang, Carol Neidle, Dimitris N. Metaxas
2014	A Persian Treebank with Stanford Typed Dependencies. Mojgan Seraji, Carina Jahani, Beáta Megyesi, Joakim Nivre
2014	A Quality-based Active Sample Selection Strategy for Statistical Machine Translation. Varvara Logacheva, Lucia Specia
2014	A Rank-based Distance Measure to Detect Polysemy and to Determine Salient Vector-Space Features for German Prepositions. Maximilian Köper, Sabine Schulte im Walde
2014	A Repository of State of the Art and Competitive Baseline Summaries for Generic News Summarization. Kai Hong, John M. Conroy, Benoît Favre, Alex Kulesza, Hui Lin, Ani Nenkova
2014	A SICK cure for the evaluation of compositional distributional semantic models. Marco Marelli, Stefano Menini, Marco Baroni, Luisa Bentivogli, Raffaella Bernardi, Roberto Zamparelli
2014	A SKOS-based Schema for TEI encoded Dictionaries at ICLTT. Thierry Declerck, Karlheinz Mörth, Eveline Wandl-Vogt
2014	A Study on Expert Sourcing Enterprise Question Collection and Classification. Yuan Luo, Thomas F. Boucher, Tolga Oral, David Osofsky, Sara Weber
2014	A System for Experiments with Dependency Parsers. Kiril Ivanov Simov, Iliana Simova, Ginka Ivanova, Maria Mateva, Petya Osenova
2014	A Tagged Corpus and a Tagger for Urdu. Bushra Jawaid, Amir Kamran, Ondrej Bojar
2014	A Toolkit for Efficient Learning of Lexical Units for Speech Recognition. Matti Varjokallio, Mikko Kurimo
2014	A Unified Annotation Scheme for the Semantic/Pragmatic Components of Definiteness. Archna Bhatia, Mandy Simons, Lori S. Levin, Yulia Tsvetkov, Chris Dyer, Jordan Bender
2014	A Vector Space Model for Syntactic Distances Between Dialects. Emanuele Di Buccio, Giorgio Maria Di Nunzio, Gianmaria Silvello
2014	A Wikipedia-based Corpus for Contextualized Machine Translation. Jennifer Drexler, Pushpendre Rastogi, Jacqueline Aguilar, Benjamin Van Durme, Matt Post
2014	A cascade approach for complex-type classification. Lauren Romeo, Sara Mendes, Núria Bel
2014	A corpus of European Portuguese child and child-directed speech. Ana Lúcia Santos, Michel Généreux, Aida Cardoso, Celina Agostinho, Silvana Abalada
2014	A decade of HLT Agency activities in the Low Countries: from resource maintenance (BLARK) to service offerings (BLAISE). Peter Spyns, Remco van Veenendaal
2014	A finite-state morphological analyzer for a Lakota HPSG grammar. Christian Curtis
2014	A flexible language learning platform based on language resources and web services. Elena Volodina, Ildikó Pilán, Lars Borin, Therese Lindström Tiedemann
2014	A hierarchical taxonomy for classifying hardness of inference tasks. Martin Gleize, Brigitte Grau
2014	A language-independent and fully unsupervised approach to lexicon induction and part-of-speech tagging for closely related languages. Yves Scherrer, Benoît Sagot
2014	A model to generate adaptive multimodal job interviews with a virtual recruiter. Zoraida Callejas, Brian Ravenet, Magalie Ochs, Catherine Pelachaud
2014	A multimodal interpreter for 3D visualization and animation of verbal concepts. Coline Claude-Lachenaud, Eric Charton, Benoît Ozell, Michel Gagnon
2014	A set of open source tools for Turkish natural language processing. Çagri Çöltekin
2014	A stream computing approach towards scalable NLP. Xabier Artola, Zuhaitz Beloki, Aitor Soroa
2014	A tool suite for creating question answering benchmarks. Axel-Cyrille Ngonga Ngomo, Norman Heino, René Speck, Prodromos Malakasiotis
2014	ACTIV-ES: a comparable, cross-dialect corpus of 'everyday' Spanish from Argentina, Mexico, and Spain. Jerid Francom, Mans Hulden, Adam Ussishkin
2014	ALICO: a multimodal corpus for the study of active listening. Hendrik Buschmeier, Zofia Malisz, Joanna Skubisz, Marcin Wlodarczak, Ipke Wachsmuth, Stefan Kopp, Petra Wagner
2014	ANCOR_Centre, a large free spoken French coreference corpus: description of the resource and reliability measures. Judith Muzerelle, Anaïs Lefeuvre, Emmanuel Schang, Jean-Yves Antoine, Aurore Pelletier, Denis Maurel, Iris Eshkol, Jeanne Villaneau
2014	ASR-based CALL systems and learner speech data: new resources and opportunities for research and development in second language learning. Catia Cucchiarini, Steve Bodnar, Bart Penning de Vries, Roeland van Hout, Helmer Strik
2014	Access control by query rewriting: the case of KorAP. Piotr Banski, Nils Diewald, Michael Hanl, Marc Kupietz, Andreas Witt
2014	Accommodations in Tuscany as Linked Data. Clara Bacciu, Angelica Lo Duca, Andrea Marchetti, Maurizio Tesconi
2014	Adapting Freely Available Resources to Build an Opinion Mining Pipeline in Portuguese. Patrik Lambert, Carlos Rodríguez Penagos
2014	Adapting VerbNet to French using existing resources. Quentin Pradet, Laurence Danlos, Gaël de Chalendar
2014	Adapting a part-of-speech tagset to non-standard text: The case of STTS. Heike Zinsmeister, Ulrich Heid, Kathrin Beck
2014	Aggregation methods for efficient collocation detection. Anca Dinu, Liviu P. Dinu, Ionut Sorodoc
2014	Aix Map Task corpus: The French multimodal corpus of task-oriented dialogue. Jan Gorisch, Corine Astésano, Ellen Gurman Bard, Brigitte Bigi, Laurent Prévot
2014	Alert!... Calm Down, There is Nothing to Worry About. Warning and Soothing Speech Synthesis. Milan Rusko, Sakhia Darjaa, Marián Trnka, Marian Ritomský, Róbert Sabo
2014	Aligning Predicate-Argument Structures for Paraphrase Fragment Extraction. Michaela Regneri, Rui Wang, Manfred Pinkal
2014	Aligning parallel texts with InterText. Pavel Vondricka
2014	All Fragments Count in Parser Evaluation. Jasmijn Bastings, Khalil Sima'an
2014	Amazigh Verb Conjugator. Fadoua Ataa-Allah, Siham Boulaknadel
2014	An Analysis of Older Users' Interactions with Spoken Dialogue Systems. Jamie Bost, Johanna D. Moore
2014	An Arabic Twitter Corpus for Subjectivity and Sentiment Analysis. Eshrag Refaee, Verena Rieser
2014	An Effortless Way To Create Large-Scale Datasets For Famous Speakers. François Salmon, Félicien Vallet
2014	An Exercise in Reuse of Resources: Adapting General Discourse Coreference Resolution for Detecting Lexical Chains in Patent Documentation. Nadjet Bouayad-Agha, Alicia Burga, Gerard Casamayor, Joan Codina, Rogelio Nazar, Leo Wanner
2014	An Innovative World Language Centre : Challenges for the Use of Language Technology. Auður Hauksdóttir
2014	An Iterative Approach for Mining Parallel Sentences in a Comparable Corpus. Lise Rebout, Philippe Langlais
2014	An Open-Source Heavily Multilingual Translation Graph Extracted from Wiktionaries and Parallel Corpora. Valérie Hanoka, Benoît Sagot
2014	An Out-of-Domain Test Suite for Dependency Parsing of German. Wolfgang Seeker, Jonas Kuhn
2014	An analysis of ambiguity in word sense annotations. David Jurgens
2014	An efficient and user-friendly tool for machine translation quality estimation. Kashif Shah, Marco Turchi, Lucia Specia
2014	An efficient language independent toolkit for complete morphological disambiguation. László János Laki, György Orosz
2014	An evaluation of the role of statistical measures and frequency for MWE identification. Sandra Antunes, Amália Mendes
2014	An open source part-of-speech tagger for Norwegian: Building on existing language resources. Cristina Sánchez Marco
2014	Annotating Arguments: The NOMAD Collaborative Annotation Tool. Georgios Petasis
2014	Annotating Clinical Events in Text Snippets for Phenotype Detection. Prescott Klassen, Fei Xia, Lucy Vanderwende, Meliha Yetisgen
2014	Annotating Events in an Emotion Corpus. Sophia Yat Mei Lee, Shoushan Li, Chu-Ren Huang
2014	Annotating Inter-Sentence Temporal Relations in Clinical Notes. Jennifer D'Souza, Vincent Ng
2014	Annotating Question Decomposition on Complex Medical Questions. Kirk Roberts, Kate Masterton, Marcelo Fiszman, Halil Kilicoglu, Dina Demner-Fushman
2014	Annotating Relation Mentions in Tabloid Press. Hong Li, Sebastian Krause, Feiyu Xu, Hans Uszkoreit, Robert Hummel, Veselina Mironova
2014	Annotating Relations in Scientific Articles. Adam Meyers, Giancarlo Lee, Angus Grieve-Smith, Yifan He, Harriet Taber
2014	Annotating the Focus of Negation in Japanese Text. Suguru Matsuyoshi, Ryo Otsuki, Fumiyo Fukumoto
2014	Annotating the MASC Corpus with BabelNet. Andrea Moro, Roberto Navigli, Francesco Maria Tucci, Rebecca J. Passonneau
2014	Annotation Pro + TGA: automation of speech timing analysis. Katarzyna Klessa, Dafydd Gibbon
2014	Annotation of Computer Science Papers for Semantic Relation Extrac-tion. Yuka Tateisi, Yo Shidahara, Yusuke Miyao, Akiko Aizawa
2014	Annotation of specialized corpora using a comprehensive entity and relation scheme. Louise Deléger, Anne-Laure Ligozat, Cyril Grouin, Pierre Zweigenbaum, Aurélie Névéol
2014	Applying Accessibility-Oriented Controlled Language (CL) Rules to Improve Appropriateness of Text Alternatives for Images: an Exploratory Study. Silvia Rodríguez Vázquez, Pierrette Bouillon, Anton Bolfing
2014	AraNLP: a Java-based Library for the Processing of Arabic Text. Maha Althobaiti, Udo Kruschwitz, Massimo Poesio
2014	Assessment of Non-native Prosody for Spanish as L2 using quantitative scores and perceptual evaluation. Valentín Cardeñoso-Payo, César González Ferreras, David Escudero Mancebo
2014	Augmenting English Adjective Senses with Supersenses. Yulia Tsvetkov, Nathan Schneider, Dirk Hovy, Archna Bhatia, Manaal Faruqui, Chris Dyer
2014	AusTalk: an audio-visual corpus of Australian English. Dominique Estival, Steve Cassidy, Felicity Cox, Denis Burnham
2014	Author-Specific Sentiment Aggregation for Polarity Prediction of Reviews. Subhabrata Mukherjee, Sachindra Joshi
2014	Automatic Annotation of Machine Translation Datasets with Binary Quality Judgements. Marco Turchi, Matteo Negri
2014	Automatic Error Detection concerning the Definite and Indefinite Conjugation in the HunLearner Corpus. Veronika Vincze, János Zsibrita, Péter Durst, Martina Katalin Szabó
2014	Automatic Expansion of the MRC Psycholinguistic Database Imageability Ratings. Ting Liu, Kit Cho, George Aaron Broadwell, Samira Shaikh, Tomek Strzalkowski, John Lien, Sarah M. Taylor, Laurie Feldman, Boris Yamrom, Nick Webb, Umit Boz, Ignacio Cases, Ching-Sheng Lin
2014	Automatic Extraction of Synonyms for German Particle Verbs from Parallel Data with Distributional Similarity as a Re-Ranking Feature. Moritz Wittmann, Marion Weller, Sabine Schulte im Walde
2014	Automatic Long Audio Alignment and Confidence Scoring for Conversational Arabic Speech. Mohamed Elmahdy, Mark Hasegawa-Johnson, Eiman Mustafawi
2014	Automatic Mapping Lexical Resources: A Lexical Unit as the Keystone. Eduard Bejcek, Václava Kettnerová, Markéta Lopatková
2014	Automatic Methods for the Extension of a Bilingual Dictionary using Comparable Corpora. Michael Rosner, Kurt Sultana
2014	Automatic Refinement of Syntactic Categories in Chinese Word Structures. Jianqiang Ma
2014	Automatic acquisition of Urdu nouns (along with gender and irregular plurals). Tafseer Ahmed
2014	Automatic creation of WordNets from parallel corpora. Antoni Oliver, Salvador Climent
2014	Automatic detection of other-repetition occurrences: application to French conversational Speech. Brigitte Bigi, Roxane Bertrand, Mathilde Guardiola
2014	Automatic language identity tagging on word and sentence-level in multilingual text sources: a case-study on Luxembourgish. Thomas Lavergne, Gilles Adda, Martine Adda-Decker, Lori Lamel
2014	Automatic semantic relation extraction from Portuguese texts. Leonardo Sameshima Taba, Helena de Medeiros Caseli
2014	Automatically enriching spoken corpora with syntactic information for linguistic studies. Alexis Nasr, Frédéric Béchet, Benoît Favre, Thierry Bazillon, José Deulofeu, André Valli
2014	Basque Speecon-like and Basque SpeechDat MDB-600: speech databases for the development of ASR technology for Basque. Igor Odriozola, Inma Hernáez, María Inés Torres, Luis Javier Rodríguez-Fuentes, Mikel Peñagarikano, Eva Navas
2014	Because Size Does Matter: The Hamburg Dependency Treebank. Kilian A. Foth, Arne Köhn, Niels Beuck, Wolfgang Menzel
2014	Benchmarking Twitter Sentiment Analysis Tools. Ahmed Abbasi, Ammar Hassan, Milan Dhar
2014	Benchmarking of English-Hindi parallel corpora. Jayendra Rakesh Yeka, Prasanth Kolachina, Dipti Misra Sharma
2014	Benchmarking the Extraction and Disambiguation of Named Entities on the Semantic Web. Giuseppe Rizzo, Marieke van Erp, Raphaël Troncy
2014	Bidirectionnal converter between syntactic annotations : from French Treebank Dependencies to PASSAGE annotations, and back. Munshi Asadullah, Patrick Paroubek, Anne Vilnat
2014	Bilingual Dictionary Construction with Transliteration Filtering. John Richardson, Toshiaki Nakazawa, Sadao Kurohashi
2014	Bilingual Dictionary Induction as an Optimization Problem. Wushouer Mairidan, Toru Ishida, Donghui Lin, Katsutoshi Hirayama
2014	Bilingual dictionaries for all EU languages. Ahmet Aker, Monica Lestari Paramita, Marcis Pinnis, Robert J. Gaizauskas
2014	Billions of Parallel Words for Free: Building and Using the EU Bookshop Corpus. Raivis Skadins, Jörg Tiedemann, Roberts Rozis, Daiga Deksne
2014	BiographyNet: Methodological Issues when NLP supports historical research. Antske Fokkens, Serge Ter Braake, Niels Ockeloen, Piek Vossen, Susan Legêne, Guus Schreiber
2014	Biomedical entity extraction using machine-learning based approaches. Cyril Grouin
2014	Boosting Open Information Extraction with Noun-Based Relations. Clarissa Castellã Xavier, Vera Lúcia Strube de Lima
2014	Boosting the creation of a treebank. Blanca Arias, Núria Bel, Mercè Lorente, Montserrat Marimon, Alba Milà, Jorge Vivaldi, Muntsa Padró, Marina Fomicheva, Imanol Larrea
2014	Bootstrapping Open-Source English-Bulgarian Computational Dictionary. Krasimir Angelov
2014	Bootstrapping Term Extractors for Multiple Languages. Ahmet Aker, Monica Lestari Paramita, Emma Barker, Robert J. Gaizauskas
2014	Bootstrapping an Italian VerbNet: data-driven analysis of verb alternations. Gianluca Lebani, Veronica Viola, Alessandro Lenci
2014	Bridging the gap between speech technology and natural language processing: an evaluation toolbox for term discovery systems. Bogdan Ludusan, Maarten Versteegh, Aren Jansen, Guillaume Gravier, Xuan-Nga Cao, Mark Johnson, Emmanuel Dupoux
2014	Bring vs. MTRoget: Evaluating automatic thesaurus translation. Lars Borin, Jens Allwood, Gerard de Melo
2014	Building Domain Specific Bilingual Dictionaries. Lucas Welter Hilgert, Lucelene Lopes, Artur Freitas, Renata Vieira, Denise N. Hogetop, Aline A. Vanin
2014	Building The Sense-Tagged Multilingual Parallel Corpus. Shan Wang, Francis Bond
2014	Building a Corpus of Manually Revised Texts from Discourse Perspective. Ryu Iida, Takenobu Tokunaga
2014	Building a Crisis Management Term Resource for Social Media: The Case of Floods and Protests. Irina P. Temnikova, Andrea Varga, Dogan Biyikli
2014	Building a Database of Japanese Adjective Examples from Special Purpose Web Corpora. Masaya Yamaguchi
2014	Building a Dataset for Summarization and Keyword Extraction from Emails. Vanessa Loza, Shibamouli Lahiri, Rada Mihalcea, Po-Hsiang Lai
2014	Building a Dataset of Multilingual Cognates for the Romanian Lexicon. Liviu P. Dinu, Alina Maria Ciobanu
2014	Building a reference lexicon for countability in English. Tibor Kiss, Francis Jeffry Pelletier, Tobias Stadtfeld
2014	Building and Modelling Multilingual Subjective Corpora. Motaz Saad, David Langlois, Kamel Smaïli
2014	Buy one get one free: Distant annotation of Chinese tense, event type and modality. Nianwen Xue, Yuchen Zhang
2014	C-PhonoGenre: a 7-hours corpus of 7 speaking styles in French: relations between situational features and prosodic properties. Jean-Philippe Goldman, Tea Prsir, Antoine Auchlin
2014	CFT13: A resource for research into the post-editing process. Michael Carl, Mercedes García-Martínez, Bartolomé Mesa-Lao
2014	CIEMPIESS: A New Open-Sourced Mexican Spanish Radio Corpus. Carlos Daniel Hernandez Mena, Abel Herrera Camacho
2014	CLARA: A New Generation of Researchers in Common Language Resources and Their Applications. Koenraad De Smedt, Erhard W. Hinrichs, Detmar Meurers, Inguna Skadina, Bolette S. Pedersen, Costanza Navarretta, Núria Bel, Krister Lindén, Markéta Lopatková, Jan Hajic, Gisle Andersen, Przemyslaw Lenkiewicz
2014	CLARIN-NL: Major results. Jan Odijk
2014	CLiPS Stylometry Investigation (CSI) corpus: A Dutch corpus for the detection of age, gender, personality, sentiment and deception in text. Ben Verhoeven, Walter Daelemans
2014	CORILGA: a Galician Multilevel Annotated Speech Corpus for Linguistic Analysis. Carmen García-Mateo, Antonio Cardenal López, Xose Luis Regueira, Elisa Fernández Rei, Marta Martinez, Roberto Seara, Rocío Varela, Noemí Basanta
2014	CROMER: a Tool for Cross-Document Event and Entity Coreference. Christian Girardi, Manuela Speranza, Rachele Sprugnoli, Sara Tonelli
2014	Can Crowdsourcing be used for Effective Annotation of Arabic? Wajdi Zaghouani, Kais Dukes
2014	Can Numerical Expressions Be Simpler? Implementation and Demostration of a Numerical Simplification System for Spanish. Susana Bautista, Horacio Saggion
2014	Can the Crowd be Controlled?: A Case Study on Crowd Sourcing and Automatic Validation of Completed Tasks based on User Modeling. Balamurali A. R.
2014	Casa de la Lhéngua: a set of language resources and natural language processing tools for Mirandese. José Pedro Ferreira, Cristiano Chesi, Daan Baldewijns, Fernando Miguel Pinto, Margarita Correia, Daniela Braga, Hyongsil Cho, Amadeu Ferreira, Miguel Sales Dias
2014	Characterizing and Predicting Bursty Events: The Buzz Case Study on Twitter. Mohamed Morchid, Georges Linarès, Richard Dufour
2014	Chasing the Perfect Splitter: A Comparison of Different Compound Splitting Tools. Carla Parra Escartín
2014	Choosing which to use? A study of distributional models for nominal lexical semantic classification. Lauren Romeo, Gianluca Lebani, Núria Bel, Alessandro Lenci
2014	Classifying Inconsistencies in DBpedia Language Specific Chapters. Elena Cabrio, Serena Villata, Fabien Gandon
2014	ClearTK 2.0: Design Patterns for Machine Learning in UIMA. Steven Bethard, Philip V. Ogren, Lee Becker
2014	Clinical Data-Driven Probabilistic Graph Processing. Travis R. Goodwin, Sanda M. Harabagiu
2014	Clustering of Multi-Word Named Entity variants: Multilingual Evaluation. Guillaume Jacquet, Maud Ehrmann, Ralf Steinberger
2014	Clustering tweets usingWikipedia concepts. Guoyu Tang, Yunqing Xia, Weizhi Wang, Raymond Lau, Fang Zheng
2014	Co-Training for Classification of Live or Studio Music Recordings. Nicolas Auguin, Pascale Fung
2014	Co-clustering of bilingual datasets as a mean for assisting the construction of thematic bilingual comparable corpora. Guiyao Ke, Pierre-François Marteau
2014	CoRoLa ― The Reference Corpus of Contemporary Romanian Language. Verginica Barbu Mititelu, Elena Irimia, Dan Tufis
2014	ColLex.en: Automatically Generating and Evaluating a Full-form Lexicon for English. Tim vor der Brück, Alexander Mehler, Zahurul Islam
2014	Collaboration in the Production of a Massively Multilingual Lexicon. Martin Benjamin
2014	Collaboratively Annotating Multilingual Parallel Corpora in the Biomedical Domain―some MANTRAs. Johannes Hellrich, Simon Clematide, Udo Hahn, Dietrich Rebholz-Schuhmann
2014	Collecting Natural SMS and Chat Conversations in Multiple Languages: The BOLT Phase 2 Corpus. Zhiyi Song, Stephanie M. Strassel, Haejoong Lee, Kevin Walker, Jonathan Wright, Jennifer Garland, Dana Fore, Brian Gainor, Preston Cabe, Thomas Thomas, Brendan Callahan, Ann Sawyer
2014	Collection of a Simultaneous Translation Corpus for Comparative Analysis. Hiroaki Shimizu, Graham Neubig, Sakriani Sakti, Tomoki Toda, Satoshi Nakamura
2014	Collocation or Free Combination? ― Applying Machine Translation Techniques to identify collocations in Japanese. Lis Pereira, Elga Strafella, Yuji Matsumoto
2014	Combining dependency information and generalization in a pattern-based approach to the classification of lexical-semantic relation instances. Silvia Necsulescu, Sara Mendes, Núria Bel
2014	Combining elicited imitation and fluency features for oral proficiency measurement. Deryle Lonsdale, Carl Christensen
2014	Comparative Analysis of Portuguese Named Entities Recognition Tools. Daniela O. F. do Amaral, Evandro Brasil da Fonseca, Lucelene Lopes, Renata Vieira
2014	Comparative analysis of verbal alignment in human-human and human-agent interactions. Sabrina Campano, Jessica Durand, Chloé Clavel
2014	Comparing Similarity Measures for Distributional Thesauri. Muntsa Padró, Marco Idiart, Aline Villavicencio, Carlos Ramisch
2014	Comparing the Quality of Focused Crawlers and of the Translation Resources Obtained from them. Bruno Laranjeira, Viviane Pereira Moreira, Aline Villavicencio, Carlos Ramisch, Maria José Bocorny Finatto
2014	Comparing two acquisition systems for automatically building an English-Croatian parallel corpus from multilingual websites. Miquel Esplà-Gomis, Filip Klubicka, Nikola Ljubesic, Sergio Ortiz-Rojas, Vassilis Papavassiliou, Prokopis Prokopidis
2014	Comparison of Gender- and Speaker-adaptive Emotion Recognition. Maxim Sidorov, Stefan Ultes, Alexander Schmitt
2014	Comparison of the Impact of Word Segmentation on Name Tagging for Chinese and Japanese. Haibo Li, Masato Hagiwara, Qi Li, Heng Ji
2014	Compounds and distributional thesauri. Olivier Ferret
2014	Comprehensive Annotation of Multiword Expressions in a Social Web Corpus. Nathan Schneider, Spencer Onuffer, Nora Kazour, Emily Danchik, Michael T. Mordowanec, Henrietta Conrad, Noah A. Smith
2014	Computational Narratology: Extracting Tense Clusters from Narrative Texts. Thomas Bögel, Jannik Strötgen, Michael Gertz
2014	Computer-Aided Quality Assurance of an Icelandic Pronunciation Dictionary. Martin Jansche
2014	Computer-aided morphology expansion for Old Swedish. Yvonne Adesam, Malin Ahlberg, Peter Andersson, Gerlof Bouma, Markus Forsberg, Mans Hulden
2014	Conceptual transfer: Using local classifiers for transfer selection. Gregor Thurmair
2014	Constituency Parsing of Bulgarian: Word- vs Class-based Parsing. Masood Ghayoomi, Kiril Ivanov Simov, Petya Osenova
2014	Constructing a Chinese―Japanese Parallel Corpus from Wikipedia. Chenhui Chu, Toshiaki Nakazawa, Sadao Kurohashi
2014	Constructing a Corpus of Japanese Predicate Phrases for Synonym/Antonym Relations. Tomoko Izumi, Tomohide Shibata, Hisako Asano, Yoshihiro Matsuo, Sadao Kurohashi
2014	Constructing and exploiting an automatically annotated resource of legislative texts. Stefan Höfler, Kyoko Sugisaki
2014	Construction and Annotation of a French Folkstale Corpus. Anne Garcia-Fernandez, Anne-Laure Ligozat, Anne Vilnat
2014	Construction of Diachronic Ontologies from People's Daily of Fifty Years. Shaoda He, Xiaojun Zou, Liumingjing Xiao, Junfeng Hu
2014	Converting an HPSG-based Treebank into its Parallel Dependency-based Treebank. Masood Ghayoomi, Jonas Kuhn
2014	Coreference Resolution for Latvian. Arturs Znotins, Peteris Paikens
2014	Corpus Annotation through Crowdsourcing: Towards Best Practice Guidelines. Marta Sabou, Kalina Bontcheva, Leon Derczynski, Arno Scharl
2014	Corpus and Evaluation of Handwriting Recognition of Historical Genealogical Records. Patrick Schone, Heath E. Nielson, Mark Ward
2014	Corpus and Method for Identifying Citations in Non-Academic Text. Yifan He, Adam Meyers
2014	Corpus for Coreference Resolution on Scientific Papers. Panot Chaimongkol, Akiko Aizawa, Yuka Tateisi
2014	Corpus of 19th-century Czech Texts: Problems and Solutions. Karel Kucera, Martin Stluka
2014	Corpus-Based Computation of Reverse Associations. Reinhard Rapp
2014	Correcting Errors in a New Gold Standard for Tagging Icelandic Text. Sigrún Helgadóttir, Hrafn Loftsson, Eiríkur Rögnvaldsson
2014	Correcting and Validating Syntactic Dependency in the Spoken French Treebank Rhapsodie. Rachel Bawden, Marie-Amélie Botalla, Kim Gerdes, Sylvain Kahane
2014	Creating Summarization Systems with SUMMA. Horacio Saggion
2014	Creating a Gold Standard Corpus for the Extraction of Chemistry-Disease Relations from Patent Texts. Antje Schlaf, Claudia Bobach, Matthias Irmer
2014	Creating a massively parallel Bible corpus. Thomas Mayer, Michael Cysouw
2014	Creating and using large monolingual parallel corpora for sentential paraphrase generation. Sander Wubben, Antal van den Bosch, Emiel Krahmer
2014	Creative language explorations through a high-expressivity N-grams query language. Carlo Strapparava, Lorenzo Gatti, Marco Guerini, Oliviero Stock
2014	Criteria for Identifying and Annotating Caused Motion Constructions in Corpus Data. Jena D. Hwang, Annie Zaenen, Martha Palmer
2014	CroDeriV: a new resource for processing Croatian morphology. Kresimir Sojat, Matea Srebacic, Marko Tadic, Tin Pavelic
2014	Croatian Dependency Treebank 2.0: New Annotation Guidelines for Improved Parsing. Zeljko Agic, Dasa Berovic, Danijela Merkler, Marko Tadic
2014	Croatian Memories. Arjan van Hessen, Franciska de Jong, Stef Scagliola, Tanja Petrovic
2014	Cross-Language Authorship Attribution. Dasha Bogdanova, Angeliki Lazaridou
2014	Cross-linguistic annotation of narrativity for English/French verb tense disambiguation. Cristina Grisot, Thomas Meyer
2014	Crowd-sourcing evaluation of automatically acquired, morphologically related word groupings. Claudia Borg, Albert Gatt
2014	Crowdsourcing and annotating NER for Twitter #drift. Hege Fromreide, Dirk Hovy, Anders Søgaard
2014	Crowdsourcing as a preprocessing for complex semantic annotation tasks. Héctor Martínez Alonso, Lauren Romeo
2014	Crowdsourcing for Evaluating Machine Translation Quality. Shinsuke Goto, Donghui Lin, Toru Ishida
2014	Crowdsourcing for the identification of event nominals: an experiment. Rachele Sprugnoli, Alessandro Lenci
2014	DBpedia Domains: augmenting DBpedia with domain information. Gregor Titze, Volha Bryl, Cäcilia Zirn, Simone Paolo Ponzetto
2014	DCEP -Digital Corpus of the European Parliament. Najeh Hajlaoui, David Kolovratník, Jaakko Väyrynen, Ralf Steinberger, Dániel Varga
2014	DENSE COMPONENTS IN THE STRUCTURE OF WORDNET. Ahti Lohk, Kaarel Allik, Heili Orav, Leo Võhandu
2014	DINASTI: Dialogues with a Negotiating Appointment Setting Interface. Layla El Asri, Romain Laroche, Olivier Pietquin
2014	Data Mining with Shallow vs. Linguistic Features to Study Diversification of Scientific Registers. Stefania Degaetano-Ortlieb, Peter Fankhauser, Hannah Kermes, Ekaterina Lapshinova-Koltunski, Noam Ordan, Elke Teich
2014	DeLex, a freely-avaible, large-scale and linguistically grounded morphological lexicon for German. Benoît Sagot
2014	Deep Syntax Annotation of the Sequoia French Treebank. Marie Candito, Guy Perrier, Bruno Guillaume, Corentin Ribeyre, Karën Fort, Djamé Seddah, Éric Villemonte de la Clergerie
2014	Definition patterns for predicative terms in specialized lexical resources. Antonio San Martín, Marie-Claude L'Homme
2014	Dependency parsing representation effects on the accuracy of semantic applications ― an example of an inflective language. Lauma Pretkalnina, Arturs Znotins, Laura Rituma, Didzis Gosko
2014	DerivBase.hr: A High-Coverage Derivational Morphology Resource for Croatian. Jan Snajder
2014	Design and Development of an Online Computational Framework to Facilitate Language Comprehension Research on Indian Languages. Manjira Sinha, Tirthankar Dasgupta, Anupam Basu
2014	Design and development of an RDB version of the Corpus of Spontaneous Japanese. Hanae Koiso, Yasuharu Den, Ken'ya Nishikawa, Kikuo Maekawa
2014	Designing a Bilingual Speech Corpus for French and German Language Learners: a Two-Step Process. Camille Fauth, Anne Bonneau, Frank Zimmerer, Jürgen Trouvain, Bistra Andreeva, Vincent Colotte, Dominique Fohr, Denis Jouvet, Jeanin Jügler, Yves Laprie, Odile Mella, Bernd Möbius
2014	Designing and Evaluating a Reliable Corpus of Web Genres via Crowd-Sourcing. Noushin Rezapour Asheghi, Serge Sharoff, Katja Markert
2014	Designing the Latvian Speech Recognition Corpus. Marcis Pinnis, Ilze Auzina, Karlis Goba
2014	Detecting Document Structure in a Very Large Corpus of UK Financial Reports. Mahmoud El-Haj, Paul Rayson, Steven Young, Martin Walker
2014	Detecting Subevent Structure for Event Coreference Resolution. Jun Araki, Zhengzhong Liu, Eduard H. Hovy, Teruko Mitamura
2014	Developing Politeness Annotated Corpus of Hindi Blogs. Ritesh Kumar
2014	Developing Text Resources for Ten South African Languages. Roald Eiselen, Martin J. Puttkammer
2014	Developing a Framework for Describing Relations among Language Resources. Penny Labropoulou, Christopher Cieri, Maria Gavrilidou
2014	Developing a French FrameNet: Methodology and First results. Marie Candito, Pascal Amsili, Lucie Barque, Farah Benamara, Gaël de Chalendar, Marianne Djemaa, Pauline Haas, Richard Huyghe, Yvette Yannick Mathieu, Philippe Muller, Benoît Sagot, Laure Vieu
2014	Developing an Egyptian Arabic Treebank: Impact of Dialectal Morphology on Annotation and Tool Development. Mohamed Maamouri, Ann Bies, Seth Kulick, Michael Ciul, Nizar Habash, Ramy Eskander
2014	Development of a TV Broadcasts Speech Recognition System for Qatari Arabic. Mohamed Elmahdy, Mark Hasegawa-Johnson, Eiman Mustafawi
2014	DiVE-Arabic: Gulf Arabic Dialogue in a Virtual Environment. Andrew Gargett, Sam Hellmuth, Ghazi AlGethami
2014	Digital Library 2.0: Source of Knowledge and Research Collaboration Platform. Wlodzimierz Gruszczynski, Maciej Ogrodniczuk
2014	DisMo: A Morphosyntactic, Disfluency and Multi-Word Unit Annotator. An Evaluation on a Corpus of French Spontaneous and Read Speech. George Christodoulides, Mathieu Avanzi, Jean-Philippe Goldman
2014	Disambiguating Verbs by Collocation: Corpus Lexicography meets Natural Language Processing. Ismaïl El Maarouf, Jane Bradbury, Vít Baisa, Patrick Hanks
2014	Disclose Models, Hide the Data - How to Make Use of Confidential Corpora without Seeing Sensitive Raw Data. Erik Faessler, Johannes Hellrich, Udo Hahn
2014	Discosuite - A parser test suite for German discontinuous structures. Wolfgang Maier, Miriam Kaeshammer, Peter Baumann, Sandra Kübler
2014	Discovering and Visualising Stories in News. Marieke van Erp, Gleb Satyukov, Piek Vossen, Marit Nijsen
2014	Discovering frames in specialized domains. Marie-Claude L'Homme, Benoît Robichaud, Carlos Subirats Rüggeberg
2014	Discovering the Italian literature: interactive access to audio indexed text resources. Vincenzo Galatà, Alberto Benin, Piero Cosi, Giuseppe Riccardo Leone, Giulio Paci, Giacomo Sommavilla, Fabio Tesser
2014	Distributed Distributional Similarities of Google Books over the Centuries. Martin Riedl, Richard Steuer, Chris Biemann
2014	Dual Subtitles as Parallel Corpora. Shikun Zhang, Wang Ling, Chris Dyer
2014	DysList: An Annotated Resource of Dyslexic Errors. Luz Rello, Ricardo Baeza-Yates, Joaquim Llisterri
2014	ELRA's Consolidated Services for the HLT Community. Victoria Arranz, Khalid Choukri, Valérie Mapelli, Hélène Mazo
2014	EMOVO Corpus: an Italian Emotional Speech Database. Giovanni Costantini, Iacopo Iaderola, Andrea Paoloni, Massimiliano Todisco
2014	ETER : a new metric for the evaluation of hierarchical named entity recognition. Mohamed Ameur Ben Jannet, Martine Adda-Decker, Olivier Galibert, Juliette Kahn, Sophie Rosset
2014	Efficient Reuse of Structured and Unstructured Resources for Ontology Population. Chetana Gavankar, Ashish Kulkarni, Ganesh Ramakrishnan
2014	El-WOZ: a client-server wizard-of-oz interface. Thomas Pellegrini, Vahid Hedayati, Ângela Costa
2014	Eliciting and Annotating Uncertainty in Spoken Language. Heather Pon-Barry, Stuart M. Shieber, Nicholas Longenbaugh
2014	Emilya: Emotional body expression in daily actions database. Nesrine Fourati, Catherine Pelachaud
2014	Enabling Language Resources to Expose Translations as Linked Data on the Web. Jorge Gracia, Elena Montiel-Ponsoda, Daniel Vila-Suero, Guadalupe Aguado de Cea
2014	Encompassing a spectrum of LT users in the CLARIN-DK Infrastructure. Lina Henriksen, Dorte Haltrup Hansen, Bente Maegaard, Bolette Sandford Pedersen, Claus Povlsen
2014	English-French Verb Phrase Alignment in Europarl for Tense Translation Modeling. Sharid Loáiciga, Thomas Meyer, Andrei Popescu-Belis
2014	Enhancing the TED-LIUM Corpus with Selected Data for Language Modeling and More TED Talks. Anthony Rousseau, Paul Deléglise, Yannick Estève
2014	Enriching ODIN. Fei Xia, William D. Lewis, Michael Wayne Goodman, Joshua Crowgey, Emily M. Bender
2014	Enriching the "Senso Comune" Platform with Automatically Acquired Data. Tommaso Caselli, Laure Vieu, Carlo Strapparava, Guido Vetere
2014	Enrichment of Bilingual Dictionary through News Stream Data. Ajay Dubey, Parth Gupta, Vasudeva Varma, Paolo Rosso
2014	Erlangen-CLP: A Large Annotated Corpus of Speech from Children with Cleft Lip and Palate. Tobias Bocklet, Andreas K. Maier, Korbinian Riedhammer, Ulrich Eysholdt, Elmar Nöth
2014	Estimation of Speaking Style in Speech Corpora Focusing on speech transcriptions. Raymond Shen, Hideaki Kikuchi
2014	Etymological Wordnet: Tracing The History of Words. Gerard de Melo
2014	Euronews: a multilingual speech corpus for ASR. Roberto Gretter
2014	Evaluating Improvised Hip Hop Lyrics - Challenges and Observations. Karteek Addanki, Dekai Wu
2014	Evaluating Lemmatization Models for Machine-Assisted Corpus-Dictionary Linkage. Kevin Black, Eric K. Ringger, Paul Felt, Kevin D. Seppi, Kristian Heal, Deryle Lonsdale
2014	Evaluating Web-as-corpus Topical Document Retrieval with an Index of the OpenDirectory. Clément de Groc, Xavier Tannier
2014	Evaluating corpora documentation with regards to the Ethics and Big Data Charter. Alain Couillault, Karën Fort, Gilles Adda, Hugues de Mazancourt
2014	Evaluating the effects of interactivity in a post-editing workbench. Nancy L. Underwood, Bartolomé Mesa-Lao, Mercedes García-Martínez, Michael Carl, Vicent Alabau, Jesús González-Rubio, Luis A. Leiva, Germán Sanchis-Trilles, Daniel Ortiz-Martínez, Francisco Casacuberta
2014	Evaluation of Automatic Hypernym Extraction from Technical Corpora in English and Dutch. Els Lefever, Marjan Van de Kauter, Véronique Hoste
2014	Evaluation of Simple Distributional Compositional Operations on Longer Texts. Tamara Polajnar, Laura Rimell, Stephen Clark
2014	Evaluation of Technology Term Recognition with Random Indexing. Behrang Q. Zadeh, Siegfried Handschuh
2014	Evaluation of different strategies for domain adaptation in opinion mining. Anne Garcia-Fernandez, Olivier Ferret, Marco Dinarelli
2014	Event Extraction Using Distant Supervision. Kevin Reschke, Martin Jankowiak, Mihai Surdeanu, Christopher D. Manning, Daniel Jurafsky
2014	Expanding n-gram analytics in ELAN and a case study for sign synthesis. Rosalee J. Wolfe, John McDonald, Larwan Berke, Marie Stumbo
2014	Experiences with Parallelisation of an Existing NLP Pipeline: Tagging Hansard. Stephen Wattam, Paul Rayson, Marc Alexander, Jean Anderson
2014	Experiences with the ISOcat Data Category Registry. Daan Broeder, Ineke Schuurman, Menzo Windhouwer
2014	Exploiting Portuguese Lexical Knowledge Bases for Answering Open Domain Cloze Questions Automatically. Hugo Gonçalo Oliveira, Inês Coelho, Paulo Gomes
2014	Exploiting catenae in a parallel treebank alignment. Manuela Sanguinetti, Cristina Bosco, Loredana Cupi
2014	Exploiting networks in Law. Livio Robaldo, Guido Boella, Luigi Di Caro, Andrea Violato
2014	Exploiting the large-scale German Broadcast Corpus to boost the Fraunhofer IAIS Speech Recognition System. Michael Stadtschnitzer, Jochen Schwenninger, Daniel Stein, Joachim Köhler
2014	Exploring and Visualizing Variation in Language Resources. Peter Fankhauser, Jörg Knappen, Elke Teich
2014	Exploring factors that contribute to successful fingerspelling comprehension. Leah Geer, Jonathan Keane
2014	Exploring the utility of coreference chains for improved identification of personal names. Andrea Glaser, Jonas Kuhn
2014	Extending HeidelTime for Temporal Expressions Referring to Historic Dates. Jannik Strötgen, Thomas Bögel, Julian Zell, Ayser Armiti, Tran Van Canh, Michael Gertz
2014	Extending standoff annotation. Maik Stührenberg
2014	Extending the coverage of a MWE database for Persian CPs exploiting valency alternations. Pollet Samvelian, Pegah Faghiri, Sarra El Ayari
2014	Extensions of the Sign Language Recognition and Translation Corpus RWTH-PHOENIX-Weather. Jens Forster, Christoph Schmidt, Oscar Koller, Martin Bellgardt, Hermann Ney
2014	Extracting Information for Context-aware Meeting Preparation. Simon Scerri, Behrang Q. Zadeh, Maciej Dabrowski, Ismael Rivera
2014	Extracting News Web Page Creation Time with DCTFinder. Xavier Tannier
2014	Extracting a bilingual semantic grammar from FrameNet-annotated corpora. Dana Dannélls, Normunds Gruzitis
2014	Extracting semantic relations from Portuguese corpora using lexical-syntactic patterns. Raquel Amaro
2014	Extraction of Daily Changing Words for Question Answering. Kugatsu Sadamitsu, Ryuichiro Higashinaka, Yoshihiro Matsuo
2014	Extrinsic Corpus Evaluation with a Collocation Dictionary Task. Adam Kilgarriff, Pavel Rychlý, Milos Jakubícek, Vojtech Kovár, Vít Baisa, Lucia Kocincová
2014	FLELex: a graded lexical resource for French foreign learners. Thomas François, Núria Gala, Patrick Watrin, Cédrick Fairon
2014	Facing the Identification Problem in Language-Related Scientific Data Analysis. Joseph Mariani, Christopher Cieri, Gil Francopoulo, Patrick Paroubek, Marine Delaborde
2014	Finding Romanized Arabic Dialect in Code-Mixed Tweets. Clare R. Voss, Stephen Tratz, Jamal Laoudi, Douglas M. Briesch
2014	Finding a Tradeoff between Accuracy and Rater's Workload in Grading Clustered Short Answers. Andrea Horbach, Alexis Palmer, Magdalena Wolska
2014	Finite-state morphological transducers for three Kypchak languages. Jonathan North Washington, Ilnar Salimzyanov, Francis M. Tyers
2014	First Insight into Quality-Adaptive Dialogue. Stefan Ultes, Hüseyin Dikme, Wolfgang Minker
2014	First approach toward Semantic Role Labeling for Basque. Haritz Salaberri, Olatz Arregi, Beñat Zapirain
2014	Flow Graph Corpus from Recipe Texts. Shinsuke Mori, Hirokuni Maeta, Yoko Yamakata, Tetsuro Sasada
2014	Focusing Annotation for Semantic Role Labeling. Daniel W. Peterson, Martha Palmer, Shumin Wu
2014	Free Acoustic and Language Models for Large Vocabulary Continuous Speech Recognition in Swedish. Niklas Vanhainen, Giampiero Salvi
2014	Free English and Czech telephone speech corpus shared under the CC-BY-SA 3.0 license. Matej Korvas, Ondrej Plátek, Ondrej Dusek, Lukás Zilka, Filip Jurcícek
2014	Freepal: A Large Collection of Deep Lexico-Syntactic Patterns for Relation Extraction. Johannes Kirschnick, Alan Akbik, Holmer Hemsen
2014	French Resources for Extraction and Normalization of Temporal Expressions with HeidelTime. Véronique Moriceau, Xavier Tannier
2014	From Natural Language to Ontology Population in the Cultural Heritage Domain. A Computational Linguistics-based approach. Maria Pia di Buono, Mario Monteleone
2014	From Non Word to New Word: Automatically Identifying Neologisms in French Newspapers. Ingrid Falk, Delphine Bernhard, Christophe Gérard
2014	From Synsets to Videos: Enriching ItalWordNet Multimodally. Roberto Bartolini, Valeria Quochi, Irene De Felice, Irene Russo, Monica Monachini
2014	Fuzzy V-Measure - An Evaluation Method for Cluster Analyses of Ambiguous Data. Jason Utt, Sylvia Springorum, Maximilian Köper, Sabine Schulte im Walde
2014	GENERATING A LEXICON OF ERRORS IN PORTUGUESE TO SUPPORT AN ERROR IDENTIFICATION SYSTEM FOR SPANISH NATIVE LEARNERS. Lianet Sepúlveda Torres, Magali Sanches Duran, Sandra M. Aluísio
2014	GLÀFF, a Large Versatile French Lexicon. Nabil Hathout, Franck Sajous, Basilio Calderone
2014	GRASS: the Graz corpus of Read And Spontaneous Speech. Barbara Schuppler, Martin Hagmueller, Juan Andres Morales-Cordovilla, Hannes Pessentheiner
2014	Generating Polarity Lexicons with WordNet propagation in 5 languages. Isa Maks, Rubén Izquierdo, Francesca Frontini, Rodrigo Agerri, Piek Vossen, Andoni Azpeitia
2014	Generating a Resource for Products and Brandnames Recognition. Application to the Cosmetic Domain. Cédric Lopez, Frédérique Segond, Olivier Hondermarck, Paolo Curtoni, Luca Dini
2014	Generating and using probabilistic morphological resources for the biomedical domain. Vincent Claveau, Ewa Kijak
2014	GenitivDB ― a Corpus-Generated Database for German Genitive Classification. Roman Schneider
2014	Genres in the Prague Discourse Treebank. Lucie Poláková, Pavlína Jínová, Jirí Mírovský
2014	German Alcohol Language Corpus - the Question of Dialect. Florian Schiel, Thomas Kisler
2014	Getting Reliable Annotations for Sarcasm in Online Dialogues. Reid Swanson, Stephanie M. Lukin, Luke Eisenberg, Thomas Chase Corcoran, Marilyn A. Walker
2014	Global Intelligent Content: Active Curation of Language Resources using Linked Data. David Lewis, Rob Brennan, Leroy Finn, Dominic Jones, Alan Meehan, Declan O'Sullivan, Sebastian Hellmann, Felix Sasaki
2014	GlobalPhone: Pronunciation Dictionaries in 20 Languages. Tanja Schultz, Tim Schlippe
2014	Gold-standard for Topic-specific Sentiment Analysis of Economic Texts. Pyry Takala, Pekka Malo, Ankur Sinha, Oskar Ahlgren
2014	GraPAT: a Tool for Graph Annotations. Jonathan Sonntag, Manfred Stede
2014	Guampa: a Toolkit for Collaborative Translation. Alex Rudnick, Taylor Skidmore, Alberto Samaniego, Michael Gasser
2014	HESITA(te) in Portuguese. Sara Candeias, Dirce Celorico, Jorge Proença, Arlindo Veiga, Carla Lopes, Fernando Perdigão
2014	HFST-SweNER ― A New NER Resource for Swedish. Dimitrios Kokkinakis, Jyrki Niemi, Sam Hardwick, Krister Lindén, Lars Borin
2014	HamleDT 2.0: Thirty Dependency Treebanks Stanfordized. Rudolf Rosa, Jan Masek, David Marecek, Martin Popel, Daniel Zeman, Zdenek Zabokrtský
2014	Harmonization of German Lexical Resources for Opinion Mining. Thierry Declerck, Hans-Ulrich Krieger
2014	Hashtag Occurrences, Layout and Translation: A Corpus-driven Analysis of Tweets Published by the Canadian Government. Fabrizio Gotti, Philippe Langlais, Atefeh Farzindar
2014	Heuristic Hyper-minimization of Finite State Lexicons. Senka Drobac, Krister Lindén, Flammie A. Pirinen, Miikka Silfverberg
2014	HiEve: A Corpus for Extracting Event Hierarchies from News Stories. Goran Glavas, Jan Snajder, Marie-Francine Moens, Parisa Kordjamshidi
2014	High Quality Word Lists as a Resource for Multiple Purposes. Uwe Quasthoff, Dirk Goldhahn, Thomas Eckart, Erla Hallsteinsdóttir, Sabine Fiedler
2014	HindEnCorp - Hindi-English and Hindi-only Corpus for Machine Translation. Ondrej Bojar, Vojtech Diatka, Pavel Rychlý, Pavel Stranák, Vit Suchomel, Ales Tamchyna, Daniel Zeman
2014	Hindi to English Machine Translation: Using Effective Selection in Multi-Model SMT. Kunal Sachdeva, Rishabh Srivastava, Sambhav Jain, Dipti Misra Sharma
2014	Hope and Fear: How Opinions Influence Factuality. Chantal van Son, Marieke van Erp, Antske Fokkens, Piek Vossen
2014	Hot Topics and Schisms in NLP: Community and Trend Analysis with Saffron on ACL and LREC Proceedings. Paul Buitelaar, Georgeta Bordea, Barry Coughlan
2014	How Could Veins Speed Up The Process Of Discourse Parsing. Elena Mitocariu, Daniel Alexandru Anechitei, Dan Cristea
2014	How to Tell a Schneemann from a Milchmann: An Annotation Scheme for Compound-Internal Relations. Corina Dima, Verena Henrich, Erhard W. Hinrichs, Christina Hoppermann
2014	How to Use less Features and Reach Better Performance in Author Gender Identification. Juan Soler Company, Leo Wanner
2014	How to construct a multi-lingual domain ontology. Nitsan Chrizman, Alon Itai
2014	HuRIC: a Human Robot Interaction Corpus. Emanuele Bastianelli, Giuseppe Castellucci, Danilo Croce, Luca Iocchi, Roberto Basili, Daniele Nardi
2014	Human annotation of ASR error regions: Is "gravity" a sharable concept for human annotators? Daniel Luzzati, Cyril Grouin, Ioana Vasilescu, Martine Adda-Decker, Éric Bilinski, Nathalie Camelin, Juliette Kahn, Carole Lailler, Lori Lamel, Sophie Rosset
2014	ILLINOISCLOUDNLP: Text Analytics Services in the Cloud. Hao Wu, Zhiye Fei, Aaron Dai, Mark Sammons, Dan Roth, Stephen Mayhew
2014	ISLEX ― a Multilingual Web Dictionary. Þórdís Úlfarsdóttir
2014	IXA pipeline: Efficient and Ready to Use Multilingual NLP tools. Rodrigo Agerri, Josu Bermudez, German Rigau
2014	Identification of Multiword Expressions in the brWaC. Rodrigo Boos, Kassius Prestes, Aline Villavicencio
2014	Identification of Technology Terms in Patents. Peter G. Anick, Marc Verhagen, James Pustejovsky
2014	Identifying Idioms in Chinese Translations. Wan Yu Ho, Christine Kng, Shan Wang, Francis Bond
2014	Image Annotation with ISO-Space: Distinguishing Content from Structure. James Pustejovsky, Zachary Yocum
2014	Improvements to Dependency Parsing Using Automatic Simplification of Data. Tomás Jelínek
2014	Improving Entity Linking using Surface Form Refinement. Eric Charton, Marie-Jean Meurs, Ludovic Jean-Louis, Michel Gagnon
2014	Improving Evaluation of English-Czech MT through Paraphrasing. Petra Barancíková, Rudolf Rosa, Ales Tamchyna
2014	Improving Open Relation Extraction via Sentence Re-Structuring. Jordan Schmidek, Denilson Barbosa
2014	Improving the exploitation of linguistic annotations in ELAN. Onno Crasborn, Han Sloetjes
2014	Incorporating Alternate Translations into English Translation Treebank. Ann Bies, Justin Mott, Seth Kulick, Jennifer Garland, Colin Warner
2014	Information Extraction from German Patient Records via Hybrid Parsing and Relation Extraction Strategies. Hans-Ulrich Krieger, Christian Spurk, Hans Uszkoreit, Feiyu Xu, Yi Zhang, Frank Müller, Thomas Tolxdorff
2014	Innovations in Parallel Corpus Search Tools. Martin Volk, Johannes Graën, Elena Callegaro
2014	Integration of Workflow and Pipeline for Language Service Composition. Trang Mai Xuan, Yohei Murakami, Donghui Lin, Toru Ishida
2014	Interoperability and Customisation of Annotation Schemata in Argo. Rafal Rak, Jacob Carter, Andrew Rowley, Riza Theresa Batista-Navarro, Sophia Ananiadou
2014	Interoperability of Dialogue Corpora through ISO 24617-2-based Querying. Volha Petukhova, Andrei Malchanau, Harry Bunt
2014	Introducing a Framework for the Evaluation of Music Detection Tools. Paula Lopez-Otero, Laura Docío Fernández, Carmen García-Mateo
2014	Introducing a web application for labeling, visualizing speech and correcting derived speech signals. Raphael Winkelmann, Georg Raess
2014	Investigating the Image of Entities in Social Media: Dataset Design and First Results. Julien Velcin, Young-Min Kim, Caroline Brun, Jean-Yves Dormagen, Eric SanJuan, Leila Khouas, Anne Peradotto, Stéphane Bonnevay, Claude Roux, Julien Boyadjian, Alejandro Molina-Villegas, Marie Neihouser
2014	JUST.ASK, a QA system that learns to answer new questions from previous interactions. Sérgio Curto, Ana Cristina Mendes, Pedro Curto, Luísa Coheur, Ângela Costa
2014	Japanese conversation corpus for training and evaluation of backchannel prediction model. Hiroaki Noguchi, Yasuhiro Katagiri, Yasuharu Den
2014	KALAKA-3: a database for the recognition of spoken European languages on YouTube audios. Luis Javier Rodríguez-Fuentes, Mikel Peñagarikano, Amparo Varona, Mireia Díez, Germán Bordel
2014	KoKo: an L1 Learner Corpus for German. Andrea Abel, Aivars Glaznieks, Lionel Nicolas, Egon Stemle
2014	LQVSumm: A Corpus of Linguistic Quality Violations in Multi-Document Summarization. Annemarie Friedrich, Marina Valeeva, Alexis Palmer
2014	Language CoLLAGE: Grammatical Description with the LinGO Grammar Matrix. Emily M. Bender
2014	Language Editing Dataset of Academic Texts. Vidas Daudaravicius
2014	Language Processing Infrastructure in the XLike Project. Lluís Padró, Zeljko Agic, Xavier Carreras, Blaz Fortuna, Esteban García-Cuesta, Zhixing Li, Tadej Stajner, Marko Tadic
2014	Language Resource Addition: Dictionary or Corpus? Shinsuke Mori, Graham Neubig
2014	Language Resources and Annotation Tools for Cross-Sentence Relation Extraction. Sebastian Krause, Hong Li, Feiyu Xu, Hans Uszkoreit, Robert Hummel, Luise Spielhagen
2014	Language Resources for French in the Biomedical Domain. Aurélie Névéol, Julien Grosjean, Stéfan Jacques Darmoni, Pierre Zweigenbaum
2014	Languagesindanger.eu - Including Multimedia Language Resources to disseminate Knowledge and Create Educational Material on less-Resourced Languages. Dagmar Jung, Katarzyna Klessa, Zsuzsa Duray, Beatrix Oszkó, Mária Sipos, Sándor Szeverényi, Zsuzsa Várnai, Paul Trilsbeek, Tamás Váradi
2014	Large SMT data-sets extracted from Wikipedia. Dan Tufis
2014	Large Scale Arabic Error Annotation: Guidelines and Framework. Wajdi Zaghouani, Behrang Mohit, Nizar Habash, Ossama Obeid, Nadi Tomeh, Alla Rozovskaya, Noura Farra, Sarah Alkuhlani, Kemal Oflazer
2014	Latent Semantic Analysis Models on Wikipedia and TASA. Dan Stefanescu, Rajendra Banjade, Vasile Rus
2014	Learning from Domain Complexity. Robert Remus, Dominique Ziegelmayer
2014	Legal aspects of text mining. Maarten Truyens, Patrick Van Eecke
2014	Less is More? Towards a Reduced Inventory of Categories for Training a Parser for the Italian Stanford Dependencies. Maria Simi, Cristina Bosco, Simonetta Montemagni
2014	LexTec ― a rich language resource for technical domains in Portuguese. Palmira Marrafa, Raquel Amaro, Sara Mendes
2014	LexTerm Manager: Design for an Integrated Lexicography and Terminology System. Joshua Elliot, Logan Kearsley, Jason Housley, Alan K. Melby
2014	Lexical Substitution Dataset for German. Kostadin Cholakov, Chris Biemann, Judith Eckle-Kohler, Iryna Gurevych
2014	Linguistic Evaluation of Support Verb Constructions by OpenLogos and Google Translate. Anabela Barreiro, Johanna Monti, Brigitte Orliac, Susanne Preuß, Kutz Arrieta, Wang Ling, Fernando Batista, Isabel Trancoso
2014	Linguistic landscaping of South Asia using digital language resources: Genetic vs. areal linguistics. Lars Borin, Anju Saxena, Taraka Rama, Bernard Comrie
2014	Linguistic resources and cats: how to use ISOcat, RELcat and SCHEMAcat. Menzo Windhouwer, Ineke Schuurman
2014	Linked Open Data and Web Corpus Data for noun compound bracketing. Pierre André Ménard, Caroline Barrière
2014	LinkedHealthAnswers: Towards Linked Data-driven Question Answering for the Health Care Domain. Artem Ostankov, Florian Röhrbein, Ulli Waltinger
2014	Linking Pictographs to Synsets: Sclera2Cornetto. Vincent Vandeghinste, Ineke Schuurman
2014	Locating Requests among Open Source Software Communication Messages. Ioannis Korkontzelos, Sophia Ananiadou
2014	MADAMIRA: A Fast, Comprehensive Tool for Morphological Analysis and Disambiguation of Arabic. Arfath Pasha, Mohamed Al-Badrashiny, Mona T. Diab, Ahmed El Kholy, Ramy Eskander, Nizar Habash, Manoj Pooleery, Owen Rambow, Ryan Roth
2014	MAPPING DIATOPIC AND DIACHRONIC VARIATION IN SPOKEN CZECH: THE ORTOFON AND DIALEKT CORPORA. Marie Koprivová, Hana Golánová, Petra Klimesová, David Lukes
2014	MAT: a tool for L2 pronunciation errors annotation. Renlong Ai, Marcela Charfuelan
2014	META-SHARE: One year after. Stelios Piperidis, Harris Papageorgiou, Christian Spurk, Georg Rehm, Khalid Choukri, Olivier Hamon, Nicoletta Calzolari, Riccardo Del Gratta, Bernardo Magnini, Christian Girardi
2014	ML-Optimization of Ported Constraint Grammars. Eckhard Bick
2014	MTWatch: A Tool for the Analysis of Noisy Parallel Data. Sandipan Dandapat, Declan Groves
2014	MUHIT: A Multilingual Harmonized Dictionary. Sameh Alansary
2014	Machine Translation for Subtitling: A Large-Scale Evaluation. Thierry Etchegoyhen, Lindsay Bywood, Mark Fishel, Panayota Georgakopoulou, Jie Jiang, Gerard van Loenhout, Arantza del Pozo, Mirjam Sepesy Maucec, Anja Turner, Martin Volk
2014	Machine Translationness: Machine-likeness in Machine Translation Evaluation. Joaquim Moré, Salvador Climent
2014	Macrosyntactic Segmenters of a French Spoken Corpus. Ilaine Wang, Sylvain Kahane, Isabelle Tellier
2014	Manual Analysis of Structurally Informed Reordering in German-English Machine Translation. Teresa Herrmann, Jan Niehues, Alex Waibel
2014	Mapping Between English Strings and Reentrant Semantic Graphs. Fabienne Braune, Daniel Bauer, Kevin Knight
2014	Mapping CPA Patterns onto OntoNotes Senses. Octavian Popescu, Martha Palmer, Patrick Hanks
2014	Mapping WordNet Domains, WordNet Topics and Wikipedia Categories to Generate Multilingual Domain Specific Resources. Spandana Gella, Carlo Strapparava, Vivi Nastase
2014	Mapping the Lexique des Verbes du FrancÌ§ais (Lexicon of French Verbs) to a NLP lexicon using examples. Bruno Guillaume, Karën Fort, Guy Perrier, Paul Bédaride
2014	Measuring Readability of Polish Texts: Baseline Experiments. Bartosz Broda, Bartlomiej Niton, Wlodzimierz Gruszczynski, Maciej Ogrodniczuk
2014	Measuring the Impact of Spelling Errors on the Quality of Machine Translation. Irina Galinskaya, Valentin Gusev, Elena Mescheryakova, Mariya Shmatova
2014	Media monitoring and information extraction for the highly inflected agglutinative language Hungarian. Júlia Pajzs, Ralf Steinberger, Maud Ehrmann, Mohamed Ebrahim, Leonida Della Rocca, Stefano Bucci, Eszter Simon, Tamás Váradi
2014	Meta-Classifiers Easily Improve Commercial Sentiment Detection Tools. Mark Cieliebak, Oliver Dürr, Fatih Uzdilli
2014	Metadata as Linked Open Data: mapping disparate XML metadata registries into one RDF/OWL registry. Marta Villegas, Maite Melero, Núria Bel
2014	Mining Online Discussion Forums for Metaphors. Andrew Gargett, John A. Barnden
2014	Mining a multimodal corpus for non-verbal behavior sequences conveying attitudes. Mathieu Chollet, Magalie Ochs, Catherine Pelachaud
2014	Missed opportunities in translation memory matching. Friedel Wolff, Laurette Pretorius, Paul Buitelaar
2014	Modeling Language Proficiency Using Implicit Feedback. Chris Hokamp, Rada Mihalcea, Peter Schuelke
2014	Modeling and evaluating dialog success in the LAST MINUTE corpus. Dietmar F. Rösner, Rafael Friesen, Stephan Günther, Rico Andrich
2014	Modeling, Managing, Exposing, and Linking Ontologies with a Wiki-based Tool. Mauro Dragoni, Alessio Bosca, Matteo Casu, Andi Rexha
2014	Modelling Irony in Twitter: Feature Analysis and Evaluation. Francesco Barbieri, Horacio Saggion
2014	Modern Chinese Helps Archaic Chinese Processing: Finding and Exploiting the Shared Properties. Yan Song, Fei Xia
2014	Momresp: A Bayesian Model for Multi-Annotator Document Labeling. Paul Felt, Robbie Haertel, Eric K. Ringger, Kevin D. Seppi
2014	Morfeusz Reloaded. Marcin Wolinski
2014	Morpho-Syntactic Study of Errors from Speech Recognition System. Maria Goryainova, Cyril Grouin, Sophie Rosset, Ioana Vasilescu
2014	Morphological parsing of Swahili using crowdsourced lexical resources. Patrick Littell, Kaitlyn Price, Lori S. Levin
2014	MotàMot project: conversion of a French-Khmer published dictionary for building a multilingual lexical system. Mathieu Mangeot
2014	MultiVal - towards a multilingual valence lexicon. Lars Hellan, Dorothee Beermann, Tore Bruland, Mary Esther Kropp Dakubu, Montserrat Marimon
2014	Multilingual Test Sets for Machine Translation of Search Queries for Cross-Lingual Information Retrieval in the Medical Domain. Zdenka Uresová, Jan Hajic, Pavel Pecina, Ondrej Dusek
2014	Multilingual corpora with coreferential annotation of person entities. Marcos García, Pablo Gamallo
2014	Multilingual eXtended WordNet Knowledge Base: Semantic Parsing and Translation of Glosses. Tatiana N. Erekhinskaya, Meghana N. Satpute, Dan I. Moldovan
2014	Multimodal Corpora for Silent Speech Interaction. João Freitas, António J. S. Teixeira, Miguel Sales Dias
2014	Multimodal dialogue segmentation with gesture post-processing. Kodai Takahashi, Masashi Inoue
2014	Multiple Choice Question Corpus Analysis for Distractor Characterization. Van-Minh Pho, Thibault André, Anne-Laure Ligozat, Brigitte Grau, Gabriel Illouz, Thomas François
2014	Multiword Expressions in Machine Translation. Valia Kordoni, Iliana Simova
2014	Mörkum Njálu. An annotated corpus to analyse and explain grammatical divergences between 14th-century manuscripts of Njál's saga. Ludger Zeevaert
2014	N-gram Counts and Language Models from the Common Crawl. Christian Buck, Kenneth Heafield, Bas van Ooyen
2014	NARROWING THE GAP BETWEEN TERMBASES AND CORPORA IN COMMERCIAL ENVIRONMENTS. Kara Warburton
2014	NASTIA: Negotiating Appointment Setting Interface. Layla El Asri, Rémi Lemonnier, Romain Laroche, Olivier Pietquin, Hatim Khouzaimi
2014	NIF4OGGD - NLP Interchange Format for Open German Governmental Data. Mohamed Ahmed Sherif, Sandro Athaíde Coelho, Ricardo Usbeck, Sebastian Hellmann, Jens Lehmann, Martin Brümmer, Andreas Both
2014	NOMAD: Linguistic Resources and Tools Aimed at Policy Formulation and Validation. George Kiomourtzis, George Giannakopoulos, Georgios Petasis, Pythagoras Karampiperis, Vangelis Karkaletsis
2014	Named Entity Corpus Construction using Wikipedia and DBpedia Ontology. Younggyun Hahm, Jungyeul Park, Kyungtae Lim, Youngsik Kim, Dosam Hwang, Key-Sun Choi
2014	Named Entity Recognition on Turkish Tweets. Dilek Küçük, Guillaume Jacquet, Ralf Steinberger
2014	Named Entity Tagging a Very Large Unbalanced Corpus: Training and Evaluating NE Classifiers. Joachim Bingel, Thomas N. Haider
2014	Native Language Identification Using Large, Longitudinal Data. Xiao Jiang, Yufan Guo, Jeroen Geertzen, Dora Alexopoulou, Lin Sun, Anna Korhonen
2014	New Directions for Language Resource Development and Distribution. Christopher Cieri, Denise DiPersio, Mark Y. Liberman, Andrea Mazzucchi, Stephanie M. Strassel, Jonathan Wright
2014	New Spanish speech corpus database for the analysis of people suffering from Parkinson's disease. Juan Rafael Orozco-Arroyave, Julián David Arias-Londoño, Jesús Francisco Vargas-Bonilla, María Claudia Gonzalez-Rátiva, Elmar Nöth
2014	New bilingual speech databases for audio diarization. David Tavarez, Eva Navas, Daniel Erro, Ibon Saratxaga, Inma Hernáez
2014	New functions for a multipurpose multimodal tool for phonetic and linguistic analysis of very large speech corpora. Philippe Martin
2014	NewsReader: recording history from daily news streams. Piek Vossen, German Rigau, Luciano Serafini, Pim Stouten, Francis Irving, Willem Robert van Hage
2014	NoSta-D Named Entity Annotation for German: Guidelines and Dataset. Darina Benikova, Chris Biemann, Marc Reznicek
2014	NomLex-PT: A Lexicon of Portuguese Nominalizations. Valeria de Paiva, Livy Real, Alexandre Rademaker, Gerard de Melo
2014	Not an Interlingua, But Close: Comparison of English AMRs to Chinese and Czech. Nianwen Xue, Ondrej Bojar, Jan Hajic, Martha Palmer, Zdenka Uresová, Xiuhong Zhang
2014	N³ - A Collection of Datasets for Named Entity Recognition and Disambiguation in the NLP Interchange Format. Michael Röder, Ricardo Usbeck, Sebastian Hellmann, Daniel Gerber, Andreas Both
2014	Off-Road LAF: Encoding and Processing Annotations in NLP Workflows. Emanuele Lapponi, Erik Velldal, Stephan Oepen, Rune Lain Knudsen
2014	On Complex Word Alignment Configurations. Miriam Kaeshammer, Anika Westburg
2014	On Paraphrase Identification Corpora. Vasile Rus, Rajendra Banjade, Mihai C. Lintean
2014	On Stopwords, Filtering and Data Sparsity for Sentiment Analysis of Twitter. Hassan Saif, Miriam Fernández, Yulan He, Harith Alani
2014	On the Importance of Text Analysis for Stock Price Prediction. Heeyoung Lee, Mihai Surdeanu, Bill MacCartney, Dan Jurafsky
2014	On the Romance Languages Mutual Intelligibility. Liviu P. Dinu, Alina Maria Ciobanu
2014	On the annotation of TMX translation memories for advanced leveraging in computer-aided translation. Mikel L. Forcada
2014	On the origin of errors: A fine-grained analysis of MT and PE errors and their relationship. Joke Daems, Lieve Macken, Sonia Vandepitte
2014	On the reliability and inter-annotator agreement of human semantic MT evaluation via HMEANT. Chi-kiu Lo, Dekai Wu
2014	On the use of a fuzzy classifier to speed up the Sp_ToBI labeling of the Glissando Spanish corpus. David Escudero Mancebo, Lourdes Aguilar-Cuevas, César González Ferreras, Yurena Gutiérrez-González, Valentín Cardeñoso-Payo
2014	Online experiments with the Percy software framework - experiences and some early results. Christoph Draxler
2014	Online optimisation of log-linear weights in interactive machine translation. Mara Chinea-Rios, Germán Sanchis-Trilles, Daniel Ortiz-Martínez, Francisco Casacuberta
2014	Open Philology at the University of Leipzig. Frederik Baumgardt, Giuseppe G. A. Celano, Gregory R. Crane, Stella Dee, Maryam Foradi, Emily Franzini, Greta Franzini, Monica Lent, Maria Moritz, Simona Stoyanova
2014	Open-domain Interaction and Online Content in the Sami Language. Kristiina Jokinen
2014	OpenLogos Semantico-Syntactic Knowledge-Rich Bilingual Dictionaries. Anabela Barreiro, Fernando Batista, Ricardo Ribeiro, Helena Moniz, Isabel Trancoso
2014	Optimizing a Distributional Semantic Model for the Prediction of German Particle Verb Compositionality. Stefan Bott, Sabine Schulte im Walde
2014	Out in the Open: Finding and Categorising Errors in the Lexical Simplification Pipeline. Matthew Shardlow
2014	Overview of Todai Robot Project and Evaluation Framework of its NLP-based Problem Solving. Akira Fujita, Akihiro Kameda, Ai Kawazoe, Yusuke Miyao
2014	PACE Corpus: a multilingual corpus of Polarity-annotated textual data from the domains Automotive and CEllphone. Christian Haenig, Andreas Niekler, Carsten Wuensch
2014	PanLex: Building a Resource for Panlingual Lexical Translation. David Kamholz, Jonathan Pool, Susan M. Colowick
2014	ParCor 1.0: A Parallel Pronoun-Coreference Corpus to Support Statistical MT. Liane Guillou, Christian Hardmeier, Aaron Smith, Jörg Tiedemann, Bonnie L. Webber
2014	Parsing Chinese Synthetic Words with a Character-based Dependency Model. Fei Cheng, Kevin Duh, Yuji Matsumoto
2014	Parsing Heterogeneous Corpora with a Rich Dependency Grammar. Achim Stein
2014	Phone Boundary Annotation in Conversational Speech. Yi-Fen Liu, Shu-Chuan Tseng, Jyh-Shing Roger Jang
2014	Phoneme Set Design Using English Speech Database by Japanese for Dialogue-Based English CALL Systems. Xiaoyun Wang, Jinsong Zhang, Masafumi Nishida, Seiichi Yamamoto
2014	Phoneme Similarity Matrices to Improve Long Audio Alignment for Automatic Subtitling. Pablo Ruiz Fabo, Aitor Álvarez, Haritz Arzelus
2014	Pivot-based multilingual dictionary building using Wiktionary. Judit Ács
2014	PoliTa: A multitagger for Polish. Lukasz Kobylinski
2014	Polish Coreference Corpus in Numbers. Maciej Ogrodniczuk, Mateusz Kopec, Agata Savary
2014	Polysemy Index for Nouns: an Experiment on Italian using the PAROLE SIMPLE CLIPS Lexical Database. Francesca Frontini, Valeria Quochi, Sebastian Padó, Monica Monachini, Jason Utt
2014	Potsdam Commentary Corpus 2.0: Annotation for Discourse Research. Manfred Stede, Arne Neumann
2014	Praaline: Integrating Tools for Speech Corpus Research. George Christodoulides
2014	Pre-ordering of phrase-based machine translation input in translation workflow. Alexandru Ceausu, Sabine Hunsicker
2014	Predicate Matrix: extending SemLink through WordNet mappings. Maddalen Lopez de Lacalle, Egoitz Laparra, German Rigau
2014	Presenting a system of human-machine interaction for performing map tasks. Gabriele Pallotti, Francesca Frontini, Fabio Affè, Monica Monachini, Stefania Ferrari
2014	Priberam Compressive Summarization Corpus: A New Multi-Document Summarization Corpus for European Portuguese. Miguel B. Almeida, Mariana S. C. Almeida, André F. T. Martins, Helena Figueira, Pedro Mendes, Cláudia Pinto
2014	Proceedings of the Ninth International Conference on Language Resources and Evaluation, LREC 2014, Reykjavik, Iceland, May 26-31, 2014. Nicoletta Calzolari, Khalid Choukri, Thierry Declerck, Hrafn Loftsson, Bente Maegaard, Joseph Mariani, Asunción Moreno, Jan Odijk, Stelios Piperidis
2014	Production of Phrase Tables in 11 European Languages using an Improved Sub-sentential Aligner. Juan Luo, Yves Lepage
2014	Projection-based Annotation of a Polish Dependency Treebank. Alina Wróblewska, Adam Przepiórkowski
2014	PropBank: Semantics of New Predicate Types. Claire Bonial, Julia Bonn, Kathryn Conger, Jena D. Hwang, Martha Palmer
2014	Propa-L: a semantic filtering service from a lexical network created using Games With A Purpose. Mathieu Lafourcade, Karën Fort
2014	Prosodic, syntactic, semantic guidelines for topic structures across domains and corpora. Ana Isabel Mata, Helena Moniz, Telmo Móia, Anabela Gonçalves, Fátima Silva, Fernando Batista, Inês Duarte, Fátima De Cassia E. Oliveira, Isabel Falé
2014	Pruning the Search Space of the Wolof LFG Grammar Using a Probabilistic and a Constraint Grammar Parser. Cheikh M. Bamba Dione
2014	Quality Estimation for Synthetic Parallel Data Generation. Raphaël Rubino, Antonio Toral, Nikola Ljubesic, Gema Ramírez-Sánchez
2014	RECSA: Resource for Evaluating Cross-lingual Semantic Annotation. Achim Rettinger, Lei Zhang, Dasa Berovic, Danijela Merkler, Matea Srebacic, Marko Tadic
2014	REFRACTIVE: An Open Source Tool to Extract Knowledge from Syntactic and Semantic Relations. Peter Exner, Pierre Nugues
2014	RELISH LMF: Unlocking the Full Power of the Lexical Markup Framework. Menzo Windhouwer, Justin Petro, Shakila Shayan
2014	RESTful Annotation and Efficient Collaboration. Jonathan Wright
2014	ROOTS: a toolkit for easy, fast and consistent processing of large sequential annotated data collections. Jonathan Chevelu, Gwénolé Lecorvé, Damien Lolive
2014	RSS-TOBI - A Prosodically Enhanced Romanian Speech Corpus. Tiberiu Boros, Adriana Stan, Oliver Watts, Stefan Daniel Dumitrescu
2014	Ranking Job Offers for Candidates: learning hidden knowledge from Big Data. Marc Poch, Núria Bel, Sergio Espeja, Felipe Navio
2014	Rapid Deployment of Phrase Structure Parsing for Related Languages: A Case Study of Insular Scandinavian. Anton Karl Ingason, Hrafn Loftsson, Eiríkur Rögnvaldsson, Einar Freyr Sigurðsson, Joel Wallenberg
2014	Re-using an Argument Corpus to Aid in the Curation of Social Media Collections. Clare Llewellyn, Claire Grover, Jon Oberlander, Ewan Klein
2014	Recent Developments in DeReKo. Marc Kupietz, Harald Lüngen
2014	Recognising suicidal messages in Dutch social media. Bart Desmet, Véronique Hoste
2014	Reconstructing the Semantic Landscape of Natural Language Processing. Elisa Omodei, Jean-Philippe Cointet, Thierry Poibeau
2014	Relating Frames and Constructions in Japanese FrameNet. Kyoko Ohara
2014	Relation Inference in Lexical Networks ... with Refinements. Manel Zarrouk, Mathieu Lafourcade
2014	Representing Multilingual Data as Linked Data: the Case of BabelNet 2.0. Maud Ehrmann, Francesco Cecconi, Daniele Vannella, John Philip McCrae, Philipp Cimiano, Roberto Navigli
2014	Representing Multimodal Linguistic Annotated data. Brigitte Bigi, Tatsuya Watanabe, Laurent Prévot
2014	Resource Creation and Evaluation for Multilingual Sentiment Analysis in Social Media Texts. Alexandra Balahur, Marco Turchi, Ralf Steinberger, José Manuel Perea Ortega, Guillaume Jacquet, Dilek Küçük, Vanni Zavarella, Adil El Ghali
2014	Resources for the Detection of Conventionalized Metaphors in Four Languages. Lori S. Levin, Teruko Mitamura, Brian MacWhinney, Davida Fromm, Jaime G. Carbonell, Weston Feely, Robert E. Frederking, Anatole Gershman, Carlos Ramírez
2014	Resources in Conflict: A Bilingual Valency Lexicon vs. a Bilingual Treebank vs. a Linguistic Theory. Jana Sindlerová, Zdenka Uresová, Eva Fucíková
2014	Reusing Swedish FrameNet for training semantic roles. Ildikó Pilán, Elena Volodina
2014	Revising the annotation of a Broadcast News corpus: a linguistic approach. Vera Cabarrão, Helena Moniz, Fernando Batista, Ricardo Ribeiro, Nuno J. Mamede, Hugo Meinedo, Isabel Trancoso, Ana Isabel Mata, David Martins de Matos
2014	Rhapsodie: a Prosodic-Syntactic Treebank for Spoken French. Anne Lacheret, Sylvain Kahane, Julie Beliao, Anne Dister, Kim Gerdes, Jean-Philippe Goldman, Nicolas Obin, Paola Pietrandrea, Atanas Tchobanov
2014	Rule-based Reordering Space in Statistical Machine Translation. Nicolas Pécheux, Alexandre Allauzen, François Yvon
2014	Ruled-based, Interlingual Motivated Mapping of plWordNet onto SUMO Ontology. Pawel Kedzia, Maciej Piasecki
2014	S-pot - a benchmark in spotting signs within continuous signing. Ville Viitaniemi, Tommi Jantunen, Leena Savolainen, Matti Karppa, Jorma Laaksonen
2014	SANA: A Large Scale Multi-Genre, Multi-Dialect Lexicon for Arabic Subjectivity and Sentiment Analysis. Muhammad Abdul-Mageed, Mona T. Diab
2014	SAVAS: Collecting, Annotating and Sharing Audiovisual Language Resources for Automatic Subtitling. Arantza del Pozo, Carlo Aliprandi, Aitor Álvarez, Carlos Mendes, Joao P. Neto, Sérgio Paulo, Nicola Piccinini, Matteo Raffaelli
2014	SLMotion - An extensible sign language oriented video analysis tool. Matti Karppa, Ville Viitaniemi, Marcos Luzardo, Jorma Laaksonen, Tommi Jantunen
2014	SWIFT Aligner, A Multifunctional Tool for Parallel Corpora: Visualization, Word Alignment, and (Morpho)-Syntactic Cross-Language Transfer. Timur Gilmanov, Olga Scrivner, Sandra Kübler
2014	Segmentation evaluation metrics, a comparison grounded on prosodic and discourse units. Klim Peshkov, Laurent Prévot
2014	Self-training a Constituency Parser using n-gram Trees. Arda Çelebi, Arzucan Özgür
2014	Semantic Clustering of Pivot Paraphrases. Marianna Apidianaki, Emilia Verzeni, Diana McCarthy
2014	Semantic Search in Documents Enriched by LOD-based Annotations. Pavel Smrz, Jan Kouril
2014	Semantic Technologies for Querying Linguistic Annotations: An Experiment Focusing on Graph-Structured Data. Milen Kouylekov, Stephan Oepen
2014	Semantic approaches to software component retrieval with English queries. Huijing Deng, Grzegorz Chrupala
2014	Semi-automatic annotation of the UCU accents speech corpus. Rosemary Orr, Marijn Huijbregts, Roeland van Beek, Lisa Teunissen, Kate Backhouse, David A. van Leeuwen
2014	Semi-compositional Method for Synonym Extraction of Multi-Word Terms. Béatrice Daille, Amir Hazem
2014	Semi-supervised methods for expanding psycholinguistics norms by integrating distributional similarity with the structure of WordNet. Michael Mohler, Marc T. Tomlinson, David B. Bracewell, Bryan Rink
2014	SenTube: A Corpus for Sentiment Analysis on YouTube Social Media. Olga Uryupina, Barbara Plank, Aliaksei Severyn, Agata Rotondi, Alessandro Moschitti
2014	Sentence Rephrasing for Parsing Sentences with OOV Words. Hen-Hsen Huang, Huan-Yuan Chen, Chang-Sheng Yu, Hsin-Hsi Chen, Po-Ching Lee, Chun-Hsun Chen
2014	Sharing Cultural Heritage: the Clavius on the Web Project. Matteo Abrate, Angelo Mario Del Grosso, Emiliano Giovannetti, Angelica Lo Duca, Damiana Luzzi, Lorenzo Mancini, Andrea Marchetti, Irene Pedretti, Silvia Piccini
2014	Sharing resources between free/open-source rule-based machine translation systems: Grammatical Framework and Apertium. Grégoire Détrez, Víctor M. Sánchez-Cartagena, Aarne Ranta
2014	Shata-Anuvadak: Tackling Multiway Translation of Indian Languages. Anoop Kunchukuttan, Abhijit Mishra, Rajen Chatterjee, Ritesh M. Shah, Pushpak Bhattacharyya
2014	Simple Effective Microblog Named Entity Recognition: Arabic as an Example. Kareem Darwish, Wei Gao
2014	Single Classifier Approach for Verb Sense Disambiguation based on Generalized Features. Daisuke Kawahara, Martha Palmer
2014	Single-Person and Multi-Party 3D Visualizations for Nonverbal Communication Analysis. Michael Kipp, Levin Freiherr von Hollen, Michael Christopher Hrstka, Franziska Zamponi
2014	SinoCoreferencer: An End-to-End Chinese Event Coreference Resolver. Chen Chen, Vincent Ng
2014	Smile and Laughter in Human-Machine Interaction: a study of engagement. Mariette Soury, Laurence Devillers
2014	Sockpuppet Detection in Wikipedia: A Corpus of Real-World Deceptive Writing for Linking Identities. Thamar Solorio, Ragib Hasan, Mainul Mizan
2014	Speech Recognition Web Services for Dutch. Joris Pelemans, Kris Demuynck, Hugo Van hamme, Patrick Wambacq
2014	Speech-Based Emotion Recognition: Feature Selection by Self-Adaptive Multi-Criteria Genetic Algorithm. Maxim Sidorov, Christina Brester, Wolfgang Minker, Eugene Semenkin
2014	Sprinter: Language Technologies for Interactive and Multimedia Language Learning. Renlong Ai, Marcela Charfuelan, Walter Kasper, Tina Klüwer, Hans Uszkoreit, Feiyu Xu, Sandra Gasber, Philip Gienandt
2014	Standardisation and Interoperation of Morphosyntactic and Syntactic Annotation Tools for Spanish and their Annotations. Antonio Pareja-Lora, Guillermo Cárcamo-Escorza, Alicia Ballesteros-Calvo
2014	Statistical Analysis of Multilingual Text Corpus and Development of Language Models. Shyam S. Agrawal, Abhimanue, Shweta Bansal, Minakshi Mahajan
2014	Student achievement and French sentence repetition test scores. Deryle Lonsdale, Benjamin Millard
2014	Sublanguage Corpus Analysis Toolkit: A tool for assessing the representativeness and sublanguage characteristics of corpora. Irina P. Temnikova, William A. Baumgartner Jr., Negacy D. Hailu, Ivelina Nikolova, Tony McEnery, Adam Kilgarriff, Galia Angelova, K. Bretonnel Cohen
2014	Summarizing News Clusters on the Basis of Thematic Chains. Natalia V. Loukachevitch, Aleksey Alekseev
2014	Supervised Within-Document Event Coreference using Information Propagation. Zhengzhong Liu, Jun Araki, Eduard H. Hovy, Teruko Mitamura
2014	SwissAdmin: A multilingual tagged parallel corpus of press releases. Yves Scherrer, Luka Nerima, Lorenza Russo, Maria Ivanova, Eric Wehrli
2014	Synergy of Nederlab and. Martin Reynaert
2014	Szeged Corpus 2.5: Morphological Modifications in a Manually POS-tagged Hungarian Corpus. Veronika Vincze, Viktor Varga, Katalin Ilona Simkó, János Zsibrita, Ágoston Nagy, Richárd Farkas, János Csirik
2014	T-PAS; A resource of Typed Predicate Argument Structures for linguistic analysis and semantic processing. Elisabetta Jezek, Bernardo Magnini, Anna Feltracco, Alessia Bianchini, Octavian Popescu
2014	T2K^2: a System for Automatically Extracting and Organizing Knowledge from Texts. Felice Dell'Orletta, Giulia Venturi, Andrea Cimino, Simonetta Montemagni
2014	TALC-sef A Manually-Revised POS-TAgged Literary Corpus in Serbian, English and French. Antonio Balvet, Dejan Stosic, Aleksandra Miletic
2014	TLAXCALA: a multilingual corpus of independent news. Antonio Toral
2014	TMO ― The Federated Ontology of the TrendMiner Project. Hans-Ulrich Krieger, Thierry Declerck
2014	TUKE-BNews-SK: Slovak Broadcast News Corpus Construction and Evaluation. Matús Pleva, Jozef Juhár
2014	TVD: A Reproducible and Multiply Aligned TV Series Dataset. Anindya Roy, Camille Guinaudeau, Hervé Bredin, Claude Barras
2014	TaLAPi ― A Thai Linguistically Annotated Corpus for Language Processing. AiTi Aw, Sharifah Aljunied Mahani, Nattadaporn Lertcheva, Sasiwimon Kalunsima
2014	Taalportaal: an online grammar of Dutch and Frisian. Frank Landsbergen, Carole Tiberius, Roderik Dernison
2014	TagNText: A parallel corpus for the induction of resource-specific non-taxonomical relations from tagged images. Theodosia Togia, Ann A. Copestake
2014	Teenage and adult speech in school context: building and processing a corpus of European Portuguese. Ana Isabel Mata, Helena Moniz, Fernando Batista, Julia Hirschberg
2014	TermWise: A CAT-tool with Context-Sensitive Terminological Support. Kris Heylen, Stephen Bond, Dirk De Hertog, Ivan Vulic, Hendrik J. Kockaert
2014	Terminology Resources and Terminology Work Benefit from Cloud Services. Tatiana Gornostay, Andrejs Vasiljevs
2014	Terminology localization guidelines for the national scenario. Juris Borzovs, Ilze Ilzina, Iveta Keisa, Marcis Pinnis, Andrejs Vasiljevs
2014	TexAFon 2.0: A text processing tool for the generation of expressive speech in TTS applications. Juan María Garrido, Yesika Laplaza, Benjamin Kolz, Miquel Cornudella
2014	Text Readability and Word Distribution in Japanese. Satoshi Sato
2014	Textual Emigration Analysis (TEA). André Blessing, Jonas Kuhn
2014	Tharwa: A Large Scale Dialectal Arabic - Standard Arabic - English Lexicon. Mona T. Diab, Mohamed Al-Badrashiny, Maryam Aminian, Mohammed Attia, Heba Elfardy, Nizar Habash, Abdelati Hawwari, Wael Salloum, Pradeep Dasigi, Ramy Eskander
2014	The AMARA Corpus: Building Parallel Language Resources for the Educational Domain. Ahmed Abdelali, Francisco Guzmán, Hassan Sajjad, Stephan Vogel
2014	The AV-LASYN Database : A synchronous corpus of audio and 3D facial marker data for audio-visual laughter synthesis. Hüseyin Çakmak, Jérôme Urbain, Thierry Dutoit, Joëlle Tilmanne
2014	The Alveo Virtual Laboratory: A Web Based Repository API. Steve Cassidy, Dominique Estival, Timothy Jones, Denis Burnham, Jared Burghold
2014	The American Local News Corpus. Ann Irvine, Joshua Langfus, Chris Callison-Burch
2014	The CLARIN Research Infrastructure: Resources and Tools for eHumanities Scholars. Erhard W. Hinrichs, Steven Krauwer
2014	The CLE Urdu POS Tagset. Saba Urooj, Sarmad Hussain, Asad Mustafa, Rahila Parveen, Farah Adeeba, Tafseer Ahmed, Miriam Butt, Annette Hautli
2014	The CMD Cloud. Matej Durco, Menzo Windhouwer
2014	The CMU METAL Farsi NLP Approach. Weston Feely, Mehdi Manshadi, Robert E. Frederking, Lori S. Levin
2014	The CUHK Discourse TreeBank for Chinese: Annotating Explicit Discourse Connectives for the Chinese TreeBank. Lanjun Zhou, Binyang Li, Zhongyu Wei, Kam-Fai Wong
2014	The D-ANS corpus: the Dublin-Autonomous Nervous System corpus of biosignal and multimodal recordings of conversational speech. Shannon Hennig, Ryad Chellali, Nick Campbell
2014	The DARE Corpus: A Resource for Anaphora Resolution in Dialogue Based Intelligent Tutoring Systems. Nobal B. Niraula, Vasile Rus, Rajendra Banjade, Dan Stefanescu, William Baggett, Brent Morgan
2014	The DBOX Corpus Collection of Spoken Human-Human and Human-Machine Dialogues. Volha Petukhova, Martin Gropp, Dietrich Klakow, Gregor Eigner, Mario Topf, Stefan Srb, Petr Motlícek, Blaise Potard, John Dines, Olivier Deroo, Ronny Egeler, Uwe Meinz, Steffen Liersch, Anna Schmidt
2014	The DIRHA simulated corpus. Luca Cristoforetti, Mirco Ravanelli, Maurizio Omologo, Alessandro Sosi, Alberto Abad, Martin Hagmueller, Petros Maragos
2014	The DWAN framework: Application of a web annotation framework for the general humanities to the domain of language resources. Przemyslaw Lenkiewicz, Olha Shkaravska, Twan Goosen, Daan Broeder, Menzo Windhouwer, Stephanie Roth, Olof Olsson
2014	The Dangerous Myth of the Star System. André Bittar, Luca Dini, Sigrid Maurel, Mathieu Ruhlmann
2014	The Database for Spoken German ― DGD2. Thomas Schmidt
2014	The Development of Dutch and Afrikaans Language Resources for Compound Boundary Analysis. Menno van Zaanen, Gerhard B. Van Huyssteen, Suzanne Aussems, Chris Emmery, Roald Eiselen
2014	The Development of the Multilingual LUNA Corpus for Spoken Language System Porting. Evgeny A. Stepanov, Giuseppe Riccardi, Ali Orkan Bayer
2014	The Distress Analysis Interview Corpus of human and computer interviews. Jonathan Gratch, Ron Artstein, Gale M. Lucas, Giota Stratou, Stefan Scherer, Angela Nazarian, Rachel Wood, Jill Boberg, David DeVault, Stacy Marsella, David R. Traum, Skip Rizzo, Louis-Philippe Morency
2014	The Dutch LESLLA Corpus. Eric Sanders, Ineke van de Craats, Vanja de Lint
2014	The EASR Corpora of European Portuguese, French, Hungarian and Polish Elderly Speech. Annika Hämäläinen, Jairo Avelar, Silvia Rodrigues, Miguel Sales Dias, Artur Kolesinski, Tibor Fegyó, Géza Németh, Petra Csobánka, Karine Lan, David Hewson
2014	The ETAPE speech processing evaluation. Olivier Galibert, Jérémy Leixa, Gilles Adda, Khalid Choukri, Guillaume Gravier
2014	The Ellogon Pattern Engine: Context-free Grammars over Annotations. Georgios Petasis
2014	The Extended DIRNDL Corpus as a Resource for Coreference and Bridging Resolution. Anders Björkelund, Kerstin Eckart, Arndt Riester, Nadja Schauffler, Katrin Schweitzer
2014	The Gulf of Guinea Creole Corpora. Tjerk Hagemeijer, Michel Généreux, Iris Hendrickx, Amália Mendes, Abigail Tiny, Armando Zamora
2014	The Halliday Centre Tagger: An Online Platform for Semi-automatic Text Annotation and Analysis. Billy Tak-Ming Wong, Ian C. Chow, Jonathan J. Webster, Hengbin Yan
2014	The Hungarian Gigaword Corpus. Csaba Oravecz, Tamás Váradi, Bálint Sass
2014	The IMAGACT Visual Ontology. An Extendable Multilingual Infrastructure for the representation of lexical encoding of Action. Massimo Moneglia, Susan Brown, Francesca Frontini, Gloria Gagliardi, Anas Fahad Khan, Monica Monachini, Alessandro Panunzi
2014	The IULA Spanish LSP Treebank. Montserrat Marimon, Núria Bel, Beatríz Fisas, Blanca Arias, Silvia Vázquez, Jorge Vivaldi, Carlos Morell, Mercè Lorente
2014	The Impact of Cohesion Errors in Extraction Based Summaries. Evelina Rennes, Arne Jönsson
2014	The Interplay Between Lexical and Syntactic Resources in Incremental Parsebanking. Victoria Rosén, Petter Haugereid, Martha Thunes, Gyri Smørdal Losnegaard, Helge Dyvik
2014	The KiezDeutsch Korpus (KiDKo) Release 1.0. Ines Rehbein, Sören Schalowski, Heike Wiese
2014	The LIMA Multilingual Analyzer Made Free: FLOSS Resources Adaptation and Correction. Gaël de Chalendar
2014	The LRE Map disclosed. Riccardo Del Gratta, Gabriella Pardelli, Sara Goggi
2014	The Language Application Grid. Nancy Ide, James Pustejovsky, Christopher Cieri, Eric Nyberg, Di Wang, Keith Suderman, Marc Verhagen, Jonathan Wright
2014	The MERLIN corpus: Learner language and the CEFR. Adriane Boyd, Jirka Hana, Lionel Nicolas, Detmar Meurers, Katrin Wisniewski, Andrea Abel, Karin Schöne, Barbora Stindlová, Chiara Vettori
2014	The MMASCS multi-modal annotated synchronous corpus of audio, video, facial motion and tongue motion data of normal, fast and slow speech. Dietmar Schabus, Michael Pucher, Phil Hoole
2014	The Making of Ancient Greek WordNet. Yuri Bizzoni, Federico Boschetti, Harry Diakoff, Riccardo Del Gratta, Monica Monachini, Gregory R. Crane
2014	The Meta-knowledge of Causality in Biomedical Scientific Discourse. Claudiu Mihaila, Sophia Ananiadou
2014	The Multilingual Paraphrase Database. Juri Ganitkevitch, Chris Callison-Burch
2014	The Munich Biovoice Corpus: Effects of Physical Exercising, Heart Rate, and Skin Conductance on Human Speech Production. Björn W. Schuller, Felix Friedmann, Florian Eyben
2014	The N2 corpus: A semantically annotated collection of Islamist extremist stories. Mark A. Finlayson, Jeffry R. Halverson, Steven R. Corman
2014	The NewSoMe Corpus: A Unifying Opinion Annotation Framework across Genres and in Multiple Languages. Roser Saurí, Judith Domingo, Toni Badia
2014	The Nijmegen Corpus of Casual Czech. Mirjam Ernestus, Lucie Kocková-Amortová, Petr Pollák
2014	The Norwegian Dependency Treebank. Per Erik Solberg, Arne Skjærholt, Lilja Øvrelid, Kristin Hagen, Janne Bondi Johannessen
2014	The Polish Summaries Corpus. Maciej Ogrodniczuk, Mateusz Kopec
2014	The Procedure of Lexico-Semantic Annotation of Składnica Treebank. Elzbieta Hajnicz
2014	The RATS Collection: Supporting HLT Research with Degraded Audio Data. David Graff, Kevin Walker, Stephanie M. Strassel, Xiaoyi Ma, Karen Jones, Ann Sawyer
2014	The Research and Teaching Corpus of Spoken German ― FOLK. Thomas Schmidt
2014	The SETimes.HR Linguistically Annotated Corpus of Croatian. Zeljko Agic, Nikola Ljubesic
2014	The SSPNet-Mobile Corpus: Social Signal Processing Over Mobile Phones. Anna Polychroniou, Hugues Salamin, Alessandro Vinciarelli
2014	The SYN-series corpora of written Czech. Milena Hnátková, Michal Kren, Pavel Procházka, Hana Skoumalová
2014	The Slovak Categorized News Corpus. Daniel Hládek, Ján Stas, Jozef Juhár
2014	The Slovene BNSI Broadcast News database and reference speech corpus GOS: Towards the uniform guidelines for future work. Andrej Zgank, Ana Zwitter Vitez, Darinka Verdonik
2014	The Strategic Impact of META-NET on the Regional, National and International Level. Georg Rehm, Hans Uszkoreit, Sophia Ananiadou, Núria Bel, Audroné Bieleviciené, Lars Borin, António Branco, Gerhard Budin, Nicoletta Calzolari, Walter Daelemans, Radovan Garabík, Marko Grobelnik, Carmen García-Mateo, Josef van Genabith, Jan Hajic, Inma Hernáez, John Judge, Svetla Koeva, Simon Krek, Cvetana Krstev, Krister Lindén, Bernardo Magnini, Joseph Mariani, John McNaught, Maite Melero, Monica Monachini, Asunción Moreno, Jan Odijk, Maciej Ogrodniczuk, Piotr Pezik, Stelios Piperidis, Adam Przepiórkowski, Eiríkur Rögnvaldsson, Michael Rosner, Bolette S. Pedersen, Inguna Skadina, Koenraad De Smedt, Marko Tadic, Paul Thompson, Dan Tufis, Tamás Váradi, Andrejs Vasiljevs, Kadri Vider, Jolanta Zabarskaite
2014	The Sweet-Home speech and multimodal corpus for home automation interaction. Michel Vacher, Benjamin Lecouteux, Pedro Chahuara, François Portet, Brigitte Meillon, Nicolas Bonnefond
2014	The Tutorbot Corpus ― A Corpus for Studying Tutoring Behaviour in Multiparty Face-to-Face Spoken Dialogue. Maria Koutsombogera, Samer Al Moubayed, Bajibabu Bollepalli, Ahmed Hussen Abdelaziz, Martin Johansson, José David Águas Lopes, Jekaterina Novikova, Catharine Oertel, Kalin Stefanov, Gül Varol
2014	The USAGE review corpus for fine grained multi lingual opinion analysis. Roman Klinger, Philipp Cimiano
2014	The Use of a FileMaker Pro Database in Evaluating Sign Language Notation Systems. Julie Hochgesang
2014	The WaveSurfer Automatic Speech Recognition Plugin. Giampiero Salvi, Niklas Vanhainen
2014	The Weltmodell: A Data-Driven Commonsense Knowledge Base. Alan Akbik, Thilo Michael
2014	The eIdentity Text Exploration Workbench. Fritz Kliche, André Blessing, Ulrich Heid, Jonathan Sonntag
2014	The evolving infrastructure for language resources and the role for data scientists. Nelleke Oostdijk, Henk van den Heuvel
2014	The liability of service providers in e-Research Infrastructures: killing the messenger? Pawel Kamocki
2014	The pragmatic annotation of a corpus of academic lectures. Sian Alsop, Hilary Nesi
2014	The taraXÜ corpus of human-annotated machine translations. Eleftherios Avramidis, Aljoscha Burchardt, Sabine Hunsicker, Maja Popovic, Cindy Tscherwinka, David Vilar, Hans Uszkoreit
2014	Thematic Cohesion: measuring terms discriminatory power toward themes. Clément de Groc, Xavier Tannier, Claude de Loupy
2014	Thomas Aquinas in the TüNDRA: Integrating the Index Thomisticus Treebank into CLARIN-D. Scott Martens, Marco Passarotti
2014	Three dimensions of the so-called "interoperability" of annotation schemes. Eva Hajicová
2014	To Pay or to Get Paid: Enriching a Valency Lexicon with Diatheses. Anna Vernerová, Václava Kettnerová, Markéta Lopatková
2014	Tools for Arabic Natural Language Processing: a case study in qalqalah prosody. Claire Brierley, Majdi Sawalha, Eric Atwell
2014	Toward a unifying model for Opinion, Sentiment and Emotion information extraction. Amel Fraisse, Patrick Paroubek
2014	Towards Automatic Detection of Narrative Structure. Jessica Ouyang, Kathy McKeown
2014	Towards Automatic Transformation between Different Transcription Conventions: Prediction of Intonation Markers from Linguistic and Acoustic Features. Yuichi Ishimoto, Tomoyuki Tsuchiya, Hanae Koiso, Yasuharu Den
2014	Towards Electronic SMS Dictionary Construction: An Alignment-based Approach. Cédric Lopez, Reda Bestandji, Mathieu Roche, Rachel Panckhurst
2014	Towards Linked Hypernyms Dataset 2.0: complementing DBpedia with hypernym discovery. Tomás Kliegr, Ondrej Zamazal
2014	Towards Multilingual Conversations in the Medical Domain: Development of Multilingual Medical Data and A Network-based ASR System. Sakriani Sakti, Keigo Kubo, Sho Matsumiya, Graham Neubig, Tomoki Toda, Satoshi Nakamura, Fumihiro Adachi, Ryosuke Isotani
2014	Towards Shared Datasets for Normalization Research. Orphée De Clercq, Sarah Schulz, Bart Desmet, Véronique Hoste
2014	Towards an Encyclopedia of Compositional Semantics: Documenting the Interface of the English Resource Grammar. Dan Flickinger, Emily M. Bender, Stephan Oepen
2014	Towards an Integration of Syntactic and Temporal Annotations in Estonian. Siim Orasmaa
2014	Towards an environment for the production and the validation of lexical semantic resources. Mikaël Morardo, Éric Villemonte de la Clergerie
2014	Towards automatic quality assessment of component metadata. Thorsten Trippel, Daan Broeder, Matej Durco, Oddrun Pauline Ohren
2014	Towards building a Kashmiri Treebank: Setting up the Annotation Pipeline. Riyaz Ahmad Bhat, Shahid Musjtaq Bhat, Dipti Misra Sharma
2014	Towards interoperable discourse annotation. Discourse features in the Ontologies of Linguistic Annotation. Christian Chiarcos
2014	Transfer learning of feedback head expressions in Danish and Polish comparable multimodal corpora. Costanza Navarretta, Magdalena Lis
2014	Translation errors from English to Portuguese: an annotated corpus. Ângela Costa, Tiago Luís, Luísa Coheur
2014	Transliteration and alignment of parallel texts from Cyrillic to Latin. Mircea Petic, Daniela Gîfu
2014	Treelet Probabilities for HPSG Parsing and Error Correction. Angelina Ivanova, Gertjan van Noord
2014	Turkish Resources for Visual Word Recognition. Begum Erten, Cem Bozsahin, Deniz Zeyrek
2014	Turkish Treebank as a Gold Standard for Morphological Disambiguation and Its Influence on Parsing. Özlem Çetinoglu
2014	TweetCaT: a tool for building Twitter corpora of smaller languages. Nikola Ljubesic, Darja Fiser, Tomaz Erjavec
2014	TweetNorm_es: an annotated corpus for Spanish microtext normalization. Iñaki Alegria, Nora Aranberri, Pere Comas, Víctor Fresno, Pablo Gamallo, Lluís Padró, Iñaki San Vicente, Jordi Turmo, Arkaitz Zubiaga
2014	Twente Debate Corpus ― A Multimodal Corpus for Head Movement Analysis. Bayu Rahayudi, Ronald Poppe, Dirk Heylen
2014	Two Approaches to Metaphor Detection. Brian MacWhinney, Davida Fromm
2014	Two-Step Machine Translation with Lattices. Bushra Jawaid, Ondrej Bojar
2014	UM-Corpus: A Large English-Chinese Parallel Corpus for Statistical Machine Translation. Liang Tian, Derek F. Wong, Lidia S. Chao, Paulo Quaresma, Francisco Oliveira, Lu Yi
2014	USING A SERIOUS GAME TO COLLECT A CHILD LEARNER SPEECH CORPUS. Claudia Baur, Manny Rayner, Nikos Tsourakis
2014	Universal Stanford dependencies: A cross-linguistic typology. Marie-Catherine de Marneffe, Timothy Dozat, Natalia Silveira, Katri Haverinen, Filip Ginter, Joakim Nivre, Christopher D. Manning
2014	UnixMan Corpus: A Resource for Language Learning in the Unix Domain. Kyle Richardson, Jonas Kuhn
2014	Untrained Forced Alignment of Transcriptions and Audio for Language Documentation Corpora using WebMAUS. Jan Strunk, Florian Schiel, Frank Seifart
2014	Use of unsupervised word classes for entity recognition: Application to the detection of disorders in clinical reports. Maria Evangelia Chatzimina, Cyril Grouin, Pierre Zweigenbaum
2014	Using Audio Books for Training a Text-to-Speech System. Aimilios Chalamandaris, Pirros Tsiakoulis, Sotiris Karabetsos, Spyros Raptis
2014	Using C5.0 and Exhaustive Search for Boosting Frame-Semantic Parsing Accuracy. Guntis Barzdins, Didzis Gosko, Laura Rituma, Peteris Paikens
2014	Using Large Biomedical Databases as Gold Annotations for Automatic Relation Extraction. Tilia Ellendorff, Fabio Rinaldi, Simon Clematide
2014	Using Resource-Rich Languages to Improve Morphological Analysis of Under-Resourced Languages. Peter Baumann, Janet B. Pierrehumbert
2014	Using Stem-Templates to Improve Arabic POS and Gender/Number Tagging. Kareem Darwish, Ahmed Abdelali, Hamdy Mubarak
2014	Using TEI, CMDI and ISOcat in CLARIN-DK. Dorte Haltrup Hansen, Lene Offersgaard, Sussi Olsen
2014	Using Transfer Learning to Assist Exploratory Corpus Annotation. Paul Felt, Eric K. Ringger, Kevin D. Seppi, Kristian Heal
2014	Using Word Familiarities and Word Associations to Measure Corpus Representativeness. Reinhard Rapp
2014	Using a machine learning model to assess the complexity of stress systems. Liviu P. Dinu, Alina Maria Ciobanu, Ioana Chitoran, Vlad Niculae
2014	Using a sledgehammer to crack a nut? Lexical diversity and event coreference resolution. Agata Cybulska, Piek Vossen
2014	Utilizing constituent structure for compound analysis. Kristín Bjarnadóttir, Jón Daðason
2014	VERTa: Facing a Multilingual Experience of a Linguistically-based MT Evaluation. Elisabet Comelles, Jordi Atserias, Victoria Arranz, Irene Castellón, Jordi Sesé
2014	VOAR: A Visual and Integrated Ontology Alignment Environment. Bernardo Severo, Cássia Trojahn dos Santos, Renata Vieira
2014	VOCE Corpus: Ecologically Collected Speech Annotated with Physiological and Psychological Stress Assessments. Ana Aguiar, Mariana Kaiseler, Hugo Meinedo, Pedro R. Almeida, Mariana Cunha, Jorge M. B. Silva
2014	VOLIP: a corpus of spoken Italian and a virtuous example of reuse of linguistic resources. Iolanda Alfano, Francesco Cutugno, Aurelio De Rosa, Claudio Iacobini, Renata Savy, Miriam Voghera
2014	Valency and Word Order in Czech ― A Corpus Probe. Katerina Rysová, Jirí Mírovský
2014	Validation Issues induced by an Automatic Pre-Annotation Mechanism in the Building of Non-projective Dependency Treebanks. Ophélie Lacroix, Denis Béchet
2014	VarClass: An Open-source Language Identification Tool for Language Varieties. Marcos Zampieri, Binyam Gebrekidan Gebre
2014	Variations on quantitative comparability measures and their evaluations on synthetic French-English comparable corpora. Guiyao Ke, Pierre-François Marteau, Gildas Ménier
2014	Verbs of Saying with a Textual Connecting Function in the Prague Discourse Treebank. Magdalena Rysova
2014	Visualization of Language Relations and Families: MultiTree. Damir Cavar, Malgorzata Cavar
2014	Vocabulary-Based Language Similarity using Web Corpora. Dirk Goldhahn, Uwe Quasthoff
2014	Votter Corpus: A Corpus of Social Polling Language. Nathan Green, Septina Dian Larasati
2014	Vulnerability in Acquisition, Language Impairments in Dutch: Creating a VALID Data Archive. Jetske Klatter, Roeland van Hout, Henk van den Heuvel, Paula Fikkert, Anne Baker, Jan De Jong, Frank Wijnen, Eric Sanders, Paul Trilsbeek
2014	Walenty: Towards a comprehensive valence dictionary of Polish. Adam Przepiórkowski, Elzbieta Hajnicz, Agnieszka Patejuk, Marcin Wolinski, Filip Skwarski, Marek Swidzinski
2014	Web-imageability of the Behavioral Features of Basic-level Concepts. Yoshihiko Hayashi
2014	When POS data sets don't add up: Combatting sample bias. Dirk Hovy, Barbara Plank, Anders Søgaard
2014	When Transliteration Met Crowdsourcing : An Empirical Study of Transliteration via Crowdsourcing using Efficient, Non-redundant and Fair Quality Control. Mitesh M. Khapra, Ananthakrishnan Ramanathan, Anoop Kunchukuttan, Karthik Visweswariah, Pushpak Bhattacharyya
2014	Who cares about Sarcastic Tweets? Investigating the Impact of Sarcasm on Sentiment Analysis. Diana Maynard, Mark A. Greenwood
2014	Why Chinese Web-as-Corpus is Wacky? Or: How Big Data is Killing Chinese Corpus Linguistics. Shu-Kai Hsieh
2014	Word Alignment-Based Reordering of Source Chunks in PB-SMT. Santanu Pal, Sudip Kumar Naskar, Sivaji Bandyopadhyay
2014	Word Semantic Similarity for Morphologically Rich Languages. Kalliopi Zervanou, Elias Iosif, Alexandros Potamianos
2014	Word-Formation Network for Czech. Magda Sevcíková, Zdenek Zabokrtský
2014	WordNet―Wikipedia―Wiktionary: Construction of a Three-way Alignment. Tristan Miller, Iryna Gurevych
2014	YouDACC: the Youtube Dialectal Arabic Comment Corpus. Ahmed Salama, Houda Bouamor, Behrang Mohit, Kemal Oflazer
2014	Zmorge: A German Morphological Lexicon Extracted from Wiktionary. Rico Sennrich, Beat Kunz
2014	caWaC - A web corpus of Catalan and its application to language modeling and machine translation. Nikola Ljubesic, Antonio Toral
2014	sloWCrowd: A crowdsourcing tool for lexicographic tasks. Darja Fiser, Ales Tavcar, Tomaz Erjavec
2014	xLiD-Lexica: Cross-lingual Linked Data Lexica. Lei Zhang, Michael Färber, Achim Rettinger