Conference on CMC and Social Media corpora for the Humanities (CMCCORPORA)

Steuerungsgruppe:

  • Michael Beißwenger (Universität Duisburg-Essen)
  • Darja Fišer (Universität Ljubljana)
  • Ciara R. Wigham (Universität Clermont-Auvergne)

Bisherige Konferenzen:

  • 1. Konferenz: TU Dortmund, DEU (2013)
  • 2. Konferenz: TU Dortmund, DEU (2014)
  • 3. Konferenz: Universität Rennes, FRA (2015) [Website]
  • 4. Konferenz: Univeristät Ljubljana, SVN (2016) [Website]
  • 5. Konferenz: Eurac, Bozen, ITA (2017) [Website]
  • 6. Konferenz: Universität Antwerpen, BEL (2018)

Website der Konferenzreihe:

Kurzbeschreibung (Englisch):

CMCCORPORA is a series of conferences dedicated to the collection, analysis and processing of mono and multimodal, synchronous and asynchronous communications. The focus encompasses different CMC genres. These include, but are not limited to, discussion forums, blogs, newsgroups, emails, SMS and WhatsApp, text chats, wiki discussions, social network exchanges (such as Facebook, Twitter, Linkedin), discussions in multimodal and/or 3D environments (virtual worlds, gaming worlds).

The conference series brings together language-centered research on CMC and social media in linguistics, philologies, communication sciences, media and social sciences with research questions from the field of corpus and computational linguistics, language technology, text technology and machine learning.

Topics of interest:

1. Development of CMC corpora

  • Building CMC corpora: from data collection to publication
  • Open data for research on CMC: questions of ethics and rights
  • Annotation of CMC genres: representation of CMC genres, annotation of linguistic phenomena, metadata
  • Multimodal corpora

2. Analysis of CMC corpora

  • Sociolinguistic studies of CMC
  • Discourse analysis of CMC
  • Linguistic characteristics of CMC
  • Multimodal aspects of CMC
  • Language in contact and code-switching in CMC
  • CMC in language learning & teaching

3. Natural Language Processing of CMC

  • Normalization
  • PoS Tagging
  • Lemmatization
  • Syntactic parsing
  • Named-entity recognition

Peer Review:

Die Konferenzen sind peer-reviewed. Über die Auswahl von Beiträgen für die Konferenzen entscheidet ein Scientific Comitee, das für jede Ausgabe der Konferenz gemeinsam mit den lokalen VeranstalterInnen neu festgelegt wird.

Conference Proceedings und Publikationen:

Seit 2016 werden die für die Konferenzen zur Präsentation angenommenen Beiträge zum Konferenztermin online in Form von Conference Proceedings publiziert:

Ausgewählte Beiträge der Konferenzen 2013, 2015 und 2016 wurden darüber hinaus in den folgenden Buch- bzw. Journalpublikationen veröffentlicht:

  • [Konferenz 2016]
    Fišer, Darja: Beißwenger, Michael (Eds., 2017): Investigating Computer-Mediated Communication: Corpus-Based Approaches to Language in the Digital World. Ljubljana: Ljubljana University Press (Translation Studies and Applied Linguistics). Open-Access-Publikation
  • [Konferenz 2015]
    Wigham, Ciara R. & Gudrun Ledegen, (Hrsg., 2017): Corpus de Communication Médiée par les Réseaux. Construction, structuration, analyse. Paris: L’Harmattan (Humanités numériques).
  • [Konferenz 2013]
    Beißwenger, Michael; Oostdijk, Nelleke; Storrer, Angelika; van den Heuvel, Henk (Eds., 2014): Building and Annotating Corpora of Computer-Mediated Communication: Issues and Challenges at the Interface of Corpus and Computational Linguistics.Special Issue, Journal of Language Technology and Computational Linguistics (JLCL 2/2014). http://jlcl.org/ 

cmccorpora17
 cmccorpora16





Publikationen

Investigating Deckblatt



wighamledegen
jlcl