Forschungsprojekte

MigTex – Textressourcen für die Migrations- und Integrationsforschung

 

Das Ziel des Projekts ist, für die Migrations- und Integrationsforschung relevante Textressourcen (Korpora, Diktionäre, Annotationen, Trainingsdaten) zu identifizieren, diese in nachhaltige Formate zu überführen und für die Forschung bereit zu stellen. Methodisch ist das Projekt im Bereich der eHumanities bzw. Computational Social Sciences angesiedelt. Es wird in einer Kooperation zwischen der Universität Duisburg-Essen (Interdisziplinäres Zentrum für Integrations- und Migrationsforschung / InZentIM) und dem Wissenschaftszentrum Berlin (WZB) durchgeführt. „MigTex“ baut dabei auf der Infrastruktur, der Codebasis und den Zielsetzungen des PolMine-Projekts (www.polmine.de) auf. Als Strukturprojekt trägt „MigTex“ zur Forschungsdateninfrastruktur des Deutschen Zentrums für Migrations- und Integrationsforschung (DeZIM) bei.

Ein zentrales Interesse des Projekts ist die nachhaltige Bereitstellung von Textressourcen für die Migrations- und Integrationsforschung. Diese Textressourcen in nachhaltige Formate (eXtended Markup Language / XML) zu überführen, dient der Reproduzierbarkeit und führt somit zu mehr Transparenz in der Forschung. Aufwändige Doppelarbeiten können vermieden werden. Die Entwicklung einschlägiger Korpora, Diktionäre und Annotationen eröffnet Potenziale für neue Forschungsansätze und Forschungsvorhaben der Migrations- und Integrationsforschung. Hierzu ist es notwendig, sowohl neue Verfahren bei der nachhaltigen Aufbereitung der Textressourcen zu entwickeln, als auch die ‚klassischen’ qualitativen und quantitativen Ansätze der Inhaltsanalyse um Verfahren der eHumanities bzw. Computational Social Sciences zu erweitern.

Der Arbeitsplan des Projekts sieht vor, dass einschlägige Ressourcen identifiziert und Standardisierungen entwickelt werden. Zunächst sollen gemeinfreie Arbeitsmaterialien (Parlaments- und Regierungskommunikation) aufbereitet werden. Im Rahmen des Projekts besteht allerdings auch die Möglichkeit, lizenzrechtlich geschützte Materialien zu erschließen. Im Projekt wird dann die Verbesserung der Zugänglichkeit und die Dissemination der entwickelten Methoden und der aufbereiteten Daten im Vordergrund stehen. Hierzu ist die Bereitstellung einer Analyseumgebung (auf Basis des bereits vorliegenden R-Pakets ‚polmineR’, vgl. https://cran.r-project.org/package=polmineR) ebenso zentral wie die Erstellung von Tutorials und Workshops (November 2018 und September 2019), die der Vermittlung der bereitstehenden Daten und Methoden dienen sollen.

Nach Abschluss des Projektes stehen die Daten wissenschaftlichen NutzerInnen in lizenzrechtlich geklärter Weise zur Verfügung. Eine Analyseumgebung kann genutzt werden, die quelloffen ist und durch adäquate Dokumentation, Tutorials und Schulungsmaterialen eine technisch niedrigschwellige Verwendung dieser Daten erlaubt. Diese Transparenz und Mechanismen des User-Feedbacks dienen der Qualitätssicherung des Projekts.

 

Kooperationen

 

UDE-interne Kooperationen:
InZentIM
 
Externe Kooperationen:
Wissenschaftszentrum Berlin für Sozialforschung (WZB)

Projektleitung

Blätte1

Prof. Dr. Andreas Blätte

Fakultät für Gesellschaftswissenschaften
Institut für Politikwissenschaft
 

Projektmitarbeit

Merve Schmitz-Vardar
Christoph Leonhardt
Kevin Glock
Florian Gilberg
 

Förderung

DeZIM-Gemeinschaft
 

Projektlaufzeit

01/2018 – 10/2019
 

Weitere Projektinformationen