Produktdetails

Stata wird vom Softwareanbieter StatCorp mit dem Untertitel “Data Analysis and Statistical Software” beschrieben. Dieses Produkt wird insbesondere von Wirtschaftswissenschaftlern verstärkt genutzt.
Mithilfe der Navigation und der Syntax können in Stata Datenreihen erstellt, bearbeitet und für Analysen genutzt werden.

Für Stata sind zwei Dateiformate von besonderer Bedeutung:

  • *.do ⇒ Do-Files dokumentieren die durchgeführten Befehle und erleichtern deren Reproduktion.
  • *.dta ⇒ Daten-Datei im Stata-Format.

Stata verfügt über fünf aneinander gedockte Fenster:

  • Ein Variablenfenster, in dem die Variablen gelistet werden (rechts, oben),
  • ein Fenster, das die Variableneigenschaften bei Auswahl dieser anzeigt (rechts, unten)
  • ein Kommandofenster (unten)
  • das Review-Fenster, in dem die genutzten Befehle gelistet werden (links) und
  • das Output-Fenster, das die Ergebnisse inklusive der getätigten Befehle wiedergibt (mittig).

Syntax-Einführung
Syntax-Einführung

Syntax

__________

Erläuterung

_____________

Struktur

 

command (varlist)

Basisstruktur eines Stata-Befehls

command (varlist) (if) (in), (options)

Erweiterte Struktur eines Stata-Befehls

Kommentare

 

*

Leitet eine Kommentarzeile ein

/*

Leitet einen Kommentar innerhalb einer Zeile ein

*/

Beendet einen Kommentar innerhalb einer Zeile

Hilfe

 

. help (command)

Öffnet die Hilfe zu einem bestimmten Befehl

Daten-Input

 

use

Öffnet einen Stata-Datensatz im dta-Format

clear

Löscht alle innerhalb eines Fensters erstellten Daten/Berechnungen aus Stata

insheet

Liest und importiert Tabellenkalkulationsdateien

infile

Liest und importiert weitere Dateienformate

edit

Öffnet den Daten-Editor

Daten-Handling

 

describe

Beschreibt Variablen und deren Eigenschaften

browse

Zeigt alle oder bestimmte Variablen

list

Listet alle oder bestimmte Variablen auf

generate

Eine neue Variable generieren

replace

Ersetzt den Inhalt (die Werte) einer bereits existierenden Variable

label

Benennt eine Variable

drop

Löscht Variablen oder Beobachtungen innerhalb eines Datensatzes

keep

Behält alle ausgewählten Variablen und löscht alle nicht ausgewählten Variablen/Beobachtungen innerhalb eines Datensatzes

sort

Sortiert den Datensatz bzgl. der Werte der ausgewählten Variable (aufsteigend)

gsort

Sortiert den Datensatz bzgl. der Werte der ausgewählten Variable (aufsteigend oder absteigend)

merge

Kombiniert Datensätze

append

Ergänzt Datensätze

Deskriptive Statistiken

 

summarize

Deskriptive Analyse einer Variablen (Anz. der Erhebungen, arithmetisches Mittel, Standardabweichung, Min, Max)

summarize, detail

Deskriptive Analyse einer Variablen ergänzt um Perzentile, Varianz, Schiefe und Kurtosis

tabulate

Tabellarische Darstellung der Merkmalsausprägungen einer Variable bzgl. absolute, relative und kumulierte Häufigkeit der Ausprägung

graph pie

Erstellt ein Kreisdiagramm

graph twoway scatter

Erstellt ein Streudiagramm/eine Punktwolke in einem zweidimensionalen Koordinatensystem

Regression

 

regress

OLS-Regression einer abhängigen (1. Variable) auf unabhängige Variablen (ab der 2. genannten Variablen)

probit

Probit-Regression einer abhängigen (1. Variable) auf unabhängige Variablen (ab der 2. genannten Variablen) (Maximum Likelihood Methode)

tobit

Tobit-Regression einer abhängigen (1. Variable) auf unabhängige Variablen (ab der 2. genannten Variablen) (Maximum Likelihood Methode)

sonstige

 

codebook

Nennt Kodierungen z. B. für Dummy-Variablen

 

Hinweis 

Unabhängig davon, welches Dezimaltrennzeichen über die Regions- und Sprachoptionen der Systemeinstellung des Betriebssystems eingestellt worden ist, interpretiert Stata immer den Punkt als Dezimaltrennzeichen (anders als in SPSS und Excel, diese Programme übernehmen die Einstellungen des Betriebssystems). Stata liest demnach die Daten aus Excel-Dateien fehlerhaft ein, wenn in der Datei die Dezimalstellen durch ein Komma abgetrennt ist. Damit bei einem Import/Export von Textdateien in/aus Excel oder SPSS der Punkt als Dezimaltrennzeichen benutzt wird, stellen Sie in der Systemeinstellung das Dezimaltrennzeichen auf den international gebräuchlicheren Punkt ein:

Systemsteuerung → Region und Sprache → Weitere Einstellungen → Dezimaltrennzeichen (Komma durch Punkt ersetzen) → OK.

Zugang und Support

Die Software ist kostenpflichtig, steht Studierenden der Mercator School of Management und der Fakultät für Wirtschaftswissenschaften der Universität Duisburg-Essen aber über eine gemeinsame Campus-Lizenz zur Verfügung.

Weitere Informationen

  • Über das Produkt
  • Tutorials
    • Seminar zu Stata als Teil des Modul 3 “Schlüsselqualifikationen” im Master Survey Methodology (Institut für Soziologie, Universität Duisburg-Essen)
    • Textbasiertes Stata-Tutorial von Germán Rodríguez bereitgestellt durch die Princeton University.
    • Video-Tutorials bereitgestellt durch Stata Corp.
    • Textbasiertes Tutorial “Introduction to Stata” von Phil Bardsley, Kim Chantala und Dan Blanchette bereitgestellt durch das Carolina Population Center.

Literaturempfehlungen

  • Kohler, Ulrich, Kreuter, Frauke (2016): Datenanalyse mit Stata: allgemeine Konzepte der Datenanalyse und ihre praktische Anwendung. München: Oldenbourg. Universität Duisburg Essen
  • Cleff, Thomas (2015): Deskriptive Statistik und Explorative Datenanalyse. Eine computergestützte Einführung mit Excel, SPSS und Stata. Wiesbaden: Gabler. Universität Duisburg Essen
  • Wenzelburger, Georg; Jäckle, Sebastian; König, Pascal (2014): Weiterführende statistische Methoden für Politikwissenschaftler. Eine anwendungsbezogene Einführung mit Stata.  München: De Gruyter. Universität Duisburg Essen