Einfaktorielle Varianzanalyse (ANOVA) in SPSS

Lesen Sie, unter welchen Voraussetzungen Sie die ANOVA anwenden können und wie die Berechnung und Interpretation in SPSS anhand von Beispielen erfolgt.

Sebastian | 29.01.2023 | Lesedauer 7 min

Die ANOVA kann als Erweiterung des t-Tests für unabhängige Stichproben aufgefasst werden. Während der t-Test allerdings Mittelwertabweichungen zwischen zwei Gruppen untersucht, kann die ANOVA verwendet werden, wenn drei oder mehr Gruppen unterschieden werden. Daneben wird zwischen der einfaktoriellen und der mehrfaktoriellen ANOVA unterschieden. Während die einfaktorielle ANOVA nur eine unabhängige Variable berücksichtigt, können bei der mehrfaktoriellen ANOVA gleich mehrere unabhängige Variablen aufgenommen werden. In allen Fällen dienen die unabhängigen Variablen zur Unterscheidung von Gruppen in einem Datensatz.

Der Beitrag bietet eine Übersicht zu den wichtigsten Voraussetzungen der einfaktoriellen ANOVA und demonstriert die Berechnung anhand von Beispielen mithilfe von SPSS. Da die ANOVA zunächst nur anzeigt, ob signifikante Gruppenunterschiede vorliegen, werden auch die sogenannten Post-hoc-Verfahren thematisiert, die Aussagen über die Richtung der Gruppenunterschiede auf Basis paarweiser Vergleiche erlauben. Behandelt wird also auch eine beispielhafte Interpretation des SPSS-Outputs.

Grundsätzlich bestehen bei SPSS zwei Alternativen, die gewünschten Berechnungen in das Programm einzugeben: via Menüleiste oder über einen Befehlscode, die sogenannte Syntax. Auf eine Eingabe mittels Menü geht der Beitrag ebenso ein wie auf die Eingabe via SPSS-Syntax.

Ist man im Umgang mit dem Programm fortgeschrittener, so lassen sich Arbeitsschritte über diese Syntax effizienter abarbeiten als über manuelle Menüeingaben. Auch bei Seminar- und Abschlussarbeiten wird häufig gefordert, der Arbeit die verwendete Syntax anzuhängen. Sie dient gleichzeitig als von aussen nachvollziehbares Protokoll der Arbeitsschritte.

 

Einfaktorielle ANOVA am Beispiel eines Länderdatensatzes

Die einfaktorielle ANOVA wird hier beispielhaft an einem Länderdatensatz angewendet. Dieser Datensatz enthält Angaben von 195 Ländern der Welt. Es soll untersucht werden, ob bürgerliche Rechte und Freiheiten in einem Land in Zusammenhang mit der Durchdringung sozialer Netzwerke stehen. Zuvor wurde auf Grundlage von Literatur und empirischen Beobachtungen («Arabischer Frühling») die Hypothese aufgestellt, dass die Regierungen unfreier Länder die Nutzung sozialer Netzwerke einschränken.

Zur Operationalisierung von Rechten und Freiheiten wird der Freedom-House-Index herangezogen, der jedem Land auf Grundlage von unterschiedlichsten Indikatoren eine der Ausprägungen «free», «not free» oder «partly free» zuweist. Die Durchdringung sozialer Netzwerke wird als Bevölkerungsanteil gemessen, der das soziale Netzwerk Facebook nutzt.

ANOVA SPSS freedom-house-index

 

Voraussetzungen zur Berechnung der einfaktoriellen ANOVA

Eine zentrale Voraussetzung für die Anwendung einer ANOVA ist die Unabhängigkeit der Messungen im Datensatz. Das bedeutet, dass die Messung an einer Gruppe in keinem Zusammenhang mit der Messung an einer anderen Gruppe stehen soll. Da im vorliegenden Datensatz jedem Land nur eine der drei Ausprägungen «free», «not free» oder «partly free» zugeordnet wird und keine Messwiederholungen vorliegen, ist diese Voraussetzung erfüllt.

Anhand der Ausprägungen «free», «not free» oder «partly free» wird auch deutlich, dass die weitere Voraussetzung der Nominalskalierung der unabhängigen Variable erfüllt ist. Aufseiten der abhängigen Variable wird eine metrische Skalierung vorausgesetzt, die mit dem Anteilswert der Facebook-Mitglieder an der jeweiligen Gesamtbevölkerung gegeben ist.

Hinzu kommt, dass die abhängige Variable in jeder der Gruppen einer Normalverteilung folgen sollte. Lässt man sich die Verteilung der Facebook-Durchdringung für die Gruppen «free», «not free» oder «partly free» ausgeben, so liegen die Daten bestenfalls in jeder der Gruppen in etwa auf der Gauss- bzw. Normalverteilungskurve. Ebenso sollten sich die Varianzen der Gruppen auf ähnlichem Niveau bewegen, was im Zuge der nachfolgenden Berechnung der ANOVA überprüft wird. Analog zu anderen Verfahren sollten die Daten auch vor der Berechnung der ANOVA auf mögliche Ausreisser untersucht werden, die den Output verzerren können.

  • Voraussetzungen der einfaktoriellen ANOVA
    • Unabhängige Messungen
    • Metrische Skalierung der abhängigen Variable
    • Nominale/kategoriale Skalierung der unabhängigen Variable
    • Normalverteilung der abhängigen Variable in jeder Gruppe
    • Gleichheit der Varianzen in jeder Gruppe (Varianzhomogenität)
    • Keine Ausreisser

Sind einzelne Voraussetzungen nicht erfüllt, stellt sich die Frage, ob man die ANOVA dennoch verwendet oder auf alternative Verfahren ausweicht. Die ANOVA gilt mittlerweile z. B. als robust gegenüber Abweichungen von der Normalverteilung. Als mögliche Alternativen kann man je nach verletzter Voraussetzung z. B. den Kruskal-Wallis-Test oder die logistische bzw. lineare Regressionsanalyse verwenden.

 

Berechnung der ANOVA in SPSS

Um die einfaktorielle ANOVA über das SPSS-Menü zu erreichen, klicken wir auf «Analysieren», «Mittelwerte vergleichen» und anschliessend auf «Einfaktorielle Varianzanalyse».

Menüführung ANOVA SPSS

Das folgende Dialogfenster listet alle im Datensatz verfügbaren Variablen auf der linken Seite auf. Auf der rechten Seite kann nun zunächst die abhängige Variable bestimmt werden. Hierfür wird die hier relevante Variable «Facebook» aus der Liste ausgewählt und durch einen Klick auf den blauen Pfeil in das Feld «Abhängige Variablen» verschoben.

Im Feld «Faktor» wird nun die unabhängige Variable spezifiziert, die anhand ihrer nominalen Ausprägungen die jeweilige Zugehörigkeit eines Landes zu einer der drei Gruppen «free», «not free» oder «partly free» anzeigt. Während die unabhängige Variable in der ANOVA also als Faktor bezeichnet wird, gelten ihre Ausprägungen als Faktorstufen. Im aktuellen Dialogfeld wird ausserdem das Kontrollkästchen neben «Effektgrösse für gesamte Tests schätzen» aktiviert, da wir nur anhand dieser Effektgrössen Aussagen über die Stärke möglicher Zusammenhänge treffen können.

Dialogfeld ANOVA SPSS

Die grundlegenden Einstellungen sind damit bereits vorgenommen. Benötigt wird darüber hinaus allerdings noch die Ausgabe bestimmter Statistiken und eines Post-hoc-Tests, der bereits zu Beginn thematisiert wurde. Wir wählen daher zunächst die Schaltfläche «Optionen» und aktivieren hier die Kontrollkästchen «Deskriptive Statistik», «Test auf Homogenität der Varianzen» und «Diagramm der Mittelwerte». Auf diese Weise lässt man sich nicht nur gruppenspezifische deskriptive Statistiken und Diagramme ausgeben, sondern prüft zugleich die oben genannte Voraussetzung der Varianzhomogenität. Die übrigen angezeigten Einstellungen entsprechen den Standardeinstellungen und bleiben unverändert, sodass nun mit «Weiter» bestätigt werden kann.

Optionen ANOVA SPSS

 

Nach Rückkehr ins ursprüngliche Dialogfeld «Einfaktorielle Varianzanalyse» klicken wir ausserdem auf «Post hoc», woraufhin sich das folgende Untermenü öffnet. Hier hat man die Auswahl aus einer Vielzahl von Post-hoc-Verfahren, die sich zunächst in die Bereiche «Varianzgleichheit angenommen» und «Keine Varianzgleichheit angenommen» gliedern. Da Varianzgleichheit angenommen wird, wählen wir das weitverbreitete Tukey-Verfahren aus.

Wenn keine Varianzgleichheit besteht, kann z. B. auf das Games-Howell-Verfahren zurückgegriffen werden. Die jeweiligen Post-hoc-Verfahren können auf einem Kontinuum zwischen den Polen «konservativ» und «liberal» verortet werden und unterscheiden sich u. a. danach, wie robust der Test auf Verletzung der Normalverteilung reagiert. Nach Auswahl des entsprechenden Kontrollkästchens kann auch hier mit «Weiter» bestätigt werden. Anschliessend wird nach einem Klick auf «OK» die Ausgabe generiert.

Post-hoc Mehrfachvergleiche ANOVA SPSS

 

Interpretation der ANOVA in SPSS

Die Ausgabe beginnt mit einer Anzeige deskriptiver Statistiken. Dabei erhält jede der Faktorstufen «free», «not free» und «partly free» eine Zeile mit deskriptiven Statistiken der abhängigen Variable «Facebook». Die Zeile «Gesamt» fasst die drei Faktorstufen zusammen und zeigt die deskriptiven Statistiken der abhängigen Variable für den gesamten Datensatz an.

Die Beschäftigung mit den deskriptiven Statistiken zeigt zunächst, dass Länder am häufigsten in die Freedom-House-Kategorie «free» fallen (N = 90). 52 Länder sind der Faktorstufe «not free», 40 Länder der Faktorstufe «partly free» zugeordnet. Bereits die Mittelwerte der Facebook-Mitgliederanteile zeigen, dass deutliche Unterschiede zwischen den Ländergruppen vorliegen. So liegt der Mittelwert der abhängigen Variable in Ländern der Faktorstufe «free» bei 29,28 %, in Ländern der Faktorstufe «not free» hingegen bei nur 15,02 %.

Im Anschluss folgt der ausgewählte Test der Varianzhomogenität, für den SPSS auf den Levene-Test zurückgreift. Eine Verletzung der Annahme der Varianzhomogenität müsste man dann annehmen, wenn der Signifikanzwert des Tests p < .05 ist. Da der Signifikanzwert auf Basis des Mittelwertes im Beispiel allerdings bei p = .367 liegt, können wir die Voraussetzung der Varianzhomogenität als gegeben betrachten.

Ausgabe I ANOVA SPSS

 

Nachdem die Voraussetzung der Varianzhomogenität geklärt ist, können wir uns dem Herzstück der einfaktoriellen ANOVA in der folgenden Tabelle widmen. Der Signifikanzwert in der Zeile «Zwischen den Gruppen» zeigt uns an, ob sich die Mittelwerte der Facebook-Mitgliederanteile zwischen mindestens zwei der drei Ländergruppen signifikant unterscheiden. Nachdem das Signifikanzniveau zuvor auf 5 % festgelegt wurde, würde ein p-Wert < .05 einen signifikanten Gruppenunterschied anzeigen.

Im Beispiel liegt der Wert bei p = .000 und zeigt somit an, dass signifikante Unterschiede zwischen mindestens zwei Gruppen vorliegen. Die anschliessende Tabelle «ANOVA-Effektgrössen» erlaubt Schlüsse über die Stärke des Effekts, wobei meist Eta-Quadrat (η2) interpretiert wird, das hier η2 = .203 ist. Bei der Einordnung der Effektstärke hilft die einschlägige Literatur, wonach hier ein starker Effekt vorliegt.

Unklar bleibt jedoch zunächst, welche der drei Ländergruppen bzw. Faktorstufen signifikante Unterschiede im Mittelwert der abhängigen Variable aufweisen. Ein signifikanter Unterschied zwischen lediglich zwei Ländergruppen ist ebenso möglich wie eine signifikante Mittelwertdifferenz zwischen allen denkbaren Gruppenkombinationen. Für nähere Informationen müssen wir daher auf Post-hoc-Verfahren zurückgreifen.

 

Tukey-Test als Post-hoc-Test in SPSS

Nach der zentralen ANOVA-Tabelle werden die Ergebnisse des Post-hoc-Tests ausgegeben. Der Tukey-Test zeichnet sich dadurch aus, dass er alle möglichen Kombinationen von Faktorstufen bzw. Gruppen vergleicht, um paarweise mögliche Mittelwertunterschiede mit statistischer Signifikanz erkennen zu können. Auf Basis von drei Faktorstufen ergibt sich, dass drei mögliche Gruppenkombinationen existieren:

  • «free» vs. «not free»
  • «free» vs. «partly free»
  • «partly free» vs. «not free»

Die SPSS-Ausgabe suggeriert hingegen sechs mögliche Gruppenkombinationen. Das liegt daran, dass SPSS z. B. für die Kombination «free» vs. «not free» zwei Vergleiche anstellt, bei denen jeweils die Reihenfolge der Gruppen vertauscht ist. Für die Interpretation spielt die Reihenfolge der Gruppenkombinationen eine untergeordnete Rolle, da sich z. B. mit Blick auf die Spalte «Mittelwertdifferenz (I-J)» lediglich das Vorzeichen ändert.

Wir können also ablesen, dass Länder in der Freedom-House-Kategorie «free» signifikant höhere Facebook-Mitgliederanteile vorweisen als Länder in der Kategorie «not free» (p = .000) oder «partly free» (p = .000). Die oben deskriptiv identifizierten Mittelwertunterschiede erweisen sich also als statistisch signifikant. Der deskriptiv beobachtete Mittelwertunterschied zwischen den Gruppen «partly free» und «not free» sind laut Tukey-Test dagegen statistisch nicht signifikant (p = .339).

Der ursprünglich in der ANOVA beobachtete signifikante Gruppenunterschied geht also ausschliesslich auf die Differenzen zwischen «free» und den beiden übrigen Faktorstufen zurück. Zusammenfassend zeigt der Tukey-Test einen signifikanten Unterschied in den Facebook-Mitgliedsanteilen zwischen den Gruppen «free» und «not free» (p =.000) sowie zwischen den Gruppen «free» und «partly free» (p = .000). Die Folgetabelle «Homogene Untergruppen» fasst die Ergebnisse in einer abweichenden Darstellung zusammen.

Ausgabe II ANOVA SPSS

Zuletzt folgt die grafische Darstellung der Mittelwertunterschiede, in der auch visuell der deutliche Unterschied in den Facebook-Mitgliederanteilen der Ländergruppe «free» gegenüber den beiden übrigen Gruppen erkennbar wird. Zugleich zeigt sich auch hier, dass die Mittelwerte der abhängige Variable zwischen den Gruppen «not free» und «partly free» nur geringfügig abweichen. Bei der Interpretation der Grafik ist allerdings Vorsicht geboten, da die y-Achse nicht bei 0 beginnt und Gruppenunterschiede grösser erscheinen können, als sie tatsächlich sind.

Alle zuvor genannten Berechnungsschritte lassen sich mithilfe des folgenden Befehls über die Syntax generieren. Nach dem einleitenden Befehl für die einfaktorielle ANOVA («ONEWAY») wird die abhängige und anschliessend die unabhängige Variable definiert. Mit den folgenden Zeilen werden die optionalen Einstellungen in Bezug auf Effektgrössen, Statistiken, Konfidenzintervall und Post-hoc-Test vorgenommen.

ONEWAY Facebook BY FreedomHouseKategorie
/ES=OVERALL
/STATISTICS DESCRIPTIVES HOMOGENEITY
/PLOT MEANS
/MISSING ANALYSIS
/CRITERIA=CILEVEL(0.95)
/POSTHOC=TUKEY ALPHA(0.05).

Weiterführende Literatur:

Eckstein, P. P. (2017). Datenanalyse mit SPSS. Wiesbaden: Springer.

Janczyk, M., Pfister, R. (2013). Inferenzstatistik verstehen. Berlin, Heidelberg: Springer.