Wir zeigen Ihnen anhand von Beispielen und Screenshots, wie Sie mit SPSS die Beziehung zwischen zwei Variablen untersuchen.
scroll
Sebastian | 16.07.2022 | Lesedauer 5 min
Der Begriff der bivariaten Statistik wurde bereits an anderer Stelle erläutert. Knapp formuliert setzt man dabei zwei Variablen miteinander in Beziehung, um mögliche statistische Zusammenhänge zu untersuchen. Die bivariate Statistik ist damit ein fester Bestandteil quantitativer Untersuchungen. Der genannte Beitrag stellt zudem eine Interpretationshilfe für die hier erzeugten Tabellen dar.
Der vorliegende Beitrag klärt über die verschiedenen Möglichkeiten der Erstellung bivariater Beziehungen in SPSS auf. Der Text gliedert sich zunächst in Abschnitte zur Generierung von deskriptiven Kreuztabellen und Diagrammen. Abschliessend werden inferenzstatistische bivariate Analysen in SPSS thematisiert.
Grundsätzlich bestehen bei SPSS zwei Alternativen, die gewünschten Berechnungen in das Programm einzugeben: via Menüleiste oder über einen Befehlscode, die sogenannte Syntax. Auf eine Eingabe mittels Menü geht der Beitrag ebenso ein wie auf die Eingabe via SPSS-Syntax.
Ist man im Umgang mit dem Programm fortgeschrittener, so lassen sich Arbeitsschritte über diese Syntax effizienter abarbeiten als über manuelle Menüeingaben. Auch bei Seminar- und Abschlussarbeiten wird häufig gefordert, der Arbeit die verwendete Syntax anzuhängen. Sie dient gleichzeitig als von aussen nachvollziehbares Protokoll der Arbeitsschritte.
Kreuztabellen
Kreuztabellen stellen die einfachste und intuitiv verständlichste Möglichkeit der bivariaten Analyse dar. Nehmen wir zunächst einen Datensatz mit zwei nominal skalierten Variablen an. Während eine Variable das Geschlecht („Männlich“ (1), „Weiblich“ (2), „Divers“ (3)) der untersuchten Personen erfasst, beinhaltet die zweite Variable Angaben darüber, ob die jeweilige Person ein Haustier hält („Nein“ (0), „Ja“ (1)). Es wurden insgesamt 20 Personen befragt.
Mithilfe der Kreuztabelle können wir nun darstellen, wie die Geschlechterverteilung in den Gruppen der Haustierhaltenden und -nichthaltenden ausfällt. Zugleich ist ablesbar, wie hoch die Anteile der Haustierhaltenden innerhalb der Geschlechter ausfallen. Mithilfe des SPSS-Menüs können Kreuztabellen über die Schaltflächen „Analysieren“, „Deskriptive Statistik“ und anschliessend „Kreuztabellen“ erstellt werden.
Geschlecht
Haustier
1
1
0
2
1
1
3
3
0
4
2
0
5
2
0
6
2
0
7
2
0
8
2
1
9
2
1
10
3
0
11
1
1
12
3
0
13
3
0
14
3
0
15
1
1
16
2
0
17
2
1
18
1
0
19
1
1
20
1
1
Das dann folgende Dialogfeld bietet die Möglichkeit, die interessierenden Variablen zu selektieren und zu entscheiden, welche Variable jeweils zeilen- und spaltenweise dargestellt werden soll. Hierfür werden die Variablen aus der linken Gesamtliste in die jeweiligen Felder verschoben. Über die Schaltfläche „Zellen“ besteht die Option, sich neben den absoluten Werten zeilen- und spaltenweise Prozentwerte ausgeben zu lassen. Anschliessend bestätigt man mit „OK“ und erhält die gewünschten Tabellen über die Programmausgabe.
Aus der resultierenden Kreuztabelle lassen sich die Zusammenhänge zwischen den Variablen ausführlich beschreiben, was bspw. für die Verschriftlichung von Umfrageergebnissen in quantitativen Arbeiten hilfreich ist. So lässt sich u. a. feststellen, dass 3 von 5 weiblichen Befragten ein Haustier halten. Der entsprechende Prozentwert innerhalb des Geschlechts wird folglich mit 37,5 % angegeben. Aus der Spalte „Ja“ innerhalb der Variable „Haustier“ wird deutlich, dass das männliche Geschlecht über den höchsten Anteil der Haustierhaltenden verfügt. So halten 5 männliche Personen ein Haustier, während nur 3 weibliche Personen und keine diverse Person ein Haustier halten. Entsprechend fallen 62,5 % der Haustierhaltenden auf das männliche Geschlecht.
Ein analoges Vorgehen ergibt sich auch bei anderen Skalenausprägungen, z. B. bei zwei ordinal bzw. metrisch skalierten Merkmalen. Als Beispiel dienen zwei Variablen, die zum einen die sportliche Aktivität („gar nicht sportlich“ (1) – „sehr sportlich“ (5)) von Personen erfassen, zum anderen ihre Lebenszufriedenheit („gar nicht zufrieden“ (1) – „vollumfänglich zufrieden“ (5)). Im Ergebnis erhält man die dargestellte Ausgabe.
Während der Weg zu den Kreuztabellen bislang über die Menüführung führte, wird nun der Weg über die SPSS-Syntax dargestellt. Dies erfolgt über die Befehle „CROSSTABS“, der in den nachfolgenden Zeilen weiter spezifiziert wird. Nach „/TABLES“ werden die interessierenden Variablen definiert, in diesem Falle z. B. „geschlecht“ und „haustier“. Genauso gut können die nominal skalierten Variablen durch solche mit einem höheren Skalenniveau ersetzt werden.
CROSSTABS
/TABELES=geschlecht BY haustier
/FORMAT=AVALUE TABLES
/CELLS=COUNT
/COUNTROUND CELL.
Während sich Kreuztabellen bei ordinal bzw. metrisch skalierten Variablen mit nur wenigen Ausprägungen noch übersichtlich darstellen lassen, kann dies bei metrischen Variablen mit unendlich vielen Werten kaum noch erfolgen. Enthält der Datensatz z. B. exakte Gewichtsangaben von 1.000 Personen, so könnte eine Kreuztabelle viele Hundert Spalten breit oder Zeilen lang werden. In diesen Fällen greift man zur Beschreibung bivariater Zusammenhänge am besten auf grafische oder inferenzstatistische Verfahren zurück, die im Folgenden beschrieben werden.
Diagramme
Für die grafische Darstellung des bivariaten Zusammenhangs zwischen zwei nominal skalierten Variablen greifen wir zunächst auf ein Balkendiagramm zurück. SPSS bietet die Möglichkeit zur Erstellung eines Balkendiagramms unter Verwendung der bereits geschilderten Erzeugung von Kreuztabellen. Hierfür aktiviert man im entsprechenden Dialogfeld einfach das Kästchen „Gruppierte Balkendiagramme anzeigen“.
Dies hat zur Folge, dass SPSS das Balkendiagramm direkt im Anschluss an die gewünschten Kreuztabellen ausgibt. Will man die Variablen auf der X- und Y-Achse des Diagramms vertauschen, so tauscht man sie entweder über das Dialogfeld aus oder kehrt ihre Reihenfolge in der Syntax um (s. u.).
Über die Syntax kann das Diagramm erzeugt werden, indem unter dem „CROSSTABS“-Befehl eine weitere Zeile „/BARCHART“ hinzugefügt wird.
Im Falle von Variablen mit einer höheren Anzahl von Merkmalsausprägungen wird das Balkendiagramm wieder unübersichtlich. In der Regel eignet sich dann ein Streudiagramm, dessen Erstellung nachfolgend beschrieben wird. Für das Streudiagramm wird erneut der Datensatz verwendet, der Angaben zu sportlicher Aktivität und Lebenszufriedenheit enthält. Auch hier führt der Weg zur Erstellung zunächst über die Menüschaltfläche „Grafik“, dann „Diagrammerstellung“.
Aus der Liste der Diagrammtypen wird nun „Streu-/Punktdiagramm“ gewählt. Anschliessend entscheiden wir uns für das Icon, das ein einfaches Streudiagramm darstellt. Nach der entsprechenden Auswahl erscheint die Diagrammvorschau, die mithilfe der Variablen im Datensatz spezifiziert werden kann. Hier soll die sportliche Aktivität auf der X-Achse und die Lebenszufriedenheit auf der Y-Achse dargestellt werden. Zudem soll SPSS Werte stapeln, sofern an einer Stelle mehrere Datenpunkte vorliegen. Abschliessend wird mit „OK“ bestätigt.
Das resultierende Diagramm erlaubt nun eine visuelle Beurteilung des bivariaten Zusammenhangs und erste Schlüsse auf systematische Beziehungen zwischen den Variablen. So zeigt sich visuell, dass eine höhere sportliche Aktivität tendenziell mit höheren Werten in der Lebenszufriedenheit verbunden ist.
Die SPSS-Programmsyntax, die zum selben Ergebnis führt, wird nachfolgend ebenfalls dargestellt.
Inferenzstatische Verfahren
Eine inferenzstatistische Möglichkeit zur Beurteilung bivariater Zusammenhänge besteht in der Berechnung von Assoziationsmassen bzw. Korrelationskoeffizienten. Bereits im Beitrag zur bivariaten Statistik wurde erläutert, dass die Kombination der Skalenniveaus entscheidend für die Wahl des Korrelationsmasses (z. B. nach Spearman, Pearson usw.) ist. Zur Illustration werden erneut die o. g. Datensätze (Geschlecht und Haustierhaltung, sportliche Aktivität und Lebenszufriedenheit) verwendet.
Der Zusammenhang zwischen den nominal skalierten Variablen Geschlecht und Haustierhaltung kann über einen Chi-Quadrat-Test untersucht werden. Praktischerweise erlaubt SPSS die Berechnung dieses Tests im Zuge der Erstellung von Kreuztabellen, sodass sich die Menüführung bis zum entsprechenden Dialogfeld gleicht. Bevor man jedoch mit „OK“ bestätigt, kann man über die Schaltfläche „Statistiken“ nun „Chi-Quadrat“ wählen.
Um den neben der Kreuztabelle zusätzlichen Chi-Quadrat-Test über die Syntax anzufordern, wird die o. g. Syntax um die Zeile „/STATISTICS=CHISQ“ ergänzt.
Bivariate Untersuchungen der Variablen Aktivität und Lebenszufriedenheit können mithilfe des Korrelationskoeffizienten nach Pearson erfolgen. Eine Möglichkeit zur Berechnung dieses Koeffizienten wurde bereits dargestellt, da über die Option „Statistiken“ innerhalb des Menüs für Kreuztabellen auch andere Kennwerte gewählt werden können. Aktiviert man hier den Punkt „Korrelationen“, so werden neben den Kreuztabellen verschiedene Korrelationsmasse ausgegeben, darunter auch der Koeffizient nach Pearson.
An eine weitere Möglichkeit zur Berechnung von Korrelationskoeffizienten gelangt man über das Menü, indem „Analysieren“, „Korrelation“ und anschliessend „Bivariat“ gewählt werden. Nachdem die interessierenden Variablen in das rechte Feld verschoben und der relevante Koeffizient mit einem Häkchen aktiviert wurde, kann mit „OK“ bestätigt werden.
Der Weg über die Syntax führt über den Befehl „CORRELATIONS“, woraufhin die nachfolgenden Zeilen erneut die interessierenden Variablen, das Korrelationsmass sowie den Umgang mit fehlenden Werten spezifizieren.
Weiterführende Literatur:
Eckstein, P. P. (2017). Datenanalyse mit SPSS. Wiesbaden: Springer.
Steiner, E., Benesch, M. (2018). Der Fragebogen: Von der Forschungsidee zur SPSS-Auswertung. Stuttgart: UTB.