Lesen Sie, in welchen Fällen Sie t-Tests für unabhängige Stichproben, t-Tests für abhängige Stichproben oder Einstichproben-t-Tests anwenden und sie in SPSS berechnen.
T-Tests dienen im Allgemeinen der Prüfung von Hypothesen, die sich auf Mittelwertunterschiede beziehen. Seinen Namen verdankt der t-Test der sogenannten t-Verteilung, auf der der Test basiert. Grundsätzlich werden dabei t-Werte und kritische t-Werte berechnet, in deren Abhängigkeit entschieden wird, ob eine Hypothese angenommen oder abgelehnt wird. Dieser kritische Grenzwert wird durch die Anzahl der Freiheitsgrade und das festgelegte Signifikanzniveau definiert. Somit lässt sich überprüfen, ob ein ggf. bereits deskriptiv identifizierter Mittelwertunterschied inferenzstatistisch signifikant ist.
Der vorliegende Beitrag stellt eine anwendungsorientierte Hilfe für die Durchführung verschiedener t-Tests in SPSS bereit. Unterschieden werden Einstichprobentests, t-Tests für unabhängige Stichproben und t-Tests für abhängige Stichproben. Im Folgenden werden Anwendungsfälle dieser drei Tests vorgestellt.
Grundsätzlich bestehen bei SPSS zwei Alternativen, die gewünschten Berechnungen in das Programm einzugeben: via Menüleiste oder über einen Befehlscode, die sogenannte Syntax. Auf eine Eingabe mittels Menü geht der Beitrag ebenso ein wie auf die Eingabe via SPSS-Syntax.
Ist man im Umgang mit dem Programm fortgeschrittener, so lassen sich Arbeitsschritte über diese Syntax effizienter abarbeiten als über manuelle Menüeingaben. Auch bei Seminar- und Abschlussarbeiten wird häufig gefordert, der Arbeit die verwendete Syntax anzuhängen. Sie dient gleichzeitig als von aussen nachvollziehbares Protokoll der Arbeitsschritte.
unabhängige Stichproben
t-Test für unabhängige Stichproben
Die wohl am häufigsten durchgeführten Tests auf Mittelwertdifferenzen sind t-Tests für unabhängige Stichproben, auch als t-Tests für unverbundene oder ungepaarte Stichproben bezeichnet. Sie werden dann angewendet, wenn die zu untersuchenden Stichprobeneinheiten keine Verbindung zueinander haben. Das ist z. B. der Fall, wenn Menschen zufällig einer Experimental- oder einer Kontrollgruppe zugewiesen werden oder zwei Gruppen mit jeweils einem bestimmten Merkmal gebildet werden (z. B. Personen mit und ohne Haustier, Frauen und Männer).
Eine Voraussetzung für die Anwendung des Tests wurde damit schon angerissen – es muss eine Variable existieren, die diese beiden Gruppen unterscheidbar macht. Eine weitere Voraussetzung für die Anwendung des t-Tests bei unabhängigen Stichproben ist die metrische Skalierung der abhängigen Variable, aus der mithilfe des Tests gruppenspezifische Mittelwerte gebildet werden. Zudem sollte die abhängige Variable innerhalb beider Gruppen einer Normalverteilung folgen. Bei Durchführung des Tests wird zudem im weiteren Verlauf von SPSS mithilfe des Levene-Tests geprüft, ob beide Gruppen eine etwa gleiche Varianz aufweisen.
Grundlage eines Anwendungsbeispiels ist ein Datensatz, der die Körpergrösse von 40 Personen in cm mithilfe der metrisch skalierten Variable „körpergrösse“ erfasst. Es liegen zwei unabhängige Stichproben aus 20 Frauen und 20 Männern vor. Die Stichproben sind mithilfe der dichotom skalierten Variable „geschlecht“ unterscheidbar.
Will man den entsprechenden t-Test über die Menüführung erreichen, geht man über „Analysieren“, „Mittelwerte vergleichen“ und anschliessend „t-Test bei unabhängigen Stichproben“.
Dabei öffnet sich das folgende Dialogfeld. Wie gewohnt sind die relevanten Variablen aus der vollständigen Liste der Variablen in die entsprechenden Felder rechts zu verschieben. Die abhängige Variable wird zunächst markiert und mithilfe des blauen Pfeils in das Feld „Testvariable(n)“ verschoben. Die darunter zu definierende „Gruppierungsvariable“ ist in diesem Fall „geschlecht“, sodass diese Variable ebenfalls mithilfe des Pfeils in das Feld unten rechts verschoben wird.
Anschliessend muss mit einem Klick auf die Schaltfläche „Gruppen definieren“ festgelegt werden, welche Ausprägungen der Gruppierungsvariable miteinander verglichen werden sollen. Grund für die Festlegung ist die mögliche Verwendung von Gruppierungsvariablen mit mehr als zwei Ausprägungen, aus denen jedoch stets zwei ausgewählt werden. Über die Ausprägungen der Gruppierungsvariable muss in jedem Fall Klarheit bestehen. In diesem Fall stehen die Ausprägungen 1 für „männlich“ und 2 für „weiblich“, sodass diese Werte in das Dialogfeld eingetragen werden. Denkbar ist hier auch die Festlegung eines Trennwertes, nach dem die Gruppen differenziert werden. Häufig wird dabei der Median der Verteilung gewählt, um zwei gleich grosse Gruppen zu erhalten. Die Auswahl kann dann mit „Weiter“ und „OK“ bestätigt werden.
Anschliessend werden in der Ausgabe des Programms folgende Ergebnistabellen angezeigt. Die vorgelagerten „Gruppenstatistiken“ bestehen aus deskriptiven Berechnungsergebnissen und erlauben somit einen gruppenbezogenen Überblick über die Anzahl der Stichprobeneinheiten, Mittelwerte und Standardabweichung. Deskriptiv zeigt sich, dass die Stichprobe der Männer im Mittel eine Körpergrösse von 181,40 cm aufweist, während der Durchschnittswert für Frauen bei 171,55 cm liegt.
In der folgenden Tabelle „Test bei unabhängigen Stichproben“ ist zunächst der Levene-Test auf Varianzgleichheit der Gruppen von Interesse. Ein Signifikanzwert < 0,05 würde zu dem Schluss führen, dass die Annahme gleicher Varianzen verletzt ist. Im vorliegenden Fall kann aufgrund des Signifikanzwertes von p = 0,505 die Nullhypothese gleicher Varianzen angenommen werden, sodass diese Voraussetzung für den t-Test erfüllt ist.
Das Herzstück des t-Tests sind schliesslich die folgenden Spalten unter „t-Test für die Mittelwertgleichheit“. Der Signifikanzwert in der Zeile „Varianzen sind gleich“ weist einen Wert von p = 0,000 aus, wonach es signifikante Gruppenunterschiede in der Körpergrösse zwischen Männern und Frauen gibt. Zur Beurteilung, ob es sich um schwache oder starke Gruppenunterschiede handelt, kann die Punktschätzung unter Cohens d in der Tabelle „Effektgrössen bei unabhängigen Stichproben“ herangezogen werden. Je nach Quelle entsprechen z. B. Werte ab r = 0,10 einem schwachen, ab 0,30 einem mittleren und ab 0,50 einem starken Effekt. Im fiktiven Anwendungsbeispiel liegt der Wert aufgrund des eindeutigen Unterschieds in der Körpergrösse zwischen Männern und Frauen sogar bei d = 1,475. Bei einem sehr geringen Stichprobenumfang sollte auf „Hedges‘ Korrektur“ zurückgegriffen werden.
Will man die Befehle über die Syntax in SPSS eingeben, erfolgt dies über „T-TEST GROUPS“, woraufhin zunächst die Gruppierungsvariable und dann die Gruppenausprägungen definiert werden. Die Testvariable wird in der Zeile „/VARIABLES“ spezifiziert. Wie alle anderen Parameter kann auch das Konfidenzintervall mithilfe der Syntax festgelegt werden.
Eine weitere Variante des t-Tests sind solche für abhängige, verbundene oder gepaarte Stichproben. Wie der Name bereits vermuten lässt, wendet man diesen an, wenn die Stichprobeneinheiten bzw. Messungen auf unterschiedliche Weise miteinander verbunden sind. Das ist z. B. der Fall, wenn man an denselben Personen mehrere Messungen durchführt. Man könnte bspw. den Akzeptanzwert von Personen für Laborfleisch vor einem Treatment in Form eines Informationsfilms messen, um im Anschluss eine weitere Messung durchzuführen. Sind signifikante Mittelwertunterschiede das Ergebnis, so ist die Veränderung des Akzeptanzwertes mit hoher Wahrscheinlichkeit auf das Treatment zurückzuführen.
Nicht vergessen
Je nach Quelle entsprechen z. B. Werte ab r = 0,10 einem schwachen, ab 0,30 einem mittleren und ab 0,50
Um abhängige Stichproben handelt es sich aber auch, wenn die Stichprobeneinheiten auf natürliche Weise miteinander verbunden sind, z. B. im Falle von Ehepaaren. In allen Fällen kann von einer Beeinflussung des Messwertes durch die verbundene Stichprobeneinheit bzw. die vorangegangene Messung ausgegangen werden.
Wie für den t-Test für unabhängige Stichproben ist auch für den t-Test für abhängige Stichproben Voraussetzung, dass die abhängige Variable eine metrische Skalierung besitzt. Wenn eine Stichprobe weniger als 30 Einheiten umfasst, sollte zudem auf Normalverteilung der Differenzen zwischen den verbundenen Messwerten getestet werden. Abhängigkeiten dürfen darüber hinaus lediglich innerhalb der verbundenen Einheiten bestehen, nicht darüber hinaus. Konkret wird z. B. eine statistische Verbindung innerhalb eines Ehepaares angenommen, nicht aber über die Ehepaare hinweg.
Für das Anwendungsbeispiel wird erneut ein Datensatz mit 40 Stichprobeneinheiten verwendet. In diesem Beispiel wird an jeder Person zweimalig eine Messung vorgenommen. Zu beiden Messzeitpunkten sollten die Personen auf einer siebenstufigen Ratingskala von „stimme überhaupt nicht zu“ (1) bis „stimme voll und ganz zu“ (7) angeben, wie hoch ihre Akzeptanz für Laborfleisch ist. Die entsprechenden Variablen werden als „messung_t1“ für den ersten und „messung_t2“ für den zweiten Messzeitpunkt bezeichnet. Zwischen den Messzeitpunkten haben sich die Personen einen Aufklärungsfilm über das Thema gesehen.
Zum t-Test für abhängige Stichproben gelangt man über das Menü „Analysieren“, „Mittelwerte vergleichen“ und schliesslich „t-Test für verbundene Stichproben“. Das nachfolgende Dialogfeld zeigt auf der linken Seite die im Datensatz verfügbaren Variablen an. Neben „Paar“ auf der rechten Seite wird nun definiert, welche Variablen die verbundenen Messungen beinhalten. Per Drag and Drop oder durch Betätigung des blauen Pfeils werden die Variablen nun zugeordnet. Als Variable 1 wird „messung_t1“, als Variable 2 „messung_t2“ festgelegt. Da zudem analog zum o. g. Beispiel die Effektstärke von Interesse ist, wird das Häkchen bei „Effektgrössen schätzen“ gesetzt. Nach Bedarf können unter „Optionen“ ausserdem Konfidenzintervall und Behandlung fehlender Werte verändert werden.
Die Einstellungen werden mit „OK“ bestätigt und SPSS produziert die gewünschte Ausgabe. Auch hier werden zunächst deskriptive Statistiken in der Tabelle „Statistik bei gepaarten Stichproben“ dargestellt. Bereits hier lässt sich erkennen, dass sich die Akzeptanzwerte für Laborfleisch im Mittel von 3,78 bei der ersten Messung auf 4,63 bei der zweiten Messung erhöht haben. SPSS berechnet anschliessend „Korrelationen bei gepaarten Stichproben“.
Bereits erwähnt wurde die Annahme, dass die Messungen zu beiden Zeitpunkten durch ihre Verbundenheit miteinander korrelieren. Der Wert r = 0,859 weist auf eine hohe Korrelation, sodass die Akzeptanzwerte zum zweiten Messzeitpunkt in engem Zusammenhang mit den Akzeptanzwerten zum ersten Messzeitpunkt stehen.
Die zentralen Ergebnisse des t-Tests folgen in der Tabelle „Test bei gepaarten Stichproben“. In der Spalte „Mittelwert“ lässt sich die Mittelwertdifferenz zwischen den Messzeitpunkten ablesen, der hier -0,850 beträgt. Anschliessend folgen die Teststatistiken des t-Tests. Zur abschliessenden Beurteilung der Mittelwertdifferenzen ist vor allem der Signifikanzwert von Interesse, der im Beispiel bei p = 0,000 liegt. Damit zeigt sich, dass der Aufklärungsfilm einen signifikanten Einfluss auf die Akzeptanzwerte für Laborfleisch hat.
Die Effektstärke lässt sich anhand der Tabelle „Effektstärke bei Stichproben mit paarigen Werten“ beurteilen. Auch hier wird Cohens d ausgewiesen, dessen Wert im Beispiel bei d = -0,809 liegt. Damit kann ein starker Effekt abgeleitet werden. Auch hier sollte man auf „Hedges‘ Korrektur“ ausweichen, wenn eine sehr kleine Stichprobe vorliegt.
Die Syntax zur Durchführung des t-Tests bei abhängigen Stichproben wird mit „T-TEST PAIRS“ eingeleitet, woraufhin die Variablennamen der verbundenen Messungen definiert werden. Anschliessend werden Ausgabe von Effektgrössen, Konfidenzintervall und Umgang mit fehlenden Werten festgelegt.
T-TESTPAIRS=messung_t1 WITH messung_t2 (PAIRED)
/ESDISPLAY(TRUE) STANDARDIZER(SD)
/CRITERIA=CI(.9500)
/MISSING=ANALYSIS.
Einstichproben-t-Tests
Einstichproben-t-Tests
Die letzte hier vorgestellte Variante des t-Tests ist der Einstichproben-t-Test. Dieser wird verwendet, um ableiten zu können, ob sich der Mittelwert einer Stichprobe von einem definierten Mittelwert unterscheidet. Zum Beispiel könnte eine Lehrperson mit dem Test untersuchen, ob die Ergebnisse der Mathe-Klassenarbeit signifikant von den Ergebnissen vorangegangener Klassenarbeiten abweichen. Auch eine Person, die zur Akzeptanz von Laborfleisch forscht, könnte sich dem Einstichproben-t-Test bedienen. Sie könnte z. B. ermitteln, ob die Akzeptanzwerte einer aktuellen Stichprobe von dem Mittelwert einer zurückliegenden Stichprobe abweichen.
Nicht vergessen
Je nach Quelle entsprechen z. B. Werte ab r = 0,10 einem schwachen, ab 0,30 einem mittleren und ab 0,50
Für die abhängige Testvariable ist erneut eine metrische Skalierung notwendig, die z. B. mit Ratingskalen vorliegt. Anders als im Falle des t-Tests für abhängige Stichproben sollen beim Einstichproben-t-Test keine Abhängigkeiten zwischen den Stichprobeneinheiten bestehen. Die Verteilung der Testvariable muss auch hier normalverteilt sein. Da ausserdem der Mittelwert der Stichprobe gegen einen definierten Mittelwert getestet wird, muss ein begründeter Mittelwert vorliegen. In einigen Fällen kann dies z. B. der bekannte Wert der Grundgesamtheit (aus amtlichen Statistiken) sein, er kann aber auch aus vergangenen Messungen oder aus theoretischen Überlegungen resultieren.
Als Beispiel dient erneut der oben verwendete Datensatz zur Akzeptanz von Laborfleisch. In dem Datensatz ist aber einzig die Messung zum ersten Messzeitpunkt von Interesse. Da die forschende Person eine analoge Untersuchung bereits vor 5 Jahren durchgeführt hat, kennt sie den Mittelwert der damaligen Akzeptanzwerte, der 3,10 beträgt. Geprüft wird nun, ob der aktuelle Mittelwert der Stichprobe signifikant von 3,10 abweicht. Zum Einstichproben-t-Test gelangt man über das Menü, indem man „Analysieren“, „Mittelwerte vergleichen“ und dann „t-Test bei einer Stichprobe“ auswählt.
Es öffnet sich das folgende Dialogfeld, das wie gewohnt auf der linken Seite eine Liste der im Datensatz verfügbaren Variablen auflistet. Die Variable, die als abhängige Testvariable verwendet werden soll, kann mithilfe des blauen Pfeils oder per Drag and Drop nach rechts verschoben werden. Zentral ist zudem die Eingabe des Wertes in „Testwert“, der in diesem Fall der Wert von 3,10 aus vergangenen Untersuchungen ist. Zudem wird wieder das Häkchen bei „Effektgrössen schätzen“ gesetzt, da wir uns auch für die Stärke der Abweichung interessieren. Unter „Optionen“ können ggf. der Prozentsatz des Konfidenzintervalls und der Umgang mit fehlenden Werten modifiziert werden. Sind alle Einstellungen vorgenommen, kann mit „OK“ bestätigt werden und SPSS produziert die Ergebnisse des Tests.
Die Tabelle „Statistik bei einer Stichprobe“ bietet eine Übersicht über die deskriptiven Statistiken der Variable in der aktuellen Stichprobe. Hier lässt sich ablesen, dass der Mittelwert bei 3,78 liegt. Deskriptiv sind die Akzeptanzwerte der neueren Stichprobe also gegenüber der zurückliegenden Erhebung gestiegen. Ob diese Differenz inferenzstatistisch signifikant ist, verrät die folgende Tabelle „Test bei einer Stichprobe“. Neben den Statistiken des t-Tests wird ein Signifikanzwert p = 0,042 ausgewiesen. Die Akzeptanzwerte für Laborfleisch in der neueren Stichprobe sind also signifikant gestiegen. Zur Beurteilung der Intensität der Veränderung kann Cohens d in der letzten Tabelle „Effektgrössen bei einer Stichprobe“ herangezogen werden. Der Wert d = 0,332 lässt auf einen schwachen bis mittleren Effekt schliessen.
Der Syntax-Befehl für den Einstichproben-t-Test wird mit „T-TEST“ eingeleitet. In den folgenden Befehlszeilen werden nach Schrägstrichen die Testeinstellungen festgelegt, konkret Testwert („/TESTVAL=3.1“), Umgang mit fehlenden Werten („/MISSING=ANALYSIS“), Testvariablen („/VARIABLES=messung_t1“), Anzeige von Effektgrössen („/ES DISPLAY(TRUE)“) und Konfidenzintervall („/CRITERIA=CI(.95)“).