Will man Unterschiede zwischen zwei Gruppen in einer ungepaarten Stichprobe untersuchen, sind nicht immer die Voraussetzungen gegeben, einen t-Test für unabhängige Stichproben zu berechnen. Wie im Beitrag über die verschiedenen Varianten des t-Tests dargelegt, setzt der t-Test für unabhängige Stichproben unter anderem die Normalverteilung der abhängigen Variable innerhalb beider Gruppen voraus. Ist diese Voraussetzung nicht erfüllt, so bietet sich ein nicht parametrisches bzw. voraussetzungsfreies Verfahren an.
Mann-Whitney-U-Test
Ein solches nicht parametrisches Verfahren liegt mit dem Mann-Whitney-U-Test vor. Der Test wird manchmal auch als U-Test, Wilcoxon-Rangsummentest oder Wilcoxon-Mann-Whitney-Test bezeichnet. Voraussetzung für die Anwendung des Mann-Whitney-U-Tests ist eine mindestens ordinalskalierte abhängige Variable, sodass das Verfahren auch bei kleinen Stichproben eingesetzt werden kann.
Zur Unterscheidung der zu vergleichenden Gruppen muss zudem eine Variable vorhanden sein, die die Zuordnung der Personen oder Stichprobenelemente zu den beiden Gruppen ermöglicht. Anders als der t-Test für unabhängige Stichproben fragt der Mann-Whitney-U-Test ausserdem nicht nach Mittelwertunterschieden, sondern nach Unterschieden in den «zentralen Tendenzen» der Stichproben bzw. Gruppen. Die Interpretationen der Tests ähneln sich aber, sodass man in beiden Fällen (nicht) signifikante Gruppenunterschiede ableiten kann.
Dieser Beitrag beinhaltet einen Überblick über die Funktionsweise des Tests und zeigt seine praktische Anwendung anhand eines Beispiels in SPSS. Grundsätzlich bestehen bei SPSS zwei Alternativen, die gewünschten Berechnungen in das Programm einzugeben: via Menüleiste oder über einen Befehlscode, die sogenannte Syntax. Auf eine Eingabe mittels Menü geht der Beitrag ebenso ein wie auf die Eingabe via SPSS-Syntax.
Ist man im Umgang mit dem Programm fortgeschrittener, so lassen sich Arbeitsschritte über diese Syntax effizienter abarbeiten als über manuelle Menüeingaben. Auch bei Seminar- und Abschlussarbeiten wird häufig gefordert, der Arbeit die verwendete Syntax anzuhängen. Sie dient gleichzeitig als von aussen nachvollziehbares Protokoll der Arbeitsschritte.
Funktionsweise des Mann-Whitney-U-Tests
Zur Erläuterung der Funktionsweise des Mann-Whitney-U-Tests schauen wir uns einen fiktiven Datensatz an, der als Beispiel dient. Erfasst wurden die benötigten Minuten für die Schulwege von 20 Schülerinnen und Schülern einer Klasse. Wir untersuchen die Frage, ob sich die zentralen Tendenzen der Wegezeiten zwischen Jungen (Geschlecht = 1) und Mädchen (Geschlecht = 2) unterscheiden. Der Mann-Whitney-U-Test basiert auf den Rangplätzen der einzelnen Werte, vergleichbar mit dem Vorgehen beim Rangkorrelationskoeffizienten nach Spearman. Entsprechend werden die Schulwege aufsteigend nach ihrer Dauer sortiert und mit Rängen versehen. Der kürzeste Schulweg beträgt 19 Minuten und erhält den Rang 1, während der längste Schulweg 45 Minuten dauert und Rang 20 erhält.
Ein ähnliches Vorgehen ergibt sich, wenn Werte mehrmals vorkommen. In diesem Fall teilen sich die Werte einen Rangplatz und man spricht von verbundenen Rängen. Lägen z. B. drei Schülerinnen und Schüler bei 28 Minuten, würden sie sich die Ränge 8, 9 und 10 teilen. Zur Ermittlung des gemeinsamen Rangs würde man nun den Mittelwert von 8, 9 und 10 berechnen ((8+9+10)/3=9). Die drei Schülerinnen und Schüler mit der gleichen Wegezeit erhielten also jeweils den Rang 9, die darauffolgende Person den 11. Rang.
Die Übersetzung in Rangplätze hat den Vorteil, dass das Verfahren robust gegen mögliche Ausreisser ist. Zwar berücksichtigt der Mann-Whitney-U-Test auf diese Weise keine absoluten Abstände zwischen den Schulwegen, allerdings würde ein Ausreisserwert von 90 Minuten in diesem Beispiel ebenso wie der Wert 45 in der Tabelle den 20. Rang einnehmen.
ID | Geschlecht | Schulweg in Minuten | Rang |
1 | 1 | 31 | 11 |
2 | 1 | 32 | 12 |
3 | 1 | 37 | 17 |
4 | 1 | 28 | 8 |
5 | 1 | 45 | 20 |
6 | 1 | 36 | 16 |
7 | 1 | 30 | 10 |
8 | 1 | 29 | 9 |
9 | 1 | 35 | 15 |
10 | 1 | 34 | 14 |
11 | 2 | 26 | 6 |
12 | 2 | 39 | 19 |
13 | 2 | 20 | 2 |
14 | 2 | 19 | 1 |
15 | 2 | 23 | 3 |
16 | 2 | 33 | 13 |
17 | 2 | 38 | 18 |
18 | 2 | 27 | 7 |
19 | 2 | 24 | 4 |
20 | 2 | 25 | 5 |
Nach Zuweisung der Ränge werden im nächsten Schritt die Rangsummen nach Gruppen berechnet. Für die Schülerinnen ergibt sich nach Addition der Ränge eine Rangsumme von 78, für die Schüler eine Rangsumme von 132. Mit den gruppenweisen Fallzahlen und den Rangsummen liegen nun alle notwendigen Werte vor, die für die Berechnung des Tests benötigt werden. Da SPSS alle erforderlichen Arbeitsschritte automatisiert übernimmt, ist für das Verständnis der Funktionsweise des Mann-Whitney-U-Tests vor allem die beschriebene Zuordnung von Rangplätzen von Bedeutung.
Mann-Whitney-U-Test in SPSS
Um in SPSS den Mann-Whitney-U-Test aufzurufen, öffnen wir zunächst den Datensatz. Er enthält neben der Identifikationsnummer das Geschlecht und die Wegezeit in Minuten. Die Rangplätze sind nicht erforderlich, da sie im Zuge des Tests automatisch von SPSS zugewiesen werden.
Anschliessend gelangen wir über das Menü zum Mann-Whitney-U-Test, indem wir «Analysieren», «Nicht parametrische Tests», «Klassische Dialogfelder» und schliesslich «2 unabhängige Stichproben» auswählen.
Nun öffnet sich das folgende Dialogfeld «Tests bei zwei unabhängigen Stichproben», in dem das Häkchen bei «Mann-Whitney-U-Test» bereits standardmässig gesetzt ist. Wie gewohnt wird auf der linken Seite eine Liste der Variablen im Datensatz angezeigt. Die abhängige Variable bzw. Testvariable wird mit dem Feld oben rechts definiert. In diesem Fall lautet der Name der Testvariable «minuten», sodass wir diese auf der linken Seite markieren und mithilfe des oberen blauen Pfeils in das Feld «Testvariablen» verschieben.
Vergleichbar mit dem Vorgehen beim t-Test ist ausserdem auch hier die Definition einer Gruppierungsvariable notwendig. Da wir Unterschiede zwischen den Geschlechtern untersuchen, unterscheiden wir die zwei Gruppen mithilfe der Variable «geschlecht». Auch diese Variable wird auf der linken Seite markiert und dann mithilfe des unteren blauen Pfeils in das Feld «Gruppierungsvariable» verschoben.
Nach einem Klick auf «Gruppen definieren» müssen wir SPSS zudem vorgeben, welche Ausprägungen der Gruppierungsvariable verglichen werden sollen. In diesem Fall handelt es sich um die Ausprägungen 1 (männlich) und 2 (weiblich). Nach der Festlegung der Ausprägungen gelangen wir mit «Weiter» wieder ins ursprüngliche Dialogfeld.
Nachdem wir zum Dialogfeld «Tests bei zwei unabhängigen Stichproben» zurückgekehrt sind, stellen wir nach einem Klick auf «Exakt» ausserdem ein, dass wir nicht nur einen asymptotischen, sondern einen exakten Test wünschen. Wir sollten dabei eine Zeitgrenze definieren, da in manchen Fällen die Gefahr einer deutlich längeren Berechnungsdauer besteht. SPSS (bzw. IBM) empfiehlt, ab einer Dauer von 30 Minuten die Monte-Carlo-Methode zu verwenden.
Wir bestätigen die Auswahl auch hier mit «Weiter» und gelangen zum Ausgangsmenü zurück.
Im ursprünglichen Menü können wir über die Schaltfläche «Optionen» zusätzliche Statistiken auswählen. Im vorliegenden Fall wird lediglich das Häkchen bei «Deskriptive Statistik» gesetzt und auch hier mit «Weiter» bestätigt.
Nachdem alle Einstellungen vorgenommen sind, klicken wir im Dialogfeld «Tests bei zwei unabhängigen Stichproben» auf «OK» und SPSS produziert die folgende Ausgabe.