Home · Ratgeber · Statistik SPSS · Mann-Whitney-U SPSS

Der Mann-Whitney-U-Test in SPSS

Lesen Sie, warum sich der Mann-Whitney-U-Test als voraussetzungsfreies Verfahren als Alternative für Gruppenvergleiche eignet und wie der Test in SPSS berechnet und interpretiert wird.

scroll

Sebastian | 03.12.2022 | Lesedauer 7 min

Will man Unterschiede zwischen zwei Gruppen in einer ungepaarten Stichprobe untersuchen, sind nicht immer die Voraussetzungen gegeben, einen t-Test für unabhängige Stichproben zu berechnen. Wie im Beitrag über die verschiedenen Varianten des t-Tests dargelegt, setzt der t-Test für unabhängige Stichproben unter anderem die Normalverteilung der abhängigen Variable innerhalb beider Gruppen voraus. Ist diese Voraussetzung nicht erfüllt, so bietet sich ein nicht parametrisches bzw. voraussetzungsfreies Verfahren an.

Mann-Whitney-U-Test

Ein solches nicht parametrisches Verfahren liegt mit dem Mann-Whitney-U-Test vor. Der Test wird manchmal auch als U-Test, Wilcoxon-Rangsummentest oder Wilcoxon-Mann-Whitney-Test bezeichnet. Voraussetzung für die Anwendung des Mann-Whitney-U-Tests ist eine mindestens ordinalskalierte abhängige Variable, sodass das Verfahren auch bei kleinen Stichproben eingesetzt werden kann.

Zur Unterscheidung der zu vergleichenden Gruppen muss zudem eine Variable vorhanden sein, die die Zuordnung der Personen oder Stichprobenelemente zu den beiden Gruppen ermöglicht. Anders als der t-Test für unabhängige Stichproben fragt der Mann-Whitney-U-Test ausserdem nicht nach Mittelwertunterschieden, sondern nach Unterschieden in den «zentralen Tendenzen» der Stichproben bzw. Gruppen. Die Interpretationen der Tests ähneln sich aber, sodass man in beiden Fällen (nicht) signifikante Gruppenunterschiede ableiten kann.

Dieser Beitrag beinhaltet einen Überblick über die Funktionsweise des Tests und zeigt seine praktische Anwendung anhand eines Beispiels in SPSS. Grundsätzlich bestehen bei SPSS zwei Alternativen, die gewünschten Berechnungen in das Programm einzugeben: via Menüleiste oder über einen Befehlscode, die sogenannte Syntax. Auf eine Eingabe mittels Menü geht der Beitrag ebenso ein wie auf die Eingabe via SPSS-Syntax.

Ist man im Umgang mit dem Programm fortgeschrittener, so lassen sich Arbeitsschritte über diese Syntax effizienter abarbeiten als über manuelle Menüeingaben. Auch bei Seminar- und Abschlussarbeiten wird häufig gefordert, der Arbeit die verwendete Syntax anzuhängen. Sie dient gleichzeitig als von aussen nachvollziehbares Protokoll der Arbeitsschritte.

Funktionsweise des Mann-Whitney-U-Tests

Zur Erläuterung der Funktionsweise des Mann-Whitney-U-Tests schauen wir uns einen fiktiven Datensatz an, der als Beispiel dient. Erfasst wurden die benötigten Minuten für die Schulwege von 20 Schülerinnen und Schülern einer Klasse. Wir untersuchen die Frage, ob sich die zentralen Tendenzen der Wegezeiten zwischen Jungen (Geschlecht = 1) und Mädchen (Geschlecht = 2) unterscheiden. Der Mann-Whitney-U-Test basiert auf den Rangplätzen der einzelnen Werte, vergleichbar mit dem Vorgehen beim Rangkorrelationskoeffizienten nach Spearman. Entsprechend werden die Schulwege aufsteigend nach ihrer Dauer sortiert und mit Rängen versehen. Der kürzeste Schulweg beträgt 19 Minuten und erhält den Rang 1, während der längste Schulweg 45 Minuten dauert und Rang 20 erhält.

Ein ähnliches Vorgehen ergibt sich, wenn Werte mehrmals vorkommen. In diesem Fall teilen sich die Werte einen Rangplatz und man spricht von verbundenen Rängen. Lägen z. B. drei Schülerinnen und Schüler bei 28 Minuten, würden sie sich die Ränge 8, 9 und 10 teilen. Zur Ermittlung des gemeinsamen Rangs würde man nun den Mittelwert von 8, 9 und 10 berechnen ((8+9+10)/3=9). Die drei Schülerinnen und Schüler mit der gleichen Wegezeit erhielten also jeweils den Rang 9, die darauffolgende Person den 11. Rang.

Die Übersetzung in Rangplätze hat den Vorteil, dass das Verfahren robust gegen mögliche Ausreisser ist. Zwar berücksichtigt der Mann-Whitney-U-Test auf diese Weise keine absoluten Abstände zwischen den Schulwegen, allerdings würde ein Ausreisserwert von 90 Minuten in diesem Beispiel ebenso wie der Wert 45 in der Tabelle den 20. Rang einnehmen.

ID	Geschlecht	Schulweg in Minuten	Rang
1	1	31	11
2	1	32	12
3	1	37	17
4	1	28	8
5	1	45	20
6	1	36	16
7	1	30	10
8	1	29	9
9	1	35	15
10	1	34	14
11	2	26	6
12	2	39	19
13	2	20	2
14	2	19	1
15	2	23	3
16	2	33	13
17	2	38	18
18	2	27	7
19	2	24	4
20	2	25	5

Nach Zuweisung der Ränge werden im nächsten Schritt die Rangsummen nach Gruppen berechnet. Für die Schülerinnen ergibt sich nach Addition der Ränge eine Rangsumme von 78, für die Schüler eine Rangsumme von 132. Mit den gruppenweisen Fallzahlen und den Rangsummen liegen nun alle notwendigen Werte vor, die für die Berechnung des Tests benötigt werden. Da SPSS alle erforderlichen Arbeitsschritte automatisiert übernimmt, ist für das Verständnis der Funktionsweise des Mann-Whitney-U-Tests vor allem die beschriebene Zuordnung von Rangplätzen von Bedeutung.

Mann-Whitney-U-Test in SPSS

Um in SPSS den Mann-Whitney-U-Test aufzurufen, öffnen wir zunächst den Datensatz. Er enthält neben der Identifikationsnummer das Geschlecht und die Wegezeit in Minuten. Die Rangplätze sind nicht erforderlich, da sie im Zuge des Tests automatisch von SPSS zugewiesen werden.

Anschliessend gelangen wir über das Menü zum Mann-Whitney-U-Test, indem wir «Analysieren», «Nicht parametrische Tests», «Klassische Dialogfelder» und schliesslich «2 unabhängige Stichproben» auswählen.

Nun öffnet sich das folgende Dialogfeld «Tests bei zwei unabhängigen Stichproben», in dem das Häkchen bei «Mann-Whitney-U-Test» bereits standardmässig gesetzt ist. Wie gewohnt wird auf der linken Seite eine Liste der Variablen im Datensatz angezeigt. Die abhängige Variable bzw. Testvariable wird mit dem Feld oben rechts definiert. In diesem Fall lautet der Name der Testvariable «minuten», sodass wir diese auf der linken Seite markieren und mithilfe des oberen blauen Pfeils in das Feld «Testvariablen» verschieben.

Vergleichbar mit dem Vorgehen beim t-Test ist ausserdem auch hier die Definition einer Gruppierungsvariable notwendig. Da wir Unterschiede zwischen den Geschlechtern untersuchen, unterscheiden wir die zwei Gruppen mithilfe der Variable «geschlecht». Auch diese Variable wird auf der linken Seite markiert und dann mithilfe des unteren blauen Pfeils in das Feld «Gruppierungsvariable» verschoben.

Nach einem Klick auf «Gruppen definieren» müssen wir SPSS zudem vorgeben, welche Ausprägungen der Gruppierungsvariable verglichen werden sollen. In diesem Fall handelt es sich um die Ausprägungen 1 (männlich) und 2 (weiblich). Nach der Festlegung der Ausprägungen gelangen wir mit «Weiter» wieder ins ursprüngliche Dialogfeld.

Nachdem wir zum Dialogfeld «Tests bei zwei unabhängigen Stichproben» zurückgekehrt sind, stellen wir nach einem Klick auf «Exakt» ausserdem ein, dass wir nicht nur einen asymptotischen, sondern einen exakten Test wünschen. Wir sollten dabei eine Zeitgrenze definieren, da in manchen Fällen die Gefahr einer deutlich längeren Berechnungsdauer besteht. SPSS (bzw. IBM) empfiehlt, ab einer Dauer von 30 Minuten die Monte-Carlo-Methode zu verwenden.

Wir bestätigen die Auswahl auch hier mit «Weiter» und gelangen zum Ausgangsmenü zurück.

Im ursprünglichen Menü können wir über die Schaltfläche «Optionen» zusätzliche Statistiken auswählen. Im vorliegenden Fall wird lediglich das Häkchen bei «Deskriptive Statistik» gesetzt und auch hier mit «Weiter» bestätigt.

Nachdem alle Einstellungen vorgenommen sind, klicken wir im Dialogfeld «Tests bei zwei unabhängigen Stichproben» auf «OK» und SPSS produziert die folgende Ausgabe.

Unsere SPSS Ratgeber auf einen Blick

So funktioniert SPSS.

Statistik in SPSS

Interpretation des Mann-Whitney-U-Tests in der SPSS-Ausgabe

Die erste ausgegebene Tabelle «Deskriptive Statistiken» bietet eine Übersicht über die Anzahl der Fälle, Mittelwerte, Standardabweichungen, Minima und Maxima von Test- und Gruppierungsvariable. Zumindest deskriptiv kann man hier bereits ablesen, dass der mittlere Rang der Dauer für den Schulweg für Jungen höher liegt als für Mädchen.

Als Nächstes folgen die Statistiken des Mann-Whitney-U-Tests, die mit der Tabelle «Ränge» beginnen. Hier werden die nach Gruppen aufgeschlüsselten mittleren Ränge und Rangsummen zusammengefasst, die wir bereits oben manuell berechnet hatten.

Darauf basierend folgt die zentrale Tabelle «Teststatistiken». Für einen Bericht der Ergebnisse und deren Interpretation sind die Zeilen «Mann-Whitney-U», «Z», «Asymptotische Signifikanz (2-seitig)» und «Exakte Signifikanz (2-seitig)» von Interesse.

SPSS berechnet einen exakten und einen asymptotischen Signifikanzwert. In den meisten Fällen ist es nachrangig, welcher der Werte interpretiert wird, da in der Regel beide Werte signifikant oder beide Werte nicht signifikant sind. Ist ein Wert signifikant und der andere nicht, ziehen wir normalerweise die exakte Signifikanz vor.

Manchmal ist die asymptotische Signifikanz aber dann der exakten Signifikanz vorzuziehen, wenn in der abhängigen Variable viele identische Werte vorliegen. Eine andere Regel besagt, dass die exakte Signifikanz dann verwendet wird, wenn die Fallzahl der Gruppen zusammengenommen < 30 ist. Sind die addierten Gruppenfallzahlen > 30, so sollte auf die asymptotische Signifikanz zurückgegriffen werden. Wenn die exakte Signifikanz nicht berechnet werden kann, interpretiert man ohnehin die asymptotische Signifikanz.

Nachdem sowohl asymptotische als auch exakte Signifikanz kleiner als das festgelegte Signifikanzniveau (5 %) sind, keine gleichen Werte vorkommen und eine kleine Fallzahl vorliegt, können wir für die Interpretation die exakte Signifikanz wählen.

Da der Wert p = .043 ist, können wir interpretieren, dass ein signifikanter Unterschied in der Dauer des Schulwegs zwischen Mädchen und Jungen vorliegt. In der Sprache des Tests kann man auch formulieren, dass sich die mittleren Ränge der Testvariable «minuten» für die Gruppen der Variable «geschlecht» signifikant voneinander unterscheiden.

Berechnung der Effektstärke

Zwar wissen wir nun, dass signifikante Gruppenunterschiede vorliegen, allerdings können wir aus der SPSS-Ausgabe keine Effektstärke ablesen. Da die Effektstärke in quantitativen Analysen aber zu den wichtigsten Kennzahlen gehört, können wir sie selbst berechnen und schliesslich berichten. Hierfür kann die Effektstärke r oder das Bestimmtheitsmass R² ermittelt werden. Dafür benötigen wir jeweils die Teststatistiken aus der Ausgabe (z-Statistik und Stichprobengrösse) und können die Effektstärken anschliessend wie folgt berechnen:

Effektstärke r:
- r = z/√N = -2.041/√20 = -0.456
Bestimmtheitsmass R²:
- o R² = z²/N = -2.041²/20 = 0.208

Die Effektstärke r = -0.456 kann entsprechend der Literatur als mittlerer Effekt interpretiert werden. Das Bestimmtheitsmass R² gibt den Anteil der erklärten Varianz an der Gesamtvarianz an, sodass durch das Geschlecht 20.8 % der Unterschiede in der Dauer der Schulwege erklärt werden können.

Die zuvor beschriebene SPSS-Ausgabe kann alternativ mithilfe der nachfolgenden Syntax produziert werden. Mit dem einleitenden Befehl «NPAR TESTS» wird ein nicht parametrischer Test eingeleitet, der in der folgenden Zeile mit «/M-W= …» auf den Mann-Whitney-U-Test festgelegt wird. In derselben Zeile werden Test- und Gruppierungsvariable inklusive Gruppenausprägungen definiert. Mithilfe der weiteren Zeilen werden optionale Statistiken, der Umgang mit fehlenden Werten und die gewünschte Methode («Nur asymptotisch», «Monte-Carlo» oder «Exakt») ausgewählt.

NPAR TESTS
  /M-W= minuten BY geschlecht(1 2)
  /STATISTICS=DESCRIPTIVES
  /MISSING ANALYSIS
  /METHOD=EXACT TIMER(5).

Weiterführende Literatur:

Bortz, J., Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler. Berlin: Springer

Eckstein, P. P. (2017). Datenanalyse mit SPSS. Wiesbaden: Springer.

Steiner, E., Benesch, M. (2018). Der Fragebogen: Von der Forschungsidee zur SPSS-Auswertung. Stuttgart: UTB.

Statistik Hilfe

Statistische Auswertungen

Statistik ganz oder in Teilen outsourcen? Unsere Expert:innen beraten Sie gern.

Statistische Auswertungen

SPSS Ratgeber

Ratgeber · Statistik SPSS

Prüfung auf Normalverteilung und Diagrammerstellung in SPSS

Ratgeber · Statistik SPSS

Berechnung und Interpretation von Cronbachs Alpha in SPSS

Ratgeber · Statistik SPSS

Einfaktorielle Varianzanalyse – ANOVA – in SPSS

Ratgeber · Statistik SPSS

Regressionsdiagnostik in SPSS

Ratgeber · Statistik SPSS

Datenbereinigung: Ausreisser, fehlende Werte und Plausibilitätschecks in SPSS