Häufig werden Hypothesen formuliert, anhand derer man den Einfluss einer (unabhängigen) Variable auf eine andere (abhängige) Variable untersucht. Es kann allerdings vorkommen, dass der Einfluss der unabhängigen auf die abhängige Variable durch eine dritte Variable beeinflusst oder vermittelt wird. In diesen Fällen hat man es mit Moderatorvariablen oder Mediatorvariablen zu tun. Dieser Artikel beschreibt ihre Eigenschaften und Unterschiede und beinhaltet Hinweise für die Handhabung bei der Datenanalyse.
Mediatorvariablen und Moderatorvariablen
Der Beitrag klärt die Grundlagen zum Verständnis von Mediatoren und Moderatoren in empirischen Arbeiten. Mit Grafiken und Beispielen für die eigene Umsetzung.Mediatoren
Wenn man einen möglichen Mediationseffekt zunächst unberücksichtigt lässt, lautet eine fiktive Hypothese, dass die Haltung eines Hundes (unabhängige Variable) zu einem geringeren Stressniveau (abhängige Variable) führt. Auch wenn sich diese kausale Annahme anhand der Daten bestätigen lässt, könnte man die Erklärungskraft des Modells möglicherweise noch vergrössern.
So liegt im genannten Beispiel die Annahme nahe, dass nicht (nur) der Hundehaltung selbst, sondern die Häufigkeit der Streicheleinheiten das menschliche Stressniveau beeinflusst. Vergleichbar mit zwischenmenschlichen Berührungen wird schliesslich auch hier, so wird vermutet, das Hormon Oxytocin ausgeschüttet, das sich positiv auf das subjektive Stresserleben auswirken könnte.
Die Häufigkeit der Streicheleinheiten ist in diesem Fall Mediator, da die unabhängige Variable Hundehaltung über diese Mediation auf die abhängige Variable des Stressniveaus wirkt. Synonyme Bezeichnungen für einen Mediator sind vermittelnde oder intervenierende Variablen.
Wird der Mediator im Analysemodell berücksichtigt, so wird der direkte Einfluss der unabhängigen auf die abhängige Variable reduziert. Die Intensität der Mediation wird dadurch bestimmt, wie stark diese kausale Beziehung reduziert wird. Grundsätzlich wird zudem unterschieden, ob die Wirkung der unabhängigen Variable vollständig oder nur teilweise über den Mediator übertragen wird.
Will man prüfen, ob für das eigene Analysemodell eine Mediation vorliegt, geht man in der Regel in vier Schritten vor, die auf Baron und Kenny (1986) zurückgehen (Mediationsanalyse):
- Es liegt ein signifikanter Einfluss zwischen unabhängiger Variable und abhängiger Variable vor (der Mediator bleibt hier noch aussen vor).
- Es liegt ein signifikanter Einfluss der unabhängigen Variable auf den Mediator vor.
- Es liegt ein signifikanter Einfluss des Mediators auf die abhängige Variable vor.
- Der Einfluss der unabhängigen Variable auf die abhängige Variable geht bei Berücksichtigung des Mediators gegen 0 (dann liegt eine vollständige Mediation vor) ODER der Einfluss der unabhängigen Variable ist bei einer Berücksichtigung des Mediators kleiner als bei fehlender Berücksichtigung (bei Punkt 1., dann liegt eine teilweise Mediation vor).
Für das fiktive Modell bedeutet das: Es wurde (1.) ein direkter Einfluss von Hundehaltung auf das Stressniveau nachgewiesen, (2.) ein Einfluss der Hundehaltung auf die Häufigkeit von Streicheleinheiten, (3.) ein Einfluss der Streicheleinheiten auf das Stressniveau. Zudem reduzierte sich (4.) der direkte Einfluss der Hundehaltung auf das Stressniveau unter Berücksichtigung der Häufigkeit von Streicheleinheiten.
Damit hat man gezeigt, dass alle vier Voraussetzungen erfüllt sind und die Häufigkeit der Streicheleinheiten eine Mediatorvariable ist. Vor dem Hintergrund, dass ein kausales Modell eine möglichst hohe Erklärungskraft haben sollte, um die Realität möglichst exakt nachzubilden, wird der Vorteil der Berücksichtigung eines Mediators deutlich:
Zwar wirkt sich im Mittel bereits blosse Haustierhaltung positiv auf das Stressniveau aus (bspw. durch Spaziergänge an der frischen Luft), unklar könnte aber bleiben, warum manche Tierhaltende weniger Stresserleben zeigen als andere. Die Häufigkeit der Streicheleinheiten als Mediator präzisiert schliesslich das Modell und verleiht ihm eine höhere Prognosekraft. Ohne diese vermittelnde Variable mangelt es also an einem wesentlichen Bestandteil der Kausalkette.
Moderatoren
Eine vermittelnde Mediatorvariable ist aber nur eine Möglichkeit der Modellergänzung. Ebenso kann eine Sachlage bestehen, nach der die Wirkungsstärke der unabhängigen Variable auf die abhängige Variable durch eine dritte Variable beeinflusst wird. In diesem Fall handelt es sich um eine Moderatorvariable. Anders formuliert erlaubt der Wert des Moderators Aussagen darüber, unter welchen Umständen oder für welche Teilgruppen der Analyse ein Zusammenhang besonders stark oder schwach ausfällt.
Auch die Wirkungsweise einer Moderatorvariable kann an einem fiktiven Beispiel verdeutlicht werden. Ohne Berücksichtigung eines Moderators wird zunächst ein negativer Einfluss der Arbeitszeit (unabhängige Variable) auf die sportliche Aktivität (abhängige Variable) angenommen. Eine Person mit längerer täglicher Arbeitszeit hat also grundsätzlich weniger freie Zeit zur Verfügung, die in sportliche Aktivitäten investiert werden kann.
Die Erklärungskraft des Modells kann möglicherweise aber noch verbessert werden. Gerade seit Beginn der Corona-Pandemie sollte nicht übersehen werden, dass Arbeitszeit nicht gleich Arbeitszeit ist. Während Menschen in systemrelevanteren Berufen auf ihrer Arbeitsstelle weiterhin präsent sein müssen, können andere Personen im Homeoffice ihrer Tätigkeit nachgehen. Diese Personen können ihren Alltag flexibler gestalten und beispielsweise die Mittagspause für Sport nutzen.
Folglich wird angenommen, dass der Effekt der Arbeitszeit auf die sportliche Aktivität durch die Variable Remote-Arbeit moderiert wird. Die Annahme: Bei Personen, die im Homeoffice arbeiten, hat die Länge der täglichen Arbeitszeit weniger negativen Einfluss auf die Sportaktivität als bei Personen, die ihre Arbeitsstelle physisch aufsuchen müssen.
Mithilfe bivariater Untersuchungen können Moderatoreffekte nicht modelliert werden, da hier jeweils nur paarweise Beziehungen zwischen Variablen untersucht werden können. Die Modellierung kann stattdessen beispielsweise mithilfe einer multiplen Regression vorgenommen werden. Der Wert der Moderatorvariable beeinflusst dann die Höhe und Steigung der Regressionsgeraden, die Erklärungskraft des Modells hat sich verbessert. Dies wird mithilfe eines Interaktionsterms umgesetzt, der dem Modell als Prädiktor hinzugefügt wird (hier: Arbeitszeit*Remote-Arbeit, siehe weiterführende Literatur).
Zunächst wird ein Blick auf das Regressionsmodell geworfen, das die Moderatorvariable nicht berücksichtigt. Anhand der negativen Steigung der Regressionsgeraden wird der negative Zusammenhang zwischen unabhängiger und abhängiger Variable deutlich. Anhand der Abstände der Datenpunkte zur Regressionsgeraden (Residuen) zeigt sich aber, dass der Effekt der Arbeitszeit entweder unter- oder überschätzt wird.
Wird nun die dichotome Variable Remote-Arbeit als Moderator hinzugefügt, resultiert jeweils für beide möglichen Ausprägungen (Remote-Arbeit vs. keine Remote-Arbeit) eine separate Regressionsgerade. Die Abstände der Regressionsgeraden zu den Datenpunkten haben sich deutlich reduziert, sodass das Modell die Dauer der Sportaktivität nun präziser vorhersagt. Der Einfluss der Arbeitszeit wird nun weniger unter- oder überschätzt.
Inhaltlich zeigt sich, dass Personen in Remote-Arbeit und Personen in Präsenzarbeit bei einer geringen wöchentlichen Arbeitszeit auf ähnlichem Niveau sportlich aktiv sind. Eine Steigerung der wöchentlichen Arbeitszeit hat allerdings bei Personen in Remote-Arbeit weniger negative Auswirkungen auf die sportliche Aktivität als bei Personen in Präsenzarbeit. Die Steigung der Regressionsgeraden fällt also für beide Gruppen unterschiedlich hoch aus.
Nicht immer kann ein multiples Regressionsmodell für die Moderatoranalyse verwendet werden. Die Wahl der konkreten statistischen Methode orientiert sich jedoch an den Skalenniveaus von unabhängiger Variable und Moderatorvariable. Während das genannte Beispiel die Verwendung eines multiplen Regressionsmodells erlaubt, sind in anderen Fällen Varianzanalysen (z. B. 2×2 ANOVA) geeignet.
Weiterführende Literatur:
- Albers, S., Klapper, D., Konradt, U., Walter, A., Wolf, J. (Hrsg.) (2009). Methodik der empirischen Forschung. Wiesbaden: Springer.
- Baron, R. M., Kenny, D. A. (1986). The moderator–mediator variable distinction in social psychological research: Conceptual, strategic, and statistical considerations. Journal of personality and social psychology, 51(6), S. 1173–1182.
- Döring, N., Bortz, J. (2016). Forschungsmethoden und Evaluation. Wiesbaden: Springer.
- Wolf, C., Best, H. (Hrsg.) (2010). Handbuch der sozialwissenschaftlichen Datenanalyse. Wiesbaden: VS Verlag für Sozialwissenschaften.