Mit der Grundgesamtheit einer Erhebung wird die Aussagekraft und Reichweite der folgenden Analysen festgelegt. Mithilfe einer Zufallsstichprobe aus dieser Grundgesamtheit ist es möglich, repräsentative Schlüsse über die untersuchten Personen hinaus zu ziehen. Problematisch wird es eventuell, wenn für die Stichprobe ausgewählte Personen nicht an der Befragung teilnehmen können oder wollen. In diesem Fall kann die Verteilung von Stichprobenparametern von der Grundgesamtheit abweichen. Mit der Gewichtung des Datensatzes kann dieser Verschiebung begegnet werden.
Was ist Unit-Nonresponse?
In der Umfrageforschung wird zwischen Item-Nonresponse und Unit-Nonresponse unterschieden. Während eine Zielperson bei Item-Nonresponse einzelne Fragen oder Items der Befragung nicht beantwortet, fällt sie im Falle von Unit-Nonresponse für die gesamte Befragung aus. Hierfür gibt es mehrere denkbare Ursachen. Eine Möglichkeit besteht in der Verweigerung der Befragung. Häufig nehmen Menschen z. B. nicht an Umfragen teil, weil sie sich dafür keine Zeit nehmen wollen, desinteressiert sind oder sich in ihrer Privatsphäre verletzt sehen. Daneben können auch Krankheiten Ursache für die Nichtteilnahme sein, wenn eine Person z. B. schlecht hören oder sprechen kann. Als weitere Ursache kommt schliesslich eine Nichterreichbarkeit der Zielperson infrage. Häufig fallen hierunter beruflich eingespannte Personen, die nur innerhalb sehr begrenzter Zeitfenster erreicht werden können.
Unit-Nonresponse
Welche Konsequenzen hat Unit-Nonresponse?
Das Ausmass von Unit-Nonresponse wird mit der Ausschöpfungsrate angegeben. Sie beschreibt den Anteil der tatsächlichen Befragungen an den ursprünglich geplanten Befragungen. Die Ausschöpfungsrate allein hat jedoch noch keine Aussagekraft hinsichtlich möglicher Verzerrungen der Stichprobe gegenüber der Grundgesamtheit. Entscheidender ist die Unterscheidung zwischen den o. g. Ursachen der Unit-Nonresponse.
Ein hoher Anteil von Personen, die die Befragung verweigern, ist in der Regel nicht mit Konsequenzen für die Ergebnisse der Analysen verbunden. Eine Erkrankung der Zielpersonen wirkt sich vor allem dann negativ aus, wenn die Themen der Umfrage gesundheitsbezogen sind. Am problematischsten ist hingegen die Nichterreichbarkeit von ausgewählten Personen. Es sind zahlreiche Themen denkbar, bei denen die interessierenden Daten mit der Erreichbarkeit der Untersuchungsobjekte zusammenhängen. Werden in der Umfrage z. B. Daten zum monatlichen Einkommen oder zur Berufstätigkeit erhoben, hängen diese stark mit dem Ausmass der Erreichbarkeit einer Person zusammen. Wurden viele ausgewählte Personen nicht erreicht, kann dies z. B. zur Unterschätzung des monatlichen Einkommens führen.
In diesem Zusammenhang lohnt sich auch die Beschäftigung mit den sogenannten Ausfallmechanismen „missing completely at random“ (MCAR), „missing at random“ (MAR) und „missing not at random“ (MNAR). Der unproblematischste Ausfallmechanismus ist MCAR, da das Fehlen von Daten zufällig ist und sich somit keine systematische Verzerrung der Ergebnisse ergibt. Im schlechtesten Fall MNAR ist der Ausfallmechanismus nicht zufällig und kann durch keine andere Variable im Datensatz vorhergesagt werden. Der häufigste Ausfallmechanismus MAR meint, dass Daten zwar nicht zufällig fehlen, aber Variablen gemessen wurden, die den Ausfall vorhersagen können. Dieser Umstand macht den Ausfallmechanismus MAR durch eine Datengewichtung korrigierbar.
Umfrageinstitute, deren erhobene Daten häufig im Rahmen einer Sekundäranalyse verwendet werden können, führen zur Schätzung möglicher Abweichungen regelmässig Nonresponse-Studien durch. Dabei werden die Angaben der Nonrespondent:innen mit denen der Respondent:innen abgeglichen. Auf Grundlage dieser Differenz identifizieren die Institute mögliche Verzerrungen. Sekundärdatensätze enthalten meist schon Gewichtungsvariablen, die durch die Institute berechnet wurden, sodass die manuelle Gewichtung in den meisten Fällen nicht notwendig ist. In diesem Fall stellt sich ausschliesslich die Frage, welche Gewichtungsvariable im Statistikprogramm aktiviert wird. Hinweise hierzu finden sich in der Methodendokumentation der jeweiligen Studie.