In einem anderen Beitrag haben wir uns bereits mit der deskriptiven oder beschreibenden Statistik beschäftigt. Die Inferenzstatistik, auch induktive oder schliessende Statistik, bildet einen Gegenpol zur deskriptiven Statistik. Während das Ziel der deskriptiven Statistik darin besteht, die Kennzahlen einer Stichprobe zu beschreiben, will die Inferenzstatistik über die untersuchte Stichprobe hinaus Schlussfolgerungen für eine grössere Personengruppe ziehen.
Schliessen von einer Stichprobe auf die Grundgesamtheit
In den Sozialwissenschaften oder in der Psychologie ist man häufig mit Fragestellungen konfrontiert, die grosse Populationen betreffen. So will man bspw. erfahren, welche Ausprägungen von Persönlichkeitsmerkmalen in der deutschen Bevölkerung existieren oder wie sich die Corona-Pandemie auf das Sozialverhalten ausgewirkt hat. Zur Untersuchung dieser Fragen ist es kaum möglich, die gesamte Population zu untersuchen (Vollerhebung). Stattdessen macht man sich statistische Gesetzmässigkeiten zunutze, nachdem man eine Stichprobe aus der interessierenden Population gezogen hat.
Die mit der Forschungsfrage fokussierte Population wird als Grundgesamtheit bezeichnet und umfasst die Menge der Objekte, über die bestimmte Aussagen getroffen werden sollen. So kann die Grundgesamtheit im o. g. Beispiel als deutschsprachige Wohnbevölkerung in einem Alter zwischen 18 und 65 Jahren definiert werden. Ebenso könnte je nach Erkenntnisinteresse der weibliche oder jugendliche Anteil einer Population als Grundgesamtheit definiert werden.
Die Stichprobe nähert sich mit zunehmender Grösse der Grundgesamtheit an
Die Möglichkeit des Schliessens von einer Stichprobe auf eine Grundgesamtheit ergibt sich u. a. aus der Annahme der Normalverteilung von Variablen in einer Population. Zieht man zunächst eine Stichprobe mit nur wenigen Personen, so ist noch keine definierbare Verteilung der Daten zu erkennen. Je mehr Personen und Stichproben gezogen werden, desto mehr nähert sich die Datenverteilung schliesslich der Normalverteilung an. Das bedeutet gleichzeitig, dass sich der Mittelwert der Stichprobe dem fraglichen Parameter (Erwartungswert μ) in der Grundgesamtheit annähert. Die Untersuchung einer Stichprobe ist also die vergleichsweise effizienteste Lösung, um einen Wert in der Grundgesamtheit zu schätzen.
Dieser Annäherungsmechanismus geht auf den zentralen Grenzwertsatz zurück, eines der wichtigsten Phänomene der Inferenzstatistik. Technisch ausgedrückt besagt dieser, dass sich die Verteilung der Summe von n unabhängigen standardisierten Zufallsvariablen mit identischer Wahrscheinlichkeitsverteilung mit steigender Stichprobengrösse der typisch glockenförmigen Standardnormalverteilung annähert. Dies impliziert zugleich, dass Stichproben mit grösseren oder kleineren Mittelwerten unwahrscheinlicher sind.