Lesen Sie, wie Sie in SPSS über das Menü und die Syntax bestimmte Fälle in einem Datensatz für die Analyse auswählen.
scroll
Sebastian | 31.08.2022 | Lesedauer 4 min
Aus verschiedenen Gründen kann es vorkommen, dass man bestimmte Fälle aus der Analyse ausschliessen oder umgekehrt ausschliesslich bestimmte Fälle berücksichtigen will. SPSS bietet dabei die Möglichkeit, die Fälle nicht dauerhaft aus dem Datensatz auszuschliessen, sondern Filter anzulegen, die nach Bedarf aktiviert oder wieder deaktiviert werden können.
Grundsätzlich bestehen bei SPSS zwei Alternativen, die gewünschten Berechnungen in das Programm einzugeben: via Menüleiste oder über einen Befehlscode, die sogenannte Syntax. Auf eine Eingabe mittels Menüs geht der Beitrag ebenso ein wie auf die Eingabe via SPSS-Syntax.
Ist man im Umgang mit dem Programm fortgeschrittener, so lassen sich Arbeitsschritte über diese Syntax effizienter abarbeiten als über manuelle Menüeingaben. Auch bei Seminar- und Abschlussarbeiten wird häufig gefordert, der Arbeit die verwendete Syntax anzuhängen. Sie dient gleichzeitig als von aussen nachvollziehbares Protokoll der Arbeitsschritte.
Mögliche Anlässe für einen Ausschluss bestimmter Fälle sind zahlreich. So kann es sein, dass man z. B. im Zuge einer grafischen Analyse mittels Boxplot festgestellt hat, dass einige Datenausreisser vorliegen. Diese Ausreisser liegen weit unter- oder oberhalb des Wertebereichs der übrigen Personen im Datensatz und können so u. a. ein Regressionsmodell verzerren. Man könnte ausserdem von vornherein Fälle ausschliessen, die ausserhalb eines realistischen Wertebereichs liegen. Sollen die befragten Personen bspw. ihr Alter angeben, bietet es sich an, ausschliesslich Werte bis 100 Jahre zu berücksichtigen. Zur Sicherung der Datenqualität kann es auch sinnvoll sein, ausschliesslich Personen im Datensatz zu belassen, die eine Mindestdauer des Interviews nicht unterschritten haben oder bestimmte Fragen beantwortet haben.
Ein weiterer Grund für eine Selektion der Fälle ist die bewusste Betrachtung eines Teildatensatzes. Stellt man bspw. in bivariaten Analysen Korrelationen zwischen bestimmten Variablen fest, kann mithilfe eines Filters untersucht werden, ob sich dieser Zusammenhang auch ausschliesslich für Frauen, Minderjährige oder Personen in einer bestimmten Altersgruppe findet.
Fallauswahl durch einfache Filter
Als Beispiel dient ein Umfragedatensatz, der Körpergrösse, Gewicht, Alter und Geschlecht von 40 Personen erfasst. Zunächst wollen wir ausschliesslich männliche Befragte im Datensatz belassen und verwenden daher die Variable Geschlecht zum Filtern (1: männlich, 2: weiblich). Über die Menüführung gelangt man über „Daten“ und anschliessend „Fälle auswählen“ zur Filterfunktion von SPSS.
Im anschliessenden Dialogfeld wird auf der linken Seite die Variablenliste des Datensatzes angezeigt. Um nun weibliche Personen zu selektieren, wird zunächst die Schaltfläche „Falls Bedingung zutrifft“ angeklickt. Die darunterliegende Schaltfläche „Falls“ wird nun aktiv und im nächsten Schritt ausgewählt.
Es erscheint ein weiteres Dialogfeld, das neben einer Liste der Variablen ein Feld enthält, mit dem die Filteranweisungen konkretisiert werden. Da zunächst die Geschlechtsvariable benötigt wird, wird die Variable links aktiviert und mithilfe des blauen Pfeils nach rechts verschoben. Nachdem ausschliesslich Frauen beibehalten werden sollen, werden die Fälle unter der Ausprägung 2 benötigt. Das Programm behält nun die Fälle bei, in denen Geschlecht = 2 ist. Abschliessend wird die Auswahl mit „Weiter“ und „OK“ bestätigt.
SPSS hat nun eine Variable berechnet, die den definierten Filter enthält („filter_$“). Mit dessen Hilfe kann die einmal definierte Fallauswahl immer wieder aufgehoben oder aktiviert werden (vgl. Syntax). Die unter Aktivierung des Filters nicht ausgewählten Fälle werden im Dateneditor von SPSS als durchgestrichen dargestellt, sodass sämtliche Analysen unter Vernachlässigung dieser Personen erstellt werden. Soll der Filter über das Menü wieder deaktiviert werden, geht man erneut über das Menü „Daten“, „Fälle auswählen“, setzt die Einstellungen zurück und bestätigt wieder mit „OK“.
Ein analoges Vorgehen ergibt sich bei metrisch skalierten Filtervariablen, wenn z. B. ausschliesslich Personen in einer bestimmten Altersspanne beibehalten werden sollen. Man wählt erneut den Menüpfad „Daten“, „Fälle auswählen“ und klickt auf „Falls Bedingung zutrifft“. Unter der Schaltfläche „Falls“ wird nun die Variable Alter ins rechte Feld verschoben. Mithilfe der mathematischen Operatoren kann nun der gewünschte Wertebereich festgelegt werden. Da ausschliesslich Personen im mittleren Alter im Datensatz verbleiben sollen, wird eine Altersspanne von 35 bis 65 Jahren definiert. Ein solches Intervall kann mit einer logischen Und-Verknüpfung angegeben werden. Sprachlich übersetzt bedeutet der Ausdruck „Alter >= 35 & Alter <= 65“ also: Behalte Fälle im Datensatz, die ein Mindestalter von 35 Jahren UND ein Höchstalter von 65 Jahren haben.
Fallauswahl durch kombinierte Filter
Mithilfe eines logischen Operators wie dem „&“ für „UND“ können verschiedene Filter miteinander kombiniert werden. Als Beispiel sollen die beiden zuletzt verwendeten Filter kombiniert werden und folglich ausschliesslich Frauen im Alter zwischen 35 und 65 Jahren beibehalten werden. Hierfür müssen die beiden Filteranweisungen im Dialogfeld „Falls“ zusammengeführt und mit einem „&“ verknüpft werden. Auf diese Weise könnte man z. B. auch Personen filtern, die männlich sind UND eine bestimmte Gewichtsuntergrenze überschreiten („=>“ bzw. „>“).
Neben der logischen Und-Verknüpfung ist auch der Oder- („|“) oder Nicht-Operator („<>“) nützlich. Sollen z. B. Fälle unter den meisten Variablenausprägungen beibehalten werden, ist der Weg über den Nicht-Operator effizienter. Mithilfe des logischen ODER können bspw. Personen beibehalten werden, die mit Blick auf eine der Variablen extreme Werte aufweisen. So könnten ausschliesslich die Fälle eingeschlossen bleiben, die eine Körpergrösse von mindestens 190 cm ODER ein Gewicht von mindestens 100 kg aufweisen.
Alle dargestellten Filter können auch mithilfe der SPSS-Syntax produziert werden. Technisch wird dabei jeweils eine neue Variable berechnet, die die Filteranweisungen mithilfe dichotomer Ausprägungen erfasst (0: „Not Selected“, 1: „Selected“). Der jeweils aktive Filter kann entweder über die Befehle „USE ALL“ oder „FILTER OFF“ deaktiviert werden. Wird allein der Befehl „FILTER BY filter_$“ eingegeben oder das Menü verwendet, wird der jeweils zuletzt definierte Filter wieder aktiviert. Über die Syntax ist es jedoch auch möglich, mehrere Filter mit unterschiedlichen Bezeichnungen zu definieren, die dann nicht automatisch bei der Definition eines neuen Filters ersetzt werden.
Syntax
COMPUTE filter $=(Geschlecht = 2).
VARIABLE LABELS filter_$ 'Geschlecht = 2 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.FILTEROFF.COMPUTE filter_$=(Alter >= 35 & Alter <= 65).
VARIABLE LABELS filter_$ 'Alter >= 35 & Alter <= 65 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.USE ALL.COMPUTE filter_$=(Geschlecht = 2 & Alter >= 35 & Alter <= 65).
VARIABLE LABELS filter_$ 'Geschlecht = 2 & Alter >= 35 & Alter <= 65 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.FILTER OFF.COMPUTE filter_$=(Körpergröße >= 190 | Gewicht >=100).
VARIABLE LABELS filter_$ 'Körpergröße >= 190 | Gewicht >=100 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
Weiterführende Literatur:
Eckstein, P. P. (2017). Datenanalyse mit SPSS. Wiesbaden: Springer.
Steiner, E., Benesch, M. (2018). Der Fragebogen: Von der Forschungsidee zur SPSS-Auswertung. Stuttgart: UTB.