ungewöhnliche Fälle identifizieren

Beitrag von **Lilly** » 22.03.2007, 09:31

Hallo, bin neu hier und zwar weil ich mich gerade mit meiner Diplomarbeit abmühe und sicher noch öfter einige Fragen haben werde, die mir hier hoffentlich jemand beantworten kann. Leider habe ich von Spss nämlich nur etwa soviel Ahnung wie von Statistik (und das ist nicht viel)

Hier wäre auch schon meine erste Frage:
Ist es möglich in einem Datensatz die Fälle rauszufiltern, bei denen außergewöhnlich viele Items unbeantwortet geblieben sind?
Bei ungewöhnliche Fälle identifizieren ist es ja (glaub ich) nur möglich komische Werte zu erkennen, oder?
Ich hatte nämlich leider einige Probanden, die meine Untersuchung wohl nicht so ernst genommen haben wie ich und diese Fälle möchte ich jetzt natürlich entfernen.

Jemand nen Tipp?
LG Lilly

Beitrag von **Marco** » 22.03.2007, 13:34

hi,

zunächst solltest du dir Gedanken darübe rmachen, woran du die falsch ausgefüllten Fragebögen erkennst und wie du falsch ausgefüllte Fragen von komplett falsch ausgefüllten Fragebögen unterscheidest.

Danach kannst du über die Syntax gezielt die Fälle auswählen, die auf deine Bedingungen zutreffen.

Beitrag von **Lilly** » 22.03.2007, 16:04

Ja, wenn das so einfach wäre... Die Fragen sind 5- oder 2-stufig beantwortbar (Kreuzchen). Daher wird das schwierig. Das einzige Merkmal könnten eben viele unbeantwortete Fragen auf einem Fragebogen sein.
Trotzdem Danke

Beitrag von **guido** » 22.03.2007, 16:12

Also "unsinnige" Antworten filtert man in einem ersten Schritt oft während oder nach der Dateneingabe einfach per Hand raus. Da kann sich auf groben Unsinn beziehen, der keinen Sinn ergibt (z.B. Antworten, die sich klar wiedersprechen) oder auch auf weniger klare Fälle (z.B. Alter = 320 Jahre, der Rest ist aber gut ausgefüllt. Schreibfehler oder Absicht?). Hier muss man auch mal nach Bauchgefühl entscheiden, ob der Fall rauskommt oder nicht und das geht so meistens auch schneller, als komplexe Filterregeln zu entwerfen.

Danach (oder wenn die Sachen sich gut in Regeln abbilden lassen) würde ich vorgehen wie von Marco vorgeschlagen: Du könntest im Hinblick auf Missings z.B. eine neue Variable bilden, welche die Anzahl dieser Missings abbildet. Wenn diese Variable > x, fliegt der Fall raus.

Beitrag von **Lilly** » 22.03.2007, 16:40

Mhm, kannst du mir vielleicht auch genauer sagen, wie das dann geht? Danach nerv ich auch nicht mehr

Beitrag von **guido** » 22.03.2007, 17:10

Muss man zur Not ein wenig rumbasteln...

Ich würde es spontan so machen

Code: Alles auswählen

USE ALL.
COMPUTE filter_$=(SYSMIS(package)  |  SYSMIS(brand)).
VARIABLE LABEL filter_$ 'SYSMIS(package)  |  SYSMIS(brand) (FILTER)'.
VALUE LABELS filter_$  0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .

Sieht kompliziert aus, selektiert aber lediglich die Fälle, die Missing in den Variablen "package" oder "brand" haben.

Das kannst Du auch manuell ohne Syntax über "Data -> Select Cases" -> "Select Cases If" machen. Du wählst also nur die Fälle aus die in bestimmten Variablen Missings aufweisen.

Code: Alles auswählen

SYSMIS(package)  |  SYSMIS(brand)

| steht dabei für das logische "oder"
& steht für das logische "und"

Was eleganteres fällt mir jetzt leider nicht ein, was jedoch nicht heisst, das es auch simpler geht.

Beitrag von **Lilly** » 22.03.2007, 17:29

Tausend Dank!!!