ungewöhnliche Fälle identifizieren

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
Lilly
Beiträge: 4
Registriert: 22.03.2007, 09:21

ungewöhnliche Fälle identifizieren

Beitrag von Lilly »

Hallo, bin neu hier und zwar weil ich mich gerade mit meiner Diplomarbeit abmühe und sicher noch öfter einige Fragen haben werde, die mir hier hoffentlich jemand beantworten kann. Leider habe ich von Spss nämlich nur etwa soviel Ahnung wie von Statistik (und das ist nicht viel) :(

Hier wäre auch schon meine erste Frage:
Ist es möglich in einem Datensatz die Fälle rauszufiltern, bei denen außergewöhnlich viele Items unbeantwortet geblieben sind?
Bei ungewöhnliche Fälle identifizieren ist es ja (glaub ich) nur möglich komische Werte zu erkennen, oder?
Ich hatte nämlich leider einige Probanden, die meine Untersuchung wohl nicht so ernst genommen haben wie ich und diese Fälle möchte ich jetzt natürlich entfernen.

Jemand nen Tipp?
LG Lilly
Marco
Beiträge: 43
Registriert: 12.12.2006, 11:09

Beitrag von Marco »

hi,

zunächst solltest du dir Gedanken darübe rmachen, woran du die falsch ausgefüllten Fragebögen erkennst und wie du falsch ausgefüllte Fragen von komplett falsch ausgefüllten Fragebögen unterscheidest.

Danach kannst du über die Syntax gezielt die Fälle auswählen, die auf deine Bedingungen zutreffen.
Lilly
Beiträge: 4
Registriert: 22.03.2007, 09:21

Beitrag von Lilly »

Ja, wenn das so einfach wäre... Die Fragen sind 5- oder 2-stufig beantwortbar (Kreuzchen). Daher wird das schwierig. Das einzige Merkmal könnten eben viele unbeantwortete Fragen auf einem Fragebogen sein.
Trotzdem Danke
guido
Moderator
Beiträge: 304
Registriert: 17.01.2006, 19:20

Beitrag von guido »

Also "unsinnige" Antworten filtert man in einem ersten Schritt oft während oder nach der Dateneingabe einfach per Hand raus. Da kann sich auf groben Unsinn beziehen, der keinen Sinn ergibt (z.B. Antworten, die sich klar wiedersprechen) oder auch auf weniger klare Fälle (z.B. Alter = 320 Jahre, der Rest ist aber gut ausgefüllt. Schreibfehler oder Absicht?). Hier muss man auch mal nach Bauchgefühl entscheiden, ob der Fall rauskommt oder nicht und das geht so meistens auch schneller, als komplexe Filterregeln zu entwerfen.

Danach (oder wenn die Sachen sich gut in Regeln abbilden lassen) würde ich vorgehen wie von Marco vorgeschlagen: Du könntest im Hinblick auf Missings z.B. eine neue Variable bilden, welche die Anzahl dieser Missings abbildet. Wenn diese Variable > x, fliegt der Fall raus.
Lilly
Beiträge: 4
Registriert: 22.03.2007, 09:21

Beitrag von Lilly »

Mhm, kannst du mir vielleicht auch genauer sagen, wie das dann geht? Danach nerv ich auch nicht mehr :wink:
guido
Moderator
Beiträge: 304
Registriert: 17.01.2006, 19:20

Beitrag von guido »

Muss man zur Not ein wenig rumbasteln...

Ich würde es spontan so machen

Code: Alles auswählen

USE ALL.
COMPUTE filter_$=(SYSMIS(package)  |  SYSMIS(brand)).
VARIABLE LABEL filter_$ 'SYSMIS(package)  |  SYSMIS(brand) (FILTER)'.
VALUE LABELS filter_$  0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .
Sieht kompliziert aus, selektiert aber lediglich die Fälle, die Missing in den Variablen "package" oder "brand" haben.

Das kannst Du auch manuell ohne Syntax über "Data -> Select Cases" -> "Select Cases If" machen. Du wählst also nur die Fälle aus die in bestimmten Variablen Missings aufweisen.

Code: Alles auswählen

SYSMIS(package)  |  SYSMIS(brand)
| steht dabei für das logische "oder"
& steht für das logische "und"

Was eleganteres fällt mir jetzt leider nicht ein, was jedoch nicht heisst, das es auch simpler geht.
Lilly
Beiträge: 4
Registriert: 22.03.2007, 09:21

Beitrag von Lilly »

Tausend Dank!!!
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten