Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
ich würde mich freuen, wenn mir in kürze jemand erklären könnte, wie ich die fälle ausschließen kann, die bspw <50% eines fragebogens ausgefüllt haben
ferner wäre ich unendlich dankbar, wenn noch jemand erläutern könnte, wie ich meine fehlenden werte möglichst einfach regressionsanalytisch ersetze. also mach ich ne multiple regressionsanalyse und ersetze dann mittels der variable, die die beste beta-gewichtung hat?
fälle ausschliessen, die 50% des fragebogens nicht beantwortet haben:
syntax-fenster öffnen und schreiben:
if (nmiss(frage1 to frage_n) >= zahl*) raus = 1.
if (nmiss(frage1 to frage_n) < zahl*) raus = 0.
variable labels raus 'Ausschluß wegen zu wenig Anworten'.
value labels raus 1 'ja, Ausschluß' 0 'nicht ausgeschlossen'.
*zahl = die anzahl der fragebogenitems / 2, d.h. 50%
frage1 to frage_n funktioniert nur, wenn alle notwendigen fragen zwischen der ersten und letzten frage liegen. wenn das nicht so ist (d.h. zwischen den fragen, von denen 50% beantwortet sein sollen, liegen noch andere, z.b. schon gebildete skalen oder demografie), dann müssen entweder die nicht relevanten fragen vor oder hinter die zu untersuchenden fragen geschoben werden; oder man zählt in der klammer alle relevanten fragen=variablen auf als nmiss(frage1, frage2, ..., frage_n).
die 999 muss unbedingt als fehlender wert (missing) markiert werden. man kann bei jeder variable einstellen, dass eine bestimmte zahl oder ein wertebereich als missing gilt. sonst wird die 999 als zahl angesehen und somit als "ausgefüllt" gezählt. wird 999 als fehlender wert bezeichnet, wird es auch als fehlender wert gezählt, auch wenn faktisch das feld ja nicht leer ist (hab es eben ausprobiert). d.h. eine weitere bearbeitung der daten ist danach nicht mehr nötig.
wenn du dann eine häufigkeitsverteilung der variable machst, siehst du, dass dann 999 als "fehlende werte" bezeichnet wird.