Hallo- das Thema ist in diesem Forum ja schon öfter vorgekommen. Ich habe fehlende Werte und weiß nicht ob ich nun irgendeinen unmöglichen Wert eingeben soll, den ganzen Fall entfernen muss oder die automoatisierten "Pünktchen" von spss lassen soll.
Weiß das jemand, wie man wann mit fehlenden Werten umgehen soll?
Oder weiß da jemand eine gute Überblicksliteratur dazu?
Liebe Grüße
fehlende Werte
-
- Beiträge: 1733
- Registriert: 11.03.2010, 22:28
Wie man mit fehlenden Werten umgeht kommt u.a. darauf an wie hoch der Anteil fehlender Werte ist und wo sie gehäuft auftreten und welche Fragestellung untersucht wird und welche statistischen Analysen und Tests gerechnet werden sollen und ob sich die Frage allein auf 1 Variable bezieht oder auf alle Variablen und welcher Art diese Variablen sind und welche sonstigen Variablen noch im Datensatz sind. Man kann je nach Sachlage die betreffenden Variablen ausschließen oder einzelne Fälle ausschließen oder die fehlenden Werte nach simplen aber eher schlechten Regeln ersetzen oder mit komplexen Verfahren Ersatzwerte berechnen, siehe zum Beispiel den Eintrag zu "Imputation" in wikipedia.
Was den Datenpflege-Aspekt angeht, gemeinhin ersetzt man einen fehlenden Wert durch einen prägnanten Wert (wie 9999 oder -9 oder was immer sich anbietet), der dann als "missing value" definiert wird. Das hat u.a. den Vorteil, dass immer klar ist, dass der Wert fehlt und es sich nicht um eine vergessene und noch nachzuholende Eingabe handelt.
Was den Datenpflege-Aspekt angeht, gemeinhin ersetzt man einen fehlenden Wert durch einen prägnanten Wert (wie 9999 oder -9 oder was immer sich anbietet), der dann als "missing value" definiert wird. Das hat u.a. den Vorteil, dass immer klar ist, dass der Wert fehlt und es sich nicht um eine vergessene und noch nachzuholende Eingabe handelt.
-
- Beiträge: 141
- Registriert: 25.07.2008, 19:08
Literatur zu fehlenden Werten...puuh...landet man da nicht zwangsläufig bei Imputationsthemen?
Ansonsten ist es weit verbreitet, dass man einzelne Antwortausfälle als 98/99 oder sowas eingibt und diese Fälle pro Item dann per mis val () Befehl von der Analyse ausschließt. Wenn zu viele Fälle rausfliegen, dann solltest dir Gedanken machen.
Edit: Da war jemand schneller und ausführlicher.
Ansonsten ist es weit verbreitet, dass man einzelne Antwortausfälle als 98/99 oder sowas eingibt und diese Fälle pro Item dann per mis val () Befehl von der Analyse ausschließt. Wenn zu viele Fälle rausfliegen, dann solltest dir Gedanken machen.
Edit: Da war jemand schneller und ausführlicher.
-
- Beiträge: 36
- Registriert: 25.10.2011, 15:37
@ skuz Nichtsdestotrotz- danke! Also das ist üblich! Das ist für mich sehr nützlich, weil meine Betreuung sicher auch etwas "Übliches" von mir erwartet und keine tolle Methode, die niemand außer mir verwendet und mit der niemand etwas anfängt 
@ Generalist: Danke- danke für den link- das ist wirklich eine kleine übersicht
. Aber erkennt spss nicht auch die automatisierten Eintragungen? Bei zugewiesenen Werten bekommt man ja eventuell Probleme bei den Berechnungen?
@ all Habe mir gestern ein nützliches Skript von der Uni Trier ausgeruckt zum Thema- heißt ungefähr "Umgang mit fehlenden Daten"- werd ich mir baldigst zu Gemüte führen
Liebe Grüße

@ Generalist: Danke- danke für den link- das ist wirklich eine kleine übersicht

@ all Habe mir gestern ein nützliches Skript von der Uni Trier ausgeruckt zum Thema- heißt ungefähr "Umgang mit fehlenden Daten"- werd ich mir baldigst zu Gemüte führen

Liebe Grüße
-
- Beiträge: 141
- Registriert: 25.07.2008, 19:08
Imputation ist inzwischen durchaus eine gängige Methode. Ob sie immer angemessen eingesetzt wird, ist allerdings eine andere Frage.Diplomandin_123 hat geschrieben:@ skuz Nichtsdestotrotz- danke! Also das ist üblich! Das ist für mich sehr nützlich, weil meine Betreuung sicher auch etwas "Übliches" von mir erwartet und keine tolle Methode, die niemand außer mir verwendet und mit der niemand etwas anfängt![]()
-
- Beiträge: 36
- Registriert: 25.10.2011, 15:37
So nun habe ich "Behandlung fehlender Werte in SPSS und AMOS" durch- bin aber nicht viel weiter, hier bezieht man sich außerdem nur auf metrische Variablen und auf Regressionsanalysen.
Wenn ich "99" eingebe und Fälle ausschließe werden nur mehr wenige ProbandInnen übrigbleiben
. Aber ich nehme an man muss den ganzen Fall ausschließen, weil man ja sonst nicht weiß wie bei einer Person unterschiedliche Variablen zusammenhängen...
Schaut man vor dieser "üblichen Methode" ob die fehlenden Daten systematisch oder unsystematisch sind? Ist die Imputation beim SPSS auch gängig, oder nur bei AMOS?
Liebe Grüße
Wenn ich "99" eingebe und Fälle ausschließe werden nur mehr wenige ProbandInnen übrigbleiben

Schaut man vor dieser "üblichen Methode" ob die fehlenden Daten systematisch oder unsystematisch sind? Ist die Imputation beim SPSS auch gängig, oder nur bei AMOS?
Liebe Grüße
-
- Beiträge: 141
- Registriert: 25.07.2008, 19:08
Mach erstmal den Standardweg, also auf 99 setzen, mis val, Regressionen rechnen und dann schauen wie viele Fälle in die Regression mit einbezogen werden. Wenn von einem N=2000 beispielsweise noch 1600 in die Analyse mit einbezogen werden, sehe ich keinen Grund die Brechstange anzusetzen und zu imputieren, sofern nicht systematisch bestimmte Merkmalskombination rausfliegen. Sollten nur noch 300 oder sowas übrig bleiben, würde ich mich mal mit meinem(r) BetreuerIn zusammensetzen und über das weitere Vorgehen nachdenken.
Auch wenn Imputation immer mehr im kommen ist, sollte man dem ganzen immer mit einer gesunden Portion Skepsis gegenüberstehen, da die Annahmen meist ziemlich stark sind.
Auch wenn Imputation immer mehr im kommen ist, sollte man dem ganzen immer mit einer gesunden Portion Skepsis gegenüberstehen, da die Annahmen meist ziemlich stark sind.
-
- Beiträge: 36
- Registriert: 25.10.2011, 15:37
Ich habe soweit nach der üblichen Methode für alle fehlenden Werte, den Wert 99 eingegeben (vorübergehend) und als fehlenden Wert definiert.
Nach dem 99 setzen habe ich keine Regression, sondern Cronbach alpha für die Skalen eines jungen Fragebogens berechnet.
Je nach Skala sind von 720 Fällen zwischen 293 bis 327 ungültige Fälle dabei. Das Cronbach ist überall recht ok, mit Werten ab .7. Die Trennschärfe ist zumindest nicht unter .3 und da das Cronbach für die Skala passt würde ich eigentlich kein Item löschen. Nachvollziehbare Schlussfolgerung?
Das heißt es wird wahrsch imputiert werden müssen.
Jedoch muss ich mich noch wegen den Gründen für das Fehlen einer Daten erkundigen bzw. warte ich bereits auf Antworten per mail (erfahrungsgemäß dauert das seine Zeit). Zwischenzeitlich werde ich jedoch schon mal zwecks der Übung die geplanten Berechnungen (Konfirmatorische Faktorenanalyse, MANOVA, Multiple hierarchische Regression, Korrelation) anstellen.
@konfirmatorische Faktorenanalyse: habe mich mal informiert, was listenweiser vs paarweiser fallausschluss bedeutet (spss 19 von brosius). wo liegt der vor- und nachteil?
Nach dem 99 setzen habe ich keine Regression, sondern Cronbach alpha für die Skalen eines jungen Fragebogens berechnet.
Je nach Skala sind von 720 Fällen zwischen 293 bis 327 ungültige Fälle dabei. Das Cronbach ist überall recht ok, mit Werten ab .7. Die Trennschärfe ist zumindest nicht unter .3 und da das Cronbach für die Skala passt würde ich eigentlich kein Item löschen. Nachvollziehbare Schlussfolgerung?
Das heißt es wird wahrsch imputiert werden müssen.
Jedoch muss ich mich noch wegen den Gründen für das Fehlen einer Daten erkundigen bzw. warte ich bereits auf Antworten per mail (erfahrungsgemäß dauert das seine Zeit). Zwischenzeitlich werde ich jedoch schon mal zwecks der Übung die geplanten Berechnungen (Konfirmatorische Faktorenanalyse, MANOVA, Multiple hierarchische Regression, Korrelation) anstellen.
@konfirmatorische Faktorenanalyse: habe mich mal informiert, was listenweiser vs paarweiser fallausschluss bedeutet (spss 19 von brosius). wo liegt der vor- und nachteil?