Welche fehlenden Werte einer Stichprobe darf ich ersetzen...

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
Mr_Sam
Beiträge: 2
Registriert: 02.02.2014, 14:52

Welche fehlenden Werte einer Stichprobe darf ich ersetzen...

Beitrag von Mr_Sam »

...Masterarbeit Psychologie?

Hallo :)

Ich habe bei den Daten für meine Untersuchung leider in nahezu jeder Variable vereinzelte fehlende Werte. Das sind selten über 5%, die pro Variable fehlen, aber da es immer unterschiedliche Versuchspersonen sind, habe ich in SPSS für jede Variable natürlich eine ganz andere Stichprobengröße.

Nun hat man uns beigebracht, dass es problematisch ist, fehlende Werte einfach zu ignorieren und paarweiser oder listenweiser Fallauschluss sei in einer Bachelorarbeit noch akzeptiert, in einer Masterarbeit werde aber schon erwartet, dass fehlende Werte durch Multiple Imputation oder wenigstens per EM-Algorithmus ersetzt werden. Ich habe auch gelernt, wie das geht, und auch mit der SPSS-Berechnung kein Problem. Ich habe auch schon geprüft, die Voraussetzung zur Ersetzung, dass alle Werte zufällig fehlen (also missing completely at random), trifft auch durchaus zu.

Nur stehe ich gerade etwas auf dem Schlauch damit, bei welchen Werten es überhaupt Sinn macht, sie zu ersetzen. Ich finde im Internet hunderte Anleitungen, WIE man fehlende Werte ersetzt und viel zu MCAR/MAR usw. aber nicht, welche Werte man überhaupt üblicherweise auf diesem Weg ersetzt.

Dass man einzelnde unbeantwortete Items in einem Fragebogen ersetzen kann, leuchtet mir auch ein, da sie ja durch die anderen Items des Fragebogens weitestgehend repräsentiert werden.

Aber was ist z.B., wenn bei einer Person ein kompletter Fragebogen fehlt oder einzelne soziodemografische Angaben wie die Anzahl der Kinder in der Familie? Selbst wenn ich herausfinde, dass die Werte mit anderen Daten aus meiner Stichprobe korrelieren - macht es Sinn bzw. ist es überhapt ein korrektes Vorgehen, diese per multipler Imputation oder EM zu ersetzen? Mir kommt das nämlich etwas merkwürdig vor, dann bei der Beschreibung der Stichprobe zu behaupten, so-und-so-viel Prozent hätten ein Kind, so viel % zwei Kinder usw. wenn ich mir die Information teilweise aus anderen daten zusammengebastelt habe (wie alt die Mutter ist oder wie viel sie verdient usw.)

Und falls ich die soziodemografischen Daten besser nicht ersetzte: Was gebe ich dann in meiner Arbeit aus SPSS korrekterweise für Prozente an, wenn ich über die Stichprobe berichte. Wenn z.B. bei drei Personen das Alter fehlt, gebe ich dann die "normalen" Prozente an und sage dazu, wie viel % fehlen? oder darf ich der Einfachheit halber auch die "gültigen Prozente" angeben, also wie sich die Merkmale in der Stichprobe mit vorhandenen Daten verteilen?

Viel Info auf einmal, ich hoffe, es liest sich überhaupt jemand durch...

Danke auf jeden Fall schon mal im Voraus! :oops:
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten