Nach Imputation Dezimalzahlen Problem mit Likert-Skala

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
Rumo
Beiträge: 3
Registriert: 16.02.2021, 13:40

Nach Imputation Dezimalzahlen Problem mit Likert-Skala

Beitrag von Rumo »

Hallo ihr Lieben,
ich habe meine Daten Imputiert (MW bzw. Median). Nun sind leider häufig Werte mit Dezimalzahlen dabei herausgekommen.
Da ich zum Teil eine Likert-Skala (1-5) nutze, würde ich die Daten gerne runden, um das Skalenniveau zu behalten. Es handelt sich um insgesamt 29 imputierte Variablen. Deshalb wäre eine Lösung toll, bei der ich nicht für jede einzelne Variable aufzeigen muss, was mit dem (einen) Dezimalwert passieren soll. Falls es anders nicht geht, bin ich aber natürlich auch für jeden anderen Vorschlag dankbar!

Ich hatte es mit RND versucht (z.B. RND(1.6, 2), aber dadurch ist der komplette Datensatz der entsprechenden Variable auf den Wert 2 gerundet worden.

Danke für eure Hilfe! :)



Ich weiß nicht, ob die Likert Skala hier bekannt ist, deshalb versuche ich kurz aufzuzeigen, wo das Problem liegt. So sollte die Werteverteilung bei der Häufigkeitsangabe aussehen:
1 - Häufigkeit
2 - Häufigkeit
3 - Häufigkeit
4 - Häufigkeit
5 - Häufigkeit
So sieht sie z.B. aktuell nach Imputation aus:
1 - Häufigkeit
1,6 - Häufigkeit
2 - Häufigkeit
3 - Häufigkeit
4 - Häufigkeit
5 - Häufigkeit

Anmerkung: Wenn ich in SPSS die Dezimalzahlstellen bei der Variablenansicht auf 0 stelle, ist meine Aufstellung wie folgt:
1
2
2
3
4
5
dutchie
Beiträge: 2765
Registriert: 01.02.2018, 10:45

Re: Nach Imputation Dezimalzahlen Problem mit Likert-Skala

Beitrag von dutchie »

Hallo Rumo

Dein Problem ist keines!!

Diese Dezimalstellen stören überhaupt nicht!! Die müssen bleiben!

Das Skalenniveau einer "Likert" - "Skala" ist metrisch, da stört das Komma nicht.
.. das sieht vielleicht nur komisch aus. Aber du rechnest mit den Werten so als ob nichts wäre!

Wenn das ein etablierter Fragebogen ist, mit Gebrauchsanweisung,
steht in dieser, wie mit fehlenden Werten zu verfahren ist.

Und es ist auch abwegig, sich eine Argumentation für die Imputation (die bräuchte man eigentlich)
zu überlegen, um dann die imputierten Werte einfach zu runden.

..und der RND falsch angewendet, einfach nur die Variable rein nicht den Wert,
also RND(Frage1), aber das hat sich erübrigt, nicht runden!!

gruß
dutchie
Rumo
Beiträge: 3
Registriert: 16.02.2021, 13:40

Re: Nach Imputation Dezimalzahlen Problem mit Likert-Skala

Beitrag von Rumo »

Hallo dutchie,
vielen Dank für deine Antwort.

Die Imputation wurde von meinem Prof gewünscht. Ich weiß, dass das umstritten ist, allerdings ist das gerade nicht mein Problem.
Zur Likert-Skala: Wenn meine Auflistung Dezimalzahlen enthält, sind die Abstände doch nicht mehr gleich?!

Der Fragebogen ist nicht etabliert, sondern erst kürzlich entstanden.

Falls jemand das gleiche Problem hatte, meine Lösung zum Aufrunden sieht so aus:
COMPUTE Var_gerundet= TRUNC(RND(Var_nicht_gerundet)).
EXECUTE.

Grüße
Rumo

P.S. Hast du Interesse, zu erklären, was gegen Imputation spricht? Ich habe einige Quellen gefunden, die die (multiple) Imputation gegenüber dem paar-/fallweise Ausschluss klar empfehlen, da letzte Methoden nur bei MCAR Bedingung gegeben sein dürfen, die selten vorliegt. Mit meiner Lizenz könnte ich sie aber auch nicht testen (Little).
Ich gebe sehr gerne zu, dass ich sehr wenig Ahnung von Statistik habe, aber sehr viel Interesse haben, mehr zu lernen :)
dutchie
Beiträge: 2765
Registriert: 01.02.2018, 10:45

Re: Nach Imputation Dezimalzahlen Problem mit Likert-Skala

Beitrag von dutchie »

Hallo Rumo
Rumo hat geschrieben:
18.02.2021, 16:02
Wenn meine Auflistung Dezimalzahlen enthält, sind die Abstände doch nicht mehr gleich?!
ne, ne ,ne, so ist das nicht zu verstehen!

Du verdrehst da unterschiedliche Dinge!

Man stellt sich das Merkmal als stetig vor (versus diskret)
stetig heißt, zwischen zwei Merkmalsausprägungen gibt es immer noch eine.
zwischen 170,7 cm und 170,6 cm gibt es 170,65 cm...

Das muss so sein, weil sonst bestünde auch die Gefahr, dass Mittelwert (!) oder Varianzen
nicht zu interpretieren sind.

Das hat aber nichts damit zu tun mit welcher Messgenauigkeit gemessen wird.
Bei Messung durch rating mit 1 2 3 4 5 Skala, ist die Messgenauigkeit eingeschränkt,
das ist aber dem Umstand eines ratings geschuldet,
um die Personen nicht zu überfordern, das heißt nicht dass es nur diese Merkmalsausprägungen gibt!

Und selbst wenn das Merkmal, faktisch diskret wäre, wäre Dezimalstellen nicht unsinnig!
Die durchschnittliche Familie hat 2,3 Kinder, das ist sag bar und enthält Information!

Und das hat nichts mit "gleichabständig" zu tun. Zwischen 2 und 3 ist derselbe Abstand wie
zwischen 4 und 5, und zwischen 3,4 und 3,6 ist derselbe Abstand wie zwischen 4,4 und 4,6.
Dies im Kontrat zu ordinalen Daten, das gibt es zwischen GOLD und SILBER und zwischen
SILBER und BRONZE andere Abstände, bzw zwischen den ersten, zweiten und dritten Platz.

Imputation, :shock:
sollte man nur, wenn man wirklich muss!
Aber schwieriges Thema, weil man es auch nicht einfach ignorieren kann.
Multiple Imputation ist zu aufwendig. Wenn das nur eine Bachelorarbeit ist,
ist es für dich eher wichtig das Problem zu beschreiben (Stichprobenbeschreibung)
statt zu lösen, dein Prof kommt dir in diesen Punkt entgegen.

Imputation ist nichts anderes als cheaten!

Es besteht immer die Gefahr, dass Imputation nicht mit wissenschaftlichen
Kriterien, Ansprüchen kollidiert!

Wenn Werte fehlen-> klären warum sie fehlen!!
keine Daten, sind keine Daten--> neu messen, andere Methode usw.
aber nicht eine Auswertung, Entscheidung erzwingen.
Ganz gefährlich.

...und wenn dann, entgegen den eigenen Hypothese imputieren!
...und eben nicht durch statistisches Tricksen Werte "erfinden".

Wenn random kann man das nutzen und argumentieren, ok,
aber wer will entscheiden, ob das random ist, gerade bei Befragung von Personen.

Es gibt aber Situationen, in denen eine Inferenz-Entscheidung nötig ist
und die Daten, anders als durch Imputation, nicht auszuwerten sind,
wie in einer Bachelorarbeit z.B., bei einer Dissertation sieht das schon wieder anders aus!

Aber ein Atomkraftwerk würd ich mit imputierten Daten nicht bauen!

Das Ganze war jetzt sehr pauschal, das kommt auch immer sehr stark auf die Situation an!
In Abhängigkeit davon müsste man Strategien entwickeln, um Missings entgegen zu wirken.
Aber schon vorher.

..und bitte nicht runden.. :wink:

gruß
dutchie
Rumo
Beiträge: 3
Registriert: 16.02.2021, 13:40

Re: Nach Imputation Dezimalzahlen Problem mit Likert-Skala

Beitrag von Rumo »

Hallo dutchie,
wieder einmal vielen lieben Dank für deine ausführliche Antwort! :)

Okay, also lasse ich die Likert-Items bzw. alle intervallskalierten Items nach der Mittelwert-Imputation so, wie sie sind, runde also nicht!
Ist es denn dann ein Problem bei der Median-Imputation? Ich habe z.B. Dichotomie Variablen ("Welche Technik finden Sie gut" und dann konnten die TN aus einer Liste einfach ankreuzen, was sie nutzen). Die Frage war etwas anders gestellt, aber ich hoffe, du weißt, was ich meine.
Nach der Median-Imputation habe ich jetzt auch Werte mit Dezimalzahlen. Ist das problematisch?

"Wenn Werte fehlen-> klären warum sie fehlen!!
keine Daten, sind keine Daten--> neu messen, andere Methode usw.
aber nicht eine Auswertung, Entscheidung erzwingen.
Ganz gefährlich." Ja, meist wird es bei uns so gehandhabt, dass man den listenweise Fallausschluss nutzt. Das scheint aber auch nicht gerade das Gelbe vom Ei zu sein.

Es ist aber so, dass das Fragebogen so aufgebaut ist, dass wir z.B. Filtervariablen haben, die dann natürlich absichtlich von deutlich weniger TN bearbeitet wurden. Andererseits haben wir auch Variablen, die die TN vll einfach nicht gerne ausgefüllt haben und deshalb sind dort Messings.

Ich habe mich entschieden, bei der Imputation zu bleiben, wenn es möglich ist.

Mein Prof hat es so dargestellt, dass ich sonst zu wenige Fälle habe, wenn ich den listenweisen Fallausschluss nutze.

Ich soll eine PCA rechnen und dann noch die Items analysieren. Außerdem soll ich natürlich meine zuvor aufgestellten Hypothesen untersuchen. Da wollte ich z.B. t-Tests für abh. Stichproben nutzen. Allerdings gibt es so viele Methoden und die Daten sind so schlecht für vieles, was ich gerne rechnen würde, dass ich ziemlich überfordert bin. Mein Prof ist da leider auch keine Hilfe, weil nie erreichbar. :(

Viele Grüße
Rumo
dutchie
Beiträge: 2765
Registriert: 01.02.2018, 10:45

Re: Nach Imputation Dezimalzahlen Problem mit Likert-Skala

Beitrag von dutchie »

Hallo Rumo

Dichtome Variablen imputieren..kommt darauf an..
Geschlecht imputieren, eher schwierig, das mit 0.7 (oder so) zu schätzen,
das zerschieß dir die spätere Auswertung, weil dann hat die Variable mehrere Stufen hat.

...aber bei deiner Technikfrage nach ja/nein würde ich einfach fehlend mit nein werten.

Der Fragebogen war vielleicht auch nicht gut, du kannst auch eventuell noch ein paar TN
nacherheben...

Und diese Filter produzieren regelmaßig Chaos, weil man eigentlich zuviel wissen will,
und dann das Ganze nicht unterbringt. Aber das der Filter missings erzeugt, ist ja klar.

...das ist immer ein Abwägungssache, bei der PCA, da wird ja wohl rauskommen,
was rauskommen soll. Man kann die ja auch zweimal machen mit vollständigen Daten
und mit imputierten, vergleichen fertig.

so weit so gut
gruß
dutchie
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten