Hallo Rumo
Rumo hat geschrieben: ↑18.02.2021, 16:02
Wenn meine Auflistung Dezimalzahlen enthält, sind die Abstände doch nicht mehr gleich?!
ne, ne ,ne, so ist das nicht zu verstehen!
Du verdrehst da unterschiedliche Dinge!
Man stellt sich das Merkmal als stetig vor (versus diskret)
stetig heißt, zwischen zwei Merkmalsausprägungen gibt es immer noch eine.
zwischen 170,7 cm und 170,6 cm gibt es 170,65 cm...
Das muss so sein, weil sonst bestünde auch die Gefahr, dass Mittelwert (!) oder Varianzen
nicht zu interpretieren sind.
Das hat aber nichts damit zu tun mit welcher Messgenauigkeit gemessen wird.
Bei Messung durch rating mit 1 2 3 4 5 Skala, ist die Messgenauigkeit eingeschränkt,
das ist aber dem Umstand eines ratings geschuldet,
um die Personen nicht zu überfordern, das heißt nicht dass es nur diese Merkmalsausprägungen gibt!
Und selbst wenn das Merkmal, faktisch diskret wäre, wäre Dezimalstellen nicht unsinnig!
Die durchschnittliche Familie hat 2,3 Kinder, das ist sag bar und enthält Information!
Und das hat nichts mit "gleichabständig" zu tun. Zwischen 2 und 3 ist derselbe Abstand wie
zwischen 4 und 5, und zwischen 3,4 und 3,6 ist derselbe Abstand wie zwischen 4,4 und 4,6.
Dies im Kontrat zu ordinalen Daten, das gibt es zwischen GOLD und SILBER und zwischen
SILBER und BRONZE andere Abstände, bzw zwischen den ersten, zweiten und dritten Platz.
Imputation,
sollte man nur, wenn man wirklich muss!
Aber schwieriges Thema, weil man es auch nicht einfach ignorieren kann.
Multiple Imputation ist zu aufwendig. Wenn das nur eine Bachelorarbeit ist,
ist es für dich eher wichtig das Problem zu beschreiben (Stichprobenbeschreibung)
statt zu lösen, dein Prof kommt dir in diesen Punkt entgegen.
Imputation ist nichts anderes als cheaten!
Es besteht immer die Gefahr, dass Imputation nicht mit wissenschaftlichen
Kriterien, Ansprüchen kollidiert!
Wenn Werte fehlen-> klären warum sie fehlen!!
keine Daten, sind keine Daten--> neu messen, andere Methode usw.
aber nicht eine Auswertung, Entscheidung erzwingen.
Ganz gefährlich.
...und wenn dann, entgegen den eigenen Hypothese imputieren!
...und eben nicht durch statistisches Tricksen Werte "erfinden".
Wenn random kann man das nutzen und argumentieren, ok,
aber wer will entscheiden, ob das random ist, gerade bei Befragung von Personen.
Es gibt aber Situationen, in denen eine Inferenz-Entscheidung nötig ist
und die Daten, anders als durch Imputation, nicht auszuwerten sind,
wie in einer Bachelorarbeit z.B., bei einer Dissertation sieht das schon wieder anders aus!
Aber ein Atomkraftwerk würd ich mit imputierten Daten nicht bauen!
Das Ganze war jetzt sehr pauschal, das kommt auch immer sehr stark auf die Situation an!
In Abhängigkeit davon müsste man Strategien entwickeln, um Missings entgegen zu wirken.
Aber schon vorher.
..und bitte nicht runden..
gruß
dutchie