Hallo,
ich möchte eine ordinal skalierte Variable mit den Ausprägungen "nie", "weniger als 1x/Monat", "monatlich", "wöchentlich" und "täglich" in eine metrisch skalierte Variable (Tage/Jahr) umwandeln, um daraus - neben dem absoluten Wert - auch einen relativen (wie oft hilft jemand im Vergleich zu seinen Geschwistern?) Wert berechnen zu können. (Letztlich sollen zwei Analysen gerechnet werden, einmal mit absolutem und einmal mit relativem Zeitaufwand.)
Folgende Umkodierung wurde dabei abgenickt:
"nie" = 0
"weniger als 1x/Monat" = 6
"monatlich" = 12
"wöchentlich" = 52
"täglich" = 365
Die Variable dient in meiner Analyse als abhängige Variable. Kann ich mit dieser Kodierung (und damit ja nur fünf Werten, die auf der metrischen Skala tatsächlich angenommen werden) eine lineare Regression rechnen? Oder ergeben sich daraus Probleme?
Alternativ müsste ich wohl mit den absoluten (ordinalen) Werten eine ordinale Regression rechnen; bei der relativen Aufbereitung ergeben sich ja Zwischenwerte (ich teile die absolute Zeit eines Kindes durch die Gesamtzeit aller Geschwister, und setze das wiederum ins Verhältnis zum Anteil, den ein Kind unter gleichberechtigter Aufteilung leisten sollte), so dass ich dafür eine lineare Regression nicht als problematisch erachte.
Danke im Voraus für jeden Gedankenanstoß!
Viele Grüße
clarina
Skalenniveau: von ordinal nach metrisch kodieren?
-
- Beiträge: 2
- Registriert: 13.12.2021, 20:35
-
- Beiträge: 2762
- Registriert: 01.02.2018, 10:45
Re: Skalenniveau: von ordinal nach metrisch kodieren?
Hallo Clarina,
also mit absolut meinst du die ursprügliche codierung
1 2 3 4 5 als ordinal
0 6 12 52 365 als metrisch,
relativ geht nur mit metrischen Werten und mir scheint es muss relativiert werden.
ääh...oh weh
Die Frage ist, ob die metrische Codierung "adäquat" ist, ob die Befragten das wirklich
realitästreu wiedergeben, überhaupt wiedergeben können, wo findet sich jemand wieder der
180 kontakte hat? natürlich ist das problematisch. Und dafür hab ich spontan auch keine einfache Lösung.
Das führt dazu, dass die 365 Kategorie häufiger "genommen" wird als wahr ist, das führt dazu,
dass die metrische Skala quasi wie ein Gummiband gestreckt wird. Und das ist keine lineare Transformation.
ich kann mir beinah vorstellen, dass es das signifikanter macht, aber dann ist das Ergebnis nur ordinal zu interpretieren.
echt schwierig...
Du hättest die Frage offen stellen sollen und eine Zahl eintragen lassen, das hätte die Messung
wahrscheinlich nicht genauer gemacht, aber du hättest das Problem nicht. Du presst etwas stetiges
in ein diskretes Korsett.
Wenn das abgenickt wurde, mach das rein metrisch, geh in der Diskussion aber darauf ein.
Man könnte jenseits dessen versuchen über die ordinale Regression irgendwie unter
Berücksichtigung der Häuigkeiten und dann einer korrigierenden Transformation das irgendwie
zurecht ruckeln...aber...pfff
...und die folgende Relativierung der absoluten Werte macht die Sache ja auch nicht einfacher.
Schau einfach mal was rauskommt, rein metrisch, wenn rauskommt was soll alles gut.
gruß
dutchie
also mit absolut meinst du die ursprügliche codierung
1 2 3 4 5 als ordinal
0 6 12 52 365 als metrisch,
relativ geht nur mit metrischen Werten und mir scheint es muss relativiert werden.
ääh...oh weh

Die Frage ist, ob die metrische Codierung "adäquat" ist, ob die Befragten das wirklich
realitästreu wiedergeben, überhaupt wiedergeben können, wo findet sich jemand wieder der
180 kontakte hat? natürlich ist das problematisch. Und dafür hab ich spontan auch keine einfache Lösung.
Das führt dazu, dass die 365 Kategorie häufiger "genommen" wird als wahr ist, das führt dazu,
dass die metrische Skala quasi wie ein Gummiband gestreckt wird. Und das ist keine lineare Transformation.
ich kann mir beinah vorstellen, dass es das signifikanter macht, aber dann ist das Ergebnis nur ordinal zu interpretieren.
echt schwierig...
Du hättest die Frage offen stellen sollen und eine Zahl eintragen lassen, das hätte die Messung
wahrscheinlich nicht genauer gemacht, aber du hättest das Problem nicht. Du presst etwas stetiges
in ein diskretes Korsett.
Wenn das abgenickt wurde, mach das rein metrisch, geh in der Diskussion aber darauf ein.
Man könnte jenseits dessen versuchen über die ordinale Regression irgendwie unter
Berücksichtigung der Häuigkeiten und dann einer korrigierenden Transformation das irgendwie
zurecht ruckeln...aber...pfff

...und die folgende Relativierung der absoluten Werte macht die Sache ja auch nicht einfacher.
Schau einfach mal was rauskommt, rein metrisch, wenn rauskommt was soll alles gut.
gruß
dutchie
-
- Beiträge: 2
- Registriert: 13.12.2021, 20:35
Re: Skalenniveau: von ordinal nach metrisch kodieren?
Hallo dutchie,
danke für deine Antwort.
Zur Klärung: Ich habe die Befragung nicht durchgeführt (Sekundärdaten), schlimmer noch: die Daten wurden von der Person erhoben, der geholfen wurde. Also: "Wie oft hat Ihnen Kind x bei Tätigkeit z durchschnittlich in den letzten 12 Monaten geholfen?". Die Antwortkategorien waren dann "nie", "weniger als 1x/Monat" etc.
Ich möchte mir nun ansehen, inwiefern Merkmale eines Kindes dazu führen, wie oft es dem Elternteil hilft (absolut) bzw. wie viel Hilfe es im Vergleich zu seinen Geschwistern bereitstellt (relativ). Und dafür muss ich die ursprünglich ordinale Codierung in eine metrische umwandeln. Dass die Werte vermutlich nicht exakt stimmen (also z.B. eine Person, der zweimal pro Woche geholfen wurde, entweder "wöchentlich" oder "täglich" gewählt hat, und damit in der metrischen Umwandlung entweder bei 52 oder 365 landet), ist klar und ärgerlich.
Mich interessiert aber viel mehr, ob grundsätzlich ein Problem in der Schätzung besteht, wenn auf einer metrischen Skala nur wenige Ausprägungen angenommen werden und sich große Lücken dazwischen befinden (bei mir auf der Skala von 0 bis 365 eben nur die Werte 0, 6 12, 52 und 365). Ist das - wenn man annehmen würde, dass es valide gemessen wurde - egal?
Viele Grüße
clarina
danke für deine Antwort.
Zur Klärung: Ich habe die Befragung nicht durchgeführt (Sekundärdaten), schlimmer noch: die Daten wurden von der Person erhoben, der geholfen wurde. Also: "Wie oft hat Ihnen Kind x bei Tätigkeit z durchschnittlich in den letzten 12 Monaten geholfen?". Die Antwortkategorien waren dann "nie", "weniger als 1x/Monat" etc.
Ich möchte mir nun ansehen, inwiefern Merkmale eines Kindes dazu führen, wie oft es dem Elternteil hilft (absolut) bzw. wie viel Hilfe es im Vergleich zu seinen Geschwistern bereitstellt (relativ). Und dafür muss ich die ursprünglich ordinale Codierung in eine metrische umwandeln. Dass die Werte vermutlich nicht exakt stimmen (also z.B. eine Person, der zweimal pro Woche geholfen wurde, entweder "wöchentlich" oder "täglich" gewählt hat, und damit in der metrischen Umwandlung entweder bei 52 oder 365 landet), ist klar und ärgerlich.
Mich interessiert aber viel mehr, ob grundsätzlich ein Problem in der Schätzung besteht, wenn auf einer metrischen Skala nur wenige Ausprägungen angenommen werden und sich große Lücken dazwischen befinden (bei mir auf der Skala von 0 bis 365 eben nur die Werte 0, 6 12, 52 und 365). Ist das - wenn man annehmen würde, dass es valide gemessen wurde - egal?
Viele Grüße
clarina
-
- Beiträge: 2762
- Registriert: 01.02.2018, 10:45
Re: Skalenniveau: von ordinal nach metrisch kodieren?
hallo Clarina,
es besteht auch dann ein grundsetzliches Problem, wenn dem stetige Charakter nicht entsprochen wird.
stetig würde bedeuten jeder hat eigentlich einen anderen Wert, auch wenn die Werte valide sind.
(ich würd eher sagen reliabel) also 365 sind tatsächlich 365.
Das würde bedeuten, dass du in deiner Stichprobe nur 5 Merkmalsausprägungen festgestellt hast,
merkwürdiges stetige Merkmal, obwohl das Merkmal in echt stetig ist.
Wie soll man sich das dann vorstellen, es brauch jetzt viel Fantasie sich das auszumalen...
Das ist die AV! Was macht eine stetige UV mit so einer AV?
Eine stetige UV kann sowas gar nicht erklären.
Die AV Varianz produziert den Fehler! Die AV Varianz müsste in deinem Fall größer sein.
wenn 0 der kleinst möglich und 365 der größtmögliche wert ist, ist das NV?
symmetrisch? 365 wäre sehr selten.
und die Residuen? die Fehlervarinz müsste größer sein..und nicht NV
Es ist ja denkbar, dass das Ganze nicht linear ist, und wenn du jetzt
diese Lücke hast??
Es kann sein, dass das bis 52 linear ist und der Sprung auf 365 keine Effekt hat,
und der knick nicht ganz genau bei 52 liegt, jetzt bekommst du durch die Lücke einen größeren Fehler.
Auch wenn das valide ist, wichtig dabei ist aber auch das die Häufigkeiten den realen entsprechen.
damit die externe Validität nicht leidet. Das Problem hat man generell und es wird vernachlässigt,
aber die Reduktion einer Spanne von 365 auf 5 Kategorien zumal nicht gleichabständig, ist extem!
Das kannst du fast dichotom auffassen. Was ich auch ausprobieren würde.
ich würd auch mal nur mit 0 6 12 52 korrelieren dann sie 356 dazupacken
um ehrlich zu sein man müsste das Ganze mal ausprobieren
ich hab gerade so ein residualplot bekommen:
ohne Zusammenhang:
https://ibb.co/D1Kg52y
mit Zusammenhang:
https://ibb.co/3CMGhn1
also schlimmer geht nicht.
gruß
dutchie
gute Frage, spontan würde ich sagen ja,clarina hat geschrieben: ↑14.12.2021, 10:56Mich interessiert aber viel mehr, ob grundsätzlich ein Problem in der Schätzung besteht, wenn auf einer metrischen Skala nur wenige Ausprägungen angenommen werden und sich große Lücken dazwischen befinden (bei mir auf der Skala von 0 bis 365 eben nur die Werte 0, 6 12, 52 und 365). Ist das - wenn man annehmen würde, dass es valide gemessen wurde - egal?
es besteht auch dann ein grundsetzliches Problem, wenn dem stetige Charakter nicht entsprochen wird.
stetig würde bedeuten jeder hat eigentlich einen anderen Wert, auch wenn die Werte valide sind.
(ich würd eher sagen reliabel) also 365 sind tatsächlich 365.
Das würde bedeuten, dass du in deiner Stichprobe nur 5 Merkmalsausprägungen festgestellt hast,
merkwürdiges stetige Merkmal, obwohl das Merkmal in echt stetig ist.
Wie soll man sich das dann vorstellen, es brauch jetzt viel Fantasie sich das auszumalen...
Das ist die AV! Was macht eine stetige UV mit so einer AV?
Eine stetige UV kann sowas gar nicht erklären.
Die AV Varianz produziert den Fehler! Die AV Varianz müsste in deinem Fall größer sein.
wenn 0 der kleinst möglich und 365 der größtmögliche wert ist, ist das NV?
symmetrisch? 365 wäre sehr selten.
und die Residuen? die Fehlervarinz müsste größer sein..und nicht NV
Es ist ja denkbar, dass das Ganze nicht linear ist, und wenn du jetzt
diese Lücke hast??
Es kann sein, dass das bis 52 linear ist und der Sprung auf 365 keine Effekt hat,
und der knick nicht ganz genau bei 52 liegt, jetzt bekommst du durch die Lücke einen größeren Fehler.
Auch wenn das valide ist, wichtig dabei ist aber auch das die Häufigkeiten den realen entsprechen.
damit die externe Validität nicht leidet. Das Problem hat man generell und es wird vernachlässigt,
aber die Reduktion einer Spanne von 365 auf 5 Kategorien zumal nicht gleichabständig, ist extem!
Das kannst du fast dichotom auffassen. Was ich auch ausprobieren würde.
ich würd auch mal nur mit 0 6 12 52 korrelieren dann sie 356 dazupacken
um ehrlich zu sein man müsste das Ganze mal ausprobieren
ich hab gerade so ein residualplot bekommen:
ohne Zusammenhang:
https://ibb.co/D1Kg52y
mit Zusammenhang:
https://ibb.co/3CMGhn1

also schlimmer geht nicht.
gruß
dutchie