banale Frage zur Symmetrie und Skalenniveau

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
Kate
Beiträge: 1
Registriert: 15.04.2022, 18:04

banale Frage zur Symmetrie und Skalenniveau

Beitrag von Kate »

Hallo, ich wende mich nun ans Schwarmwissen :) Ich hab im Rahmen eines Masters auch eine Biostatistik-Vorlesung und hab eine (für euch wohl banale 8) ) Frage:

Ich muss das Skalenniveau und die Beziehung (Symmetrie) zweier Variablen bestimmen und begründen:
Es geht um den Zusammenhang von PatientInnen mit einem BMI kleiner oder größer/gleich 25 und dem Konsum von Obst oder Gemüse, ob die Essgewohnheiten einen Einfluss auf das Vorhandensein von Übergewicht haben.

Die erste Variable ist der BMI, allerdings dichotom mit den Ausprägungen kleiner und größer/gleich 25. Die zweite Variable ist der Konsum von Obst oder Gemüse mit 5 Ausprägungen: mehrmals täglich - täglich - wöchentlich - weniger als wöchentlich - nie.

Ich denke dass BMI nominal skaliert ist, weil er nur 2 Ausprägungen hat, bin aber unschlüssig, weil man klar erkennen kann, dass es ja größer oder kleiner als 25 ist.
Die Variable Konsum ist ordinal skaliert, weil eine Rangordnung der Häufigkeit der Einnahme möglich ist.
Die Beziehung ist in meinen Augen asymmetrisch weil nur eine Variable die andere beeinflusst, bin aber unsicher, weil symmetrisch hieße ja, dass sie sich gegenseitg beeinfluss, was auch sein kann :shock: Vorallem wird in nachfolgender Fragestellung die Berechnung von Chi Quadrat gefragt, was ja die Basis für nominale Zusammenhangsberechnungen ist, aber man rechnet ja immer auf kleinerem Skalenniveau... bin etwas verwirrt :|

Ich bitte um Hilfe und bin minimal aufgeregt, hab noch nie was in einem Forum gepostet :D
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: banale Frage zur Symmetrie und Skalenniveau

Beitrag von dutchie »

Hallo Kate,

Variablen:

BMI: Die Variable ist eigentlich metrisch, ob intervall oder sogar
rational kann man philosophieren wenn man will, wurde aber dichotom gemessen.

Per Kriterium > 25 , ab da beginnt per Konvention das Übergewicht.
Das ist künstlich dichotom im Gegensatz zu z.B. Geschlecht, was als natürlich dichotom
gilt (lassen wir dei TERF TRANS Debatte mal außer Acht).

Künstlich dichotome Variablen sind irgendwie auch "ordinal", ja, aber das hat nur
auf die Interpretation Einfluss nicht auf irgendwelche Berechnungen, und ordinale
Variablen mit vielen Rangbindungen, d.h gleicher Ausprägung sind problematisch.

Dichotome Variablen können wie metrische behandelt werden, innerhalb
von Korrelation und Regression, sofern sie UVs (Regressoren) darstellen.

Also BMI --> dichotom.

Konsum ist rational skalierbar, es gibt mit "nie" eine Nullpunkt, aber das so zu messen
ist praktisch sehr schwierig, z.B. gemessen als kg, als Menge.

Es wurde mit Hilfe einer 5er Ratingskala gemessen (kein Likert!)
über Verhalten, unabhängig von der Menge, zwei Radieschen täglich
müsste in die höchste Kategorie fallen.
Gemessen wurde aber mit nicht gleichabständigen Kategorienbenennungen,
hätte man diese nach Rohrman benannt:

https://de.wikipedia.org/wiki/Verbale_Rating-Skala

mit: nie - selten -gelegentlich - oft - immer

hätte man es als intervallskaliert ansehen können, was aber zu
inhaltlichen Schwierigkeiten geführt hätte, wer ist schon immer Gemüse :shock:

Die adäquate Kodierung in Zahlen ist das Problem.
bezogen auf ein Jahr oder möglich wäre auch die ganze Lebensspanne.
Kodierung :
mehrmals täglich --> x > 356
täglich --> x =365 = eindeutig
wöchentlich --> x = 52 = eindeutig
weniger als wöchentlich --> x < 7
nie --> x= 0 = eindeutig

..die uneindeutigen kann man "mitteln" und es wäre metrisch,
aber die höchste Kategorie ist oben offen :shock:
ist metrik nötig (da würden auch einige motzen), oder langt eine ordinale Interpretation
zur Klärung der Hypothesen?

nie --> X = 0
selten --> X = 1
gelegentlich --> X =2
oft --> X = 3
immer --> X = 4
...hätte man mit 0 1 2 3 4 kodieren können und es wäre
aufgrund der Äquidistanz zwischen den Kategorien metrisch.

Also Konsum ordinal, besser geordnet kategorial.

Man sieht was in das Skalenniveau alles einfließt
Eigenschaften der Variable, der Messung, der Praxis, der Hypothesen,
also die Messung ist das Kunststück, nicht Statistik.

Alle statistischen Verfahren für eine niedrigeres Skalenniveau funktionieren
auch auf einem höherem, aber nicht umgekehrt. Man kann ordinal als
nominal behandeln. Aber nicht nominal als ordinal.

Man kann dichotom als ordinal(künstlich) oder metrisch behandeln.
Deshalb spricht man besser bei zwei Ausprägungen von einer dichtomer Variable
als von einer nominalen.

Zusammenhänge

Alles bisher gesagte bezog sich nur auf eine Variable, was wenn zwei
Variablen aufeinanderbutschen und man eine Zusammenhang feststellen will.
Jetzt wird es erst richtig bunt :D

Man könnte ordinal/ordinal auswerten--> z.B. Spearman, Kendall,
Man könnte aber auch nominal/ordinal auswerten oder
nominal/nominal, man kann von Information (Ordnung)
absehen, man kann aber keine hinzuerfinden (z.B. aus nominal
ordinal machen, denke an z.B. an Farben)
Kate hat geschrieben:
15.04.2022, 18:18
aber man rechnet ja immer auf kleinerem Skalenniveau... bin etwas verwirrt :|
nein, normal rechnet man auf dem höheren Niveau.

Bei Zusammenhängen kommen aber zwei Dinger hinzu,
der Signifikanztest und "dessen Güte", und die Möglichkeit
den Effekt deskriptiv zu beschreiben, wenn er sig. ist.

Man kann jetzt hier den Sig Test nominal/nominal machen, CHI2
weil die Stichprobe groß ist, weil viele Rangbindungen vorkommen.
Weil man in eine Kreuztabelle auch differenzierter gucken kann, wie
sich die Variablen zueinander verhalten.

Man kann jetzt aber den Effekt, beschreiben z.B. mit Somers d
plus speziellen sig Test, dieses Effektmaß ginge symmetrisch und gerichtet
und wäre ordinal/ordinal zu interpretieren.

Es gibt auch Effektmaße nominal/nominal die sym. und gerichtet gehen.

Symmetrie

Symmetrische Effektmaße gehen nur wenn beide Variablen dasselbe Niveau
haben. Manche von diesen könne eine Richtung unterscheiden Somners d,
Lambda, manche nicht, z.B. Pearson r.

Diese Richtung, meint, was weiß ich bei Kenntnis der einen von der Anderen,
und umgekehrt, das hat nix mit Kausalität zu tun, normal berechnet man auch beide
Richtungen.

Gewicht und Gemüse ist bestimmt kausal interaktiv,
"Gemüse hält schlank" versus "Ich mach Diät und zwing mich"
die eine Richtung ist aber bestimmt stärker als die anderer :D.

so weit so gut :D

gruß
dutchie
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten