Hallo zusammen,
in meinem Fragebogen habe ich abgefragt, wie oft die Teilnehmer Kaffee trinken (nie bis häufig). Daraus habe ich eine dichotome Variable gebildet (Kaffeetrinker = 1/ Kein Kaffeetrinker = 0).
Nun möchte ich untersuchen, ob Kaffeetrinker/Kein Kaffeetrinker mit der Kaufbereitschaft einer Kaffeemarke korreliert.
(Kaufbereitschaft wurde anhand von 4 Items auf einer siebenstufigen Skala gemessen und kann somit als intervallskaliert betrachtet werden).
Nach etwas Recherche bin ich auf die punktbiseriale Korrelation für dichotome Variablen gestoßen. Diese setzt natürlich dichotome Variablen voraus (z.B.: Geschlecht). Für künstlich dichotome Variablen wird auf die biseriale Korrelation verwiesen. Künstlich dichotome Variablen, sind laut meiner Recherche, intervallskalierte Variablen (z.B.: Alter) aus denen eine dichotome Variable (alt/jung) gebildet wurde. Dies ist bei meiner dichotomen Variable aber ebenfalls nicht der Fall (ursprünglich ordinal skaliert).
Rechne ich eine punktbiseriale oder eine biseriale Korrelation? Oder gibt es vielleicht noch eine ganz andere Alternative?
Über eine schnelle Antwort würde ich mich sehr freuen
Punktbiseriale oder biseriale Korrelation?
-
- Beiträge: 2
- Registriert: 02.03.2023, 15:54
-
- Beiträge: 2739
- Registriert: 01.02.2018, 10:45
Re: Punktbiseriale oder biseriale Korrelation?
Hallo Anna
ich würde sagen deskriptiv und für den Sig Test ist punktbiserial besser.
Zum eine gibt des dann Mittelwerte für das Kaufverhalten
einen schönen t Test und dass Kaffeetrinken normalverteilt ist,
glaub ich nicht.
Außerdem hätt ich das nicht dichotomisiert!!!
interpretiere nie bis häufig intervallskaliert fertig!
Wer würde widersprechen?
du kannst das um ein ordinales Maß ergänzen,
wenn es nur um "mehr desto" Hypothesen geht.
gruß
dutchie
ich würde sagen deskriptiv und für den Sig Test ist punktbiserial besser.
Zum eine gibt des dann Mittelwerte für das Kaufverhalten
einen schönen t Test und dass Kaffeetrinken normalverteilt ist,
glaub ich nicht.
Außerdem hätt ich das nicht dichotomisiert!!!
interpretiere nie bis häufig intervallskaliert fertig!
Wer würde widersprechen?
du kannst das um ein ordinales Maß ergänzen,
wenn es nur um "mehr desto" Hypothesen geht.
gruß
dutchie
-
- Beiträge: 2
- Registriert: 02.03.2023, 15:54
Re: Punktbiseriale oder biseriale Korrelation?
Hallo dutchie,
danke für die schnelle Antwort
Nehme ich dann punktbiserial? (Normalverteilung sollte doch laut des zentralen Grenzwertsatz bei N=180 kein Problem sein, oder?)
Ich bin immer noch etwas verunsichert was es mit diesen natürlich und künstlich dichotomen Variablen auf sich hat. Und unter was Kaffeetrinker/Kein Kaffeetrinker einzuordnen wäre.
Liebe Grüße
Anna
danke für die schnelle Antwort
Was ist wenn, ich eine Korrelation anstatt eines Mittelwertvergleichs rechnen möchte?
Nehme ich dann punktbiserial? (Normalverteilung sollte doch laut des zentralen Grenzwertsatz bei N=180 kein Problem sein, oder?)
Ich bin immer noch etwas verunsichert was es mit diesen natürlich und künstlich dichotomen Variablen auf sich hat. Und unter was Kaffeetrinker/Kein Kaffeetrinker einzuordnen wäre.
Liebe Grüße
Anna
-
- Beiträge: 2739
- Registriert: 01.02.2018, 10:45
Re: Punktbiseriale oder biseriale Korrelation?
Hallo Anna
aber jedes für sich ist nicht vollständig.
die Mittelwerte sind deskriptiv sinnvoll
um den Unterschied zu "fühlen",
die Korrelation beschreibt wie groß der Zusammenhang ist,
egal ob du das ETA2 oder punktbiserial nennst.
weil das Merkmal in echt normal sein muss
und nicht approximativ, oder in der Stichprobe.
(Dieses omega wir bei größerer Stichprobe nur genauer)
Wenn das aber nicht geht und nur dichotom vorliegt, haben sich Statistik Nerds ausgedacht, dass
die Korrelationen nicht richtig sind, die kann man dann quasi hochrechnen...
Es ist überhaupt kein Problem, wenn du Kaffeetrinker als echt dichotom ansetzt, das ist deine Entscheidung
eine theoretische. Dann verwendest du auch nur diese Information, und nicht irgendwie intervallskaliertes "oben drüber"
Kaffeetrinken ist ein komplexes Merkmal wie Geschlecht, (und Geschlecht wertet man auch als echt dichotom)
Das setzt sich aus vielfältigen Verhalten zusammen. Kaffee Menge in Liter, Kaffee menge in Koffein,
Geld das man dafür bezahlt, wie man es zelebriert, mit Milch oder Zucker usw., Höhe des Genusses.
UM Kaffeetrinken komplett abzubilden bräuchtest du all diese Variablen.
Vielleicht korreliert die eine, aber nicht die andere Kaffeefacette
Niemand würde sich an dieser Stelle die Frage stellen, ob echt oder natürlich dichotom.
Deine Verunsicherung ist künstlich! (zuviel gegoogelt)
gruß
dutchie
Amch mal beides und die siehst es ist quasi identisch
aber jedes für sich ist nicht vollständig.
die Mittelwerte sind deskriptiv sinnvoll
um den Unterschied zu "fühlen",
die Korrelation beschreibt wie groß der Zusammenhang ist,
egal ob du das ETA2 oder punktbiserial nennst.
Das ist Quatsch,
weil das Merkmal in echt normal sein muss
und nicht approximativ, oder in der Stichprobe.
(Dieses omega wir bei größerer Stichprobe nur genauer)
Wenn ein Merkmal intervallskaliert ist sollte es auch so gemessen werden!
Wenn das aber nicht geht und nur dichotom vorliegt, haben sich Statistik Nerds ausgedacht, dass
die Korrelationen nicht richtig sind, die kann man dann quasi hochrechnen...
Es ist überhaupt kein Problem, wenn du Kaffeetrinker als echt dichotom ansetzt, das ist deine Entscheidung
eine theoretische. Dann verwendest du auch nur diese Information, und nicht irgendwie intervallskaliertes "oben drüber"
Kaffeetrinken ist ein komplexes Merkmal wie Geschlecht, (und Geschlecht wertet man auch als echt dichotom)
Das setzt sich aus vielfältigen Verhalten zusammen. Kaffee Menge in Liter, Kaffee menge in Koffein,
Geld das man dafür bezahlt, wie man es zelebriert, mit Milch oder Zucker usw., Höhe des Genusses.
UM Kaffeetrinken komplett abzubilden bräuchtest du all diese Variablen.
Vielleicht korreliert die eine, aber nicht die andere Kaffeefacette
Niemand würde sich an dieser Stelle die Frage stellen, ob echt oder natürlich dichotom.
Deine Verunsicherung ist künstlich! (zuviel gegoogelt)
gruß
dutchie