Korrelation bei dichotomer und metrischer Var

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
ahnungslos
Beiträge: 32
Registriert: 14.09.2007, 09:29

Korrelation bei dichotomer und metrischer Var

Beitrag von ahnungslos »

Welches Korrelationsmaß kann ich bei einer dichotom und einer metrisch skalierten Variable benutzen? Pearson's r ist doch nicht erlaubt, oder?
Jack Crow
Beiträge: 146
Registriert: 14.12.2006, 18:41

Beitrag von Jack Crow »

Das kommt drauf an welche der Variablen die abhängige Variable ist: Ist die AV metrisch und die UV nominal kannst du Eta benutzten, andersrum nicht.
Soweit ich weiß kann man aber beim Spezialfall dichotomer Variablen trotzdem r verwenden, da dann o und 1 quasi als 0 - 100% interpretiert werden. Berechnet man z.B. die Korrelation von zwei dichotomen Variablen sind r und das für diesen Spezialfall konstruierte Maß Phi identisch.
"Life is 10% effort and 90% lucky timing"
Scott Adams
ahnungslos
Beiträge: 32
Registriert: 14.09.2007, 09:29

Beitrag von ahnungslos »

Hallo Jack!

Die aV ist dichotom und die uVs sind metrisch (alle auf einer siebenstufigen Likert-Skala gemessen).

Mit welchem Korrelationsmaß geht das?

Darf man Pearsons r eigentlich bei metrischen Variablen benutzen, wenn diese NICHT normalverteilt sind?

Danke schon mal :D

LG
Jack Crow
Beiträge: 146
Registriert: 14.12.2006, 18:41

Beitrag von Jack Crow »

Nein.
Dir gehts ja wenn ich den anderen Thread richtig interpretiere eigentlich um Vorstufen zu einem Gesamtmodell. Wenn du da eine log.Reg. anwendest könnte es sinnvoll sein, dieses Verfahren auch auf die bivariaten Beziehungen anzuwenden um Vergleichwerte auf der gleichen Ebene zu bekommen.
Ansonsten gilt, daß bei unterschiedlcihen Skalenniveaus das niedrigere Niveau den Maßstab bildet - du kannst also einfach ein nominales Assoziationsmaß wie Cramers V verwenden.
"Life is 10% effort and 90% lucky timing"
Scott Adams
ahnungslos
Beiträge: 32
Registriert: 14.09.2007, 09:29

Beitrag von ahnungslos »

Tausend Dank, dass Du so geduldig mit mir bist...

Ok, dann nehme ich für die Korrelation VOR der eigentlich Regression für die dichotom/metrisch-Kombi also Cramers V.

Aber womit berechne ich die Korrelation bei metrischen, die nicht normalverteilt sind? Geht da dieser Spearman?
Jack Crow
Beiträge: 146
Registriert: 14.12.2006, 18:41

Beitrag von Jack Crow »

Ja, den kannst du verwednen, auch wenn er besser für ordinale Daten funktioniert. Ich muss aber auch mein "Nein" von eben relativieren: Mangels Alternativen ist es häufig so, daß r trotz einer Abweichung von der Normalverteilung berechnet wird (in den Sozialwissenschaften z.B. wird man sowieso so gut wie nie eine Normalverteilung antreffen), und es ist dabei auch recht robust sofern man es nicht ganz genau interpretiert. Für eine Aussage "zwischen den v'ariablen besteht wahrscheinlich ein Zusammenhang ja/nein" reicht das eigentlich aus. ;)
"Life is 10% effort and 90% lucky timing"
Scott Adams
ahnungslos
Beiträge: 32
Registriert: 14.09.2007, 09:29

Beitrag von ahnungslos »

naja, es ist aber nicht nur eine ABWEICHUNG, es ist ziemlich deutlich definitiv meilenweit von einer Normalverteilung entfernt... Ich kriege zwar tatsächlich gute Korrelationen heraus bei Verwendung von r und diese ähneln auch Spearman, aber ich bin mir halt nicht sicher, ob ich dat darf ;)

Im Übrigen ist die Untersuchung tatsächlich sozialwissenschaftlich :D
Jack Crow
Beiträge: 146
Registriert: 14.12.2006, 18:41

Beitrag von Jack Crow »

Wie ist denn die Verteilung? Eine Möglichkeit, zumindest linkssteil verteilte Variablen der NV anzunähern ist eine Transformation zum natürlichen Logarithmus - aber bei Umfragedaten ist das wohl eher nicht der Fall...
"Life is 10% effort and 90% lucky timing"
Scott Adams
ahnungslos
Beiträge: 32
Registriert: 14.09.2007, 09:29

Beitrag von ahnungslos »

Einige sind linkssteil, aber die meisten sind einfach nur irgendwie verteilt...

Meinst Du denn, es ist ok, wenn ich nicht Spearman, sondern Pearson nehme? Wie gesagt, die Signifikanzniveaus sind ähnlich, halt nur andere Werte...
Jack Crow
Beiträge: 146
Registriert: 14.12.2006, 18:41

Beitrag von Jack Crow »

Bei verschiedenen Maßen kommen ja immer auch unterschiedliche Werte raus. Solange die ungefähr in der gleichen Liga sind ist das nicht so schlimm. Ich glaub nicht daß dir einer eine reinwürgen wird wenn du r nimmst, solange du im Text auf die Problematik hinweist.
"Life is 10% effort and 90% lucky timing"
Scott Adams
ahnungslos
Beiträge: 32
Registriert: 14.09.2007, 09:29

Beitrag von ahnungslos »

Naja, das kann ich mir ja noch überlegen, aber auf jeden Fall ist es gut zu wissen, was ich so machen kann... Aber als Erstes muss ich jetzt mal mein Problem mit der logreg lösen... :cry:
ahnungslos
Beiträge: 32
Registriert: 14.09.2007, 09:29

Beitrag von ahnungslos »

Jetzt hab ich aber nochmal ne Frage...

Meine Kreuztabellen sind z.T. 2x2, kann ich trotzdem Cramers V nehmen oder soll ich Phi nehmen? Mich interessiert das hinterher für mein Geschreibsel, denn die Werte sind immer gleich. Ich frag mich nur, ob man Cramers V auch bei 2x2 benutzen darf, weil ich jetzt verschiedentlich hier im Forum gelesen hab, dass man es da nicht nehmen sollte, sondern stattdessen Phi...

Was mich für die Interpretation noch interessiert: ich erhalte für Cramers V (oder Phi) z.B. den Wert 0,535. Das deutet doch auf einen recht deutlichen Zusammenhang hin, oder nicht? Bei "näherungsweiser Signifikanz" zeigt er mir allerdings 0,429 an, was ja nun überhaupt nicht signifikant ist. Was mich noch mehr irritiert: was heißt beim asymptotischen Standardfehler dieses a: Nullhypothese wird nicht angenommen? Was ich noch sagen muss: bei dieser speziellen KT ist mein n=39, also recht klein. Will die Tabelle mir jetzt sagen, dass zwar in meiner kleinen Stichprobe ein recht guter Zsh besteht, dieser aber in der GG mit nur 58% Whs gefunden werden kann?

Danke nochmal für eine Antwort!!
Jack Crow
Beiträge: 146
Registriert: 14.12.2006, 18:41

Beitrag von Jack Crow »

ahnungslos hat geschrieben:Jetzt hab ich aber nochmal ne Frage...

Meine Kreuztabellen sind z.T. 2x2, kann ich trotzdem Cramers V nehmen oder soll ich Phi nehmen? Mich interessiert das hinterher für mein Geschreibsel, denn die Werte sind immer gleich. Ich frag mich nur, ob man Cramers V auch bei 2x2 benutzen darf, weil ich jetzt verschiedentlich hier im Forum gelesen hab, dass man es da nicht nehmen sollte, sondern stattdessen Phi...
Da die Werte identisch sind ist es eigentlich egal welchen Wert du nimmst. Beide basieren auf Chi², bei V wird der Wert nur auf die Größe der Tabelle korrigiert, was bei 2x2-Tabellen nicht nötig ist.
Was mich für die Interpretation noch interessiert: ich erhalte für Cramers V (oder Phi) z.B. den Wert 0,535. Das deutet doch auf einen recht deutlichen Zusammenhang hin, oder nicht? Bei "näherungsweiser Signifikanz" zeigt er mir allerdings 0,429 an, was ja nun überhaupt nicht signifikant ist. Was mich noch mehr irritiert: was heißt beim asymptotischen Standardfehler dieses a: Nullhypothese wird nicht angenommen? Was ich noch sagen muss: bei dieser speziellen KT ist mein n=39, also recht klein. Will die Tabelle mir jetzt sagen, dass zwar in meiner kleinen Stichprobe ein recht guter Zsh besteht, dieser aber in der GG mit nur 58% Whs gefunden werden kann?
Genau - der Wert ist nicht signifikant also mit sehr hoher Wahrscheinlichkeit nur zufällig zustandegekommen und nicht, weil tatsächlich ein Zusammenhang besteht. Nach allgemeiner Konvention ist der Wert dann "wertlos" ;) Allerdings sind nur 39 Fälle auch eine sehr dünne Grundöage für statistische Tests.
"Life is 10% effort and 90% lucky timing"
Scott Adams
ahnungslos
Beiträge: 32
Registriert: 14.09.2007, 09:29

Beitrag von ahnungslos »

Hmmm... Immerhin schon mal richtig gedacht meinerseits :wink:

Wenn ich auf die geringe Fallzahl und die damit verbundene Problematik hinweise, kann ich dann den Wert trotzdem erwähnen oder sollte man lieber von vornherein sagen, dass (vermutlich) kein Zsg besteht?
Jack Crow
Beiträge: 146
Registriert: 14.12.2006, 18:41

Beitrag von Jack Crow »

Du präsentierst natürlich erst die SPSS-Ergebnisse (Wert + Sign. sind eh in einer Tabelle) und sagst dann, daß auf Grund dieser Ergebnisse vermutlich kein Zusammenhang besteht - sonst könntest du das ja auch gar nciht wissen ;). Oder du berechnest nur einen einfachen Chi²-Test und demonstrierst mit dem daß es keinen signifikanten Zusammenhang gibt (= sehr niedriger Chi²-Wert + Signifikanz über 0.05) - das ist dann noch weniger verwirrend.
"Life is 10% effort and 90% lucky timing"
Scott Adams
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten