Überprüfung des Zusammenhangs

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
janice
Beiträge: 1
Registriert: 18.05.2008, 09:58

Überprüfung des Zusammenhangs

Beitrag von janice »

Hallo,
ich sitze an meiner Diploamarbeit und wollte den Zusammenhang zwischen Unfallhäufung und Entfernung bestätigen. Allerdings ergibt das Chi² keinen Sinn, da 5 Zellen eine erwartete Häufigkeit unter 5 haben und auch die Signifikanz viel zu hoch ist (0,385). Habe ich den falschen Test angewendet oder bestätigt sich somit der Zusammenhang gar nicht?

Wie soll ich einen Zusammenhang mit Cramers V von 0,099 zu interpretieren, wenn die Signifikanz mit 0,096 zu hoch ist? Trifft sie nur für die Stärke des Zusammenhangs zu oder existiert dann tatsächlich kein Zusammenhang?

Wär schön, wenn Ihr mir weiterhelfen könntet.

Grüße Janice
shamsee
Beiträge: 3
Registriert: 09.04.2008, 15:11

Überprüfung des zusammenhangs

Beitrag von shamsee »

Hallo Janice,

ich kann dir nicht alle Deine Fragen beantworten, aber vielleicht kann ich dir zumindest bei einem Teil weiterhelfen.

Zunächst ist es so, dass der Sinn von Chi-Quadrat nicht davon abhängt, wieviel Zellen erwartete Häufigkeiten < 5 haben, sondern wieviel Prozent der Zellen das aufweisen (dürfen nicht mehr als 20 % sein, der Prozentsatz steht unter der Chi-Quadrat-Tabelle).
Falls es jetzt mehr als 20 % der Zellen sind, dann habe ich gehört, dass man alternativ den Likelihood-Quotienten auswerten darf.
Allerdings habe ich das nur gehört und kann es nicht begründen, Du solltest Dich also nochmal weiter erkundigen, ob das auch stimmt!!! Vielleicht kann hier ja auch ein weiteres Forumsmitglied helfen???

Falls jetzt aber nicht mehr als 20 % der Zellen erwartete Häufigkeiten < 5 haben, kannst du den Test auswerten (vorausgesetzt, es ist von vornherein der richtige Test, dazu müsste man mehr über Deine Daten und die Hypothese wissen). Das würde also bedeuten, dass der Test nicht signifikant ist und dass es folglich keinen Zusammenhang zwischen den beiden Variablen gibt.

Noch eine Anmerkung am Rande: Von hoher Signifikanz spricht man, wenn der Wert sehr klein ist ( p= .10 marginal signifikant: p=.05 signifikant; p=.01 sehr signifikant; p<= .001 höchst signifikant).
Werte darüber werden als nicht signifikant bezeichnet und ihre Höhe macht keinerlei Unterschied.

Zu Cramers V kann ich Dir leider gar nichts sagen, aber ich hoffe, ich konnte Dir zumindest ein bisschen weiterhelfen und wünsche dir viel Erfolg.

Liebe Grüsse, shamsee
meerschwarz
Beiträge: 8
Registriert: 18.03.2008, 10:37

Beitrag von meerschwarz »

hallo janice,
ich glaub wir plagen uns mit einem ähnlichen problem.

mein versuch einer hilfe:
wenn die signifikanz von chi² über 0.05 liegt, is dein ergebnis nicht signifikant, du kannst keine aussagen über einen zusammenhang machen, da die irrtumswahrscheinlichkeit zu hoch ist.

das mit den erwarteten häufigkeiten ist eine der vorraussetzungen, dass chi² zuverlässige ergebnisse liefert:
1. du musst eine zufallsstichprobe haben
2. die kreuztabelle sollte möglichst mindestens 6 felder haben
3. die erwartete häufigkeit größer als 5.

was du also beachten solltest:
- wie groß ist deine stichprobe ? (je größer, desto besser für die ergebnisse)
- hast du "nur" dichotome variablen ? (das ergäbe ja dann eine 2x2 kreuztabelle à 4 felder -> siehe punkt 2)

mit der signifikant der koeffizienten da hab ich auch mein problem...


:?: auch frage von mir:
wenn chi² unter 0.05 ist, das signifikanzniveau von (in meinem fall) phi/spearman über 0.05 liegt, wie interpretier ich das dann ?
-> es gibt einen zusammenhang, ich kann allerdings keine aussage über die stärke und richtung machen ?

wäre froh, wen mir da jmd weiterhelfen könnt und würd :) ... danke
meerschwarz
Beiträge: 8
Registriert: 18.03.2008, 10:37

Beitrag von meerschwarz »

ääääh, vergiss das mit den dichotomen variablen. bei unfallhäufung und entfernung müsst ja mind eine der beiden mehr als zwei ausprägungen haben :oops:
Volker
Beiträge: 67
Registriert: 17.01.2007, 18:15

Beitrag von Volker »

Hallo zusammen,

ich denke ihr solltet euch erst mals klar werden, was für ein Datenniveau ihr habt, da hat Meerschwarz schon den richtigen Ansatz.

Bei einem Zusammenhang von Unfallhäufigkeit und Entfernung würde ich erwarten, dass beide Varaiblen metrisch skaliert sind. In diesem Fall könnt ihr einfach Pearsons r verwenden. Allerdings misst Pearsons r nur lineare Zusammenhänge. Falls zu erwarten sein sollte, dass ein nicht linearer Zusammenhang besteht, sollte zusätzlich noch der Koeffizient ETA berechnet werden. Dies könnte der Fall sein, wenn die Unfallhäufigkeit z.B. mit zunehmender Entfernung erst ansteigt, bei einer mittleren Entfernung ein Optimum erreicht und dann wieder abnimmt. Das ist aber eine Frage eures Modells. ETA ist ein asymetrisches Maß, d.h., ihr müsst in diesem Fall die Unfallhäufigkeit als abhängige Variable betrachten. Am besten verwendet ihr beide Zusammenhangsmaße.

Falls die Daten nicht metrisch skaliert sein sollten, muss man andere Zusamenhangsmaße verwenden. Eigentlich sollte dann Spearmans Rho oder Tau-b für ordinal skalierte Daten passen.


Noch kurz ein paar Hinweise zur Verwendung des Chi²-Testes. Die von Meerschwarz angeführten drei Bedingungen sind nur teilweis richtig.

ad 3) Die erwarteten Häufigkeiten müssen nicht größer als 5 sein, also ab 6 sondern mindestens 5, vier und weniger pro Zelle ist zu wenig. Eine Ausnahme ist von Shamsee bereits angesprochen worden. Bei Tabellen dürfen nicht mehr als 20% aller Zellen eine erwartete Häufigkeit kleiner 5 haben, in diesem Fall kann der Chi²-Test noch korrekt angewendet werden.

ad 2) Ein Chi²-Test kann auch mit geringer Zellenzahl gerechnet werden, mindestens 6 Zellen ist keine Bedingung. Der Phi-Koeffizient ist sogar speziell für 4-Felder-Tabellen entwickelt worden. Sogar wenn du nur zwei Häufigkeiten miteinander vergleichen willst kannst du den Chi²-Test rechnen.

ad 1) Ob die Daten mit einer Zufallsstichprobe erhoben wurden ist für die Korrektheit des Chi²-Tests nicht von Bedeutung. Wichtig ist dies erst für die Verwendung der Ergebnisse. Möchte man eine repräsentative Aussage treffen, ist dies sicher richtig, handelt es sich aber um eine explorative Studie muss das nicht sein.

Ich wünsche euch noch viel Erfolg.

Viele Grüße
Volker
meerschwarz
Beiträge: 8
Registriert: 18.03.2008, 10:37

Beitrag von meerschwarz »

vielen dank volker, für deine hilfe !

... meine daten sind nicht normalverteilt.
bei einer kreuztabelle, die aus nominalen daten besteht, habe ich mir daher phi angeben lassen. (was laut deinen aussagen richtig wär :)
und bei ordinal/nominal skalierten daten habe ich kendall-tau-c zur aussage der stärke verwendet.

was mir unklar ist: wenn chi² signifikant ist, das signifikanzniveau von phi bzw kendall jedoch über 0,05 liegt, wie ich das dann interpretiere -> kann ich die hypothese gar nicht testen? oder lediglich sagen, dass ein signifikanter zusammenhang zwischen den beiden variablen besteht ?

... danke ...
Volker
Beiträge: 67
Registriert: 17.01.2007, 18:15

Beitrag von Volker »

Hallo Meerschwarz,

schön, dass ich helfen konnte.

Völlig richtig, bei nicht normalverteilten Daten musst du natürlich auf ein niedrigeres Niveau testen. Wie viele Zellen hat denn deine Tabele mit Nominaldaten? Phi ist nur für 2x2-Tabellen, also vier Felder. Wenn die Tabelle mehr als vier Felder hat (z.B. 2x3 usw.) musst du einen anderen Chi²-basierten Korrealtionskoeffizienten verwenden, ich nehme dann üblicherweise Cramers V.

Habe ich das richtig verstanden, du hast noch eine Tabelle mit nominalen und ordinalen Daten? Bei Korrelationen mit gemischtem Skalenniveau musst du immer den Korrelationskoeffizienten des niedrigeren Niveaus verwenden, also hier auch Cramers V. Kendals-tau-c ist nur dann anzuwenden, wenn beide Variablen ordinalskaliert sind.

Warum nimmst du den Tau-c? Die Tau-Koeffizienten unterscheiden sich in der Stärke, tau-a gibt sehr leicht starke Zusammenhänge, tau-c erreicht nur selten hohe Korrelationen und tau-b liegt dazwischen. Daher wird in der Literatur meist der tau-b verwendet.

Deine letzte Frage verstehe ich nicht ganz. Wenn der Chi²-Test signifikant ist, dann müsste Phi eigentlich auch signifikant sein, denn Phi basiert auf dem Chi²-Test. Es kann aber sein, das der Zusammenhang sehr niedrig ist. Hast du vielleicht die Stärke des Zusammenhangs gemeint?

Bei Kendalls-Tau wird die Signifikanz nicht über den Chi²-Test berechnet daher wird ein eigener Signifikanzwert ausgegeben. Bei der Interpretation der Signifikanz für Kendalls-tau spielt der CHi²-Test daher keine Rolle. Wenn also die Irrtumswahrscheinlichkeit bei Kendalls-tau über 0.05 liegt, hast du keinen signifikanten Zusammenhang, auch wenn der Chi²-Test unter 0.05 liegen sollte.

Bis dann und weiter viel Erfolg
Volker
meerschwarz
Beiträge: 8
Registriert: 18.03.2008, 10:37

Beitrag von meerschwarz »

ich habe 2 formen von tabellen:
eine ist 2x2 mit nominaldaten. hier stimmt demnach, dass ich phi verwandt hab *freu

die andere setzt sich aus einer nominalen variable und einer ordinalen zusammen, eine 2x5 kreuztabelle.
dass ich kendall-tau-c verwenden "soll" habe ich gelesen; ich weiß nicht mehr wo, ich plage mich schon eine zeit damit :/
nach deinen ausführungen ist es nicht korrekt und ich verwende demnach dann cramer's v, da nominal das niedrigste niveau ist und es keine 2x2 tabelle ist :) (ich hab dazu gelernt ;)

>Bei Kendalls-Tau wird die Signifikanz nicht über den Chi²-Test berechnet daher wird ein eigener Signifikanzwert ausgegeben. Bei der Interpretation der Signifikanz für Kendalls-tau spielt der CHi²-Test daher keine Rolle. Wenn also die Irrtumswahrscheinlichkeit bei Kendalls-tau über 0.05 liegt, hast du keinen signifikanten Zusammenhang, auch wenn der Chi²-Test unter 0.05 liegen sollte. <
danke ! das war meine frage. die abweichenden signifikanzen kamen auch nur bei kendalls raus.
ich habe es gerade mit cramer's v gemacht und da stimmen die signifikanzwerte überein :)))


VIELEN, VIELEN, VIELEN DANK !!!!
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten