Hallo liebe Leute!
Ich hab bei der Prüfung auf Normalverteilung meiner Variablen auf Normalverteilung (Kolmogorov-Smirnov + den anderen Test + Histogramm) festgestellt, dass meine Variablen nicht normalverteilt, sondern perfekt kubisch verteilt sind!! Dies trifft auch auf die Residuen zu, die ich als auf ihre Normalverteilung als Voraussetzung für eine Regressionsanalyse überprüft habe.
So, ich weiß jetzt, dass ich schonmal keine Regression machen darf. Da nicht nur die Residuen, sondern auch die Variablen selbst kubsich verteilt sind: darf ich jetzt auch noch nicht mal Korrelationen berechnen?
Ich hab grade bei einer Rechnung mal einfach alle 3 Korrelationsarten verwendet (= Spearmans, Rho, Kendals Tau) und da war nur der Kendals Tau-Wert etwas geringer, die beiden anderen waren sehr ähnlcih!
Noch zur Info: Ich habe Variablen aus 3 Fragebögen: in zwei Fragebögen benutze ich die Likert Skala, in dem dritten ist der Antwortmodus: "stimmt gar nicht, stimmt etwas, stimmt völlig".
Könnt ihr mir helfen??
Beste Grüße
AniMe
Was machen bei kubischer Verteilung?
-
- Beiträge: 939
- Registriert: 13.05.2008, 10:52
es darf kein test gerechnet werden, der normalverteilung voraussetzt, d.h. auch keine pearson-korrelation. spearman und kendals tau wird oft gerechnet, wenn keine normalverteilung vorliegt. ich glaube aber mich zu erinnern, dass zumindest spearman auch normalverteilung voraussetzt (steht im bortz?).
die formeln der korrelationskoeffizienten sind "verwandt", d.h. es kommt immer etwas ähnliches heraus. das sagt aber nichts darüber aus, ob es angemessen ist, die formeln auch zu verwenden.
die formeln der korrelationskoeffizienten sind "verwandt", d.h. es kommt immer etwas ähnliches heraus. das sagt aber nichts darüber aus, ob es angemessen ist, die formeln auch zu verwenden.
-
- Beiträge: 7
- Registriert: 25.11.2009, 11:21
Oh Mist
Da kann ich auch nicht mit dem "Zentralem Grenzwerttheorem" argumentieren (siehe Bortz), nach dem man von einer Normalverteilung ausgehen kann, sobald das N>30 ist, oder???
Mein N ist nämlich 1400, so dass es wohl kein Wunder ist, dass die Prüfungen auf Normalverteilung signifikant werden, oder???
Wisst ihr ob es sonste eine Möglichkeit der "Kurvenanpassung" bei der Regression auch bei Korrelationsanalysen gibt?
Das hieße nämlich sonst auch, dass ich keine Partialkorrelationen machen darf, und darauf stützen sich meine Haupthypothesen... ((
Da kann ich auch nicht mit dem "Zentralem Grenzwerttheorem" argumentieren (siehe Bortz), nach dem man von einer Normalverteilung ausgehen kann, sobald das N>30 ist, oder???
Mein N ist nämlich 1400, so dass es wohl kein Wunder ist, dass die Prüfungen auf Normalverteilung signifikant werden, oder???
Wisst ihr ob es sonste eine Möglichkeit der "Kurvenanpassung" bei der Regression auch bei Korrelationsanalysen gibt?
Das hieße nämlich sonst auch, dass ich keine Partialkorrelationen machen darf, und darauf stützen sich meine Haupthypothesen... ((
-
- Beiträge: 939
- Registriert: 13.05.2008, 10:52
es stimmt schon, dass bei großen fallzahlen kleine abweichungen zu einer signifikanz führen, siehe dazu die tabellierung der p-werte in abhängigkeit von der fallzahl z.b. im bortz. du hattest aber geschrieben, deine verteilung sei perfekt kubisch. das ist doch dann so eine art welle, d.h. mit mehr als einem gipfel? bei einer welle (so sieht eine normalverteilung eben keinesfalls aus) kann man nicht davon ausgehen, dass der k-s-test nur aufgrund der großen fallzahl signifikant geworden ist.
ich habe schon mal gelesen, dass man bei großen stichproben alternativ zum k-s-test andere dinge betrachtet z.b. schiefe und kurtosis, aber ich glaube, das war in einem forum und ich kann dazu keine weiteren hinweise geben.
man kann die daten auch transformieren, bis sie normalverteilt sind z.b. durch quadrieren, logarithmieren.... welche folgen das für die interpretation der ergebnisse hat, kann ich nicht sagen.
ich habe schon mal gelesen, dass man bei großen stichproben alternativ zum k-s-test andere dinge betrachtet z.b. schiefe und kurtosis, aber ich glaube, das war in einem forum und ich kann dazu keine weiteren hinweise geben.
man kann die daten auch transformieren, bis sie normalverteilt sind z.b. durch quadrieren, logarithmieren.... welche folgen das für die interpretation der ergebnisse hat, kann ich nicht sagen.
-
- Beiträge: 7
- Registriert: 25.11.2009, 11:21
Hallo Karin,
danke wieder für die schnelle Antwort! Ja, das stimmt, die Verteilung ist leider wirklich ein Welle. Ich hab mir jetzt auch noch mal die Schiefe und Kurtosis angeguckt: bei fast allen Variablen sind sie zu groß...
Jetzt bin cih grad auf der Suche nach Alternativen. Ich hab jetzt beim Recherchieren gelesen, dass die Varianzanalyse, die ja eigentlich auch Normalverteilung voraussetzt ab einer gewissen N-Größe robust gegen diese Verletzung ist. Seht ihr (du) das auch so??
Vielen Dank nochmal
danke wieder für die schnelle Antwort! Ja, das stimmt, die Verteilung ist leider wirklich ein Welle. Ich hab mir jetzt auch noch mal die Schiefe und Kurtosis angeguckt: bei fast allen Variablen sind sie zu groß...
Jetzt bin cih grad auf der Suche nach Alternativen. Ich hab jetzt beim Recherchieren gelesen, dass die Varianzanalyse, die ja eigentlich auch Normalverteilung voraussetzt ab einer gewissen N-Größe robust gegen diese Verletzung ist. Seht ihr (du) das auch so??
Vielen Dank nochmal
-
- Beiträge: 939
- Registriert: 13.05.2008, 10:52
ja, ab einer bestimmten stichprobengröße soll fast alles gehen. ich selber würde das aber nur mit konkretem literaturhinweis in einer qualifikationsarbeit/ veröffentlichung so machen. teils kann man nähere angaben zu robustheit finden. z.b. ist bei der varianzanalyse gut, wenn man schon keine normalverteilung hat, dass die zellen gleich oder proportional besetzt sind (gleich große vergleichsgruppen) und dass die varianzen homogen sind. der zellenumfang sollte ausserdem nicht "klein" sein, aber keiner schreibt, was klein wäre. von einem mathematiker habe ich mal gesagt bekommen: 10 und mehr pro vergleichsgruppe müssen es sein. also würde ich sagen: weniger als 10 ist klein. aber was ist dann viel? schlecht ist außerdem, soweit ich weiss, eine asymetrische verteilung z.b. in gestalt einer welle.
man macht sicher nichts falsch, wenn man auf nonparametrische verfahren ausweicht z.b. kruskal-wallis-test oder verfahren von brown & forsythe im falle von 2 faktoren (siehe z.b. diehl & arbinger 1992).
man macht sicher nichts falsch, wenn man auf nonparametrische verfahren ausweicht z.b. kruskal-wallis-test oder verfahren von brown & forsythe im falle von 2 faktoren (siehe z.b. diehl & arbinger 1992).
-
- Beiträge: 7
- Registriert: 25.11.2009, 11:21
O.k, das hat mir sehr weitergeholfen!
Dann muss ich halt schauen, wie es mit den übrigen Voraussetzungen aussieht (hab ein bisschen rumprobiert und allein die Größe der zu vergleichenden Gruppen sind teilweise arg unterschiedlich und es sind auch immer ein, zwei Variablen dabei, die die Varianzhomogenität nicht erfüllen:-/)
Naja hilft nix.
Ich werd jetzt einfach mal schauen, was die nichtparametrischen (also Mann-Whitney) für Werte ausgeben und die mit der Varianzsanalyse vergleichen. Notfalls muss ich halt wirklich auf die ausweichen, auch wenn das dann vielleicht bedeutet, dass ich nicht alle Hypothesen so prüfen kann, wie ich es wollte...
Beste Grüße dir und nochmals vielen Dank!
Dann muss ich halt schauen, wie es mit den übrigen Voraussetzungen aussieht (hab ein bisschen rumprobiert und allein die Größe der zu vergleichenden Gruppen sind teilweise arg unterschiedlich und es sind auch immer ein, zwei Variablen dabei, die die Varianzhomogenität nicht erfüllen:-/)
Naja hilft nix.
Ich werd jetzt einfach mal schauen, was die nichtparametrischen (also Mann-Whitney) für Werte ausgeben und die mit der Varianzsanalyse vergleichen. Notfalls muss ich halt wirklich auf die ausweichen, auch wenn das dann vielleicht bedeutet, dass ich nicht alle Hypothesen so prüfen kann, wie ich es wollte...
Beste Grüße dir und nochmals vielen Dank!