Hallo zusammen,
zur Überprüfung meiner Hypothese wende ich den Mann Whitney U-Test an, da ich zwei unabhängige Stichproben mit ordinalen Daten vergleichen möchte. Voraussetzung für den Test ist, dass die zu vergleichenden Stichproben die gleiche Verteilungsform aufweisen.
Daher ist meine Frage:
1. Wie überprüfe ich ob die Stichproben gleich verteilt sind? Geht das nur mit Histogramm und Schiefe?
2. Wenn die Stichproben nicht ähnlich verteilt sind, was passiert dann? Data transformieren oder einen anderen Test nehmen? Welchen?
Lieben Dank für Eure Hilfe!
Christina
U-Test & Verteilung der Stichproben
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
Voraussetzung für den Test ist, dass die zu vergleichenden Stichproben die gleiche Verteilungsform aufweisen.
Falls du damit meinen solltest, dass die Verteilung der ZV der beiden Gruppen gleich sein sollte, dann ist das nicht richtig.
Der U-Test bildet zunächst die Rangreihenfolgen x(i) -> R(i). Über Rangsummen der beiden Teilstichproben T1 und T2 werden die U1 und U2 berechnet. Die Prüfung der Gleichheit der Verteilungen der beiden Gruppen ist daher nicht notwendig.
Für den U-Test relevant sind vor allem mögichst gleichgroße Teilstichproben und wenig Verbundränge.
Eingesetzt wird der U-Test als Test auf Lage. Das musst du prüfen, ob das deiner Hypothese entspricht.
drfg2008
-
- Beiträge: 6
- Registriert: 01.08.2012, 17:04
Hallo drfg,
lieben Dank für die schnelle Antwort.
Ich habe diese Annahme aus verschiedenen Lehrbüchern entnommen.
Beispielsweise „Der U-Test spricht nur dann ausschließlich auf Unterschiede in der zentralen Tendenz an, wenn die den Stichproben zugrunde liegende Populationen gleiche Verteilungsfunktionen besitzen“ ….Und wiederum: “Wenn diese Vorrausetzung nicht erfüllt ist, kann der U-Test nicht angewandt werden“.
Damit ist doch die Verteilung der ZV der beiden Gruppen gemeint, oder? Habe ich das falsch verstanden?
Vielen Dank & Grüße!
lieben Dank für die schnelle Antwort.
Ich habe diese Annahme aus verschiedenen Lehrbüchern entnommen.
Beispielsweise „Der U-Test spricht nur dann ausschließlich auf Unterschiede in der zentralen Tendenz an, wenn die den Stichproben zugrunde liegende Populationen gleiche Verteilungsfunktionen besitzen“ ….Und wiederum: “Wenn diese Vorrausetzung nicht erfüllt ist, kann der U-Test nicht angewandt werden“.
Damit ist doch die Verteilung der ZV der beiden Gruppen gemeint, oder? Habe ich das falsch verstanden?
Vielen Dank & Grüße!
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
Den Text würde ich auch so interpretieren wie du, was allerdings nichts über die Richtigkeit aussagt. (Könntest du bitte die Literaturangaben anfügen?). In der mir hier vorliegenden Literatur habe ich das nicht finden können (Bortz/Lienert).
Zunächst wäre schon die Frage zu stellen, weshalb nichtparametrische Methoden / verteilungsfreie Verfahren ausgerechnet einen Test auf Verteilung zur Voraussetzung haben sollten.
Dann wäre die Vorgehensweise beim U-Test zu überlegen. Wie schon in der ersten Antwort beschrieben, wandelt der U-Test die X(i) in R(i) um, ... . Dadurch entsteht eine Verteilung, die bekannt ist, da die Abstände der Ränge als gleich angenommen werden können. Von der ursprünglichen Verteilung ist folglich nichts übernommen worden.
Die Frage lässt sich auch per Simulation anhand drei unterschiedlicher Verteilungen prüfen: Normalverteilung mit zwei unterschiedlichen Streuungsparametern, Normalverteilung gegen Poisson Verteilung, Normalverteilung gegen Gleichverteilung, Normalverteilung gegen Logistische Verteilung.
Unterschiedliche Verteilungen mit gleichem Lageparameter µ also. Wie die Simulationen auf einer Datenbasis von je N = 50.000 zeigen, weist der U-Test in keinem einzigen Fall einen p-Wert kleiner 5% aus nur weil die Verteilungen sich ändern. Wird hingegen der Lageparameter der Vergleichsgruppe um nur einen Punkt verändert, spricht der U-Test sofort an (p<0,01).
[quote][/quote]
Zunächst wäre schon die Frage zu stellen, weshalb nichtparametrische Methoden / verteilungsfreie Verfahren ausgerechnet einen Test auf Verteilung zur Voraussetzung haben sollten.
Dann wäre die Vorgehensweise beim U-Test zu überlegen. Wie schon in der ersten Antwort beschrieben, wandelt der U-Test die X(i) in R(i) um, ... . Dadurch entsteht eine Verteilung, die bekannt ist, da die Abstände der Ränge als gleich angenommen werden können. Von der ursprünglichen Verteilung ist folglich nichts übernommen worden.
Die Frage lässt sich auch per Simulation anhand drei unterschiedlicher Verteilungen prüfen: Normalverteilung mit zwei unterschiedlichen Streuungsparametern, Normalverteilung gegen Poisson Verteilung, Normalverteilung gegen Gleichverteilung, Normalverteilung gegen Logistische Verteilung.
Unterschiedliche Verteilungen mit gleichem Lageparameter µ also. Wie die Simulationen auf einer Datenbasis von je N = 50.000 zeigen, weist der U-Test in keinem einzigen Fall einen p-Wert kleiner 5% aus nur weil die Verteilungen sich ändern. Wird hingegen der Lageparameter der Vergleichsgruppe um nur einen Punkt verändert, spricht der U-Test sofort an (p<0,01).
Code: Alles auswählen
input program.
loop x =1 to 5*10**4 by 1.
end case.
end loop.
end file.
end input program.
EXECUTE.
COMPUTE Gruppe = RV.BERNOULLI(0.5).
*----------- N~Vtlg. mit unterschiedlicher Stbw.
DO IF Gruppe EQ 0.
COMPUTE Testvariable=RV.NORMAL(100,10).
ELSE.
COMPUTE Testvariable=RV.NORMAL(100,50).
END IF.
EXECUTE.
NPAR TESTS
/M-W= Testvariable BY Gruppe(1 0)
/MISSING ANALYSIS.
*----------- N~Vtlg. / Poisson Vtlg. .
DO IF Gruppe EQ 0.
COMPUTE Testvariable=RV.POISSON(100).
ELSE.
COMPUTE Testvariable=RV.NORMAL(100,10).
END IF.
EXECUTE.
NPAR TESTS
/M-W= Testvariable BY Gruppe(1 0)
/MISSING ANALYSIS.
*----------- N~Vtlg. / Uniform Vtlg. .
DO IF Gruppe EQ 0.
COMPUTE Testvariable=RV.UNIFORM(50,150).
ELSE.
COMPUTE Testvariable=RV.NORMAL(100,10).
END IF.
EXECUTE.
NPAR TESTS
/M-W= Testvariable BY Gruppe(1 0)
/MISSING ANALYSIS.
*----------- N~Vtlg. / Logistic Vtlg. .
DO IF Gruppe EQ 0.
COMPUTE Testvariable=RV.LOGISTIC(100,123).
ELSE.
COMPUTE Testvariable=RV.NORMAL(100,10).
END IF.
EXECUTE.
NPAR TESTS
/M-W= Testvariable BY Gruppe(1 0)
/MISSING ANALYSIS.
drfg2008
-
- Beiträge: 6
- Registriert: 01.08.2012, 17:04
Lieber drfg,
das erste Zitat stammt von Bortz, J., Lienert, G.A., und Boehnke, K. (2008): Verteilungsfreie Methoden in der Biostatistik, S. 211. Ähnlich auch Lother, S. (2004): Angewandte Statistik, S. 382. Sofern die Stichproben nicht die gleiche Verteilungsform aufweisen, empfiehlt Sachs den Median Test.
Die Vorrausetzung wird ebenso aufgegriffen in: Hollander, M., Wolfe D. (1999): Nonparametric Statistical Methods, S. 106 sowie in SPSS Handbüchern wie Allen, P., Bennett, K. (2010): PASW Statistics by SPSS. A practical Guide. Version 18.0, S. 240.
Auch hier wird Stellung zu dem Thema genommen: Kasuya, E. (2000): Mann–Whitney U test when variances are unequal, Animal Behaviour, 2001, 61, 1247–1249.
Einen eher praktischen als theoretischen Ansatz gibt es hier: http://www.youtube.com/watch?v=vtz4FgFVmYk
Nun bin ich allerdings ein wenig verunsichert. Möglicherweise habe ich auch etwas falsch verstanden. Gibt es denn explizite Literatur die das Gegenteil besagt sprich, dass die Verteilungsform nicht gleich sein muss?
Danke nochmals für die Hilfe!
das erste Zitat stammt von Bortz, J., Lienert, G.A., und Boehnke, K. (2008): Verteilungsfreie Methoden in der Biostatistik, S. 211. Ähnlich auch Lother, S. (2004): Angewandte Statistik, S. 382. Sofern die Stichproben nicht die gleiche Verteilungsform aufweisen, empfiehlt Sachs den Median Test.
Die Vorrausetzung wird ebenso aufgegriffen in: Hollander, M., Wolfe D. (1999): Nonparametric Statistical Methods, S. 106 sowie in SPSS Handbüchern wie Allen, P., Bennett, K. (2010): PASW Statistics by SPSS. A practical Guide. Version 18.0, S. 240.
Auch hier wird Stellung zu dem Thema genommen: Kasuya, E. (2000): Mann–Whitney U test when variances are unequal, Animal Behaviour, 2001, 61, 1247–1249.
Einen eher praktischen als theoretischen Ansatz gibt es hier: http://www.youtube.com/watch?v=vtz4FgFVmYk
Nun bin ich allerdings ein wenig verunsichert. Möglicherweise habe ich auch etwas falsch verstanden. Gibt es denn explizite Literatur die das Gegenteil besagt sprich, dass die Verteilungsform nicht gleich sein muss?
Danke nochmals für die Hilfe!
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
Mir liegt jetzt nur die Kurzversion von Bortz/Lienert vor, die allerdings etliche Jahre später entstanden ist (Kurzgefaßte Statistik für die klinische Forschung). In der sprechen die Autoren nur noch von "formgleich" bzw. "homomer" Verteilung:
"Der U-Test prüft die Nullhypothese, daß 2 zu vergleichende Stichproben aus formgleich (homomer) verteilten Popultationen mit identischem Medianwert stammen. (...)" S.126
Das klingt aber schon ganz anders als in ihrem früher erschienenen Standardwerk (jetzt nach dir zitiert - habe gerade keinen Zugriff). Da der U-Test auch eine höhere Teststärke als der Mediantest hat, sollte man schon einmal darüber nachdenken. Allerdings ist es so, dass es in der wissenschaftlichen Literatur eben auch die 'Leitmedien' gibt (wie der SPIEGEL bei den Printmedien). Und wenn Bortz etwas geschrieben hatte, dann haben die anderen alle bei ihm abgeschrieben. Und Bortz / Lienert / Böhnke haben das auch irgendwo her: meist aus Simulationsstudien (1950er -1980er Jahre, wenn man mal seine Quellen so anschaut). Und die waren zu ihrer Zeit sehr aufwändig und kaum von einem breiteren Publikum nachvollziehbar. Heute lässt sich so etwas aus der Hüfte programmieren. Siehe oben (müsste man noch ein Makro oder ein wenig Python drum stricken um sämtliche Kombinationen zu berechnen).
Ich würde allerdings in einer Abschlußarbeit (BA oder MA) nicht unbedingt solche Grundsatzfragen aufstellen (etwa mit dem lapidaren Hinweis: "Ich habe hier mal eine Simulation laufen lassen, und siehe da, Bortz hat nicht so ganz recht"), sondern lieber den Mediantest rechnen (wenn das wirklich ein Problem sein sollte) und die geringere Teststärke in Kauf nehmen. Oder eben den Chi-Quadrat Anpassungstest zur Prüfung von Verteilungen im Voraus berechnen.
Nachtrag: mit extrem großen Streuungsunterschieden lassen sich sehr kleine Effektgrößen tatsächlich verwischen. Wenn im Beispiel der Normalverteilung S1 = 10 und S2 = 100 (also immerhin das Zehnfache), dann wäre bei µ = 100 ein Punkt Unterschied nicht mehr bei N = 50.000 auf p<0,05 nachweisbar. Das zeigt aber auch wie wenig realistisch das ist.
Nachtrag: Ich habe auch noch nie gesehen, dass bei der Verwendung des U-Tests vorher auf Verteilung getestet wurde (etwa durch den Chi-Quadrat Anpassungstest - denn der KSO würde hier ja nicht angezeigt sein, dieser testet auch auf Lage).
"Der U-Test prüft die Nullhypothese, daß 2 zu vergleichende Stichproben aus formgleich (homomer) verteilten Popultationen mit identischem Medianwert stammen. (...)" S.126
Das klingt aber schon ganz anders als in ihrem früher erschienenen Standardwerk (jetzt nach dir zitiert - habe gerade keinen Zugriff). Da der U-Test auch eine höhere Teststärke als der Mediantest hat, sollte man schon einmal darüber nachdenken. Allerdings ist es so, dass es in der wissenschaftlichen Literatur eben auch die 'Leitmedien' gibt (wie der SPIEGEL bei den Printmedien). Und wenn Bortz etwas geschrieben hatte, dann haben die anderen alle bei ihm abgeschrieben. Und Bortz / Lienert / Böhnke haben das auch irgendwo her: meist aus Simulationsstudien (1950er -1980er Jahre, wenn man mal seine Quellen so anschaut). Und die waren zu ihrer Zeit sehr aufwändig und kaum von einem breiteren Publikum nachvollziehbar. Heute lässt sich so etwas aus der Hüfte programmieren. Siehe oben (müsste man noch ein Makro oder ein wenig Python drum stricken um sämtliche Kombinationen zu berechnen).
Ich würde allerdings in einer Abschlußarbeit (BA oder MA) nicht unbedingt solche Grundsatzfragen aufstellen (etwa mit dem lapidaren Hinweis: "Ich habe hier mal eine Simulation laufen lassen, und siehe da, Bortz hat nicht so ganz recht"), sondern lieber den Mediantest rechnen (wenn das wirklich ein Problem sein sollte) und die geringere Teststärke in Kauf nehmen. Oder eben den Chi-Quadrat Anpassungstest zur Prüfung von Verteilungen im Voraus berechnen.
Nachtrag: mit extrem großen Streuungsunterschieden lassen sich sehr kleine Effektgrößen tatsächlich verwischen. Wenn im Beispiel der Normalverteilung S1 = 10 und S2 = 100 (also immerhin das Zehnfache), dann wäre bei µ = 100 ein Punkt Unterschied nicht mehr bei N = 50.000 auf p<0,05 nachweisbar. Das zeigt aber auch wie wenig realistisch das ist.
Nachtrag: Ich habe auch noch nie gesehen, dass bei der Verwendung des U-Tests vorher auf Verteilung getestet wurde (etwa durch den Chi-Quadrat Anpassungstest - denn der KSO würde hier ja nicht angezeigt sein, dieser testet auch auf Lage).
drfg2008
-
- Beiträge: 6
- Registriert: 01.08.2012, 17:04
Danke, drfg für die kompetente und schnelle Hilfe!
Wenn ich nun den Median Test anwende bin ich mir nicht sicher, ob ich die Ergebnisse richtig interpretiere da die Literatur ein wenig beschränkt ist auf diesen Test.
Kann ich allein durch unten stehendes Ergebnis entnehmen, dass das Motiv "Geld" für die 18-33 Jährigen wichtiger ist als den 50-65 Jährigen? Oder kann der absolute Wert größer/kleiner Median das Ergebnis noch nicht erklären, da Rangfolgen durch den Test nicht abzuleiten sind?
To make cash/ win the prize, Median = 4
18- 33 years
> Median 19
< = Median 29
50-65 years
> Median 7
< = Median 93
Lieben Dank für die Hilfe!
Wenn ich nun den Median Test anwende bin ich mir nicht sicher, ob ich die Ergebnisse richtig interpretiere da die Literatur ein wenig beschränkt ist auf diesen Test.
Kann ich allein durch unten stehendes Ergebnis entnehmen, dass das Motiv "Geld" für die 18-33 Jährigen wichtiger ist als den 50-65 Jährigen? Oder kann der absolute Wert größer/kleiner Median das Ergebnis noch nicht erklären, da Rangfolgen durch den Test nicht abzuleiten sind?
To make cash/ win the prize, Median = 4
18- 33 years
> Median 19
< = Median 29
50-65 years
> Median 7
< = Median 93
Lieben Dank für die Hilfe!
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
Jetzt habe ich hier bei Bortz nachgeschlagen und das Zitat nachgelesen. Es hatte mich auch schon gewundert. Der Text lautet doch noch etwas anders:
"... Ist dieses Homomeritätspostulat nicht erfüllt - etwa weil die eine Population links-, die andere rechtsgipflig verteilt ist-, dann spricht der Test bis zu einem gewissen Grade auch auf andere Unterschiede - hier auf solche der Schiefe - an. Dennoch darf man nach Bradley (1968, S. 106) erwarten, daß der U-Test auch bei fehlender Homomerität hauptsächlich auf Unterschiede der zentralen Tendenz reagiert. (...)"
Dann führt Bortz noch einzelne Arbeiten von Dixon (1954) Hodges u. Lehmann (1956), Witting (1960), Boneau (1962), Iller (1982), usw. aus.
Damit ist die Sache eigentlich klar.
Bortz, Lienert, Boehnke: Verteilungsfreie Methoden in der Biostatistik. Heidelberg 1990 S.211 - 212
"... Ist dieses Homomeritätspostulat nicht erfüllt - etwa weil die eine Population links-, die andere rechtsgipflig verteilt ist-, dann spricht der Test bis zu einem gewissen Grade auch auf andere Unterschiede - hier auf solche der Schiefe - an. Dennoch darf man nach Bradley (1968, S. 106) erwarten, daß der U-Test auch bei fehlender Homomerität hauptsächlich auf Unterschiede der zentralen Tendenz reagiert. (...)"
Dann führt Bortz noch einzelne Arbeiten von Dixon (1954) Hodges u. Lehmann (1956), Witting (1960), Boneau (1962), Iller (1982), usw. aus.
Damit ist die Sache eigentlich klar.
Bortz, Lienert, Boehnke: Verteilungsfreie Methoden in der Biostatistik. Heidelberg 1990 S.211 - 212
drfg2008
-
- Beiträge: 6
- Registriert: 01.08.2012, 17:04
Das stimmt, dennoch wird die Voraussetzung auch von anderen Autoren aufgegriffen.
Dixon (1954), Hodges u. Lehmann (1956), Witting (1960), Boneau (1962) bestätigen doch nur hohe Effizienz, wenn das Homomeritätspostulat erfüllt ist.
Wenn nicht, spricht Illers wiederum an, dass der Test nicht immer konservativ handelt. Daraufhin wird empfohlen sich Potthoff‘s generalisierten U Test anzunähern ( Bortz et al. S. 212).
Dennoch ist die Annahme von Bradley schon einmal ein Anfang und ich werde für mich -auch dank Deiner Einschätzung - dieser Meinung anschließen und noch andere Autoren mit dieser Sichtweise als Argumentationsgrundlage heranziehen
Vielen Dank nochmals für die Hilfe! Hat mir sehr geholfen!
Grüße
Dixon (1954), Hodges u. Lehmann (1956), Witting (1960), Boneau (1962) bestätigen doch nur hohe Effizienz, wenn das Homomeritätspostulat erfüllt ist.
Wenn nicht, spricht Illers wiederum an, dass der Test nicht immer konservativ handelt. Daraufhin wird empfohlen sich Potthoff‘s generalisierten U Test anzunähern ( Bortz et al. S. 212).
Dennoch ist die Annahme von Bradley schon einmal ein Anfang und ich werde für mich -auch dank Deiner Einschätzung - dieser Meinung anschließen und noch andere Autoren mit dieser Sichtweise als Argumentationsgrundlage heranziehen
Vielen Dank nochmals für die Hilfe! Hat mir sehr geholfen!
Grüße