Hallo,
ich habe jetzt schon mehr als einmal in naturwissenschaftlichen Publikationen in etwa Folgendes gelesen:
"Results are expressed as the mean +/- SD. Data were analyzed by the nonparametric Mann-Whitney U test ..."
Macht so etwas Sinn? Nichtparametrische Hypothesentests (wie beispielsweise der Mann-Whitney U-Test) werden doch angewendet, wenn die Daten nicht normalverteilt sind.
Sind die Daten aber nicht normalverteilt, wäre es dann nicht auch sinnvoller, den Median und ggf. das 25-Perzentil und das 75-Perzentil anzugeben anstelle des arithmetischen Mittelwerts und der Standardabweichung (SD)?
SD und nichtparametrische Hypothesentests - Widerspruch?
-
- Beiträge: 29
- Registriert: 05.12.2009, 09:23
-
- Beiträge: 939
- Registriert: 13.05.2008, 10:52
der mann-whitney-u-test arbeitet mit den rangsummen. daher wäre es korrekt, die gemittelten rangsummen der beiden gruppen anzugeben. die sind leider nicht so anschaulich, daher gibt man oft trotzdem mittelwerte und standardabweichungen an. es stimmt, dass die dann die mittelwerte die verteilungen in den beiden gruppen nicht so sehr gut darstellen. die SD kann man berechnen: wenn die besonders groß ist, sieht man, dass das mittel kein so toller repräsentant der verteilung ist. sinnvoll ist es sicher, statt dem mittelwert andere charakteristika der verteilung wie median und perzentile anzugeben.
-
- Beiträge: 29
- Registriert: 05.12.2009, 09:23
Ja, das stimmt, gemittelte Rangsummen wären in der Tat sehr unanschaulich.KarinJ hat geschrieben:der mann-whitney-u-test arbeitet mit den rangsummen. daher wäre es korrekt, die gemittelten rangsummen der beiden gruppen anzugeben. Die sind leider nicht so anschaulich, daher gibt man oft trotzdem mittelwerte und standardabweichungen an.
Nur finde ich, dass selbst der Median bei stark asymmetrisch verteilten Daten kein sonderlich deskriptiver Parameter für den Datensatz bzw. die Gruppe ist. Aber irgendwas muss man ja nehmen (natürlich kann man immer einen Dot-Plot mit allen Werten erstellen, aber ich meine als zusammenfassenden Parameter).es stimmt, dass die dann die mittelwerte die verteilungen in den beiden gruppen nicht so sehr gut darstellen. die SD kann man berechnen: wenn die besonders groß ist, sieht man, dass das mittel kein so toller repräsentant der verteilung ist. sinnvoll ist es sicher, statt dem mittelwert andere charakteristika der verteilung wie median und perzentile anzugeben.