Hallo – mit einem Datensatz von 150 Probanden in der Kontroll und 30 Experimentalgruppe und nach ansehen der PP Plots, des Kolgomorov Sminrov und Shapiro WIlko Tests in SPSS, welche beide hoch signifikant waren, gehe ich hier von nicht normalverteilten Daten aus, sowie nach Ansehen des Levene Tests in SPSS, welcher hoch signifikant war, von ungleichen Varianzen –> also Mann Whitney U Test, statt t-tests bei Gruppenvergleich in Bezug auf abhängige Variable (Testwert). Zum Berichten gebe ich an, dass sich nach dem Mann Whitney U Test - in SPSS durchgeführt - die beiden Gruppen signifkant unterscheiden und dazu dann U, z und p WErte. Und dann noch die Effektstärke berechnet (habe Eta Quadrat genommen). Soweit so gut und hoffentlich auch der richtige Weg.
Jetzt frage ich mich aber folgendes: wenn ich weitere Variablen untersuche, wie Alter, Geschlecht etc. und z.b. ob Alter einen Effekt auf die Ausprägung der Testwerte hatte und dann z.b. Experimental und KOntrollgruppe innerhalb einer Altersgruppe vergleichen will, hatte ich vorher t-Tests gerechnet für unabhängige Stichproben und die F - Werte und p-Werte angegeben. (mit meist den F-Wert und p Wert für Varianzen sind nicht gleich, je nachdem wie der Levene Test ausfiel). Aber ich frage mich, ob ich jetzt wirklich darin richtig liege, jetzt für all diese Vergleiche (auch z.b. Geschlechtsunterschiede Männer/Frauen innerhalb der Gruppen (exp./kontroll) und zwischen den Gruppen wieder jeweils immer Mann Whitney U Tests durchzuführen??? Und sollte ich dann auch immer wieder jeweils für jede kleine Berechnung auch die Effektstärke angeben?
Und wie ist es mit Interaktionseffekten? z.b. Gruppe mit Alter und Geschlecht? Ich hatte eine Varianzanalyse gerechnet. Ist das in Anbetracht der nicht Normalverteilung und ungleichen Varianzen überhaupt richtig?
Und was ist mit Regressionsanalysen? Ich hatte den Effekt von einzelnen Faktoren wie soziökonomischen Status auf den Testwert gerechnet. Bei den Korrelationen habe ich jetzt Spearman Korrelationen gerechnet.
Und gibt man die Freiheitsgrade df überhaupt irgendwo an bei nicht Normalverteilung und ungleichen Varianzen?
Und was ist mit Chi Quadrat Tests? Jetzt immer nur Mann Whitney stattdessen? (z.b. wenn Gruppenunterschied zwischen Exp. und Kontrollgr. innerhalb des Geschlechts)
Bin sehr verunsichert, da ich erstmal alles mit T-Tests, Pearson Korrelationen etc. gerechnet hatte ...
Danke!
Mann Whitney U-Test statt t-Tests in SPSS
-
- Beiträge: 2
- Registriert: 27.04.2017, 12:55
-
- Beiträge: 2
- Registriert: 10.05.2017, 02:01
Re: Mann Whitney U-Test statt t-Tests in SPSS
Hi Rosa.
Ich versuche mal deine Fragen hier zu beantworten:
Natürlich kannst du trotzdem den Mann-Whitney-U-Test berechnen, wenn dir das lieber ist. Die Effektstärke lässt sich dann mithilfe der Teststatistik des Mann-Whitney-U-Tests errechnen (Ein Beispiel findest du hier: https://www.statistik-helfer.de/statist ... ney-u-test
Wenn du den Einfluss weiterer Variablen untersuchen möchtest, wird es kompliziert. Wenn du weitere metrische Variablen wie bspw. Alter einfügst, dann wäre eine Kovarianzanalyse nötig (In SPSS über Analysieren -> Allgemeines Lineares Modell).
Bei weiteren kategorialen Variablen wie Geschlecht wäre eine mehrfaktorielle ANOVA am sinnvollsten, wegen der unausgeglichenen Gruppen aber wahrscheinlich nicht durchführbar, weil die ANOVA dann nicht mehr robust gegen Verletzungen ihrer Voraussetzungen ist. Eine nichtparametrische Alternative existiert hierzu in SPSS nicht, dafür aber in R (Paket: nparLD), falls das für dich in Frage kommt. Da gibt es keine andere Wahl in SPSS, als eine Reihe von Mann-Whitney-U-Tests durchzuführen. Falls du damit vorher festgelegte Hypothesen prüfst, müsstest du noch eine Bonferroni-Korrektur des Signifikanzniveaus vornehmen.
Allgemein solltest du versuchen, dir eine Teststrategie zu überlegen und zu fokussieren, was du untersuchen möchtest. In fast jedem Datensatz gibt es so viele Variablen, dass man tausende von Fragestellungen untersuchen könnte - wenn man nicht einigermaßen hypothesengeleitet vorgeht, verliert man leicht den Überblick.
Ich hoffe, ich konnte dir bei einigen Fragen weiterhelfen. Viele Grüße, Ben.
Ich versuche mal deine Fragen hier zu beantworten:
Für den t-Test sind gar keine normalverteilten Daten notwendig. Es ist notwendig, dass der Mittelwert aus einer normalverteilten Grundgesamtheit stammt. Das bedeutet, nicht die Variablen an sich müssen normalverteilt sein, sondern deren Mittelwert. Bei Stichproben oberhalb von 30 bzw. 50 Probande (je nach Quelle) kann dies als gegeben angenommen werden (-> zentrales Grenzwerttheorem). Die Verletzung der Varianzhomogenität sollte auch kein Problem sein, da bei t-Tests immer auch der Welch-Test angegeben wird (jeweils untere Zeile in t-Test-Tabelle)mit einem Datensatz von 150 Probanden in der Kontroll und 30 Experimentalgruppe und nach ansehen der PP Plots, des Kolgomorov Sminrov und Shapiro WIlko Tests in SPSS, welche beide hoch signifikant waren, gehe ich hier von nicht normalverteilten Daten aus
Natürlich kannst du trotzdem den Mann-Whitney-U-Test berechnen, wenn dir das lieber ist. Die Effektstärke lässt sich dann mithilfe der Teststatistik des Mann-Whitney-U-Tests errechnen (Ein Beispiel findest du hier: https://www.statistik-helfer.de/statist ... ney-u-test
Wenn du den Einfluss weiterer Variablen untersuchen möchtest, wird es kompliziert. Wenn du weitere metrische Variablen wie bspw. Alter einfügst, dann wäre eine Kovarianzanalyse nötig (In SPSS über Analysieren -> Allgemeines Lineares Modell).
Bei weiteren kategorialen Variablen wie Geschlecht wäre eine mehrfaktorielle ANOVA am sinnvollsten, wegen der unausgeglichenen Gruppen aber wahrscheinlich nicht durchführbar, weil die ANOVA dann nicht mehr robust gegen Verletzungen ihrer Voraussetzungen ist. Eine nichtparametrische Alternative existiert hierzu in SPSS nicht, dafür aber in R (Paket: nparLD), falls das für dich in Frage kommt. Da gibt es keine andere Wahl in SPSS, als eine Reihe von Mann-Whitney-U-Tests durchzuführen. Falls du damit vorher festgelegte Hypothesen prüfst, müsstest du noch eine Bonferroni-Korrektur des Signifikanzniveaus vornehmen.
Allgemein solltest du versuchen, dir eine Teststrategie zu überlegen und zu fokussieren, was du untersuchen möchtest. In fast jedem Datensatz gibt es so viele Variablen, dass man tausende von Fragestellungen untersuchen könnte - wenn man nicht einigermaßen hypothesengeleitet vorgeht, verliert man leicht den Überblick.
Ich hoffe, ich konnte dir bei einigen Fragen weiterhelfen. Viele Grüße, Ben.