Hallo!
Ich werte derzeit die Daten für meine Diplomarbeit aus. Es geht um ein Experiment, bei dem eine Patienten- und eine Kontrollstichprobe eine Konfliktaufgabe (3 Bedingungen) unter Zeitdruck bearbeiten mussten. Abhängige Variablen sind zum einen die Reaktionszeiten, zum anderen der Anteil korrekter Antworten.
Ich benutze also eine 2x3 Varianzanalyse mit Messwiederholung.
Nun meine Frage: beide AVs (Reaktionszeiten und Anteil der korrekten Antworten) sind nicht normalverteilt. Die Reaktionszeiten sind rechtsschief und der Peak ist steiler als normal. Ein kurzer Überblick aus dem SPSS-Frequencies-Output:
Statistics Reaktionszeiten
N Valid 3600
Missing 208
Std. Deviation 191,478
Skewness 3,168
Std. Error of Skewness ,041
Kurtosis 18,337
Std. Error of Kurtosis ,082
Nun meine Frage: wie schlimm ist die Verletzung der Normalverteilungsannahme in diesem Fall? Sollte ich transformieren (log oder gibt's noch was anderes) oder kann ich einfach sagen "laut Bortz/XYZ ist ANOVA robust gegenüber Verletzungen der NV-Annahme"?
Beim Anteil der korrekten Antworten ist es noch schwieriger, weil kaum Fehler gemacht wurden. Der Fehleranteil liegt bei 4-5%. Entsprechend ist wenig Varianz in den Daten. Ist eine ANOVA da überhaupt sinnvoll?
Danke schon mal!
Varianzanalyse mit Messwiederholung - Normalverteilung
-
- Beiträge: 3
- Registriert: 12.03.2011, 15:37
-
- Beiträge: 3
- Registriert: 12.03.2011, 15:37
Ein kurzer Nachtrag:
für die Varianzanalyse mit Messwiederholung rechne ich ja mit aggregierten Daten, d.h. mit den mittleren Reaktionszeiten pro Versuchteilnehmer.
Sollte ich für die Entscheidung über Normalverteilung oder nicht-Normalverteilung die "Rohdaten" oder die aggregierten nehmen?
Für die Rohdaten ist der K-S-Test signifikant mit p< .001. Bei den aggregierten Daten dagegen nicht, da liegt p bei .20.
für die Varianzanalyse mit Messwiederholung rechne ich ja mit aggregierten Daten, d.h. mit den mittleren Reaktionszeiten pro Versuchteilnehmer.
Sollte ich für die Entscheidung über Normalverteilung oder nicht-Normalverteilung die "Rohdaten" oder die aggregierten nehmen?
Für die Rohdaten ist der K-S-Test signifikant mit p< .001. Bei den aggregierten Daten dagegen nicht, da liegt p bei .20.
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
Ich möchte nur einmal auf diese Frage antworten.Nun meine Frage: wie schlimm ist die Verletzung der Normalverteilungsannahme in diesem Fall? Sollte ich transformieren (log oder gibt's noch was anderes) oder kann ich einfach sagen "laut Bortz/XYZ ist ANOVA robust gegenüber Verletzungen der NV-Annahme"?
Tatsächlich scheint dieses Thema umstritten zu sein. Der Bortz selbst hat meiner Kenntnis nach nie eigene Forschung in dieser Richtung betrieben. Die gleiche Ansicht habe ich auch bei anderen Autoren (im Bereich Psychologie) wiedergefunden. Autoren, die -als Mathematiker- selbst eigene Studien publiziert haben (wie bspw. Büning) weisen auf massive Effizienzverluste der ARE bei Nichterfüllung der Voraussetzung der N~Vtlg. gerade beim F-Test hin. Das Konzept der ARE ist jedenfalls gut durchdacht. Was aber macht man, wenn kein alternatives Verfahren zur Verfügung steht?
Gruß
drfg2008
-
- Beiträge: 3
- Registriert: 12.03.2011, 15:37
ARE - sorry, die Abkürzung kenn ich nicht...
Und um die Frage "Was aber macht man, wenn kein alternatives Verfahren zur Verfügung steht" aufzugreifen: ich muss eben diese Frage irgendwie beantworten. Nur übersteigt sie natürlich bei weitem meine Kapazität, ich bin also darauf angewiesen, andere Quellen anzuzapfen. Kann man also Bortz (oder jemand anderen) zitieren, und die ANOVA einfach trotzdem rechnen (ohne gleich völligen Mist zu berichten) ?
Ich bin jetzt weniger auf theoretisch-mathematische Überlegungen aus, sondern eher auf einen praktischen Rat, wie ich das für meine Arbeit handhabe.
Danke!
Und um die Frage "Was aber macht man, wenn kein alternatives Verfahren zur Verfügung steht" aufzugreifen: ich muss eben diese Frage irgendwie beantworten. Nur übersteigt sie natürlich bei weitem meine Kapazität, ich bin also darauf angewiesen, andere Quellen anzuzapfen. Kann man also Bortz (oder jemand anderen) zitieren, und die ANOVA einfach trotzdem rechnen (ohne gleich völligen Mist zu berichten) ?
Ich bin jetzt weniger auf theoretisch-mathematische Überlegungen aus, sondern eher auf einen praktischen Rat, wie ich das für meine Arbeit handhabe.
Danke!
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
ARE - asymptotische relative Effizienz
nicht nur auf Bortz kann man sich berufen, sondern z.B. auch auf Gollwitzer, Eid, et. al. [1]. Die Autoren beschreiben auch, wie mittels Log Berechnung nicht N~vert. ZVs auf approximativ N~Vert. transformiert werden können. In der Psychologie wird das sicherlich einfach anerkannt.
Bei Mathematikern wäre das anders.
Gruß
[1]
http://www.amazon.de/gp/product/3621275 ... 362127524X
nicht nur auf Bortz kann man sich berufen, sondern z.B. auch auf Gollwitzer, Eid, et. al. [1]. Die Autoren beschreiben auch, wie mittels Log Berechnung nicht N~vert. ZVs auf approximativ N~Vert. transformiert werden können. In der Psychologie wird das sicherlich einfach anerkannt.
Bei Mathematikern wäre das anders.
Gruß
[1]
http://www.amazon.de/gp/product/3621275 ... 362127524X
drfg2008