Anova wenn nicht alle Gruppen normalverteilt sind. Möglich?
-
- Beiträge: 6
- Registriert: 14.10.2010, 20:14
Anova wenn nicht alle Gruppen normalverteilt sind. Möglich?
Hallo,
ich habe Daten aus Experimenten, die ich nun einem statistischen Test unterziehen muss. Das Experiment wurde mit Katzen durchgeführt. Eine Katze bekam einen Lichtblitz von zB 10ms Länge zu sehen. Die Reaktion der Nerven wurde gleihzeitig gemessen. Danach wurde der Lichblitz auf 100ms ausgedehnt und wieder die Reaktionen gemessen. Die Experimente wurden beide je ca. 10 Mal durchgeführt.
Nun habe ich also zwei Gruppen à 10 Messwerte, die ich mit einem Test vergleichen möchte. Durch ein Histogramm und einen Shapiro-Wilks Test habe ich heruasgefunden, dass die Daten in einer Gruppe normalverteilt sind, in der anderen aber nicht!
Welchen Test amche ich nun. ANOVA ist ja nur für normalverteilte Stichproben, nicht-parametrische Tests (Friedman) für nichtnormalverteilte. Hier sind die Werte einer Gruppe aber normalverteilt, die der anderen Gruppe aber nicht.
Danke im Voraus!
ich habe Daten aus Experimenten, die ich nun einem statistischen Test unterziehen muss. Das Experiment wurde mit Katzen durchgeführt. Eine Katze bekam einen Lichtblitz von zB 10ms Länge zu sehen. Die Reaktion der Nerven wurde gleihzeitig gemessen. Danach wurde der Lichblitz auf 100ms ausgedehnt und wieder die Reaktionen gemessen. Die Experimente wurden beide je ca. 10 Mal durchgeführt.
Nun habe ich also zwei Gruppen à 10 Messwerte, die ich mit einem Test vergleichen möchte. Durch ein Histogramm und einen Shapiro-Wilks Test habe ich heruasgefunden, dass die Daten in einer Gruppe normalverteilt sind, in der anderen aber nicht!
Welchen Test amche ich nun. ANOVA ist ja nur für normalverteilte Stichproben, nicht-parametrische Tests (Friedman) für nichtnormalverteilte. Hier sind die Werte einer Gruppe aber normalverteilt, die der anderen Gruppe aber nicht.
Danke im Voraus!
-
- Beiträge: 939
- Registriert: 13.05.2008, 10:52
du kannst das ganze nochmal testen, indem du die residuen auf normalverteilung prüfst. d.h. du würdest eine anova mit messwiederholungsfaktor (innersubjektfaktor) rechnen und bei "speichern" die unstandardisierten residuen wählen. die prüfst du dann auf normalverteilung.
dann gibt es noch verschiedene daumenregeln, für die ich keine zitierfähige stelle habe:
um von normalverteilung ausgehen zu können, sollte
- bei kleinen stichproben (bis n = 50) sollte shapiro-wilk nicht signifikant sein
- bei mittleren " " (50-100) sollte kolmogorov-smirnov nicht signifikant sein - hier nimmt man den bei "explorative analyse", da dieser test (mit lilliefors-korrektur) als spezialfall des komogorov-smirnov-tests für die untersuchung von normalverteilung entwickelt wurde.
- bei großen stichproben (über 100) tendieren beide tests dazu, zu schnell signifikant zu werden (schon kleine abweichungen führen zu einer zurückweisung der hypothese der normalverteilung). in diesem fall soll dann in der spalte "statistik" kolmogorov-smirnov > 0,1 und shapiro-wilk > 0,95 und die punkte im trendbereinigten QQ-diagramm sollten zufällig um die linie streuen und die punkte sollten weniger als 1,5 entfert sein.
ist danach immer noch keine normalverteilung zu sehen, könnten die ergebnisse trotzdem robust sein. hier spielt eine rolle, ob die zellen das gleiche n haben (was bei deiner abhängigen testung ja automatisch der fall wäre, es sei denn, es gibt noch unabhängige faktoren), ob die verteilung symmetrisch ist (auch wenn sie von der normalverteilung abweicht) und ob varianzhomogenität vorhanden ist.
nichts falsch macht man, wenn man eine non-parametrische alternative wählt. der friedman-test wäre angemessen, wenn es mehr als 2 gruppen gibt. du hast 2 stimulusvariationen, die 10x gemessen wurden. normalerweise bildet man den durchschnitt für jede stimulusvariation und vergleicht dann die beiden mittelwerte. es wäre aber möglich, dass von ermüdung etc. ausgegangen wird, so dass man den verlauf der beiden stimuli-reaktionen vergleichen möchte.
dann gibt es noch verschiedene daumenregeln, für die ich keine zitierfähige stelle habe:
um von normalverteilung ausgehen zu können, sollte
- bei kleinen stichproben (bis n = 50) sollte shapiro-wilk nicht signifikant sein
- bei mittleren " " (50-100) sollte kolmogorov-smirnov nicht signifikant sein - hier nimmt man den bei "explorative analyse", da dieser test (mit lilliefors-korrektur) als spezialfall des komogorov-smirnov-tests für die untersuchung von normalverteilung entwickelt wurde.
- bei großen stichproben (über 100) tendieren beide tests dazu, zu schnell signifikant zu werden (schon kleine abweichungen führen zu einer zurückweisung der hypothese der normalverteilung). in diesem fall soll dann in der spalte "statistik" kolmogorov-smirnov > 0,1 und shapiro-wilk > 0,95 und die punkte im trendbereinigten QQ-diagramm sollten zufällig um die linie streuen und die punkte sollten weniger als 1,5 entfert sein.
ist danach immer noch keine normalverteilung zu sehen, könnten die ergebnisse trotzdem robust sein. hier spielt eine rolle, ob die zellen das gleiche n haben (was bei deiner abhängigen testung ja automatisch der fall wäre, es sei denn, es gibt noch unabhängige faktoren), ob die verteilung symmetrisch ist (auch wenn sie von der normalverteilung abweicht) und ob varianzhomogenität vorhanden ist.
nichts falsch macht man, wenn man eine non-parametrische alternative wählt. der friedman-test wäre angemessen, wenn es mehr als 2 gruppen gibt. du hast 2 stimulusvariationen, die 10x gemessen wurden. normalerweise bildet man den durchschnitt für jede stimulusvariation und vergleicht dann die beiden mittelwerte. es wäre aber möglich, dass von ermüdung etc. ausgegangen wird, so dass man den verlauf der beiden stimuli-reaktionen vergleichen möchte.
-
- Beiträge: 6
- Registriert: 14.10.2010, 20:14
danke!
noch eine doofe Frage:
Für eine ANOVA müssen die Daten unbahängig sein oder sonst macht man eine Varianzanalyse mit Messwiederholung?
ist ein normalverteilungstest bei kklienen stichproben überhaupt aussagekräftig?
In einemstatistikbuch wurden sie bei n<=12 als "not useful" beschrieben, weil zu wenig Daten vorhanden sind.
Kommt es darauf an, ob die daten in meinem sample normalverteilt sind, oder darauf ob sie es in der ganzen "population" sind?
Meinst du unter "Allgemeines lineares Modell"-> "Univariat"? Wenn ich das mache und dann nochmal den Test auf Normalverteilung mit den Residuen, kommt immer genau dasselbe raus wie vorher.du kannst das ganze nochmal testen, indem du die residuen auf normalverteilung prüfst. d.h. du würdest eine anova mit messwiederholungsfaktor (innersubjektfaktor) rechnen und bei "speichern" die unstandardisierten residuen wählen. die prüfst du dann auf normalverteilung.
noch eine doofe Frage:
Für eine ANOVA müssen die Daten unbahängig sein oder sonst macht man eine Varianzanalyse mit Messwiederholung?
könntest Du mir erklären, wieso das so ist? nimmt man im zweifel lieber nonparamettische verfahren?nichts falsch macht man, wenn man eine non-parametrische alternative wählt.
ist ein normalverteilungstest bei kklienen stichproben überhaupt aussagekräftig?
In einemstatistikbuch wurden sie bei n<=12 als "not useful" beschrieben, weil zu wenig Daten vorhanden sind.
Kommt es darauf an, ob die daten in meinem sample normalverteilt sind, oder darauf ob sie es in der ganzen "population" sind?
-
- Beiträge: 939
- Registriert: 13.05.2008, 10:52
nein, ich meine messwiederholung, da es sich anscheinend um messwiederholung handelt (?) d.h. eine katze hat 10 ms und 100 ms gesehen (?).Meinst du unter "Allgemeines lineares Modell"-> "Univariat"?
es gilt genauso für andere tests, dass bei sehr kleinen stichproben nichts mehr verlässliches herauskommt. bei einer varianzanalyse sollte es mindestens 10 pro zelle sein (daumenregel).n<=12
alles andere kann man leicht nachlesen.
-
- Beiträge: 6
- Registriert: 14.10.2010, 20:14
[
ja, aber bei messwiederholung gibt es bei mir kein speichernMeinst du unter "Allgemeines lineares Modell"-> "Univariat"?
nein, ich meine messwiederholung, da es sich anscheinend um messwiederholung handelt (?) d.h. eine katze hat 10 ms und 100 ms gesehen (?).
letzteresommt es darauf an, ob die daten in meinem sample normalverteilt sind, oder darauf ob sie es in der ganzen "population" sind?
jaFür eine ANOVA müssen die Daten unbahängig sein oder sonst macht man eine Varianzanalyse mit Messwiederholung?
weil sie keine Aussagen über Grundgesamtheitsparameter machtnichts falsch macht man, wenn man eine non-parametrische alternative wählt.
-
- Beiträge: 939
- Registriert: 13.05.2008, 10:52
das müsse es eigentlich geben, ich habe es selbst schon verwendet. aber spss kauft man modulweise und vielleicht fehlt das entscheidende modul.ja, aber bei messwiederholung gibt es bei mir kein speichern
wobei man die stichprobe als schätzung für die population betrachtet. hat man also bestimmte sachverhalte z.b. normalverteilung in der stichprobe festgestellt, geht man davon aus, dass der gleiche sachverhalt in der population vorliegt - mit einer gewissen irrtumswahrscheinlichkeit.Zitat:
ommt es darauf an, ob die daten in meinem sample normalverteilt sind, oder darauf ob sie es in der ganzen "population" sind?
letzteres
-
- Beiträge: 5
- Registriert: 28.10.2010, 00:33
Was dazu passt und mich schon lange beschäftigt (und sagt jetzt nicht, das könne man leicht nachlesen, weil genau das hab ich ja gemacht und immer andere Angaben gefunden):
Was sollte bei einer Varianzanalyse denn eigentlich normalverteilt sein?
Ich finde in LEHRBÜCHERN ganz unterschiedliche Aussagen (Bortz, Janssen & Laatz, Rudolf & Müller, Bühl & Zöfel, Stevens, diverse Uni-Skripte):
Es werden angeboten:
1. Normalverteilung der Residuen insgesamt (z.B. Stevens, diverse Webforen und Uni-Skripte)
2. Normalverteilung der Residuen innerhalb der Gruppen, die durch die Faktoren gebildet werden (z.B. Bortz: Hier werden unter Residuen auch nicht die Modell-Residuen, sondern die Abweichungen der Messerte vom Gruppenmittelwert)
3. Normalverteilung der Residuen innerhalb der Gruppen, die durch die festen Faktoren gebildet werden
4. Normalverteilung der aV unter den einzelnen Faktorstufen (z.B. Rudolf & Müller)
5. Normalverteilung der aV insgesamt (z.B. Bühl & Zöfel, Papousek, Rasch, Friese, Hofmann, Naumann etc.)
6. Normalverteilung der aV innerhalb der Gruppen
Was sollte bei einer Varianzanalyse denn eigentlich normalverteilt sein?
Ich finde in LEHRBÜCHERN ganz unterschiedliche Aussagen (Bortz, Janssen & Laatz, Rudolf & Müller, Bühl & Zöfel, Stevens, diverse Uni-Skripte):
Es werden angeboten:
1. Normalverteilung der Residuen insgesamt (z.B. Stevens, diverse Webforen und Uni-Skripte)
2. Normalverteilung der Residuen innerhalb der Gruppen, die durch die Faktoren gebildet werden (z.B. Bortz: Hier werden unter Residuen auch nicht die Modell-Residuen, sondern die Abweichungen der Messerte vom Gruppenmittelwert)
3. Normalverteilung der Residuen innerhalb der Gruppen, die durch die festen Faktoren gebildet werden
4. Normalverteilung der aV unter den einzelnen Faktorstufen (z.B. Rudolf & Müller)
5. Normalverteilung der aV insgesamt (z.B. Bühl & Zöfel, Papousek, Rasch, Friese, Hofmann, Naumann etc.)
6. Normalverteilung der aV innerhalb der Gruppen
-
- Beiträge: 939
- Registriert: 13.05.2008, 10:52
in lehrbüchern, aber auch artikeln findet man zu vielen tests oder testvorausetzungen verschiedene meinungen. mit hilfe der statistik trifft man aussagen über etwas, das man gar nicht erfasst hat. d.h. jeder zugang ist mehr oder minder "fantasie" in dem sinne, dass man sich verschiedene wege überlegen kann, um dieses etwas möglichst wirklichkeitsgetreu zu erfassen. jeder weg hat vor- und nachteile, deren darstellung dann sehr mathematisch werden kann.
in der regel wird man sich an vorgehensweisen halten, die zitierfähig sind.
wenn es sich um eine qualifikationsarbeit handelt, würde ich mit dem gutachter der arbeit sprechen und fragen, was seine bevorzugte vorgehensweise ist.
in der regel wird man sich an vorgehensweisen halten, die zitierfähig sind.
wenn es sich um eine qualifikationsarbeit handelt, würde ich mit dem gutachter der arbeit sprechen und fragen, was seine bevorzugte vorgehensweise ist.
-
- Beiträge: 939
- Registriert: 13.05.2008, 10:52
da es um wahrscheinlichkeitsrechnung geht, wird man höchstens eine wertung "besser" - "schlechter" hinbekommen.
übrigens ist normalverteilung von was auch immer, nicht unbedingt notwendig für eine anova, da diese unter bestimmten vorausetzungen robust ist gegen verletzung der normalverteilungsannahme.
übrigens ist normalverteilung von was auch immer, nicht unbedingt notwendig für eine anova, da diese unter bestimmten vorausetzungen robust ist gegen verletzung der normalverteilungsannahme.
-
- Beiträge: 5
- Registriert: 28.10.2010, 00:33
es gibt bestimmt bessere und schlechtere Wege die Normalverteilungsannahme zu überprüfen. Das ist keine Frage. Nur wüsste ich gerne, was bei einer Varianzanalyse normalverteilt sein soll. Jetzt beschäftige ich mich schon über 15 Jahre mit Statistik und finde nirgends eine gut hergeleitete Erklärung. Nur Widersprüche in der ganzen großen Literatur.
Das die Varianzanalyse angeblich robust sein soll gegen Annahmen der Normalverteilung, das ist mir bekannt. Sowohl Bortz als auch Stevens schreiben das ganz groß. Allerdings widersprechen sich ihre Vorstellungen von Normalverteilungen bei der ANOVA vollständig.
Das die Varianzanalyse angeblich robust sein soll gegen Annahmen der Normalverteilung, das ist mir bekannt. Sowohl Bortz als auch Stevens schreiben das ganz groß. Allerdings widersprechen sich ihre Vorstellungen von Normalverteilungen bei der ANOVA vollständig.
-
- Beiträge: 939
- Registriert: 13.05.2008, 10:52
das problem kenn ich in etwa. ich bin auch seit jahren auf der suche nach bestimmten antworten und finde sie nicht. leider bin ich kein mathematiker, musste aber feststellen, dass selbst promovierte mathematiker nicht unbedingt weiterhelfen können. es ist eben ein weites feld, auf dem es viele spezialgebiete gibt.
-
- Beiträge: 5
- Registriert: 28.10.2010, 00:33
obwohl das Buch von Sabine Fromm scharfer (und z.T. wohl berechtigter Kritik ausgesetzt ist), beschreibt sie ein Verfahren zur Testung der Normalitätsvoraussetzung bei der ANOVA, dass m.M. nach mit der theoretischen Beschreibung bei Bortz übereinstimmt. Das könnte natürlich damit zusammenhängen, dass beide an der TU Berlin waren.
Aber ich vertraue denen mal, weil mir diese Annahme am wahrscheinlichsten bezüglich der getesten F-Verteilungen ist.
Aber ich vertraue denen mal, weil mir diese Annahme am wahrscheinlichsten bezüglich der getesten F-Verteilungen ist.
-
- Beiträge: 6
- Registriert: 31.07.2014, 13:28
Re: Anova wenn nicht alle Gruppen normalverteilt sind. Mögli
Ich wärme mal auf:
Normalverteilung der Residuen über alle Gruppen oder jeweils innerhalb der Gruppen?, indem du die residuen auf normalverteilung prüfst. .... die prüfst du dann auf normalverteilung.