Ich habe Chi²-Tests gerechnet, um zu schauen, ob Halbtags- und Ganztagsschüler sich im Konsum verschiedener PC-Spiele unterscheiden, z.B. bei FIFA 10.
Welchen Wert muss ich interpretieren:
1. Asymptotische Signifikanz (2-seitig) von Chi-Quadrat nach Pearson,
2. Exakte Signifikanz (2-seitig) von Exakter Test nach Fisher oder
3. Exakte Signifikanz (1-seitig) von Exakter Test nach Fisher?
Fisher oder Chi²
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
na, wenn dir SPSS schon den exakten Test anzeigt, wäre dieser der genauere von beiden. Chi-Quadrat ist, wie der Name bereits sagt, ein asymptotischer Test, also bei großen Fallzahlen geeignet.
Und du solltest selbst wissen, ob du eine einseitige oder zweiseitige Fragestellung wünschst. Vermutlich gehst du davon aus, dass die eine Gruppe mehr FIFA 10 spielt (einseitig). Und nicht einfach nur dass die Gruppen sich in irgendeine Richtung (zweiseitig) unterscheiden können.
Und du solltest selbst wissen, ob du eine einseitige oder zweiseitige Fragestellung wünschst. Vermutlich gehst du davon aus, dass die eine Gruppe mehr FIFA 10 spielt (einseitig). Und nicht einfach nur dass die Gruppen sich in irgendeine Richtung (zweiseitig) unterscheiden können.
drfg2008
-
- Beiträge: 1733
- Registriert: 11.03.2010, 22:28
Obacht, inhaltliche Hypothesen und statistische Nullhypothesen sind nicht komplementär. Eine einseitige inhaltliche Fragestellung rechtfertigt keineswegs ausreichend eine einseitige statistische Hypothese. Deswegen werden einseitige Hypothesentests in aller Regel auch nicht akzeptiert. Eine kurze Übersicht gibt die verdienstvolle Seite http://www.uni-graz.at/ilona.papousek/t ... s/faq.html, dort die FAQ Nummer 3.
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
Wenn Francescos These wäre, dass
wäre das eine zweiseitige Fragestellung. Wenn allerdings die Frage anders formuliert wird, also z.B. dassHalbtags- und Ganztagsschüler sich im Konsum verschiedener PC-Spiele unterscheiden
, dass Halbtagsschüler mehr Zeit zum Daddeln haben und als Folge ihre Lebenszeit stärker mit FIFA vertrödeln, dann wäre eine einseitige Hypothese sinnvoll. Einseitige Tests kommen schneller zu sig. Ergebnissen, daher besteht immer der Verdacht, einer pragmatischen Motivlage für Einseitigkeit der Hypothese, insbesondere dann, wenn der p-Wert bei 2-seitiger Testung über der konventionellen Grenze liegen würde, die zur Abhlehnung der H0 auf Unabhängigkeit führt.Halbtags- und Ganztagsschüler sich im Konsum verschiedener PC-Spiele (dahingehend) unterscheiden
drfg2008
-
- Beiträge: 1733
- Registriert: 11.03.2010, 22:28
Leider kann ich nicht ganz verstehen, ob es sich beim letzten Beitrag um eine Gegenposition handelt, oder eine Bestätigung, oder um ein ganz anderes Thema. Meines Erachtens ist es zur Vorbeugung von Missverständnissen hilfreich, zumidest präzise anzugeben, ob es sich bei der Verwnedung des Begriffs Hypothese um eine mathematische statistische (Punkt-) Hypothese oder um eine substanzielle/inhaltliche Hypothese handelt. Ungeachtet dessen, die Papousek-Argumente sind meines Erchtens ausreichend zur Klärung des Sachverhalts. Von meiner Seite daher EOD.
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
Das ist ja eine sehr theoretische Position von Papousek, da ein einseitiger Test sogar eher zum Verwerfen der H0 führt. Das müsste im geschilderten Fall dann der Testleiter bewusst ignorieren, weil es nicht die richtige Richtung ist. Das tut dieser vielleicht, wenn sein Promillewert bei p>5% liegt, aber doch sonst nicht. Viel problematischer ist, dass stat. nicht sig. Unterschiede dahingehend fehlinterpretiert werden, dass z.B. bei Medikamenten (um bei Papouseks Thema zu bleiben), beide Medikamente gleich wirksam erscheinen. Ein nicht sig. Ergebnis kann jedoch auch auf zu geringe Fallzahlen bei gegebener (kleiner) Effektgröße zurückzuführen sein. Wenn dann auch noch nach Ablauf eines Zeitraums wieder ein neues Medikament auf gleiche Weise „auf Gleichheit“ getestet wird, dann ergibt sich unbemerkt eine Abwärtsspirale. Aus der Mafo ist mir das aus eigener Erfahrung bekannt (Produkttests). Da wird systematisch „auf Gleichheit“ getestet.In der Regel ist es jedoch auch von Interesse / von Bedeutung, ob eine bestimmte Bedingung (Therapie etc.) das Gegenteil dessen bewirkt, was man erwartet (z.B. eine Verschlechterung der Symptomatik). In diesen Fällen muß zweiseitig getestet werden !
Auch in FAQ4 des zitierten Beitrags sind die Thesen von Papousek nicht unbedingt korrekt.
Leider ist dem nicht so. Es gibt sogar Verteilungen, die gar nicht gegen die N~Vtlg. gehen können (Cauchy), weil sie weder Erwartungswert noch Varianz oder Standardabweichung besitzen, da die entsprechenden Integrale nicht definiert sind. Dementsprechend besitzt die Cauchy-Verteilung, als Beispiel, auch keine Momente oder momenterzeugende Funktion. Wenn dem so wäre, bräuchte es auch keine Maße für Effizienzverluste (bspw. ARE) und es bedürfte letztlich auch keine sog. „robusten“ Tests. Und die Entwicklung von nichtparametrischen (Rang-) Statistiken wäre eine Freizeitbeschäftigung von akademischen N~Allergikern gewesen. Und seine Einschätzung zur Robustheit der F-Verteilung bei kleinen Stichproben ist schon sehr fragwürdig. Hier würde ich, bei allem Respekt vor der von ihm zitierten Monte-Carlo-Studie, lieber auf die ARE-Berechnungen aus der Mathematik vertrauen [1]. Und dazu am besten Büning [2] lesen, S. 156 ff. Hier ein Auszug (Ausrufungszeichen im Original): „Offensichtlich ist der klassische F-Test ausgesprochen sensitiv bei Abweichung von der Normalverteilung (...) Das alpha Robustheitsmaß r1(alpha, alpha*)=|alpha-alpha*|/alpha nimmt Werte bis zu 3.45 (!!) an für alpha=0.05 und bis zu 2.02 auf alpha =0.1 (...).“Bei größeren Stichproben ist eine Normalverteilung durch die Wirkung des Zentralen Grenzwerttheorems auf alle Fälle gewährleistet (völlig egal wie die Verteilung der Rohwerte ist !).
usw. usw.
[1]
http://www.amazon.de/Nichtparametrische ... 75&sr=1-11
[2] Büning, H.: Robuste und adapt. Tests DeGruyter 1991
drfg2008