Vergleich mehrerer Gruppen, 4x2 Felder Kontigenztafel

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
Llecter
Beiträge: 8
Registriert: 05.04.2008, 21:54

Vergleich mehrerer Gruppen, 4x2 Felder Kontigenztafel

Beitrag von Llecter »

Hallo zusammen,

ich möchte für meine Auswertung mehrere Datensätze miteinander vergleichen. Ich habe einen Versuch durchgeführt mit mehrern Prüfgruppen. Die abgefragte Variable war das Überleben der Versuchstiere, also eine Ja/Nein-Antwort.

Das Ganze sieht am Ende so aus, dass ich meine Daten in Form einer Kontingenztabelle vorliegen habe, was dann wie folgt aussieht:

Bild
Bild
(Leider scheint das Einbinden der Bilder nicht zu funktionieren. Durch den Slash am Ende bleibt der Link immerhin sichtbar und das Bild kann via Copy & Paste aufgerufen werden)

Mit diesen Daten kann ich problemlos einen Chi²-Test vornehmen, der mir aussagt dass ein signifikanter Unterschied vorliegt. Jetzt möchte ich aber wissen, zwischen welchen Gruppen genau gibt es wie große Unterschiede.

Sprich, ich möchte auch einen multiplen Vergleich:

Kontrolle vs Prügruppe 1
Kontrolle vs Prügruppe 2
Kontrolle vs Prügruppe 3
Prüfgruppe 1 vs Prüfgruppe 2
Prüfgruppe 1 vs Prüfgruppe 3
Prüfgruppe 2 vs Prüfgruppe 3

Meine Daten sind nicht normalverteilt, die Gruppen unabhängig. Nach allem, was ich mir bisher angelesen habe müsste ich in diesem Fall einen Kruskal-Wallis-Test oder einen Mann-Whitney durchführen.

Problem: Mein Statistikprogramm (Graphpad Prism 5) lässt mich nicht. Nach diesem Programm kann ich nur bei Datensätzen, wo lediglich die Reihe, aber nicht die Zeile, benannt ist diese Tests durchführen. So wie in diesem Beispiel mit den Gruppen A, B, C.

A B C
1 3 8
1 5 9
2 4 8
1 7 7
2 5 9
1 5 9

Grundsätzlich ist das Programm sehr gut durchdacht und schließt eigenständig nicht geeignete Tests aus oder weist auf sinnvollere Tests hin, was bisher auch immer einer Überprüfung stand hielt. Daher gehe ich davon aus, dass der Fehler bei mir liegt. Wenn ich den Mann-Whitney Test dennoch erzwinge, vergleicht er nur die Reihen (Emergiert vs Tot) miteinander und nimmt keine Rücksicht auf die Zeilen. Das ist dann natürlich ziemlich unsinnig.

Wie also kann ich das Problem lösen? Ich hab den Eindruck dass es eigentlich sehr simpel ist, und das ärgert mich dass ich dann nicht selbst drauf komme.

Ich hoffe ich habe das Problem halbwegs verständlich erläutert. Im Voraus bereits vielen Dank an jeden der sich mit meiner Problematik beschäftigt, selbst wenn es sich nur aufs Lesen beschränkt :)
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Du hast als abhängige Größe ein ja/nein Kriterium. Passenderweise hast Du einen Chi² gerechnet. Der Schwenk auf Verfahren für ordinalskalierte Daten (Kruskal-Wallis Test, U-Test) ist daher etwas überraschend, aber auf jeden Fall falsch. Wenn Du paarweise Vergleiche anstellen willst, dann wäre eine Möglichkeit, das mit 6 Chi-Quadrat Tests zu machen, üblicherweise würde dafür die Signifikanzschwelle Bonferroni-korrigiert (alpha dividiert durch 6).
Llecter
Beiträge: 8
Registriert: 05.04.2008, 21:54

Beitrag von Llecter »

Hey Generalist, vielen Dank für deine rasche und hilfreiche Antwort! Ich muss mich wirklich entschuldigen, dass ich deine Hilfsbereitschaft so ausnutze und dich mit weiteren Fragen bombardiere, wüsste aber im Moment nicht an wen ich mich sonst damit wenden kann und die Zeit rennt leider unerbittlich :x Also, wenn du mir zumindest bei einem Teil meiner Fragen etwas weiter helfen könntest wäre ich dir ausgesprochen dankbar!

Vorweg, ich habe mich unten vertan, tatsächlich habe ich 5 statt 4 verschiedene Gruppen, woraus sich dann 10 versch. Tests ergeben wenn ich jede Gruppe mit jeder vergleiche (s. unten). Daher muss ich mein Alpha dann durch 10 und nicht durch 6 divideren vermute ich, oder?

Ich habe bei vorherigen Auswertungen, wenn ich jeweils nur eine Gruppe mit der Kontrolle verglichen habe, den Fisher's exact test verwendet, aufgrund der eher geringen Stichprobengröße. (Aus mir nicht bekannten Gründen funktioniert der aber nur beim Vergleich von zwei Stichproben, weshalb ich in dem oben geschilderten beispiel beim Vergleich mehrerer Gruppen auf den chi² ausgewichen bin)

Ich denke mal, dass ich dann für den multiplen Vergleich hier auch wieder den Fisher's exact test nehmen kann, da ich ja dann jeweils auch nur 2 Gruppen in jedem Durchgang miteinander vergleiche, oder?

Wie verhält sich das mit der Bonferroni-Korrektion? Wird der Alpha für jeden Vergleich durch 10 geteilt oder steigt der Divisor mit der Anzahl der Tests? Sprich beim ersten Vergleich ist mein Alpha noch 0.05, beim zweiten dann 0.05/2, beim dritten 0.05/3 etc. (Habe mal ein Statistikprogramm gemacht wo das so gemacht wurde, wenn ich mich da recht erinnere. ToxRatPro, worauf ich leider keinen Zugriff mehr habe) Oder ist Alpha für alle Vergleiche schon 0.05/10?

Und ein weiteres Problem bei der Sache: Ich habe bereits einen Fisher's exakt Test gemacht für eine andere Fragestellung mit diesem Datensatz.

Für diese Fragestellung hat mich nur der Vergleich von Kontrolle und Prüfgruppe 1 interessiert. Alle übrigen Prüfgruppen waren für diese Fragestellung irrelevant und wurden daher auch nicht mit in die Auswertung einbezogen. Daher habe ich dort auch keine Bonferroni-Korrektur gemacht. Mein P-Wert für diesen Vergleich ist 0,78, dh auch mit der Bonferroni-Korrektur ändert sich da nichts daran, dass keine Signifikanz vorliegt.

Aber was wäre, wenn ich dort einen P-Wert von 0.03 habe? Ohne Bonferroni-Korrektur muss ich also in der ersten Auswertung von einer stat. Signifikanz ausgehen und jetzt in der multiplen Auswertung muss ich angeben, dass diese Gruppen sich nicht signfikant unterscheiden?

Ich habe jetzt alle Einzeltests durchgerechnet, die entsprechenden p-Werte unten angegeben.

1) Kontrolle vs Prügruppe 1 p=0,78
2) Kontrolle vs Prügruppe 2 p=0,12
3) Kontrolle vs Prügruppe 3 p<0.0001
4) Kontrolle vs Prügruppe 4 p<0.0001
5) Prüfgruppe 1 vs Prüfgruppe 2 p=0,28
6) Prüfgruppe 1 vs Prüfgruppe 3 p<0.0001
7) Prüfgruppe 1 vs Prüfgruppe 4 p<0.0001
8) Prüfgruppe 2 vs Prüfgruppe 3 p<0.0001
9) Prüfgruppe 2 vs Prüfgruppe 4 p<0.0001
10) Prüfgruppe 3 vs Prüfgruppe 4 p=0,86

Es zeigt sich also, dass die Bonferroni-Korrektur in diesem Falle nichts daran ändert ob und wo eine Signifikanz vorliegt (egal ob mein Alpha 0.05 oder 0.05/10=0.005 ist). Doch wie gebe ich dieses Ergebnis in der Diplomarbeit wieder? Bei vorherigen Ergebnissen ohne multiple Vergleiche habe ich simple Säulendiagramme gezeigt, dazu den p-Wert, ggf. mit Strechnen die Signifikanz über der Säule markiert und den verwendeten Test angegebn. Das geht ja nun nicht mehr, da durch den multiplen Vergleich in der graphischen Darstellung im Fall von Säulendiagrammen nicht mehr klar wäre auf welchen Vergleich zu welchen Gruppen sich die Signfikanz bezieht? Oder wäre es empfehlenswert Die Säulen mit Buchstaben zu kennzeichnen, wie man es gelegentlich sieht? Alle Säulen wi ein A drüber ist sind nicht (statistisch signfikant) verschiedenen zu allen anderen wo ebenfalls ein A drüber ist usw.?

Einfach in Tabellenform angeben, ähnlich wie oben dargstellt, noch zusätzlich mit genauer Angabe des durch die Bonferroni-Korrektur geänderten Alpha-wertes?
Llecter
Beiträge: 8
Registriert: 05.04.2008, 21:54

Beitrag von Llecter »

Wie gehe ich eigentlich vor, wenn ich von all diesen Tests lediglich 4 oder 5 als reevant erachte und die übrigen gar nicht brauche?

1) Kontrolle vs Prüfgruppe 1 p=0,78
2) Kontrolle vs Prüfgruppe 2 p=0,12
3) Kontrolle vs Prüfgruppe 3 p<0.0001
4) Kontrolle vs Prüfgruppe 4 p<0.0001
5) Prüfgruppe 1 vs Prüfgruppe 2 p=0,28
6) Prüfgruppe 1 vs Prüfgruppe 3 p<0.0001
7) Prüfgruppe 1 vs Prüfgruppe 4 p<0.0001

Cool Prüfgruppe 2 vs Prüfgruppe 3 p<0.0001
9) Prüfgruppe 2 vs Prüfgruppe 4 p<0.0001
10) Prüfgruppe 3 vs Prüfgruppe 4 p=0,86

Eiegntlich interessieren mich nur diese vier Tests. Lasse ich die anderen dann komplett weg und teile mein Alpha lediglich durch 4? ODer muss ich dennoch durch 10 teilen, da ich theoretisch soviele multiple Vergleiche machen könnte?
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Bei deiner Beschreibung ist ja einiges durcheinander geraten.
Mit diesen Daten kann ich problemlos einen Chi²-Test vornehmen, der mir aussagt dass ein signifikanter Unterschied vorliegt.
Der Chi-Quadrat Test testet nicht auf „Unterschied“ sondern auf Unabhängigkeit.

Mann-Whitney testet wiederum auf zentrale Tendenz.

Dann berechnest du viele Einzelvergleiche, wohl paarweise Vergleiche. Aber mit welcher Fragestellung? Und mit welchen Daten?


Vielleicht solltest du dir erst einmal Klarheit über die Fragestellung verschaffen und dich dann intensiv mit den Verfahren beschäftigen: Was testet der Chi-Quadrat Test, was testen die anderen erwähnten Tests. Möchtest du Einzelvergleiche bzgl. zentraler Tendenz, wären a posteriori Einzelvergleichstests sinnvoll (Scheffé-Test, Duncan). Die kontrollieren das Gesamt Alpha.

Angesichts der Vielzahl der Ideen, Probleme und Lösungsvorschläge in deinem Text würde ich an deiner Stelle erst einmal eine Runde im Park spazieren gehen. Joggen geht auch. ;-) Kaffee unbedingt meiden.

So, und dann in aller Ruhe den Bortz in die Hand nehmen [1]. Ganz in Ruhe die Frage stellen, ob eine ‚zentrale Tendenz’ gemessen werden soll, oder auf Unabhängigkeit getestet wird. Und nicht so sehr an die Optik denken und wo irgendwelche Sternchen hingehören.

Gruß

[1]

http://www.amazon.de/Kurzgefasste-Stati ... 909&sr=8-4
drfg2008
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten