mittlere Korrelation, Fisher Z-Trafo

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
Carlson
Beiträge: 4
Registriert: 02.05.2006, 22:07

mittlere Korrelation, Fisher Z-Trafo

Beitrag von Carlson »

Hi, ich habe folgendes statistisches Problem:
Ich präsentiere Vpn Paare von Objekten, die sich nur innerhalb der Paare um ein Merkmal unterscheiden, während sich die Paare um weitere Merkmale unterscheiden.
Beispiel: ein Automodell wird einmal statisch und einmal bwegt (rotiert) am Bildschirm dargestellt und es wird gemessen wie schnell es als eines von drei Marken erkannt wird. Es gibt drei Gruppen von Bewegungsarten, wobei sich das bewegte Modell entweder mit langsamer, mittlerer oder schneller Geschwindigkeit dreht (jeweils neun Itempaare pro Gruppe).
Die Untersuchungsfrage ist, ob sich die Korrelationen innerhalb der drei Gruppen unterscheiden.
Nun das statistische (Verständnis-)Problem: Man könnte (1.) für jedes der 9 Paare in einer Gruppe die Korrelation über die Vpn berechnen, diese Korrelationen dann mit Fisher Z transformieren, mitteln und zurücktransformieren womit man die mittlere Korrelation für die Gruppe gefunden hätte.
Alternativ könnte man (2.) auch die Korrelation über alle Paare von Reaktionszeiten innerhalb der Gruppe berechnen und erhielte dann einen gemeinsamen Korrelationskoeffizienten. Es kommt dabei nicht das gleiche raus! Welche Version ist nun richtig und warum? Wie lassen sich die Korrelationskoeffizienten der beiden Methoden interpretieren?
Mir scheint die erste Methode richtiger zu sein, aber bei der zweiten erhalte ich ein hypothesenkonformes Ergebnis :-(
Vielleicht sind die unterschiedlichen Ergebnisse auf eine Art Selektionsfehler zurückzuführen und die beiden Methoden eigentlich äquivalent?
Vielen Dank für eine Antwort!!
Grüße Carlson
guido
Moderator
Beiträge: 304
Registriert: 17.01.2006, 19:20

Beitrag von guido »

Hi Carlson,

Ich habe gleube ich noch nicht so ganz verstanden, was bei Dir jetzt eine "Gruppe" ist, was ein "Paar" und wie genau der Versuchsablauf aussieht. Welche Variablen korrelieren miteinander? Am besten Du postest mal die Ergebnisse für 3 Personen in Tabellenform (also was sind genau Deine Variablen, welche Ausprägungen haben diese etc., ) oder beschreibst genau den Versuchsablauf.

Ist leider ein generelles Problem hier im Forum und wir hatten öfters das Problem, dass wir teilweise tagelang aneinder vorbeigeredet haben weil wir unterschiedliche Vorstellungen der Begriffe hatten. Liegt also nicht unbedingt an Dir :wink:
Carlson
Beiträge: 4
Registriert: 02.05.2006, 22:07

Beitrag von Carlson »

Hi guido,
Danke für deine Rückmeldung! Dann versuche ich das mal genauer darzustellen. Das Autoexperiment ist nur ein vereinfachtes Beispiel für meine Untersuchung, die zu erklären wahrscheinlich aufwendig und für meine Frage wohl nicht relevant ist. Ich habe eine Gruppe von Versuchspersonen, die zunächst mal nicht in Untergruppen aufgeteilt worden ist (kein between Faktor). Dann gibt es Aufgabenpaare mit einem statischen und einem dynamischen Teil. Die beiden Items eines Aufgabenpaares unterscheiden sich im Faktor Geschwindigkeit des dynamischen Teils, so dass man drei Faktorstufen unterscheiden kann: langsame, mittlere und schnelle Rotation des Automodells. Für jede Faktorstufe kann man eine Korrelation zwischen den Reaktionszeiten im statischen und dynamischen Fall berechnen. Mich interessiert, ob und wie sich diese Korrelationen in den Faktorstufen unterscheiden.

[Tabelle einfügen]

Jede Versuchsperson bearbeitet zunächst die statischen Reaktionszeitaufgaben (3 * 9 Items) und anschließend die entsprechenden dynamischen Aufgaben, so dass hier insgesamt ein Messwiederholungsdesign mit zwei Faktoren vorliegt (Stufen des ersten Faktors: statisch vs. dynamisch; Stufen des zweiten Faktors: langsam, mittlere und schnelle Geschwindigkeit). Wie gesagt interessiert mich, ob sich die Korrelation der Itempaare in den Stufen des zweiten Faktors unterscheiden.

Mein Verständnisproblem liegt darin, dass ich nicht weiß ob man zur Berechnung der drei „mittleren“ Korrelationen in den Stufen jedes Itempaar einzeln korrelieren muss und dann mit Fisher-Z einen Mittelwert berechnet oder ob man alle Itempaare einer Stufe in einem Topf (in ein Scatterdiagramm) werfen darf und die Korrelation über alle Messpunktpaare rechnet.
Wenn man sich das Scatterdiagramm der einzelnen Itempaare als kleine Ellipsen im Scatterdiagramm vorstellt, könnte es ja durch die Zusammenfassung dieser Punktwolken zu einer Gesamtkorrelation kommen, die nichts mehr mit der Korrelation der einzelnen Itempaare zu tun hat. Vielleicht ist das der Grund für die unterschiedlichen Ergebnisse?
Ich könnte hier auch echte Daten einstellen, aber dann müsste ich das aufwendigere Untersuchungsdesign mit weiteren Faktorstufen beschreiben. Ich hoffe dieses Beispiel ist dazu geeignet, mein Verständnisproblem mit der mittleren Korrelation deutlich zu machen.
Gruß Carlson

PS: Kann man hier eine Wordtabelle oder ein Bild anhängen?[/img]
guido
Moderator
Beiträge: 304
Registriert: 17.01.2006, 19:20

Beitrag von guido »

Hallo,

Nein, das mit der Wordtabelle geht leider nicht.

Was mich irritiert, ist wie Du das Wort Korrelation verwendest. Du kannst ja eine Korrelation immer nur nur zwischen zwei Variablen angeben:
Also:

Code: Alles auswählen

           V1=Reaktionszeit V2=Rotation Modell A
Vpns                         
1            10ms           | langsam
2            12ms           | langsam
3            8ms             | mittel
4
5
6
usw..
Korrelation (V1/V2)= 0,8
Welche Korrelationen (zwischen welchen Variablen) hast Du vorliegen und welche möchtest Du vergleichen.

Das "Mitteln" mehrer Korrelationen (auch transformierter) macht nach meinem Verständnis eigentlich nur selten Sinn (hier kann ich mich aber auch täuschen), da ja dann der Zusammenhang zwischen zwei Variablen (nicht anderes ist ja eine Korrelation) nicht mehr abgebildet wird und ich nicht wüsste wie man so ein Ergebnis interpretieren sollte.
Eigentlich müsste man zuerst die Rohdaten sinnvoll mitteln und daraus dann eine Korrelation berechnen. Geht das in die Richtung, die Du meinst?
Carlson
Beiträge: 4
Registriert: 02.05.2006, 22:07

Beitrag von Carlson »

Hm, also nehmen wir mal ein Item aus der ersten Stufe des zweiten Faktors (in der sich das Objekt im dynamsichen Fall langsam bewegt). Dann habe ich für diese Item von den sagen wir mal 40 Vpn jeweils eine Reaktionszeit für den statischen und für den dynamischen Fall. Wenn ich die Messwerte korreliere, weiß ich wie groß der Zusammenhang zwischen der statischen und dynamischen Reaktionszeit bei diesem Item ist. Das gleiche mache ich dann auch bei den restlichen 8 Items dieser Stufe und erhalte damit für die neun Items 9 Korrelationskoeffizienten. Das Ganze mache ich nun auch für die 9 Items der Stufen in denen sich das das dynamische Item mit mittlerer bzw. hoher Geschwindigkeit bewegt.
Nun habe ich 27 Korrelationskoeffizienten und möchte eigentlich vergleichen ob die Korrelationen bei den Items in Stufe „langsam“ von denen in den anderen Stufen unterscheiden. Dazu wäre es nun sinnvoll für jede Stufe eine mittlere Korrelation zu errechnen, was dann für die drei Stufen zu drei Korrelationskoeffizient führt. Die Frage ist, nun, wie muss dieser „mittlere Korrelationskoeffizient“ berechnet werden. Soll man die 9 Korrelatioskoeffizienten mit Fischer-Z-Transformation mitteln oder kann man auch aus allen Reaktionszeitpärchen einen Korrelationskoeffizienten bilden? Dazu würde ich die Reaktionszeiten für den statischen und dynamischen Fall aller 9 Items der ersten Stufe korrelieren und daraus einen einzigen Korrelationskoeffizienten errechnen und bräuchte dann nicht auf die Fisher-Z-Trafo zurückgreifen.
Mir ist der Unterschied in der Interpretation zwischen diesen beiden Methoden aber nicht klar. Wenn ich mir das Scatterdiagramm mit den Achsen Reaktionszeit statisch – Reaktionszeit dynamisch vorstelle, dann trage ich im ersten Fall für ein Item die Reaktionszeitpaare der einzelnen Versuchspersonen in ein separates Diagramm ein (macht dann 9 Diagramme) und berechne die Korrelationen. Im zweiten Fall trage ich alle Reaktionszeitpaare der 9 Items in ein einziges Diagramm ein und berechne einen Korrelationskoeffizienten.

Hier noch mal eine Tabelle (leider weiß ich nicht wie man die besser Formatiert)

Code: Alles auswählen

						Faktor1
VP     Item  Faktor2	RZstatisch		RZdynamisch
1	1	langsam	 400ms				600ms
2	1	langsam	  …				…
3	1	…	      …				…
4	1	 …	      …				…
…	…	…	     …				…
40	1	langsam	  …				…
1	2	langsam	    …				…
…	…	…	      ...				…
40	2	langsam	    …				…
1	3	langsam	     .				.
.	.	.		   .				.
.	.	.		   .				.
40	9	langsam	    …				…
1	10	mittel		…				…
2	10	mittel		…				…

usw. bis:

40     27      schnell        ....                        ....
guido
Moderator
Beiträge: 304
Registriert: 17.01.2006, 19:20

Beitrag von guido »

Puh, ganz schön kompliziert das ganze... :?

Ich habe jetzt schon in etwa verstanden um was es Dir geht, kann Deine Frage aber leider nicht direkt beantworten, da mir der Unterschied zwischen beiden Varianten der Korrelation immer noch nicht ganz klar ist. Um den Unterschied bei der Ermittlung der "durchschnittlichen" Korrelation interpretieren zu können, müsste man schon ganz genau verstehen, was da eigentlich zusammenhängt.

Was mir aber auffällt: Bist Du dir sicher, dass Korreleationen in diesem Fall überhaupt der richtige Weg sind, ein sinnvolles Ergebnis zu erzielen?

Du korrelierst ja die "statische" Reaktionszeit der Probanden mit der "dynamischen" Reaktionszeit. Wenn da jetzt aber ein Zusammenhang besteht (z.B. für die Stufe "langsam"), heisst das ja nur das Leute, die lange brauchen, das statische Modell zu erkennen auch lange brauchen, dass langsame dynamische Modell zu erkennen (und umgekehrt).

Wenn Du diese Korrelation jetzt mit anderen vergleichen willst (z.b. mit der korrelation "statisch" <-> "mittel") sagt Dir dieser Vergleich nach meinem Verständnis nicht viel über die Unterschiede dieser Stufen aus bzw. ist es viel komplizierter, sich diesen Zusammenhang dann vorzustellen und zu interpretieren (was ja auch mit Deinem Problem zu tun hat).

Letzendlich willst Du aber ja Unterschiede erkennen, in denen sich die Reaktionszeiten der Stufe "langsam", von denen der anderen Stufen unterscheidet. Da würde sich meiner Ansicht nach eher ein Mittelwert-Vergleich und ein entsprechender Signifikanztest anbieten, wobei der Versuchsaufbau dem mehrerer abhängiger Stichproben entspricht.

Mal sehen, evtl. melden sich ja noch ein paar Leute hier zu Wort.
Carlson
Beiträge: 4
Registriert: 02.05.2006, 22:07

Beitrag von Carlson »

Ja mir kommt das auch alles recht verworren vor, aber unsere Diskussion hat glaube ich schon zu einer kleinen Erhellung geführt.
Ich bin mir inzwischen relativ sicher, dass man, wenn man an der Korrelation zweier Eigenschaften mehrerer Objekte interessiert ist, nicht Einschätzungen mehrerer (auch ähnlicher Objekte) in ein Scatterdiagramm zusammenfassen und dann korrelieren darf, weil diese Korrelation nichts mit den einzelnen Korrelationen zu tun haben muss. Man stelle sich vor, die Versuchspersonen schätzten beide Eigenschaften bei einem Objekt gering ein (die Messwerte lägen also in der unteren linken Ecke des ersten Quadranten und hätten eine negative Korrelation), bei einem anderen Objekt schätzen die Versuchspersonen beide Eigenschaften hoch ein und wieder korrelieren beide negativ (die Messerte lägen aber oben rechts im gleichen Quadranten). Wenn man die Messwerte dieser beiden Objekte in einem Scatterdiagramm zusammenfasst, sieht man zwei Cluster. Berechnet man darüber eine Gesamtkorrelation, findet man einen positiv (!) Korrelationskoeffizienten. Was nur damit zu tun hat, dass die Eigenschaften absolut gesehen für beide Objekte unterschiedlich eingeschätzt wurden. Das interessierte aber gar nicht. Deshalb muss man wohl tatsächlich die Einzelkorrelationen berechnen und dann mit Fisher Z mitteln. (Kannst du das nachvollziehen und hältst das für richtig?)
Deinen Vorschlag mit den Mittelwertvergleichen (VA mit MW) werde ich mal mit den Korrelationen vergleichen. (Kann es sein, dass Mittelwertvergleiche (t-Test) und Korrelation was die Signifikanz angeht äquivalent sind? Hab ich mal irgendwo gelesen.
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten