Clusteranalyse Interpretation

Beitrag von **franz** » 14.02.2006, 20:08

Hallo allerseits,

ich melde mich nochmal, weil ich in meiner Analyse - nachdem ich sowohl Faktoren- als auch Clusteranalyse durch Eure Hilfe soweit gemeistert habe - auf ein weiteres Problem gestoßen bin.

Bei der Interpretation der erhaltenen Cluster bekommen ich bei den "Clusterzentren der endgültigen Lösung" für die inzelnen Faktoren teilweise positive und teilweise negative Werte heraus. Meine Frage: Wie sind positive respektive negative Werte bei einer Clusterzentrenanalyse zu interpretieren?

Viele Grüße,
Franz

Beitrag von **guido** » 15.02.2006, 09:43

In den Reihen stehen die Cluster, die ja schon die einzelnen Fälle zu Gruppen zusammengefasst beinhalten. In den Zeilen sind die einzelnen Variablen/Merkmale aufgeführt. Die Werte bezeichnen die Mittelwerte der jeweilgen Variablen für die einzelnen Cluster. Du kannst also sehen wie sich diese Mittelwerte für jedes Cluster unterscheiden.

Diese Werte sollten sich eigentlich an der ursprünglichen Skalierung orientieren. Hast Du da Werte von 1 bis 5, sollten auch nur solche Werte hier auftauchen. Evtl. wurden die Werte vorher durch SPSS standardisiert, daher die negativen Werte. Dies ist bei einheitlichem Skalenniveau meines Wissens nicht notwendig. Vielleicht solltest Du nochmal die einzelnen Schritte der Analyse durchgehen und schauen, wo evtl. eine solche Standardisierung durch SPSS vorgenommen wird und diese ausschalten.

Beitrag von **franz** » 16.02.2006, 22:39

Ich habe die Clusteranalyse mit den in der Faktorenanalyse ermittelten Faktoren als Variablen durchgeführt. Darum denke ich, dass die ursprüngliche 1-bis-5-Kodierung nicht mehr greift und irgendwie negative Werte zustande kommen...

Beitrag von **guido** » 17.02.2006, 00:12

Ah, Ok

Ich gehe mal davon aus, dass Du Faktorenwerte für die dort identifizierten Faktoren hast berechnen lassen. Nur so kannst Du ja sinnvoll weiterarbeiten.

Faktorenwerte werden als so genannte z-Werte ausgegeben und liegen normalerweise im Bereich von etwa -3 bis 3. Ein hoher positiver Faktorenwert drückt dann eine hohe Zustimmung der jeweilgen Person (bei einer Skala von (1=Ablehung bis 5=völlige Zustimmung) zu den im Faktor enthaltenen Variablen aus. Ein negativer Wert drückt demzufolge Ablehung aus. 0=Neutral. Die Werte sind jetzt eben standardisiert und nicht mehr absolut im Sinne der ursrünglichen Skalierung zu sehen (Von daher war meine Vermutung gar nicht so falsch).

Die Werte in der Clusteranalyse müssten demzufolge nun analog die Mittelwerte eben dieser Faktorenwerte darstellen und sind genauso zu interpretieren. Wenn Du es ganz genau wissen willst, wäre es wohl am besten, die genaue mathematische Bedeung einer solchen Transformation in z-Werte nachzuschlagen.

Beitrag von **PearsonsR** » 20.02.2006, 17:44

Also ich hätte da auch noch eine kleine Anmerkung am Rande bzgl. der Verwendung der Ergebnisse von Faktorenanalysen für weitere Berechnungen.

Meines Wissens ist es unüblich, die gespeicherten Faktoren (also: die Faktorwerte) selbst als Variable zu verwenden (allerdings kann ich ad hoc keine methodische Begründung dafür geben). Sinnvoller (auch aus Gründen der Interpretation) ist m.E. die Bildung von Summen- bzw. Mittelwertindizes.

Summenindizes sind ganz einfach zu erstellen, indem die einzelnen zu einem Faktor gehörenden Items schlichtweg zusammenaddiert werden. Einen Mittelwertindex (der letzlich das Gleiche ist, nur eben mit dem gleichen Skalenbereich wie die Ausgangsvariablen) erhält man leicht mit dem 'mean'-Befehl, z.B. compute INDEXNAME = mean (VAR1, VAR2, ..., VARn). Sollten einige Fälle missings aufweisen, empfiehlt es sich, den mean-Befehl hinsichtlich der Mindestzahl der zu berücksichtigenden Items zu spezifizieren (z.B. mean.8 ...; das heißt dann, dass wenn du bspw. 10 Items für die Indexbildung vorgesehen hast, für mindestens 8 Items werte vorliegen müssen. Fehlen dann bei einem oder mehreren Fällen 1 oder 2 Werte, so werden diese Fälle trotzdem berücksichtigt und du reduzierst deinen Datenverlust).

LG,
PearsonsR

Beitrag von **col_s** » 02.03.2006, 16:48

Hallo PearsonsR,

zu Deiner Anmerkung zu den Faktorwerten:

Ich sitze auch gerade an Faktoren- und Clusteranalyse und lese dazu alles mögliche. Bortz (Statistik für Sozialwissenschaftler, 5. Aufl., S. 551), empfiehlt für die Clusteranalyse, möglichst unabhängige Merkmale eingehen zu lassen, z.B. indem man eine PCA mit varimax-Rotation durchführt und die Faktorwerte speichert, um sie für die Clusteranalyse zu verwenden... Das einzige Argument, das dagegen spräche, wäre, dass es eine theoretische Begründung gibt, warum die Merkmale korrelieren sollen.

Liebe Grüße, Nicole