Hallo zusammen,
beschäftige mich seit einigen Tagen mit einer Kombination mehrerer (ca.60) Variablen, die alle jeweils die Interaktion/Abhängigkeit der Fälle (ca. 500) von bestimmten, geographischen Gebieten beschreiben.
Es sollen also alle die Variablen zusammen gefasst werden, die die Interaktion mit einem bestimmten Ort beschreiben. Darauf aufbauend sollen dann die Fälle hinsichtlich deren primärer Abhängigkeit zu einem Interaktionsgebiet zusammengefasst werden.
Nach meinen bisherigen Versuchen funktioniert das auch soweit ganz gut. Allerdings habe ich mehrere Möglichkeiten, von denen ich nun nicht weiß, welche statistisch korrekt ist. Vor allem hinsichtlich der Standardisierung der Daten ergeben sich Probleme und in den Ergebnissen auch bedeutende Unterschiede.
1. Hierarchische Clusteranalyse mit allen 60 Variablen. Z-Standardisierung nach Variablen oder Fällen. Beides ergibt zwar nicht genau identische, jedoch ähnlich gute Ergebnisse ?!
Die Resultate und Zusammenfassungen der Fälle kann ich jedoch nicht direkt interpretieren. Wo wie kann ich hier auf die dahinter stehenden Variablen schließen, anhand derer die Fälle nun jeweils zusammengefasst wurden?
2. Manuelle Z-Standardisierung (bzw. SPSS --> deskriptive Statisiken). Konfirmatorische Faktorenanalyse, Methode: Hauptkomponenten, Rotation: Varimax. Liefert ein erwartetes Ergebnis von 17 Faktoren.
Frage direkt hierzu: Faktorenanalyse standardisiert die Werte der Fälle doch sowieso schon? Ist es also erlaubt und sinnvoll vorher die Werte manuell zu standardisieren? Oder geschieht das dann zweimal und is somit ein methodischer Fehler?
Auf Faktorenladungen basierende hierarchische Cluster-Analyse wie oben. Liefert nahezu identische Ergebnisse wie Cluster-Analysen.
Vorteil: Kann die jeweiligen Cluster anhand der Faktorenladungen ganz gut interpretieren.
Problem jedoch generell: Wenn ich die Werte vor der Fakotrenanalyse nicht manuell standardisiere und ich auf den Faktorenladungen eine Cluster-Analyse ohne Standardisierung der Faktorenladungen (da diese ja nicht standardisiert werden müssen bzw . es schon sind - oder??) rechne, kommen teils unsinnige Ergebnisse raus. Wenn ich jedoch eine hierarchische Cluster-Analyse mit erneuter Z-Standardisierung der benutzten Faktorenladungen rechne, ergeben sich wieder sinnvolle Ergebnisse.
Generell stellt sich mir also die Frage nach der Verbindung zwischen Standardisierung der Daten und den Faktorenladungen, bzw. den sich dabei ergebenden, beschriebenen Problemen. Gibts da einfach ne methodische oder inhaltliche Erklärung, auf die ich trotz Lehrbücher etc hier nicht komme?
Oder vielleicht als Alternativ-Lösung: Wie kann ich die (guten) Ergebnisse der reinen Cluster-Analyse von ca. 60 (!) Variblen sinnvoll und effektiv interpretieren?
Würde mich über eure Hilfe wirklich sehr sehr freuen, da ich bei meiner Arbeit nur noch an diesem Punkt hänge!
Danke & Gruß
Faktoren- UND/ODER Clusteranalyse inkl. Z-Standardisierung
-
- Beiträge: 5
- Registriert: 08.03.2013, 11:52