Hallo zusammen!
Ich habe folgendes Problem: ich möchte eine Clusteranalyse durchführen um die Kundensegmente zu identifizieren.
Dazu habe ich soziodemografische Variablen genommen, die zum Teil nominal skaliert sind. Die nominal skalierte Variablen habe ich mittels einer so genannten Dummy-Codierung in k-1 Dummy-Variablen transformiert. Dann habe ich die Dummy-Variablen mit 1/(k-1) gewichtet. Wenn man in der Clusteranalyse Variablen verwendet, die in unterschiedlichen Dimensionen gemessen werden, wird es empfohlen, die Werte zu standardisieren. Also, habe ich dies auch gemacht.
Da mein Datensatz über 2.000 Fälle hat, kann ich Hierarchische Clusteranalyse nur mit der Stichprobe durchführen.
Dann habe ich die Clusterzentrenanalyse mit verschiedener Clusteranzahl durchgeführt.
Meine Fragen sind:
1. Wie kann ich die optimale Clusteranzahl bestimmen? Ist die Hierarchische Clusteranalyse mit der Stichprobe dafür geeignet? Wenn nicht, woran erkenne ich welche Anzahl der Cluster optimal ist?
2. Wie kann man die Ergebnisse interpretieren, die ich mit Hilfe Clusterzentrenanalyse bekommen habe? Kann ich anhand dieser Ergebnisse schon Segmente beschreiben?
Danke bereits im Voraus für die Antwort(en)!
Viele Grüße
Mafo
Wie interpretiert man die Ergebnisse der Clusteranalyse
-
- Beiträge: 1
- Registriert: 13.08.2009, 16:50
-
- Beiträge: 38
- Registriert: 21.09.2009, 19:10
Hi, keine Art de Clusteranalyse ist durch die STichprobengröße beschränkt in ihrer Aussagenkraft. Clusteranalysen schaut man sich am besten graphisch an.
Welche Clusteranzahl optimal ist kann dir leider niemand sagen, am wenigsten die Clusteranalyse. Du mußt darin Muster erkennen und sie anhand deiner Daten mit einem Sinn versehen. Wenn Du keinen Sinn siehst, dann gibt es auch keinen.
Clusteranalysen sind leider nicht ganz so bequem wie andere ordnungsgebende Verfahren, da sie immer noch sehr viel Interpretation vom Forscher benötigen.
Welche Clusteranzahl optimal ist kann dir leider niemand sagen, am wenigsten die Clusteranalyse. Du mußt darin Muster erkennen und sie anhand deiner Daten mit einem Sinn versehen. Wenn Du keinen Sinn siehst, dann gibt es auch keinen.
Clusteranalysen sind leider nicht ganz so bequem wie andere ordnungsgebende Verfahren, da sie immer noch sehr viel Interpretation vom Forscher benötigen.