im Rahmen meiner Diplomarbeit muss ich eine Auswertung mit SPSS machen.
Es handelt sich um 100 Fahrzeugtypen, zu denen jeweils zwischen 5 - 30 Bestandsdaten vorliegen, jeweils eine Angabe pro Jahr. Ziel ist es, die Fahrzeugtypen geeignet zu clustern (nach Hersteller, Alter, Fzg.segment oder Leistung)
Nun habe ich versucht, mittels hierarchischer Clusterung etwas zu erreichen. Das Problem ist, dass für die Fahrzeuge selten alle 30 Bestandsangaben vorliegen, manchmal nur fünf (für ein neueres Fahrzeug). Wenn ich nun die Clusterung über alle Jahre mache, dann bezieht er nur diejenigen Fzg.typen in die Clusterung mit ein, zu denen alle Werte vorliegen (das sind nur 3 von 100 Fzg.typen)
Jetzt die Frage: Gibt es eine Möglichkeit, trotz der fehlenden Werte eine Clusterung über alle Daten durchzuführen??
Hab ihr vielleicht eine Idee, was alternativ zur hierarchischen Clusterung für diesen Datensatz noch in Frage kommen kann?
Zur Info: Die Spalten sehen in etwa so aus:
Nr. (1-100), Segment, Hersteller, Modell, Hubraum, Jahr Produktionsende, Bestand1,...., Bestand30
Bin Euch für jeden Tipp sehr dankbar!!

Gruß Juan