Hallo,
ich möchte eine Clusteranalyse durchführen, muss laut meinem Prof aber vorher eine Normierung der Daten durchführen.
Folgende "Anleitung" hat er mir gegeben:
Bei dieser Möglichkeit muss zunächst der Mittelwert ( X ) und die Standardabweichung
( s ) der betrachteten Variable gebildet werden. Die oberer Grenze (Wert 1,
100%) wird dann in diesem Fall durch die Addition der 3-fachen Standardabweichung mit
dem Mittelwert berechnet. Bei der unteren Grenze wird die 3-fache Standardabweichung
vom Mittelwert subtrahiert. Alle Ausprägungen oberhalb und unterhalb dieser beiden definierten
Grenzen werden auf den Wert 1 (100%) bzw. 0 (0%) gesetzt. Die dazwischen
liegenden Ausprägungen werden entsprechend Variante 1 und ihrer Größe innerhalb
dieses Intervalls verteilt.
Die Mittelwerte und Standardabweichung konnte ich berechnen. Die Zuordnung zu den Werten 1 und 0 auch. Aber wie ordne ich jetzt die dazwischenliegenden Werte zu?
Hat jemand eine Idee?
Danke
Daten Normierung für Clusteranalyse
-
- Beiträge: 3
- Registriert: 18.01.2012, 21:36
Und das ist Variante 1.
Die größte Ausprägung einer Variablen wird bei dieser Möglichkeit auf den
Wert 1 (100%) gesetzt, während der Minimalausprägung der Wert 0 zugewiesen wird.
Die zwischen dieser oberen und unteren Grenze liegenden Ausprägungen werden entsprechend
ihrer Größe innerhalb dieses festgelegten Intervalls verteilt.
Die größte Ausprägung einer Variablen wird bei dieser Möglichkeit auf den
Wert 1 (100%) gesetzt, während der Minimalausprägung der Wert 0 zugewiesen wird.
Die zwischen dieser oberen und unteren Grenze liegenden Ausprägungen werden entsprechend
ihrer Größe innerhalb dieses festgelegten Intervalls verteilt.