unterschiedliche Skalenniveaus für Clusteranalyse

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
tisch98
Beiträge: 2
Registriert: 01.06.2023, 16:08

unterschiedliche Skalenniveaus für Clusteranalyse

Beitrag von tisch98 »

Moin,
ich möchte aus einer durchgeführten Kundenumfrage eine Clusteranalyse durchführen.
Allerdings habe ich Fragen bzw. Antworten mit unterschiedlichen Skalenniveaus, und ich weiß nicht, ob man diese auf ein einheitliches Datenniveau kodieren kann um sie danach in einer Clusteranalyse zu verwenden.

Ordinal (Likert 1 - 5)(z.B. Vergeben von 1 bis 5 Sternen für verschiedene Kriterien oder Zustimmung zu Aussagen von "Stimme voll zu" bis "Stimme gar nicht zu")
und
Nominal (multiple-choice Einfachauswahl)(z.B. Alter: <18, 19-26, 27-40, etc. oder Tätigkeit: Schüler, Student, Angestellt, Rentner, etc.)

Besteht die Möglichkeit, die Variablen dieser beiden Skalenniveaus auf ein einheitliches Datenniveau zu kodieren?

Wenn nicht, wie lassen sich trotzdem die Variablen beider Skalenniveaus in einer statistischen Analyse vereinen?

Danke im Voraus!!!
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: unterschiedliche Skalenniveaus für Clusteranalyse

Beitrag von dutchie »

Moin Moin tisch98,

eine Likert Skala kann als intervallskaliert betrachtet werden:

viewtopic.php?f=3&t=11841&p=30988&hilit ... eau#p30988

Alter ist ebenfalls intervallskaliert.
Tätigkeit natürlich nicht.

Ordinales muss für die C-ANA als intervallskaliert betrachtet werde,
weil man nur intervallskaliert oder dichotome Variablen clustern kann, da man eine
Abstandsbegriff haben muss, um zu sagen was ist ähnlich oder unähnlich.

Erstmal muss es keine Cluster geben,
und wenn man Chaos bezüglich Skalenniveaus hat:

Du transformierst die mehrkategorial nominalen Variablen in dummies
wobei bei 5 Kategorien auch 5 dummies entstehen!!!
ist aber problematisch....nicht schlimm, weil es immer so ist.

Alle Variablen die ein "größer" kleiner" implizieren, wie Alter
begreifst du als intervallskaliert!

Dann machst du zwei Clusteranalysen
eine auf Intervallniveau und eine für die Dichotomen! :idea:

Diese zwei Clusterlösungen stellst du dann in einem letzten Schritt gegenüber.

Es lohnt sich vielleicht auch vorher eine Faktorenanalyse zu machen, um ähnliche Inhalte zu bündeln!
Und eventuell ist wichtig festzulegen, wozu das Ganze dienen soll!!

gruß
dutchie
tisch98
Beiträge: 2
Registriert: 01.06.2023, 16:08

Re: unterschiedliche Skalenniveaus für Clusteranalyse

Beitrag von tisch98 »

dutchie hat geschrieben:
01.06.2023, 17:52
Moin Moin tisch98,

eine Likert Skala kann als intervallskaliert betrachtet werden:

viewtopic.php?f=3&t=11841&p=30988&hilit ... eau#p30988

Alter ist ebenfalls intervallskaliert.
Tätigkeit natürlich nicht.

Ordinales muss für die C-ANA als intervallskaliert betrachtet werde,
weil man nur intervallskaliert oder dichotome Variablen clustern kann, da man eine
Abstandsbegriff haben muss, um zu sagen was ist ähnlich oder unähnlich.

Erstmal muss es keine Cluster geben,
und wenn man Chaos bezüglich Skalenniveaus hat:

Du transformierst die mehrkategorial nominalen Variablen in dummies
wobei bei 5 Kategorien auch 5 dummies entstehen!!!
ist aber problematisch....nicht schlimm, weil es immer so ist.

Alle Variablen die ein "größer" kleiner" implizieren, wie Alter
begreifst du als intervallskaliert!

Dann machst du zwei Clusteranalysen
eine auf Intervallniveau und eine für die Dichotomen! :idea:

Diese zwei Clusterlösungen stellst du dann in einem letzten Schritt gegenüber.

Es lohnt sich vielleicht auch vorher eine Faktorenanalyse zu machen, um ähnliche Inhalte zu bündeln!
Und eventuell ist wichtig festzulegen, wozu das Ganze dienen soll!!

gruß
dutchie
moin dutchie,
vielen dank für die schnelle info und die antwort! wurde alles entsprechend umcodiert. die anschlussfrage wäre jetzt nur, wie genau man dann die beiden clusteranalysen übereinander legen bzw miteinander vergleichen kann? habe dazu leider weder in der literatur noch im internet etwas gefunden…
danke im voraus!
LG tisch98
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: unterschiedliche Skalenniveaus für Clusteranalyse

Beitrag von dutchie »

...das schaust du dir einfach per Kreuztabelle an, wie die zwei clusterstrukturen aufeinanderbutschen,
da kannst du auch einen CHI2 test machen, ob es da eine Abhängigkeiten gibt.

gruß
dutchie
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten