Moin,
ich möchte aus einer durchgeführten Kundenumfrage eine Clusteranalyse durchführen.
Allerdings habe ich Fragen bzw. Antworten mit unterschiedlichen Skalenniveaus, und ich weiß nicht, ob man diese auf ein einheitliches Datenniveau kodieren kann um sie danach in einer Clusteranalyse zu verwenden.
Ordinal (Likert 1 - 5)(z.B. Vergeben von 1 bis 5 Sternen für verschiedene Kriterien oder Zustimmung zu Aussagen von "Stimme voll zu" bis "Stimme gar nicht zu")
und
Nominal (multiple-choice Einfachauswahl)(z.B. Alter: <18, 19-26, 27-40, etc. oder Tätigkeit: Schüler, Student, Angestellt, Rentner, etc.)
Besteht die Möglichkeit, die Variablen dieser beiden Skalenniveaus auf ein einheitliches Datenniveau zu kodieren?
Wenn nicht, wie lassen sich trotzdem die Variablen beider Skalenniveaus in einer statistischen Analyse vereinen?
Danke im Voraus!!!
unterschiedliche Skalenniveaus für Clusteranalyse
-
- Beiträge: 2
- Registriert: 01.06.2023, 16:08
-
- Beiträge: 2762
- Registriert: 01.02.2018, 10:45
Re: unterschiedliche Skalenniveaus für Clusteranalyse
Moin Moin tisch98,
eine Likert Skala kann als intervallskaliert betrachtet werden:
viewtopic.php?f=3&t=11841&p=30988&hilit ... eau#p30988
Alter ist ebenfalls intervallskaliert.
Tätigkeit natürlich nicht.
Ordinales muss für die C-ANA als intervallskaliert betrachtet werde,
weil man nur intervallskaliert oder dichotome Variablen clustern kann, da man eine
Abstandsbegriff haben muss, um zu sagen was ist ähnlich oder unähnlich.
Erstmal muss es keine Cluster geben,
und wenn man Chaos bezüglich Skalenniveaus hat:
Du transformierst die mehrkategorial nominalen Variablen in dummies
wobei bei 5 Kategorien auch 5 dummies entstehen!!!
ist aber problematisch....nicht schlimm, weil es immer so ist.
Alle Variablen die ein "größer" kleiner" implizieren, wie Alter
begreifst du als intervallskaliert!
Dann machst du zwei Clusteranalysen
eine auf Intervallniveau und eine für die Dichotomen!
Diese zwei Clusterlösungen stellst du dann in einem letzten Schritt gegenüber.
Es lohnt sich vielleicht auch vorher eine Faktorenanalyse zu machen, um ähnliche Inhalte zu bündeln!
Und eventuell ist wichtig festzulegen, wozu das Ganze dienen soll!!
gruß
dutchie
eine Likert Skala kann als intervallskaliert betrachtet werden:
viewtopic.php?f=3&t=11841&p=30988&hilit ... eau#p30988
Alter ist ebenfalls intervallskaliert.
Tätigkeit natürlich nicht.
Ordinales muss für die C-ANA als intervallskaliert betrachtet werde,
weil man nur intervallskaliert oder dichotome Variablen clustern kann, da man eine
Abstandsbegriff haben muss, um zu sagen was ist ähnlich oder unähnlich.
Erstmal muss es keine Cluster geben,
und wenn man Chaos bezüglich Skalenniveaus hat:
Du transformierst die mehrkategorial nominalen Variablen in dummies
wobei bei 5 Kategorien auch 5 dummies entstehen!!!
ist aber problematisch....nicht schlimm, weil es immer so ist.
Alle Variablen die ein "größer" kleiner" implizieren, wie Alter
begreifst du als intervallskaliert!
Dann machst du zwei Clusteranalysen
eine auf Intervallniveau und eine für die Dichotomen!

Diese zwei Clusterlösungen stellst du dann in einem letzten Schritt gegenüber.
Es lohnt sich vielleicht auch vorher eine Faktorenanalyse zu machen, um ähnliche Inhalte zu bündeln!
Und eventuell ist wichtig festzulegen, wozu das Ganze dienen soll!!
gruß
dutchie
-
- Beiträge: 2
- Registriert: 01.06.2023, 16:08
Re: unterschiedliche Skalenniveaus für Clusteranalyse
moin dutchie,dutchie hat geschrieben: ↑01.06.2023, 17:52Moin Moin tisch98,
eine Likert Skala kann als intervallskaliert betrachtet werden:
viewtopic.php?f=3&t=11841&p=30988&hilit ... eau#p30988
Alter ist ebenfalls intervallskaliert.
Tätigkeit natürlich nicht.
Ordinales muss für die C-ANA als intervallskaliert betrachtet werde,
weil man nur intervallskaliert oder dichotome Variablen clustern kann, da man eine
Abstandsbegriff haben muss, um zu sagen was ist ähnlich oder unähnlich.
Erstmal muss es keine Cluster geben,
und wenn man Chaos bezüglich Skalenniveaus hat:
Du transformierst die mehrkategorial nominalen Variablen in dummies
wobei bei 5 Kategorien auch 5 dummies entstehen!!!
ist aber problematisch....nicht schlimm, weil es immer so ist.
Alle Variablen die ein "größer" kleiner" implizieren, wie Alter
begreifst du als intervallskaliert!
Dann machst du zwei Clusteranalysen
eine auf Intervallniveau und eine für die Dichotomen!![]()
Diese zwei Clusterlösungen stellst du dann in einem letzten Schritt gegenüber.
Es lohnt sich vielleicht auch vorher eine Faktorenanalyse zu machen, um ähnliche Inhalte zu bündeln!
Und eventuell ist wichtig festzulegen, wozu das Ganze dienen soll!!
gruß
dutchie
vielen dank für die schnelle info und die antwort! wurde alles entsprechend umcodiert. die anschlussfrage wäre jetzt nur, wie genau man dann die beiden clusteranalysen übereinander legen bzw miteinander vergleichen kann? habe dazu leider weder in der literatur noch im internet etwas gefunden…
danke im voraus!
LG tisch98
-
- Beiträge: 2762
- Registriert: 01.02.2018, 10:45
Re: unterschiedliche Skalenniveaus für Clusteranalyse
...das schaust du dir einfach per Kreuztabelle an, wie die zwei clusterstrukturen aufeinanderbutschen,
da kannst du auch einen CHI2 test machen, ob es da eine Abhängigkeiten gibt.
gruß
dutchie
da kannst du auch einen CHI2 test machen, ob es da eine Abhängigkeiten gibt.
gruß
dutchie