DRINGENDE Fragen zu Clusteranalyse und Regressionsanalyse

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
burcu
Beiträge: 7
Registriert: 24.03.2013, 18:57

DRINGENDE Fragen zu Clusteranalyse und Regressionsanalyse

Beitrag von burcu »

Hallo,

ich hoffe, dass ihr mir bei folgenden Fragen behilflich sein könnt:

1) Gruppierungsmerkmale Clusteranalyse
Da es keinen Sinn macht, eine Clusteranalyse mit 2 hoch korrelierenden Variablen zu machen, möchte ich deren Unabhängigkeit nachweisen. Die Variablen haben sich (wie nahezu alle Variablen meiner Erhebung) als NICHT-NORMALVERTEILT entpuppt. Wie zeige ich, dass diese Variablen unabhängig sind? Ist es ausreichend, wenn ich die Korrelationen (Kendall und Spearman) ausgeben lasse und anhand der Signifikanz eine Aussage treffe? Bzw. kann ich vorab irgendwie nachweisen/überprüfen, ob es bzgl. dieser/einer Variablen signifikante Unterschiede in der SP'e gibt (intervall-skaliert, nicht normalverteilt) und nicht alle Befragten etwa gleich geantwortet haben bzgl. dieser Variablen.

2)Anzahl Cluster
Wie/wo kann ich statistische Kennzahlen für die Untermauerung meiner Entscheidung über die Anzahl der Cluster anfordern oder ausrechnen? Ich habe immer von "Test von Mojena" gelesen...wie berechne ich diesen am besten und wie erstelle ich die Grafik für das Elbow-Kriterium?

3) Grafik Cluster

Richtig blöde Frage, ich ahne es schon, doch wie erstellen ich diese Punktwolke, an der man so schön (wenn man Glück hat) die Cluster erkennt und schön einkringelt? Ganz normales Streudiagramm mit den Werten der 2 Gruppierungsmerkmale?

4) Cluster fertig, nun Regressionsanalyse.
Nachdem ich nun Cluster gebildet habe möchte ich diese wiederum anhand einer anderen Variable jeweils nochmal in Experimental (EG)- und Kontrollgruppe (KG) teilen. Es sollen nun separate Regressionsanalysen und Mittelwertvergleiche für EG-Cluster1, KG-Cluster1, EG-Cluster2, KG-Cluster2,... durchgeführt werden. Wie kann ich das am unkompliziertesten bewerkstelligen? Da die Variablen nicht normalverteilt sind, werde ich den Man-Whitney test machen. Doch was mache ich mit der Regression? Ich habe immer nur eine abhängige und eine unabhängige, doch lineare Regression ist ja wegen den nicht vorhandenen Normalverteilung nicht möglich?!


Ich wäre euch sehr dankbar, wenn ihr mir weiterhelfen würdet!!
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Re: DRINGENDE Fragen zu Clusteranalyse und Regressionsanalys

Beitrag von Generalist »

Die Variablen haben sich (wie nahezu alle Variablen meiner Erhebung) als NICHT-NORMALVERTEILT entpuppt. Wie zeige ich, dass diese Variablen unabhängig sind?
Pearson-Korrelation berechnen und ihre Höhe beurteilen. Normalverteilungsbetrachtungen sind nur für einen Signifikanztest
des Koeffizienten interessant, nicht für die Berechnung des
Koeffizienten.
Da die Variablen nicht normalverteilt sind, werde ich den Man-Whitney test machen. Doch was mache ich mit der Regression?
Für eine lineare Regression muss die abhängige Variable nicht normalverteilt sein
(und die unabhängigen schon gar nicht). Die Vorhersagefehler (die Residuen)
sollten aus einer normalverteilten Grundgesamtheit stammen, zumindest wenn
die Stichprobe klein ist.
burcu
Beiträge: 7
Registriert: 24.03.2013, 18:57

Re: DRINGENDE Fragen zu Clusteranalyse und Regressionsanalys

Beitrag von burcu »

Generalist hat geschrieben:
Die Variablen haben sich (wie nahezu alle Variablen meiner Erhebung) als NICHT-NORMALVERTEILT entpuppt. Wie zeige ich, dass diese Variablen unabhängig sind?
Pearson-Korrelation berechnen und ihre Höhe beurteilen. Normalverteilungsbetrachtungen sind nur für einen Signifikanztest
des Koeffizienten interessant, nicht für die Berechnung des
Koeffizienten.
Da die Variablen nicht normalverteilt sind, werde ich den Man-Whitney test machen. Doch was mache ich mit der Regression?
Für eine lineare Regression muss die abhängige Variable nicht normalverteilt sein
(und die unabhängigen schon gar nicht). Die Vorhersagefehler (die Residuen)
sollten aus einer normalverteilten Grundgesamtheit stammen, zumindest wenn
die Stichprobe klein ist.
zu 1) Ja, aber ich frage noch einmal vorsichtig, weil ich mir wirklich bezüglich nichts mehr sicher bin: Ist es nicht so, dass man nicht einfach sagen sollte "Es liegen hohe Korrelationen vor." sondern tatsächlich anhand eines Tests zeigen sollte, dass die Variablen unabhängig oder eben nicht unabhängig sind? Die Korrelationen könnten ja zufällig in dieser SP'e auftreten und der Signifikanztest, der dies widerlegt und sagt "diese Korrelation ist nicht nur zufällig" setzt doch bei Pearson Normalverteilung voraus. Oder nicht?

zu 2) Und was mache ich wenn beide Variablen, die abhängige und die unabhängige NICHT-Normalverteilt sind? Welche Regressionsanalyse führe ich dann durch?
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Re: DRINGENDE Fragen zu Clusteranalyse und Regressionsanalys

Beitrag von Generalist »

zu 1) Ja, aber ich frage noch einmal vorsichtig, weil ich mir wirklich bezüglich nichts mehr sicher bin: Ist es nicht so, dass man nicht einfach sagen sollte "Es liegen hohe Korrelationen vor." sondern tatsächlich anhand eines Tests zeigen sollte, dass die Variablen unabhängig oder eben nicht unabhängig sind?
Wenn zwei Variablen voneinander abhängig sind, sagt das für sich noch
nichts über den Grad der Assoziation, den Grad der Redundanz aus. Und
"signifikant" sagt ja bloß, dass der Zusammenhang ungleich 0 ist.

Die Faustregeln für akzeptable Korrelationshöhen bei Clusteranalyen kenne ich allerdings nicht.
zu 2) Und was mache ich wenn beide Variablen, die abhängige und die unabhängige NICHT-Normalverteilt sind? Welche Regressionsanalyse führe ich dann durch?
Für eine lineare Regression muss die abhängige Variable nicht normalverteilt sein (und die unabhängigen schon gar nicht).

Was normalverteilt sein sollte, sind die Vorhersagefehler (die Residuen) des Regressionsmodells, zumindest wenn die Stichprobe klein ist.
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten