Hallo,
ich hoffe, dass ihr mir bei folgenden Fragen behilflich sein könnt:
1) Gruppierungsmerkmale Clusteranalyse
Da es keinen Sinn macht, eine Clusteranalyse mit 2 hoch korrelierenden Variablen zu machen, möchte ich deren Unabhängigkeit nachweisen. Die Variablen haben sich (wie nahezu alle Variablen meiner Erhebung) als NICHT-NORMALVERTEILT entpuppt. Wie zeige ich, dass diese Variablen unabhängig sind? Ist es ausreichend, wenn ich die Korrelationen (Kendall und Spearman) ausgeben lasse und anhand der Signifikanz eine Aussage treffe? Bzw. kann ich vorab irgendwie nachweisen/überprüfen, ob es bzgl. dieser/einer Variablen signifikante Unterschiede in der SP'e gibt (intervall-skaliert, nicht normalverteilt) und nicht alle Befragten etwa gleich geantwortet haben bzgl. dieser Variablen.
2)Anzahl Cluster
Wie/wo kann ich statistische Kennzahlen für die Untermauerung meiner Entscheidung über die Anzahl der Cluster anfordern oder ausrechnen? Ich habe immer von "Test von Mojena" gelesen...wie berechne ich diesen am besten und wie erstelle ich die Grafik für das Elbow-Kriterium?
3) Grafik Cluster
Richtig blöde Frage, ich ahne es schon, doch wie erstellen ich diese Punktwolke, an der man so schön (wenn man Glück hat) die Cluster erkennt und schön einkringelt? Ganz normales Streudiagramm mit den Werten der 2 Gruppierungsmerkmale?
4) Cluster fertig, nun Regressionsanalyse.
Nachdem ich nun Cluster gebildet habe möchte ich diese wiederum anhand einer anderen Variable jeweils nochmal in Experimental (EG)- und Kontrollgruppe (KG) teilen. Es sollen nun separate Regressionsanalysen und Mittelwertvergleiche für EG-Cluster1, KG-Cluster1, EG-Cluster2, KG-Cluster2,... durchgeführt werden. Wie kann ich das am unkompliziertesten bewerkstelligen? Da die Variablen nicht normalverteilt sind, werde ich den Man-Whitney test machen. Doch was mache ich mit der Regression? Ich habe immer nur eine abhängige und eine unabhängige, doch lineare Regression ist ja wegen den nicht vorhandenen Normalverteilung nicht möglich?!
Ich wäre euch sehr dankbar, wenn ihr mir weiterhelfen würdet!!
DRINGENDE Fragen zu Clusteranalyse und Regressionsanalyse
-
- Beiträge: 7
- Registriert: 24.03.2013, 18:57
-
- Beiträge: 1733
- Registriert: 11.03.2010, 22:28
Re: DRINGENDE Fragen zu Clusteranalyse und Regressionsanalys
Pearson-Korrelation berechnen und ihre Höhe beurteilen. Normalverteilungsbetrachtungen sind nur für einen SignifikanztestDie Variablen haben sich (wie nahezu alle Variablen meiner Erhebung) als NICHT-NORMALVERTEILT entpuppt. Wie zeige ich, dass diese Variablen unabhängig sind?
des Koeffizienten interessant, nicht für die Berechnung des
Koeffizienten.
Für eine lineare Regression muss die abhängige Variable nicht normalverteilt seinDa die Variablen nicht normalverteilt sind, werde ich den Man-Whitney test machen. Doch was mache ich mit der Regression?
(und die unabhängigen schon gar nicht). Die Vorhersagefehler (die Residuen)
sollten aus einer normalverteilten Grundgesamtheit stammen, zumindest wenn
die Stichprobe klein ist.
-
- Beiträge: 7
- Registriert: 24.03.2013, 18:57
Re: DRINGENDE Fragen zu Clusteranalyse und Regressionsanalys
zu 1) Ja, aber ich frage noch einmal vorsichtig, weil ich mir wirklich bezüglich nichts mehr sicher bin: Ist es nicht so, dass man nicht einfach sagen sollte "Es liegen hohe Korrelationen vor." sondern tatsächlich anhand eines Tests zeigen sollte, dass die Variablen unabhängig oder eben nicht unabhängig sind? Die Korrelationen könnten ja zufällig in dieser SP'e auftreten und der Signifikanztest, der dies widerlegt und sagt "diese Korrelation ist nicht nur zufällig" setzt doch bei Pearson Normalverteilung voraus. Oder nicht?Generalist hat geschrieben:Pearson-Korrelation berechnen und ihre Höhe beurteilen. Normalverteilungsbetrachtungen sind nur für einen SignifikanztestDie Variablen haben sich (wie nahezu alle Variablen meiner Erhebung) als NICHT-NORMALVERTEILT entpuppt. Wie zeige ich, dass diese Variablen unabhängig sind?
des Koeffizienten interessant, nicht für die Berechnung des
Koeffizienten.Für eine lineare Regression muss die abhängige Variable nicht normalverteilt seinDa die Variablen nicht normalverteilt sind, werde ich den Man-Whitney test machen. Doch was mache ich mit der Regression?
(und die unabhängigen schon gar nicht). Die Vorhersagefehler (die Residuen)
sollten aus einer normalverteilten Grundgesamtheit stammen, zumindest wenn
die Stichprobe klein ist.
zu 2) Und was mache ich wenn beide Variablen, die abhängige und die unabhängige NICHT-Normalverteilt sind? Welche Regressionsanalyse führe ich dann durch?
-
- Beiträge: 1733
- Registriert: 11.03.2010, 22:28
Re: DRINGENDE Fragen zu Clusteranalyse und Regressionsanalys
Wenn zwei Variablen voneinander abhängig sind, sagt das für sich nochzu 1) Ja, aber ich frage noch einmal vorsichtig, weil ich mir wirklich bezüglich nichts mehr sicher bin: Ist es nicht so, dass man nicht einfach sagen sollte "Es liegen hohe Korrelationen vor." sondern tatsächlich anhand eines Tests zeigen sollte, dass die Variablen unabhängig oder eben nicht unabhängig sind?
nichts über den Grad der Assoziation, den Grad der Redundanz aus. Und
"signifikant" sagt ja bloß, dass der Zusammenhang ungleich 0 ist.
Die Faustregeln für akzeptable Korrelationshöhen bei Clusteranalyen kenne ich allerdings nicht.
Für eine lineare Regression muss die abhängige Variable nicht normalverteilt sein (und die unabhängigen schon gar nicht).zu 2) Und was mache ich wenn beide Variablen, die abhängige und die unabhängige NICHT-Normalverteilt sind? Welche Regressionsanalyse führe ich dann durch?
Was normalverteilt sein sollte, sind die Vorhersagefehler (die Residuen) des Regressionsmodells, zumindest wenn die Stichprobe klein ist.