Hallo,
ich möchte eine Aussage über den Zusammenhang von zwei Variablen treffen, die nicht numerisch sind (oder wo nur eine Variable numerisch und die andere ein string ist).
Beispiel:
Variable "groesse" kann folgende Inhalte haben: klein, mittel, groß, sehr groß -> diese Variable ist also string
Variable "anzahl" kann natürliche Zahlen von 1 bis 100 als Inhalt haben -> numerische Variable
Ich möchte nun sehen, ob es einen Zusammenhang zwischen einer hohen Anzahl gibt und der Größe. Dazu benötige ich eine Funktion in STATA. Leider kann ich nichts passendes finden.
Das sollte auch funktionieren, wenn es nur string Variablen sind, z.B. statt "anzahl" "land": Deutschland, USA, Italien --> Hier soll dann soetwas wie folgende Aussage rauskommen können: "Wenn das Land Deutschland ist, dann ist die Größe mittel (mit Signifikanz von x)"
(Für ausschließlich numerische Variablen ist das kein Problem, da funktioniert es ja mit Regression.)
Wäre super, wenn mir jemand hier schnell weiterhelfen könnte, auch wenn er nicht STATA-Experte ist und die allgemeine Funktion/Test kennt!
Danke!
Korrelation von nicht numerischen Daten in STATA
-
- Beiträge: 2
- Registriert: 24.10.2009, 16:47
-
- Beiträge: 2
- Registriert: 24.10.2009, 16:47
Hi,
theoretisch ist es möglich, wenn auch viel Handarbeit! Im Endeffekt wären die Zahlen aber auch nur kategorisch.
Beispiel: Viele Banken vergeben Kredite an viele Kreditnehmer und das mehrfach. Ich will jetzt sehen, ob es einen besonderen Zusammenhang gibt. D.h. ob eine Bank und ein Kreditnehmer oft ins Geschäft kommen. Das ganze sollte statistische Signifikanz (oder eben nicht zeigen). Ich wüsste nicht, wie ich das umsetzen könnte, indem ich numerische Variablen verwende.
theoretisch ist es möglich, wenn auch viel Handarbeit! Im Endeffekt wären die Zahlen aber auch nur kategorisch.
Beispiel: Viele Banken vergeben Kredite an viele Kreditnehmer und das mehrfach. Ich will jetzt sehen, ob es einen besonderen Zusammenhang gibt. D.h. ob eine Bank und ein Kreditnehmer oft ins Geschäft kommen. Das ganze sollte statistische Signifikanz (oder eben nicht zeigen). Ich wüsste nicht, wie ich das umsetzen könnte, indem ich numerische Variablen verwende.