Hallo,
ich habe ordinale Daten über das Baujahr von Häusern vorliegen. Sie sind eingeteilt in:
1= vor 1919
2= 1919 – 1948
3= 1949 – 1971
4= 1972 – 1980
5= 1981 – 1990
6= 1991 - 2000
7= 2001 – später
Jetzt möchte ich eine Regressionsanalyse durchführen, wozu ich die Daten in Dummy Variablen umkodieren muss, damit diese metrisch werden. Nur wie gehe ich davor? Ich habe ja 7 Ausprägungen und beim Dummy kann ich ja nur zwischen 0 und 1 wählen.
Vielen Dank.
Frank
Bildung von Dummy Variablen
-
- Beiträge: 4
- Registriert: 17.07.2006, 16:45
Zum Beispiel könntest du deine ordinalskalierte unabhängige Variable jahr folgendermaßen recodieren:
1000000
0100000
0010000
0001000
0000100
0000001
recode jahr (1=1) (2 thru 7=0) (else=copy) into jahr1.
recode jahr (2=1) (1, 3 thru 7=0) (else=copy) into jahr2.
recode jahr (3=1) (1, 2, 4 thru 7=0) (else=copy) into jahr3.
recode jahr (4=1) (1 thru 3, 5 thru 7=0) (else=copy) into jahr4.
recode jahr (5=1) (1 thru 4, 6, 7=0) (else=copy) into jahr5.
recode jahr (6=1) (1 thru 5, 7=0) (else=copy) into jahr6.
recode jahr (7=1) (1 thru 6=0) (else=copy) into jahr7.
Also zum Beispiel hat deine neu recodierte Variable jahr1 die Ausprägung 1, falls jemand vor 1919 genannt hat. Jahr2 macht das gleiche für 1919-1948 usw.
In der Regressionsanalyse kannst du die Beta-Werte dieser Dummy Variablen dann ähnlich interpretieren wie wenn du zum Beispiel als unabhängige Variable Geschlecht (0=nicht weiblich, 1=weiblich) hättest und beispielsweise anhand jahr6 überprüfen, wenn jemand die Kategorie 1991 bis 2000 genannt hat.
Ich hab das mal ähnlich so gemacht, keine Garantie ob das auch richtig ist. Falls du eine kategoriale (dichotom oder mehr Ausprägungen) abhängige Variable hast, dann wäre wohl eine logistische binäre oder multinomiale Regression das geeignete Verfahren.
1000000
0100000
0010000
0001000
0000100
0000001
recode jahr (1=1) (2 thru 7=0) (else=copy) into jahr1.
recode jahr (2=1) (1, 3 thru 7=0) (else=copy) into jahr2.
recode jahr (3=1) (1, 2, 4 thru 7=0) (else=copy) into jahr3.
recode jahr (4=1) (1 thru 3, 5 thru 7=0) (else=copy) into jahr4.
recode jahr (5=1) (1 thru 4, 6, 7=0) (else=copy) into jahr5.
recode jahr (6=1) (1 thru 5, 7=0) (else=copy) into jahr6.
recode jahr (7=1) (1 thru 6=0) (else=copy) into jahr7.
Also zum Beispiel hat deine neu recodierte Variable jahr1 die Ausprägung 1, falls jemand vor 1919 genannt hat. Jahr2 macht das gleiche für 1919-1948 usw.
In der Regressionsanalyse kannst du die Beta-Werte dieser Dummy Variablen dann ähnlich interpretieren wie wenn du zum Beispiel als unabhängige Variable Geschlecht (0=nicht weiblich, 1=weiblich) hättest und beispielsweise anhand jahr6 überprüfen, wenn jemand die Kategorie 1991 bis 2000 genannt hat.
Ich hab das mal ähnlich so gemacht, keine Garantie ob das auch richtig ist. Falls du eine kategoriale (dichotom oder mehr Ausprägungen) abhängige Variable hast, dann wäre wohl eine logistische binäre oder multinomiale Regression das geeignete Verfahren.