Hallo zusammen.
Ich habe einen relativ großen Datensatz (620.000 Fälle), Paneldatensatz.
Jedes Jahr werden Personen befragt. Jede Person hat eine unveränderliche PersonenID. Da jedes Jahr gefragt wird, ist die unveränderliche PersonenID als Identifikation der Personen im Datensatz hinfällig.
PERSID SURVEYYEAR
1 1990
1 1991
1 1992
2 1990
2 1991
Ich möchte jedem einzelnen Fall eine individuelle ID zuschreiben. DIese ID soll sich aus der PersonenID des Befragten und der jeweiligen Jahreszahl zusammensetzen. Das sehe ich als einzige Möglichkeit, um eine neue Variable zu bilden, die eine eindeutige Identifikation der Person zulässt.
Folgendes Schema stelle ich mir vor:
PERSID SURVEYYEAR IDENT
1 1990 11990
1 1991 11991
1 1992 11992
2 1990 21990
2 1991 21991
. . .
a) Haltet ihr eine solche Zuordnung für sinnvoll, ergeben sich dadurch keine Dopplungen?
b) Wie kann ich das im SPSS realisieren? Mir fällt bisher keine Möglichkeit ein.
LG
BumPowPow
Ich freue mich über eine angeregte Diskussion und eventuell einige gute Vorschläge. Tausend dank schonmal im Vorraus