Hallo,
ich bin neu hier im Forum und fange gerade mit meiner Diplomarbeit an und bin auf ein Problem gestoßen, dass mir schon den ganzen Tag zu schaffen macht.
Ich habe einen Datensatz von etwa 7000 Zeilen (Haushaltsdaten):
Die Spalten sind:
HaushaltsID Item Ausgaben
Die ersten drei Zeilen sehen z.b. so aus:
28 16 1500
28 22 60000
31 22 1200
..
..
..
Sprich: Haushalt 28 hat 1500 für Item 16 ausgegeben und 60000 für item 22.
Das heisst es geht bei den Haushalten nicht von 1 bis 7000 durch, da dies nur ein Teil des Datensatzes ist mit bestimmten merkmalen.
was ich gerne hätte, was auch mit anderen Daten geklappt hat, aber hier nicht klappen wollte:
haushaltsid AusgabenItem28 AusgabenItem31 AusgabenItemXX .....
sodass ich für jeden Haushalt eine Zeile habe und genau sehen kann, welcher haushalt wieviel für was ausgegeben hat.
außerdem kann ich die daten dann auch später mit anderen datenverbinden, wo die gleichen haushalt befragt wurden.
nun habe ich das mit der data -> restructure... funktion probiert
(restructure selected cases into variables) und habe die haushaltsid als identifier angegeben.
leider glückt das ergebnis nicht so wie ich es erhoffe.
es wird u.a. die variabel ausgaben.1 erstellt, aber die darunter aufgeführten werte sind immer der wert des ersten items das derhaushalt kauft. d.h. er ordnet nicht richtig die ausgaben zu den items zu.
und obwohl es eigentlich 100 items gibt, generiert er nur 13 ausgabenvariablen (weil es nur 13 verschiedene items von den 100 vorkommen im set).
klingt alles etwas kompliziert, ich hoffe mir konnte jemand folgen.
ich würde mich sehr freuen, wenn mir jemand weiterhelfen kann, da ich mitmeinem latein am ende bin...
vielen vielen dank.
grüße
johannes
frage zum restrukturieren von daten
-
- Beiträge: 1
- Registriert: 16.08.2008, 15:25