Jährlichen Mittelwert berechnen bei zwei Spalten (von/bis)

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
velor1701
Beiträge: 5
Registriert: 05.06.2014, 14:19

Jährlichen Mittelwert berechnen bei zwei Spalten (von/bis)

Beitrag von velor1701 »

Hallo,

ich bin neu im Forum und habe eine Frage, die ich durch Googeln und probieren nicht selbst lösen kann.

Ich habe zwei Variablen aus denen ich je PLZ einen jährlichen Mittelwert berechnen muss. Jedoch bfeinden sich die PLZ unterjährlich häufig bei verschiedenen Anbietern, z.B. von Mai bis Juni und dann von Juni bis ende des Jahres bei einem anderen. Die Datumsvariable besteht somit aus zwei Variablen VON und BIS.

Die Struktur sieht so aus:

PLZ Ort Netz_ID von bis Arbeitspreis Festpreis
1067 Dresden 1067001 01.07.2000 30.06.2001 0.00 17.90
1067 Dresden 1067001 01.07.2001 31.03.2002 6.38 17.00
1067 Dresden 1067001 01.04.2002 31.12.2002 6.15 17.00
1067 Dresden 1067001 01.01.2003 31.12.2003 6.20 17.00
1067 Dresden 1067001 01.01.2004 31.12.2004 5.92 17.00
1067 Dresden 1067001 01.01.2005 31.12.2005 6.09 17.00
1067 Dresden 1067001 01.01.2006 31.12.2006 6.09 17.00
1067 Dresden 1067001 01.01.2007 30.04.2007 6.09 17.00
1067 Dresden 1067001 01.05.2007 31.12.2007 5.09 16.80
1067 Dresden 1067001 01.01.2008 29.02.2008 5.07 16.80
1067 Dresden 1067001 01.03.2008 31.12.2008 4.84 16.80

Am Ende würde ich gerne haben:

PLZ Jahr Durchschnittlicher Arbeitspreis Durch. Festpreis
1067 2008 5,5 17,00

Hat jemand eine Idee? Habe auch in verschiedenen Foren gesucht aber nichts gefunden

Vielen Dank und schöne Grüße
Frido
Beiträge: 346
Registriert: 25.09.2012, 15:04

Beitrag von Frido »

Du kannst mit "compute" neue Variablen berechnen.
Außerdem kannst du mit verschiedenen Funktionen diese Berechnungen steuern:

bspw.: compute preis = mean(Arbeitspreis,Festpreis).

Das berechnet dir den Mittelwert aus beiden Variablen.
Einen Überbklick über die verschiedenen Funktionen (da gibt es sicherlich so ca. 50 verschiedene) findest du auch in der SPSS Hilfe, wenn du nach Funktionen suchst.
velor1701
Beiträge: 5
Registriert: 05.06.2014, 14:19

Beitrag von velor1701 »

Danke für die Antwort. Den Befehl compute kenne ich. Jedoch geht es darum, wie man die jährlichen durchschnitte berechnen kann, wenn die einzelnen PLZ unterschiedlich lange einem Anbieter zugeordnet waren.

Es wäre dann ja sinngemäß compute mean(Arbeitspreis; Festpreis) by year

Herauskommen müßte dann:

PLZ Jahr Durchschn. Arbeitspreis Durchschn. Festpreis
1067 2001 5 18
1067 2002 6 15
1067 2003 7 16
1067 2004 2 13
1067 2005 5 13
1067 2006 6 17
.
.
.
Frido
Beiträge: 346
Registriert: 25.09.2012, 15:04

Beitrag von Frido »

Ahh, ok.
Das machst du am besten mit "aggregate".
velor1701
Beiträge: 5
Registriert: 05.06.2014, 14:19

Beitrag von velor1701 »

Ja, soweit war icha uch schon aber ich will es ja nicht nur nach der PLZ aggregieren sondern nach dem Jahr. Da die PLZ unterschiedlich lange einem Anbieter zugeordnet waren und die Zeitspanne von einer "von" und "bis" Variable definiert ist, komme ich an dieser Stelle nicht weiter.
Frido
Beiträge: 346
Registriert: 25.09.2012, 15:04

Beitrag von Frido »

So spontan und ohne den Hintergrund zu kennen, würde ich sagen, dass du dann zwei verschiedene Aggregationsversionen hast - 1x nach Jahr und 1x nach PLZ.
velor1701
Beiträge: 5
Registriert: 05.06.2014, 14:19

Beitrag von velor1701 »

Es ist richtig, ich benötige eine Aggregation nach PLZ und Jahr. Doch wo kann ich definieren, dass die Variablen "von" und "bis" die zugehörigkeit zu einem Anbieter darstellen?
Frido
Beiträge: 346
Registriert: 25.09.2012, 15:04

Beitrag von Frido »

Das sollte eigentlich in deinem Datensatz drin stehen.
Wenn nicht, dann musst du das selbst nachtragen.
velor1701
Beiträge: 5
Registriert: 05.06.2014, 14:19

Beitrag von velor1701 »

Ja, es steht drin:

PLZ Ort Netz_ID von bis Arbeitspreis Festpreis
1067 Dresden 1067001 01.07.2000 30.06.2001 0.00 17.90
1067 Dresden 1067001 01.07.2001 31.03.2002 6.38 17.00
1067 Dresden 1067001 01.04.2002 31.12.2002 6.15 17.00
1067 Dresden 1067001 01.01.2003 31.12.2003 6.20 17.00
1067 Dresden 1067001 01.01.2004 31.12.2004 5.92 17.00
1067 Dresden 1067001 01.01.2005 31.12.2005 6.09 17.00
1067 Dresden 1067001 01.01.2006 31.12.2006 6.09 17.00
1067 Dresden 1067001 01.01.2007 30.04.2007 6.09 17.00
1067 Dresden 1067001 01.05.2007 31.12.2007 5.09 16.80
1067 Dresden 1067001 01.01.2008 29.02.2008 5.07 16.80
1067 Dresden 1067001 01.03.2008 31.12.2008 4.84 16.80

Aber wie kann ich nun von den beiden von und bis Spalten die Aggregation durchführen? Hier komme ich nicht weiter.
Frido
Beiträge: 346
Registriert: 25.09.2012, 15:04

Beitrag von Frido »

erste aus den beiden Spalten eine neue Variable mit dem Mittelwert bilden und anschließend aggregieren.
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten