Jährlichen Mittelwert berechnen bei zwei Spalten (von/bis)
-
- Beiträge: 5
- Registriert: 05.06.2014, 14:19
Jährlichen Mittelwert berechnen bei zwei Spalten (von/bis)
Hallo,
ich bin neu im Forum und habe eine Frage, die ich durch Googeln und probieren nicht selbst lösen kann.
Ich habe zwei Variablen aus denen ich je PLZ einen jährlichen Mittelwert berechnen muss. Jedoch bfeinden sich die PLZ unterjährlich häufig bei verschiedenen Anbietern, z.B. von Mai bis Juni und dann von Juni bis ende des Jahres bei einem anderen. Die Datumsvariable besteht somit aus zwei Variablen VON und BIS.
Die Struktur sieht so aus:
PLZ Ort Netz_ID von bis Arbeitspreis Festpreis
1067 Dresden 1067001 01.07.2000 30.06.2001 0.00 17.90
1067 Dresden 1067001 01.07.2001 31.03.2002 6.38 17.00
1067 Dresden 1067001 01.04.2002 31.12.2002 6.15 17.00
1067 Dresden 1067001 01.01.2003 31.12.2003 6.20 17.00
1067 Dresden 1067001 01.01.2004 31.12.2004 5.92 17.00
1067 Dresden 1067001 01.01.2005 31.12.2005 6.09 17.00
1067 Dresden 1067001 01.01.2006 31.12.2006 6.09 17.00
1067 Dresden 1067001 01.01.2007 30.04.2007 6.09 17.00
1067 Dresden 1067001 01.05.2007 31.12.2007 5.09 16.80
1067 Dresden 1067001 01.01.2008 29.02.2008 5.07 16.80
1067 Dresden 1067001 01.03.2008 31.12.2008 4.84 16.80
Am Ende würde ich gerne haben:
PLZ Jahr Durchschnittlicher Arbeitspreis Durch. Festpreis
1067 2008 5,5 17,00
Hat jemand eine Idee? Habe auch in verschiedenen Foren gesucht aber nichts gefunden
Vielen Dank und schöne Grüße
ich bin neu im Forum und habe eine Frage, die ich durch Googeln und probieren nicht selbst lösen kann.
Ich habe zwei Variablen aus denen ich je PLZ einen jährlichen Mittelwert berechnen muss. Jedoch bfeinden sich die PLZ unterjährlich häufig bei verschiedenen Anbietern, z.B. von Mai bis Juni und dann von Juni bis ende des Jahres bei einem anderen. Die Datumsvariable besteht somit aus zwei Variablen VON und BIS.
Die Struktur sieht so aus:
PLZ Ort Netz_ID von bis Arbeitspreis Festpreis
1067 Dresden 1067001 01.07.2000 30.06.2001 0.00 17.90
1067 Dresden 1067001 01.07.2001 31.03.2002 6.38 17.00
1067 Dresden 1067001 01.04.2002 31.12.2002 6.15 17.00
1067 Dresden 1067001 01.01.2003 31.12.2003 6.20 17.00
1067 Dresden 1067001 01.01.2004 31.12.2004 5.92 17.00
1067 Dresden 1067001 01.01.2005 31.12.2005 6.09 17.00
1067 Dresden 1067001 01.01.2006 31.12.2006 6.09 17.00
1067 Dresden 1067001 01.01.2007 30.04.2007 6.09 17.00
1067 Dresden 1067001 01.05.2007 31.12.2007 5.09 16.80
1067 Dresden 1067001 01.01.2008 29.02.2008 5.07 16.80
1067 Dresden 1067001 01.03.2008 31.12.2008 4.84 16.80
Am Ende würde ich gerne haben:
PLZ Jahr Durchschnittlicher Arbeitspreis Durch. Festpreis
1067 2008 5,5 17,00
Hat jemand eine Idee? Habe auch in verschiedenen Foren gesucht aber nichts gefunden
Vielen Dank und schöne Grüße
-
- Beiträge: 346
- Registriert: 25.09.2012, 15:04
Du kannst mit "compute" neue Variablen berechnen.
Außerdem kannst du mit verschiedenen Funktionen diese Berechnungen steuern:
bspw.: compute preis = mean(Arbeitspreis,Festpreis).
Das berechnet dir den Mittelwert aus beiden Variablen.
Einen Überbklick über die verschiedenen Funktionen (da gibt es sicherlich so ca. 50 verschiedene) findest du auch in der SPSS Hilfe, wenn du nach Funktionen suchst.
Außerdem kannst du mit verschiedenen Funktionen diese Berechnungen steuern:
bspw.: compute preis = mean(Arbeitspreis,Festpreis).
Das berechnet dir den Mittelwert aus beiden Variablen.
Einen Überbklick über die verschiedenen Funktionen (da gibt es sicherlich so ca. 50 verschiedene) findest du auch in der SPSS Hilfe, wenn du nach Funktionen suchst.
-
- Beiträge: 5
- Registriert: 05.06.2014, 14:19
Danke für die Antwort. Den Befehl compute kenne ich. Jedoch geht es darum, wie man die jährlichen durchschnitte berechnen kann, wenn die einzelnen PLZ unterschiedlich lange einem Anbieter zugeordnet waren.
Es wäre dann ja sinngemäß compute mean(Arbeitspreis; Festpreis) by year
Herauskommen müßte dann:
PLZ Jahr Durchschn. Arbeitspreis Durchschn. Festpreis
1067 2001 5 18
1067 2002 6 15
1067 2003 7 16
1067 2004 2 13
1067 2005 5 13
1067 2006 6 17
.
.
.
Es wäre dann ja sinngemäß compute mean(Arbeitspreis; Festpreis) by year
Herauskommen müßte dann:
PLZ Jahr Durchschn. Arbeitspreis Durchschn. Festpreis
1067 2001 5 18
1067 2002 6 15
1067 2003 7 16
1067 2004 2 13
1067 2005 5 13
1067 2006 6 17
.
.
.
-
- Beiträge: 5
- Registriert: 05.06.2014, 14:19
-
- Beiträge: 5
- Registriert: 05.06.2014, 14:19
Ja, es steht drin:
PLZ Ort Netz_ID von bis Arbeitspreis Festpreis
1067 Dresden 1067001 01.07.2000 30.06.2001 0.00 17.90
1067 Dresden 1067001 01.07.2001 31.03.2002 6.38 17.00
1067 Dresden 1067001 01.04.2002 31.12.2002 6.15 17.00
1067 Dresden 1067001 01.01.2003 31.12.2003 6.20 17.00
1067 Dresden 1067001 01.01.2004 31.12.2004 5.92 17.00
1067 Dresden 1067001 01.01.2005 31.12.2005 6.09 17.00
1067 Dresden 1067001 01.01.2006 31.12.2006 6.09 17.00
1067 Dresden 1067001 01.01.2007 30.04.2007 6.09 17.00
1067 Dresden 1067001 01.05.2007 31.12.2007 5.09 16.80
1067 Dresden 1067001 01.01.2008 29.02.2008 5.07 16.80
1067 Dresden 1067001 01.03.2008 31.12.2008 4.84 16.80
Aber wie kann ich nun von den beiden von und bis Spalten die Aggregation durchführen? Hier komme ich nicht weiter.
PLZ Ort Netz_ID von bis Arbeitspreis Festpreis
1067 Dresden 1067001 01.07.2000 30.06.2001 0.00 17.90
1067 Dresden 1067001 01.07.2001 31.03.2002 6.38 17.00
1067 Dresden 1067001 01.04.2002 31.12.2002 6.15 17.00
1067 Dresden 1067001 01.01.2003 31.12.2003 6.20 17.00
1067 Dresden 1067001 01.01.2004 31.12.2004 5.92 17.00
1067 Dresden 1067001 01.01.2005 31.12.2005 6.09 17.00
1067 Dresden 1067001 01.01.2006 31.12.2006 6.09 17.00
1067 Dresden 1067001 01.01.2007 30.04.2007 6.09 17.00
1067 Dresden 1067001 01.05.2007 31.12.2007 5.09 16.80
1067 Dresden 1067001 01.01.2008 29.02.2008 5.07 16.80
1067 Dresden 1067001 01.03.2008 31.12.2008 4.84 16.80
Aber wie kann ich nun von den beiden von und bis Spalten die Aggregation durchführen? Hier komme ich nicht weiter.