Hallo zusammen,
im Rahmen meiner Bachelorarbeit analysiere ich den Effekt von Umweltzonen auf die Feinstaubbelastung.
Das ganze erfolgt durch eine multiple Regression mit dummy-Variablen, das Modell sieht wie folgt aus:
log (Messwert) = a + b * dJahr + c * dWochenende + d * dJahr + e * Status + f * dMessstation
d = dummy-Variable, mit Status ist eine weitere dummy-Variable gemeint, die angibt, ob eine Umweltzone vorliegt (=1) oder nicht (=0).
Nun möchte ich den Einfluss der Umweltzone (Status) im Jahresverlauf auf die Messwerte ermitteln.
Momentan filtere ich die Daten nach einem bestimmten Monat und führe dann die multiple Regression mit den Messwerten des jweiligen Monats durch. Problem dabei ist, dass die Effekte der anderen Einflussfaktoren nicht konstant sind, sondern je nach Monat variieren.
Meine Idee sieht so aus, dass ich die Regressionskoeffizienten a, b, c, d und f ohne Filterung nach Monat bestimme und diese für die Regression für einzelne Monate bestimme. Wie kann ich das implementieren?
Multiplikatoreffekte durch Regressionen bestimmen
-
- Beiträge: 8
- Registriert: 09.07.2020, 18:09
-
- Beiträge: 2731
- Registriert: 01.02.2018, 10:45
Re: Multiplikatoreffekte durch Regressionen bestimmen
Hallo cash flow
Das Ganze ist zu komplex, als dass man per Text viel beraten kann.
Zumal ich nicht keinen Überblick habe wie sich das Ganze wirklich darstellt.
Wahrscheinlich hast du eine sehr unübersichtliche Datenlage, da würde ich erstmal mit einer
reduzierten üben...
wenn d= 0 besteht obiges Modell nur aus a??? und Status = dummy??
d.h Jahr müsste auch ohne interaktion in die Gleichung
log (Messwert) = a + b * Jahr + c * dummy *Jahr...
oder gar:
log (Messwert) = a + b * Jahr + c * dummy + d* dummy *Jahr...
...und d * dJahr = d quadrat???
Der Status = Umweltzone = dummy = ja oder nein...
Die Variable ist dichotom aber kein dummy!!!
Wochenende ist auch dichotom?
Messsation ist nominal, Anzahl der Messsationen führt zu dummies.
Vielleicht tust du dir leichter wenn du mehr in Unterschieden denkst als in Zusammenhängen.
Wenn das bis auf Zeit alles nominal ist tust du dir leichter wenn du das als ANOVA denkst!
plus Kovariate Jahr, aber Jahr korreliert mit Status!!!!! sehr schlecht!!!
und Monat ist gar nicht in der gleichung?
sind den alle effekte linear??? Jahreszeitliche Schwankungen sind das nicht!
da musst du erstmal Trends bestimmen!! lineare- quadratische- sinusförmige...
wenn das wellenförmig ist, erkennt das die Regresssion nicht!
Du musst die Zeit vielleicht so erfassen: mit vier Variablen:
Messung - Tag in der woche - Tag im Monat - Tag im Jahr. wie sind die Abstände der Messungen?
1 1 1 1900 --> erste Messung Januar 1900
2 2 1 1900
3 3 1 1900
4 1 2 1900 ---> erste Messung Feb 1900
gruß
dutchie
Das Ganze ist zu komplex, als dass man per Text viel beraten kann.
Zumal ich nicht keinen Überblick habe wie sich das Ganze wirklich darstellt.
Wahrscheinlich hast du eine sehr unübersichtliche Datenlage, da würde ich erstmal mit einer
reduzierten üben...
wenn d= 0 besteht obiges Modell nur aus a??? und Status = dummy??
d.h Jahr müsste auch ohne interaktion in die Gleichung
log (Messwert) = a + b * Jahr + c * dummy *Jahr...
oder gar:
log (Messwert) = a + b * Jahr + c * dummy + d* dummy *Jahr...
...und d * dJahr = d quadrat???
Der Status = Umweltzone = dummy = ja oder nein...
Die Variable ist dichotom aber kein dummy!!!
Wochenende ist auch dichotom?
Messsation ist nominal, Anzahl der Messsationen führt zu dummies.
Vielleicht tust du dir leichter wenn du mehr in Unterschieden denkst als in Zusammenhängen.
Wenn das bis auf Zeit alles nominal ist tust du dir leichter wenn du das als ANOVA denkst!
plus Kovariate Jahr, aber Jahr korreliert mit Status!!!!! sehr schlecht!!!
und Monat ist gar nicht in der gleichung?
sind den alle effekte linear??? Jahreszeitliche Schwankungen sind das nicht!
da musst du erstmal Trends bestimmen!! lineare- quadratische- sinusförmige...
wenn das wellenförmig ist, erkennt das die Regresssion nicht!
Du musst die Zeit vielleicht so erfassen: mit vier Variablen:
Messung - Tag in der woche - Tag im Monat - Tag im Jahr. wie sind die Abstände der Messungen?
1 1 1 1900 --> erste Messung Januar 1900
2 2 1 1900
3 3 1 1900
4 1 2 1900 ---> erste Messung Feb 1900
gruß
dutchie