ich komme nicht weiter und brauche Rat. In meinem Datensatz habe ich für 419 Gemeinden eines Bundeslandes für jedes Jahr seit 1995 die Bevölkerungsgröße sowie die Anzahl der eingetragenen Vereine. Ich möchte herausfinden, inwiefern die Bevölkerungsentwicklung mit der Entwicklung der Vereinszahlen statistisch miteinander zusammenhängen (ob bspw. die Vereinsanzahl von der Bevölkerungsentw. abhängt). Ich bin mir allerdings unsicher, wie und mit welchem Modell ich vorgehen sollte. Kann mir jemand helfen? Mein bisheriges Vorgehen ist wie folgt:
1. Orientiert habe ich mich an einem Video (Link siehe unten), welches zu einer Linearen Regression rät und vorher den Datensatz ins Long-Format anpasst. Das habe ich gemacht. Jede der 419 Gemeinden kommt in einer einzigen Variable dadurch jeweils 26x vor; quasi für jedes Jahr 1x. Dasselbe gilt praktisch auch für die Bevölkerungs- und Vereinsvariable.
2. Anschließend habe ich für jede Gemeinde eine Dummyvariable erzeugt; dadurch entstehen 419 Variablen, die im Falle der jeweiligen Gemeinde eine 1 enthält und andernfalls eine 0.
3. m letzten Schritt habe ich die Vereinsvariable als AV sowie die Bevölkerungsvariable (UV) und alle Gemeinde-Dummyvariablen (UV; k-1) ins Regressionsmodell gepackt. Ergebnis: R² liegt bei ,979. Die Bevölkerungsvariable zeigt sich signifikant positiv (Regressionskoeffizient ,006); Beta 1,048).
Was bedeutet das aber für die Interpretation? Also, ist das R² nicht enorm hoch? Insgesamt vernachlässige ich beim Interpretieren innerhalb der Koeffizienten-Tabelle die 418 Zeilen für die Gemeinden und fokussiere die Bevölkerungsvariable, korrekt? Wie genau ist diese aber zu interpretieren? Kann ich durch das Ergebnis schlussfolgern, dass die Bevölkerungsentwicklung allgemein einen hochsign. positiven Zusammenhang zur Vereinsentwicklung aufweist? Oder muss die Interpretation ausschließlich in Bezug auf die Referenzgemeinde stattfinden (also auf die weggelassene Variable [k-1])? Und was ist mit einer Zusammenhangsstärke? Ist sie aus dem Ergebnis ableitbar?
Und insgesamt: Was haltet ihr von dem Vorgehen? Habe ich etwas übersehen? Wird das normalerweise anders gehandhabt? Gibt es ein Modell, was hierfür zielführender wäre?
Vielen Dank für Kritik und Unterstützung
Link zum Video: https://www.youtube.com/watch?v=5DJR6J3HDKU