Datenreihe Korrelation eliminieren

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
PeterPanne
Beiträge: 9
Registriert: 30.07.2018, 19:55

Datenreihe Korrelation eliminieren

Beitrag von PeterPanne »

Guten Abend,

für eine Regression habe ich mehrere Datenreihen von denen leider zwei stark korrelieren.
Ich möchte beide Variablen aber in der Regression behalten und daher die Korrelation eliminieren, also eine Datenreihe sozusagen bereinigen, dass nur noch der Teil vorhanden ist der in Regression einen "Mehrwert" schafft.
Ich bin noch relativer Anfänger, habe aber gehört dass etwas in die Richtung möglich sein soll.

Ich wäre für Tipps sehr dankbar.

Liebe Grüße,
Peter
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: Datenreihe Korrelation eliminieren

Beitrag von dutchie »

hallo Peter

Wenn die beiden Varaiblen (X1 und X2) zu r=1 korrelieren würden, dann könntest du beide
gar nicht der Regression behalten.
Bin mir deines Anliegens nicht sicher:

Du kannst Blöcke in SPSS so definieren, und über delta R testen, ob die Hinzunahme von
X2 signifikantes beiträgt, wenn X1 schon in der Gleichung ist, je höher die beiden aber korrelieren
umso unwahrscheinlicher ist das, bzw. wenn beide denselben Varianzanteil von Y aufklären.
Es kann aber auch sein, dass trotz hoher Korrelation der beiden, beide jeweils andere Teile von y
aufklären...dann wären aber beide in der Gleichung enthalten.

Du kannst X1 aus X2 schätzen lassen per regression (binnenregression) dann X1 quasi zerlegen
in X1 (dach, von X2 geschätzt) und X1 (residuum) das nichts mit X2 zu tun hat, und dann nur das resiuum in die eigentliche
Schätzgleichung hinzufügen.
PeterPanne hat geschrieben:Ich möchte beide Variablen aber in der Regression behalten
aber wozu eigentlich? Das kann wissenschaftlich falsch sein, vorsicht!

gruß
dutchie
PeterPanne
Beiträge: 9
Registriert: 30.07.2018, 19:55

Re: Datenreihe Korrelation eliminieren

Beitrag von PeterPanne »

Hallo Dutchie,

vielen Dank für die Antwort, das ist genau das, was ich suche:
Du kannst X1 aus X2 schätzen lassen per regression (binnenregression) dann X1 quasi zerlegen
in X1 (dach, von X2 geschätzt) und X1 (residuum) das nichts mit X2 zu tun hat, und dann nur das resiuum in die eigentliche
Schätzgleichung hinzufügen.
Hast du mir dazu eine Buch oder eine Webseite, wo ich das genauer nachlesen und später in meiner Arbeit auch zitieren kann?

Ich habe noch ein weitere Frage, vielleicht hast du dazu auch eine Antwort parat. Ich arbeite leider zur Zeit in Matlab und nicht mit SPSS (ist eine Vorgabe). Ich teste dort nun die Multikollinearität nach Belsley (mit collintest). Nun kommt es teilweise vor, dass ich Multikollinearität zwischen 2 oder 3 Variablen erkenne. Wenn ich dann aber eine weitere Variable dem Modell hinzufüge kann es vorkommen, dass danach die kritischen Grenzwerte der korrelierenden Variablen nicht mehr überschritten werden und somit keine Multikollinearität mehr erkennbar ist. Wie ist das zu erklären?

Gruß,
Peter
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: Datenreihe Korrelation eliminieren

Beitrag von dutchie »

hallo

also die besten bücher meiner meinung nach sind:
von Auer "Ökonometrie"
L. Fahrmaier et. al. "Regression"
Da wirst du das aber nicht finden.

ich kenn den test nach Belsley nicht, aber Multico ist ja
eine eigenschaft des gesamten Predictorbündels
und wenn du zu drei hochkorrelierten Predictoren einen weniger korrelierten
hinzu tust wird im ganzen die Multico weniger.

gruß
dutchie
PeterPanne
Beiträge: 9
Registriert: 30.07.2018, 19:55

Re: Datenreihe Korrelation eliminieren

Beitrag von PeterPanne »

Hallo dutchie,

alles klar.
von Auer "Ökonometrie"
L. Fahrmaier et. al. "Regression"
Da wirst du das aber nicht finden.
Wo kann ich das sonst finden, hast du da eine Idee?
Ich muss das ja wissenschaftlich belegen und meine Google-Suche hat bisher nichts ergeben.

Viele Grüße,
Peter
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: Datenreihe Korrelation eliminieren

Beitrag von dutchie »

Hallo peter

mir kommt nach wie vor komisch vor, dass du beide hochkorrelierte
Predictoren im Modell haben willst, kannst du die nicht zu einem Faktor vereinen?
oder sind die in einem ursache wirkungsverhältnis?
mach doch aus einem eine Mediator,
du hast eher ein inhaltliches Problem, gut ich weiß ja gar nicht worum es geht,
aber das mit der Multico hat direkt doch erstmal den Einfluß, dass es dir die SE deiner
Regressionkoeffizienten zerschießt, eventuell!
und sonst musst du inhaltlich klären warum deine Predictoren korrelieren,
warum die Predictoren und keine anderen...
die pdfs zur Multico wirst du gegooglt haben...
sag mir doch mal was das für Variablen sind!
wenn du die nicht öffentlich machen willst
dann mach das über eine PN an mich.

gruß
dutchie
PeterPanne
Beiträge: 9
Registriert: 30.07.2018, 19:55

Re: Datenreihe Korrelation eliminieren

Beitrag von PeterPanne »

Hallo dutchie,

es handelt sich um den Kohlepreis und den CO²-Preis. Ich will den Einfluss beider Größen auf meine abhängige Variable ermitteln, insofern ist das Vereinen zu einem Faktor keine Lösung. Ich beziehe beispielsweise auch noch andere Brennstoffpreise ins Modell mit ein.
Eine der Variablen ausschließen will ich auch vermeiden.

Gruß,
Peter
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: Datenreihe Korrelation eliminieren

Beitrag von dutchie »

hallo Peter

Äh, das sind Zeitreihen?! :shock:
Da hab ich kaum Ahnung. Das ist etwas komplexer als multiple Regression.
z.B warum korrelieren die beiden denn?, wenn du da z.B.einen allgemeinen Inflationsindex
herausrechnest, aus beiden Variablen eliminierst, wird die Mulico kleiner...
oder wenn du preisschwankungen auf politische ereignisse zurückführst und herausrechnest...
und du kommst deinen Ziel näher...und was ist mit dem ganzen ARIMA Modellen?

gruß
dutchie
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten