Moin!
Bitte nicht kreuzigen, wenn meine Frage trivial ist:
Ich habe ein ein Datensample, welches ich untersuche.
Je nachdem welche Variablen ich verwende, erhalte ich ein adjusted R² von rd. 65 bis 71%.
Nun möchte ich aus einem internen Grund drei Subsample erstellen. Sprich: Ich unterteile den gesamten Datensatz, sodass ich im Endeffekt drei Datensätze habe, die jeweils 1/3 der Observations abbilden.
Nun stelle ich fest, dass die adjusted R² auf rd. 30% fallen.
Ist das normal, oder weist dass auf einen Fehler in den Schätzungen hin?
Würde mich sehr über eine Antwort freuen.
Viele Grüße,
Sven
P.S. Ich weiß, dass ich die Subsample anders bilden könnte, doch hat mein Vorgehen interne Gründe
Subsample weisen deutlich kleinere R² auf?!
-
- Beiträge: 3
- Registriert: 08.07.2016, 15:05
-
- Beiträge: 9
- Registriert: 04.07.2016, 12:53
Re: Subsample weisen deutlich kleinere R² auf?!
Hallo,
a) Wie unterteilst du den Datensatz?
b) Wie groß sind die Subsample?
Wenn du Pech hast, sind die Fälle, die zur Varianzaufklärung beitragen, aufgrund der Fallzahlen auf verschiedene Sample aufgeteilt, so dass dein R² fällt.
Wenn die Stichprobe groß genug ist, dürfte das nicht passieren, vorausgesetzt der Rest des Modells stimmt. Wenn doch, ist irgendwo ein Fehler.
Gruß
Dominik
a) Wie unterteilst du den Datensatz?
b) Wie groß sind die Subsample?
Wenn du Pech hast, sind die Fälle, die zur Varianzaufklärung beitragen, aufgrund der Fallzahlen auf verschiedene Sample aufgeteilt, so dass dein R² fällt.
Wenn die Stichprobe groß genug ist, dürfte das nicht passieren, vorausgesetzt der Rest des Modells stimmt. Wenn doch, ist irgendwo ein Fehler.
Gruß
Dominik
-
- Beiträge: 3
- Registriert: 08.07.2016, 15:05
Re: Subsample weisen deutlich kleinere R² auf?!
Vielen Dank für die Antwort!
Ich unterteile nach Größe: Also groß, mittlere und kleine Einheiten. Die Subsample weisen immer noch 10.000 bis 20.000 Beobachtungen auf.
Ich unterteile nach Größe: Also groß, mittlere und kleine Einheiten. Die Subsample weisen immer noch 10.000 bis 20.000 Beobachtungen auf.
-
- Beiträge: 9
- Registriert: 04.07.2016, 12:53
Re: Subsample weisen deutlich kleinere R² auf?!
Dann sollte es eigentlich nicht an der Größe liegen. Verstehe ich es richtig, dass du die subsample nicht per Zufallsstichprobe generierst? Wenn das so ist und du nach irgendwas anderem aufteilst, dann kann es natürlich sein, dass R² viel geringer ausfällt, weil du ja innerhalb komplett unterschiedlicher Gruppen versuchst die Varianz aufzuklären.
-
- Beiträge: 3
- Registriert: 08.07.2016, 15:05
Re: Subsample weisen deutlich kleinere R² auf?!
Ja, das ist genau so.
Ich unterteile nach einem bestimmten Raster: In dem einen Sample befinden sich nur kleine Einheiten, in dem zweiten nur mittel große Einheiten und das letzte Sample umfasst nur große Einheiten. Sprich: Die kleinen Einheiten mit ihren dazugehörigen unabhängigen Variablen werden nicht in dem Datensample der großen Einheiten auftauchen.
Machen dann die Ergebnisse wieder Sinn?
Ich unterteile nach einem bestimmten Raster: In dem einen Sample befinden sich nur kleine Einheiten, in dem zweiten nur mittel große Einheiten und das letzte Sample umfasst nur große Einheiten. Sprich: Die kleinen Einheiten mit ihren dazugehörigen unabhängigen Variablen werden nicht in dem Datensample der großen Einheiten auftauchen.
Machen dann die Ergebnisse wieder Sinn?
-
- Beiträge: 9
- Registriert: 04.07.2016, 12:53
Re: Subsample weisen deutlich kleinere R² auf?!
Ja, dann machen die Ergebnisse wieder Sinn, da es eine ganz andere Gruppe ist.