Hallo Forum,
ich habe eine Frage zur Interpretation meiner Ergebnisse.
Mein Datensatz beinhaltet mehrere Hundert Personen sowie deren Abiturnoten (f14) und einer dichotomen Variable, die den Einstieg in eine bestimmte nachschulische Institution wiederspiegelt (f15, 1= Ja, 0=Nein). Mein Ziel ist es, ein multivariates Modell aufzustellen und die besagten Variablen sowie weitere Merkmale darin einfließen zu lassen. Die Frage ist: Welche Variablen haben einen signifikanten Einfluss auf die Wahrscheinlichkeit, dass eine Person in die Institution (nicht) einsteigt. Dafür gehe ich wie folgt vor:
Da die abhängige Variable eine binäre Variable ist, kommt eine logistische Regression infrage. Daher dichomotisiere ich die Notenvariable (f14) nach den besten 25%; f14=1 heißt also "Die Abiturnote der PErson gehört zu den besten 25%". Die 0 spiegelt demnach wieder, dass die Note nicht zu den besten 25 % gehört.
Als erstes erstelle ich eine Kreuztabelle. Dort wird mir angezeigt, dass die Personen, die zu den besten 25% gehören, deutlich seltener in die Institution eintreten als jene, die nicht zu den besten 25% gehören (57 vs. 72 Prozent). Die Unterschiede sind signifikant.
Um es mir noch besser zu visualisieren, erstelle ich darüber hinaus ein Baumdiagramm (Entscheidungsbaum). Auch wenn die Prozentwerte um wenige Prozentpunkte differieren, stimmt die grundsätzliche Aussage mit der Kreuztabelle überein. Auch hier steigen die Personen mit einer besseren Note seltener in diese Institution ein.
Teste ich dies noch mit einer Korrelationsanalyse , wird mir ein geringer sign. Zusammenhang von r=0.14 angezeigt. Das bedeutet, dass der Einstieg in die Insituation (f15=1) positiv mit der guten Abiturnote (f14=1) zusammenhängt. Hier wird ist also ein anderes Ergebnis herauszulesen.
Anschließend erstelle ich noch eine logistische Regression mit ausschließlich dieser Variablen. AV ist also die f15 (Einstieg Ja/Nein) und UV ist f14 (beste 25% der Abitnote Ja/Nein). Das Ergebnis: Nimmt die Notenvariable die Ausprägung 1 an (=beste 25%), steigt die Wahrscheinlichkeit um 97 Prozent, dass auch die f15 die Ausprägung 1 annimmt (= Einstieg in die Institution: Ja).
Kurz noch einmal die Übersicht:
Kreuztabelle: die besten schließen sich seltener der Institution an.
Entscheidungsbaum: die besten schließen sich seltener der Institution an
Korrelation: gehört eine Person zu den besten 25%, schließt sie sich eher der Institution an
log. Regression: gehört eine Person zu den besten 25%, schließt sie sich eher der Institution an
Die Frage ist nun: Wie gehe ich mit den unterschiedlichen Ergebnissen um? Also klar, in die Regressionsanalyse fließen natürlich noch andere Variablen mit ein, welche das Ergebnis vllt nochmal etwas beeinflussen. Wieso aber erhalte ich bei meinem obigen Vorgehen so unterschiedliche Ergebnisse?
Regr, Kreutab, Korr,Baum: Unterschiedliche Ergebnisse
-
- Beiträge: 81
- Registriert: 25.03.2018, 17:56
-
- Beiträge: 2731
- Registriert: 01.02.2018, 10:45
Re: Regr, Kreutab, Korr,Baum: Unterschiedliche Ergebnisse
hallo
das ist ja ganz schön anspruchsvoller text...
also das verschiedliche methoden, unterschiedliche konsequenzen suggerieren
ist problematisch und auch nicht üblich, eigentlich ist zu erwarten das die resultate identisch sind
näheres kann ich ohne kenntniss der daten nicht sagen..
gruß
das ist ja ganz schön anspruchsvoller text...
also das verschiedliche methoden, unterschiedliche konsequenzen suggerieren
ist problematisch und auch nicht üblich, eigentlich ist zu erwarten das die resultate identisch sind
näheres kann ich ohne kenntniss der daten nicht sagen..
gruß
-
- Beiträge: 81
- Registriert: 25.03.2018, 17:56