Hallo,
im Zuge meiner Masterarbeit untersuche ich die Determinanten von Stress bei Studierenden.
Das mache ich mithilfe einer logistischen Regression. Meine abängige Varaible ist Belastung (0= keine bis wenige 1= mittel bis stark).
Nun habe ich drei Modelle untersucht und bin soweit zufrieden mit den Ergebnissen, bis auf eine Kleinigkeit.
Ich habe bei meinen unabhängigen Variablen die fehlenden Werte als eine gültige Kategorie formuliert (else=99 beim Recodieren).
Beii einigen der Variablen gibt es laut SPSS in dieser Kategrorie einen statistisch siginifikanten Zusammenhang, den ich mir nicht erklären kann.
Ist dies Zufall, habe ich einen Fehler gemacht oder gibt es dafür eine andere Erklärung?
Liebe Grüße und vielen Dank schon einmal im Vorraus.
Logistische Regression - Keine Angabe Werte signifikant?
-
- Beiträge: 2
- Registriert: 23.07.2018, 10:38
-
- Beiträge: 2734
- Registriert: 01.02.2018, 10:45
Re: Logistische Regression - Keine Angabe Werte signifikant?
hallo alex
bin mir nicht sicher ob ich dein Problem verstehe.
in der Variablenansicht hast du 99 als fehlende Werte definiert?
oder fehlende werte als "gültige Kategorie" definiert,
d.h. (deine UVs sind Kategorial?)
die gehen dann in die analyse mit ein und du korrelierst mit der AV weil du wissen willst ob fehlend
oder nicht ein einfluß darauf hat?
oder du korrelierst die UV untereinander?
gruß
dutchie
bin mir nicht sicher ob ich dein Problem verstehe.
in der Variablenansicht hast du 99 als fehlende Werte definiert?
oder fehlende werte als "gültige Kategorie" definiert,
d.h. (deine UVs sind Kategorial?)
die gehen dann in die analyse mit ein und du korrelierst mit der AV weil du wissen willst ob fehlend
oder nicht ein einfluß darauf hat?
oder du korrelierst die UV untereinander?
gruß
dutchie
-
- Beiträge: 2
- Registriert: 23.07.2018, 10:38
Re: Logistische Regression - Keine Angabe Werte signifikant?
@dutchi
Also meine unabhängigen Varaiblen sind kategorial. Und wir hatten es im Stuidum auch so gelernt, dass die fehlenden Werte mit als Kategorie aufgenommen werden (also habe ich diese z.B. als 4. Ausprägung einer Variable festgelegt). Normalerweise können die Zusammenhänge und Werte dieser Kategorie ja ignoriert werden. In der deskriptiven Statistik z.B. geht es ja dann nur darum zu zeigen, wie viele Werte fehlend waren. Bei meiner logistischen Regression bei der ich also untersuche ob z.B. die Bewertung der Studierbarkeit (gut, mittel, schlecht, keine Angabe) einen statistisch signifikanten Einfluss auf die Belastung hat. Ich erhalte also z.B. die Exp B Werte 0,38 bei gut und kann sagen, dass diese Gruppe ein niedrigeres Risiko hat mittel bis stark belastet zu sein als die Referenzkategorie ( schlecht). Dieser Zusammenhang ist auch hoch signifikant. Allerdings erhalte ich bei der Variable auch einen starken statistischen Zusammenhang bei der Kategorie "Keine Angabe", was ja irgendwie keinen Sinn ergibt...oder?
Ich hoffe, jetzt ist mein Problem etwas deutlicher?
Also meine unabhängigen Varaiblen sind kategorial. Und wir hatten es im Stuidum auch so gelernt, dass die fehlenden Werte mit als Kategorie aufgenommen werden (also habe ich diese z.B. als 4. Ausprägung einer Variable festgelegt). Normalerweise können die Zusammenhänge und Werte dieser Kategorie ja ignoriert werden. In der deskriptiven Statistik z.B. geht es ja dann nur darum zu zeigen, wie viele Werte fehlend waren. Bei meiner logistischen Regression bei der ich also untersuche ob z.B. die Bewertung der Studierbarkeit (gut, mittel, schlecht, keine Angabe) einen statistisch signifikanten Einfluss auf die Belastung hat. Ich erhalte also z.B. die Exp B Werte 0,38 bei gut und kann sagen, dass diese Gruppe ein niedrigeres Risiko hat mittel bis stark belastet zu sein als die Referenzkategorie ( schlecht). Dieser Zusammenhang ist auch hoch signifikant. Allerdings erhalte ich bei der Variable auch einen starken statistischen Zusammenhang bei der Kategorie "Keine Angabe", was ja irgendwie keinen Sinn ergibt...oder?
Ich hoffe, jetzt ist mein Problem etwas deutlicher?
-
- Beiträge: 2734
- Registriert: 01.02.2018, 10:45
Re: Logistische Regression - Keine Angabe Werte signifikant?
hallo
du testest den zusammenhang von keiner angabe mit deiner AV belastung (gemessen dichotom?
das ist doch wunderbar intervallskaliert messbar! das zu dichotomisieren ist doch falsch
du hast doch werte von 1 2 3 4...pro VP das ist intervallskaliert, dann hast du eine ANOVA.
Würde man bei der auch eine Kategorie "ohne angabe" hinzu tun?)
und warum macht das keinen Sinn? Die VP ohne Angabe bei der studienbewertung
unterscheiden sich in ihrer Belastung von den mit einer Angabe (so in der art, bin mir nicht sicher,
ob du die .38 richtig interpretierst!) bzw. von der referenzgruppe. Das lasst doch vermuten, das bei den VP
die Angabe nicht zufällig fehlt! du hast ja somit einen Zusammenhang zwischen misssings und AV!!
oder wird das sig weil n zu groß, und somit letztlich ein zusammenhang ohne substanz ist?
oder ist der Effekt vergleichbar mit den anderen.
gruß
dutchie
du testest den zusammenhang von keiner angabe mit deiner AV belastung (gemessen dichotom?
das ist doch wunderbar intervallskaliert messbar! das zu dichotomisieren ist doch falsch
du hast doch werte von 1 2 3 4...pro VP das ist intervallskaliert, dann hast du eine ANOVA.
Würde man bei der auch eine Kategorie "ohne angabe" hinzu tun?)
und warum macht das keinen Sinn? Die VP ohne Angabe bei der studienbewertung
unterscheiden sich in ihrer Belastung von den mit einer Angabe (so in der art, bin mir nicht sicher,
ob du die .38 richtig interpretierst!) bzw. von der referenzgruppe. Das lasst doch vermuten, das bei den VP
die Angabe nicht zufällig fehlt! du hast ja somit einen Zusammenhang zwischen misssings und AV!!
oder wird das sig weil n zu groß, und somit letztlich ein zusammenhang ohne substanz ist?
oder ist der Effekt vergleichbar mit den anderen.
gruß
dutchie