F-Wert & Signifikanz nach Regression imputierter Daten

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
Himbeere
Beiträge: 7
Registriert: 23.05.2019, 14:44

F-Wert & Signifikanz nach Regression imputierter Daten

Beitrag von Himbeere »

Hallo,
da SPSS mir bei einer multiplen Regression (nach multilper Imputation; 20 Datensätze) in der Tabelle "ANOVA" keinen F-Wert und kein p ausspuckt (es werden nur die F-Werte der einzelnen imputierten Datensets, aber kein kombinierter/gepoolter F-Wert angegeben), habe ich nun überlegt, wie ich F und p für die kombinierten Daten ermittele.
Leider finde ich nichts dazu (außer, dass das mit dem Programm R ginge, leider schaffe ich es nicht mehr mich da einzuarbeiten).
Möglichkeiten wären nun:
Einfach den Mittelwert der F-Werte und der p-Werte der einzelnen imputierten Datensets berechnen.
Oder: Den F-Wert anhand der Formel F = R² / 1-R² zu berechnen. Das gepoolte R² habe ich anhand der Vorgehensweise von Enders (2010) und Harel (2009) berechnet.
Frage an alle, die sich damit auskennen? Wäre das mit der oben angegebenen Formel logisch? Wäre der einfache Mittelwert auch ok?
Wenn ich den F-Wert ermittelt habe, wie bestimme ich die Freiheitsgrade? Sind das die gleichen, wie für die einzelnen imputierten Datensätze?
Ich bin super dankbar, falls jemand sich damit auskennt und mir antwortet - habe schon das Netz abgesucht und keine Formel gefunden.
Ideen zum poolen vom p des F-Wertes?
Vielen Dank!!!
dutchie
Beiträge: 2739
Registriert: 01.02.2018, 10:45

Re: F-Wert & Signifikanz nach Regression imputierter Daten

Beitrag von dutchie »

hallo Himbeere

kann nicht behaupten, dass ich mich damit auskenne, ich kenne aberauch keinen der das tut!
wenn man im Netz nichts findet, ist das schon verdächtig, oder?

multiplen Imputation,d.h. dass man jetzt nicht
mehr weiß wie man entscheiden soll, und das multiple wieder durch pooling
rüchgängig machen will, um zur gewohnten
automatisierten Entscheidnungsregel zu kommen.
wenn p, dann mach ich dies und das...

ich würde gar nicht poolen!!!
du hast 20 mal imputiert, (bisschen viel)!
wieviele davon sind signifikant?
Es geht ja darum abzuschätzen, ob die fehlenden Werte einen Einfluss
auf die Entscheidung haben!!!
wenn 20 mal p<.05 haben sie keinen Einfluss..entscheidung klar- und fertig!
und für die Effektstärke gibst du eine Verteilung an, mit Mittelwert ( wie auch immer der berechnet wird)

d.h. auch man braucht jetzt ein doppeltes p, eines für jedes F und eines für den Umgang mit der Multiplen Imputation..
wenn 10 so 10 so, dann ist das zufall! und ich würde mir aufgrund der fehlenden Werte keine Aussage zutrauen
und die daten wegschmeißen!!!! wegen zu großer Löcher! oder selbst selektion! oder...!
solange man nicht genau weiß, warum die Werte fehlen ist
Imputation immer ein Problem!!!
also warum fehlen die Werte?

gruß
dutchie
erdbeere
Beiträge: 2
Registriert: 07.06.2024, 10:38

Re: F-Wert & Signifikanz nach Regression imputierter Daten

Beitrag von erdbeere »

Hallo Himbeere,

ich stehe gerade vor dem gleichen Problem und wollte dich daher frage, ob du eine Lösung für das Problem gefunden hast?

Liebe Grüße

Erdbeere
dutchie
Beiträge: 2739
Registriert: 01.02.2018, 10:45

Re: F-Wert & Signifikanz nach Regression imputierter Daten

Beitrag von dutchie »

Hallo an alle

warum F poolen!?

Es langt völlig sich die Verteilung von F anzusschaun!!!

Der Wunsch der hinter "poolen" steht, ist der, dass die Statistik dem Versuchleiter das Entscheiden abnehmen soll!
Das macht die Statistik aber nicht! ..und ist auch gefährlich!

gruß
dutchie
erdbeere
Beiträge: 2
Registriert: 07.06.2024, 10:38

Re: F-Wert & Signifikanz nach Regression imputierter Daten

Beitrag von erdbeere »

Hallo dutchie,

vielen Dank für deine Antwort. Da ich in meiner Arbeit den p-Wert der ANOVA Tabelle berichten muss, würde ich ihn gerne poolen. Würdest du mir in diesem Fall raten, sich also die ganzen p-Werte der verschiedenen Imputation anzuschauen und basierend darauf eine Entscheidung zu treffen?

Gruß

Erdbeere
dutchie
Beiträge: 2739
Registriert: 01.02.2018, 10:45

Re: F-Wert & Signifikanz nach Regression imputierter Daten

Beitrag von dutchie »

Ja!

und wenn es 50:50 ist, das ein Problem und wenn es 51:49 ist, ist das auch ein Problem
gepoolt wäre das aber signifikant.

Also 50% mit p<.05 und 50% mit p>.05.

An der Streuung der F Werte und der Streuung der p Werte, erkennt man den Einfluß
der "Zufälligkeit" bei der Imputation. Durch poolen würde diese Erkenntnis zerstört.

Eigentlich sollen F und p Werte nach multipler Imputation konstant sein!
Wenn sie konstant sind macht poolen keinen Sinn.

Zudem würde das poolen von p - werten einen neuen Sig Test benötigen, dahingehend
ob der gepoolte Wert sig ist, usw..usw..

Zum einlesen in diese Problematik:
https://www.uni-trier.de/fileadmin/urt/doku/bfw/bfw.pdf

gruß
dutchie
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten