multivariate Ausreißer vor der Multiplen Imputation?

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
Himbeere
Beiträge: 7
Registriert: 23.05.2019, 14:44

multivariate Ausreißer vor der Multiplen Imputation?

Beitrag von Himbeere »

Hallo,
da die multiple Imputation sensibel auf Ausreißer reagieren kann, habe ich die Analyse auf univariate Ausreißer vor der multiplen Imputation gemacht. Nun stellt sich die Frage, wie ich mit multivariaten Ausreißern vorgehe? Ich möchte mit den imputierten Daten nämlich eine multiple Regression rechnen. Sollten die Daten dann auch schon vor der multiplen Imputation auf multivariate Ausreißer überprüft werden oder erst nach der multiplen Imputation? Nachteil der Überprüfung vor der MI wäre ja, dass ich da noch einige fehlende Werte im Datenset habe, die Personen würde also in einer mlutiplen Regression (die ich für das Durchführen der Überprüfung auf Ausreißer dann noch mit den Originaldatensatz durchführen muss) ausgeschlossen werden.
Weiß jemand, was da das gängige und sinnvolle Vorgehen ist?
Danke!!!
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: multivariate Ausreißer vor der Multiplen Imputation?

Beitrag von dutchie »

hallo Himbeere

multivariaten ausreißer?
erstmal: man imputiert nicht wenn man nicht muß!
das bleibt ein fragwürdiger vorgang!...
kennst du --> propensity score ...

du hast fehlende werte, willst aber zusätzlich vorhandene, vermeindliche ausreißer eliminieren! :shock:

warum fehlen die fehlenden..? und..
was macht den ausreißer zum ausreißer (SD?) oder ist das die einzige VP mit Effekt?
wie konnte es überhaupt so weit kommen?...

Das klingt wie sehr schematisches dem inhalt der Arbeit nicht angepasstes Vorgehen!

also wenn: macht doch vor der MI Ausreißercheck und danach nochmal..
mit wievielen ausreißern rechnest du denn?

gruß
dutchie
Himbeere
Beiträge: 7
Registriert: 23.05.2019, 14:44

Re: multivariate Ausreißer vor der Multiplen Imputation?

Beitrag von Himbeere »

Hallo dutchi,
danke für deine Antwort!
propensity score kenne ich nicht.Was ich grob gerade dazu gelesen habe, geht es da um Therapie-Effekte, in meiner Arbeit geht es jedoch nicht darum einen Therapieeffekt zu untersuchen.
Die Multiple Imputation mache ich tatsächlich, weil sie aktuell empfohlen wird bei fehlenden Werten und weil ich sonst eben fehlende Werte drin habe, die das Ergebnis ja verändern, auch wenn es bei mir eh alles nicht signifikant wird - auch ohne Multiple Imputation nicht ;-) Aber so kann ich wenigstens mit allen VPs rechnen.
Der Ausreißer in meiner Stichprobe liegt sehr weit Abseits der anderen Werte, auch nach Transformation der Variablen liegt er immer noch > 4 Sd über dem Mittelwert und weit abseits der anderen Werte (alle < 2SD, meist < 1 SD). Hinzu kommt, dass von dieser Person wichtige Daten fehlen, die den gemessenen Wert verfälschen könnten und die zum Ausschluss führen würden, wenn sie positiv ausfallen würde. Daher habe ich beschlossen die Person auszuschließen. In anderen Variablen habe ich nur sehr wenige "Ausreißer", sie liegen knapp über > 3 SD, es handelt sich aber um plausible Werte, daher bleiben die Personen drin.
Bisher habe ich keine multivariaten Ausreißer gefunden, weder in den imputierten noch in den Daten mit fehlenden Werten. Ich hatte jetzt einfach beides geprüft. Da ich nichts zu dem Thema in der Fachliteratur gefunden habe, gehe ich mal davon aus, dass es hier kein absolutes richtig oder falsch geben wird, ob man nun vor der MI oder nach der MI die multivariaten Ausreißer prüft. Ich werde erstmal beides berichten.
Danke nochmal für deine Anregungen!
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: multivariate Ausreißer vor der Multiplen Imputation?

Beitrag von dutchie »

hallo Himbeere

das ist nicht gesagt, dass die fehlenden werte das ergebnis verändern, erstmal verkleinern sie nur die stichprobe..
die du durch imputation wieder erhöhst, um signifikante ergebnisse zu provozieren?

gruß
dutchie
Himbeere
Beiträge: 7
Registriert: 23.05.2019, 14:44

Re: multivariate Ausreißer vor der Multiplen Imputation?

Beitrag von Himbeere »

Hey dutchie,
mit "Ergebnis verändern" meinte ich, dass ich dann bei diesen Personen bei Erstellung einer Summenvariable über eine Skala z.B. einen niedrigeren Wert habe, weil sie nicht alle Items ausgefüllt haben und diese fehlenden Werte dann nicht mitgezählt werden können. Jetzt frage ich mich allerdings, ob ich das Vorgehen ändern sollte und in der Regression mit fehlenden Werten (die ich bisher nur gemacht habe, um multivariate Ausreißer vor der multiplen Imputation zu identifizieren) diese Personen dann lieber mit fehlender Summenvariable einfließen lasse. Kannst du mir da einen Tipp geben, was statistisch gesehen sinnvoller ist? Ich denke gerade es wäre wohl besser den Personen mit fehlenden Werten in der betreffenden SKala dann einen fehlenden Wert Summenwert dieser Skala zuzuweisen.
Danke!
Himbeere
Beiträge: 7
Registriert: 23.05.2019, 14:44

Re: multivariate Ausreißer vor der Multiplen Imputation?

Beitrag von Himbeere »

Ich habe jetzt etwas neues überlegt:
wenn ich in der multiplen Regression nur Prädiktor-Variablen verwende, die aus mehreren Items zusammengelegt sind (z.B. Summenwerte) macht es dann überhaupt Sinn die multivariaten Ausreißer anhand einer Regression vor der Multiplen Imputation (in die ja nur die ganzen Einzel-Items eingehen) zu überprüfen?
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: multivariate Ausreißer vor der Multiplen Imputation?

Beitrag von dutchie »

hallo Himbeere

wenn items fehlen:
wenn du statt der Summe der Items den Mittelwert nimmst,
und diesen (falls einen Summe verlangt ist) dann mit der ursrünglichan vollständigen Itemzahl
multiplizierst, hast du wieder eine summe, du kannst aber auch den Mittelwert der Items selbst nehmen, dann hat die VP nur weniger items...
aber einen vergleichbaren gesamtscore,
praktisch heißt das, dass der fehlende Itemwert durch den Mittelwert der übrigen items ersetzt wird..das ist am einfachsten
(aber natürlich auch problematisch....wie alles)
In machen Testmanualen steht, wie man praktisch mit fehlenden werten um gehen soll..z.B. bei 6 Items müssen mindestens drei gegeben sein
um einen score zu berechnen...das ist aber eher einzelfallanalytisch orientiert, wenn du nur ein Item hast von sechs, nimmst du das!
wenn du eine Summe willst, dann dieses item mal sechs rechnen..

wenn du multivariate ausreißer suchst, dann über die Gesamtscores, Summenwerte nicht über die Items, und dabei den
Inhalt der scale berüchsichtigen! wie machst du das Mahalanobis?
such doch erst mal univariate Ausreißer...aber oft ist der ausreißer der, der den Effekt trägt! also nicht unbedingt eliminieren!!


du willst multiple imputieren ..dann hast du auch multiple Ergebnisse ?! vielleicht zuviel aufwand!
Imputieren wenn dann nur gesamtscores,
bevor du Imputierst musst du dir klar machen warum der wert fehlt!...missing at random...usw....
also:
1. soviel scores wie möglich berechnen...
2. mit den scores ausreißer bestimmen...aber nicht zwangsläufig eliminieren!
3. notfalls imputieren...aber nur wenn wichtig, wenn der betreuer sagt, egal!... dann nicht!!!

aber aber...wenn du z.B. online befragung hast.. kann es gut sein das 50% abbrechen, weil es ihnen zu lange dauert, zu blöd wird...
willst du die alle imputieren ? nein ! du musst versuchen mit besserer methode die 50 % zu reduzieren!
außerdem hängen fehlende wert und ausreißer oft zusammen, wenn z.B. einer in die stichprobe gerutscht ist der da nicht reingehört..
Population bedenken...

so weit so gut
gruß
dutchie
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten