Ich habe ziemlich viele Ausreißer bei einer kleinen Stichprobe (29 Versuchspersonen), weshalb ich ungern alle Ausreißer löschen würde.
Zudem empfielt field (2009) die Ausreißer nicht zu löschen, sondern durch geeignete Werte zu ersetzen.
Hierfür macht er Vorschläge, die ich nicht verstehe bzw. mir für mein Problem nicht angemessen erscheinen.
1) Die Ausreißer durch den nächst höchsten Werte zu ersetzen und mit eins zu addieren
(Ich rechne mir Rohwerten und verschiedenen Messinstrumenten. Der Wert "eins" hat bei den verschiedenen Messinstrumenten einen unterschiedlichen Wert und ich denke, dann sind sie nicht mehr gut miteinander vergleichbar. Zudem habe ich teilweise auf einer Variablen mehrere Ausreißer, die hätten dann alle den gleichen Wert. Abgesehen davon, dass ich das schon komisch fänd wird dann wohl auch keine Normalverteilung zustande kommen
2) Bei der nächsten Option bin ich mir nichht sicher, ob ich sie richtig verstanden habe.
Nach meinen Englischkenntnissen. Soll ich 3 mal die Standardabweichung rechnen und zu dem Mittelwert addieren.
Aber: Dann bekomme ich doch von der Definition her einen Ausreißer? Und genau das ist auch passiert: der so errechnete
Wert ist größer als mein Ausreißer. Ich verstehe das nicht. Daher den Vorschlag von Field im Original:
Convert back from a z-score: A z-score of 3.29 constitutes an outlier (see Jane
Superbrain Box 4.1) so we can calculate what score would give rise to a z-score
of 3.29 (or perhaps 3) by rearranging the z-score equation in section 1.7.4, which
gives us X = (z × s) + X-. All this means is that we calculate the mean (X-) and
standard deviation (s) of the data; we know that z is 3 (or 3.29 if you want to be
exact) so we just add three times the standard deviation to the mean, and replace
our outliers with that score.
Kann mir das jemand erklären?
Ich wäre für jede Hilfe sehr dankbar!
Ausreißer (ersetzen)
-
- Beiträge: 2
- Registriert: 20.06.2014, 12:12
Re: Ausreißer (ersetzen)
paula1 hat geschrieben:Ich habe ziemlich viele Ausreißer bei einer kleinen Stichprobe (29 Versuchspersonen), weshalb ich ungern alle Ausreißer löschen würde.
Zudem empfielt field (2009) die Ausreißer nicht zu löschen, sondern durch geeignete Werte zu ersetzen.
Hierfür macht er Vorschläge, die ich nicht verstehe bzw. mir für mein Problem nicht angemessen erscheinen.
Hallo Paula1,
ich habe leider keine Antwort, aber praktisch ein ähnliches Problem, weshalb ich mich gerne an dieses Thema hängen möchte: ich habe auch eine kleine Stichprobe mit 30 Probanden, denen an Tag 1-7, 10, 14, 21 und 28 Blut abgenommen wurde. Aus diesem Material wurden an jedem Beobachtungszeitpunkt 5 Parameter bestimmt. Jetzt ist es leider so, dass das Testverfahren (ELISA) zum Beispiel einen Bereich von 10-1000 ng/ml für den einzelnen Parameter erfassen kann, wobei bei einigen Probanden nun z.B. 1000 angezeigt wird, obwohl die Ergebnisse real möglicherweise viel höher sind.
Auch ich will diese Werte aber ungern ausschließen, weiß aber auch nicht wie damit umzugehen ist... Vielleicht weiß ja jemand eine gute Lösung für dieses Problem...
Danke
Flo