Guten Tag! Ich erstelle gerade Boxplots von meinen Daten und mir ist unklar, wie das Programm die Ausschlussfälle bestimmt. Leider kriege ich das hier in Textform nur schlecht dargestellt:
Fälle
Gültig Fehlend Gesamt
N Prozent N Prozent N Prozent
Abh.Var. x < 25,28 51 82,3% 11 17,7% 62 100,0%
25,29 < x < 27,47 57 91,9% 5 8,1% 62 100,0%
27,48 < x < 30,86 58 95,1% 3 4,9% 61 100,0%
30,87 < x 61 98,4% 1 1,6% 62 100,0%
Es handelt sich hierbei um eine ganz normale Boxplot-Erstellung:
Analysieren --> deskriptive Statistik --> explorative Datenanalyse
Die Einstellungen habe ich alle so gelassen wie sie waren.
Meine Frage ist nun: Wo kommen die insgesamt 20 Ausschlussfälle her? Insgesamt befinden sich in der Spalte der unabhängingen Variable 14 (!) fehlende Werte. Kann mir vielleicht einer von euch helfen, das zu verstehen bzw. erklären wie das Programm die Ausschlussfälle bestimmt? Vielen Dank schon im Voraus!
Fallausschluss bei Boxplots --> dringende Frage
-
- Beiträge: 3
- Registriert: 12.09.2007, 14:47
-
- Beiträge: 15
- Registriert: 03.11.2006, 10:21
Hallo,
so ganz versteh ich leider auch nicht was du mit Ausschlussfällen meinst.
Aber vielleicht hilft dir ja folgende Erklärung weiter:
Ein Boxplot beschreibt die Verteilung der Werte. Es stellt die Quartile,
extreme Werte und Ausreißer sowie den größten und den kleinsten nicht xtremen Wert dar. Extrem große Werte bzw. Ausreißer nach oben sind dadurch gekennzeichnet, daß ihr Abstand zum 75%-Perzentil größer ist als das 1,5fache des Abstands zwischen dem 75%- und dem 25%-Perzentil. Extrem kleine Werte bzw. Ausreißer werden entsprechend an ihrem Abstand zum 25%-Perzentil gemessen.
Ausreißer: Ausreißer sind Werte, deren Abstand vom 25%-Perzentil nach unten bzw. vom 75%-Perzentil nach oben zwischen dem 1,5fachen und dem 3fachen der Boxhöhe liegt. Die Boxhöhe gibt den Abstand zwischen dem 25%- und dem 75%-Perzentil wieder.
Extremwerte: Der Abstand extremer Werte von dem 25%- oder dem 75%- Perzentil beträgt mehr als das Dreifache der Boxhöhe.
so ganz versteh ich leider auch nicht was du mit Ausschlussfällen meinst.
Aber vielleicht hilft dir ja folgende Erklärung weiter:
Ein Boxplot beschreibt die Verteilung der Werte. Es stellt die Quartile,
extreme Werte und Ausreißer sowie den größten und den kleinsten nicht xtremen Wert dar. Extrem große Werte bzw. Ausreißer nach oben sind dadurch gekennzeichnet, daß ihr Abstand zum 75%-Perzentil größer ist als das 1,5fache des Abstands zwischen dem 75%- und dem 25%-Perzentil. Extrem kleine Werte bzw. Ausreißer werden entsprechend an ihrem Abstand zum 25%-Perzentil gemessen.
Ausreißer: Ausreißer sind Werte, deren Abstand vom 25%-Perzentil nach unten bzw. vom 75%-Perzentil nach oben zwischen dem 1,5fachen und dem 3fachen der Boxhöhe liegt. Die Boxhöhe gibt den Abstand zwischen dem 25%- und dem 75%-Perzentil wieder.
Extremwerte: Der Abstand extremer Werte von dem 25%- oder dem 75%- Perzentil beträgt mehr als das Dreifache der Boxhöhe.
-
- Beiträge: 3
- Registriert: 12.09.2007, 14:47
Tut mir leid, wenn ich mich ungenau ausgedrückt habe. Ich meine die Fälle, die in der Ausgabe als "Fehlend" angezeigt werden (siehe mein Versuch, die Ausgabe darzustellen). Das Programm zeigt hier 11 + 5 + 3 + 1 = 20 Fehlende Fälle an. Ich habe in der Zwischenzeit nochmal genau nachgeschaut. In der Spalte der unabhängingen Variable befanden sich nur 14 Fälle, die fehlten. Daher war ich verwirrt. Ich kam erst später darauf, dass ja auch die Fälle als fehlend angesehen werden, die in der abhängigen Variable fehlen. Das Problem hat sich also geklärt. Ich dachte, SPSS würde hier noch irgendwas rumrechnen. Tut es aber nicht.
Nebenbei noch eine andere Frage: SPSS scheint nicht damit zurecht zukommen, wenn ich beim Boxplot erstellen statt einer unabhängigen Variable eine Vielzahl von Variablen eingebe (z.B. 20). Es zeigt dann immer irgendwelche Fehler und viele der oben beschriebenen fehlenden Fälle. Wenn ich die SELBEN unabhängigen Variablen dann einzeln zum Boxplot verarbeite, arbeitet das Programm einwandfrei. Kennt ihr das Problem? Was kann ich dagegen tun? Es ist anstrengend, von jeder Variable einen neuen Boxplot (einzeln) machen zu müssen.
Vielen Dank übrigens nochmal für eure Antworten!
Nebenbei noch eine andere Frage: SPSS scheint nicht damit zurecht zukommen, wenn ich beim Boxplot erstellen statt einer unabhängigen Variable eine Vielzahl von Variablen eingebe (z.B. 20). Es zeigt dann immer irgendwelche Fehler und viele der oben beschriebenen fehlenden Fälle. Wenn ich die SELBEN unabhängigen Variablen dann einzeln zum Boxplot verarbeite, arbeitet das Programm einwandfrei. Kennt ihr das Problem? Was kann ich dagegen tun? Es ist anstrengend, von jeder Variable einen neuen Boxplot (einzeln) machen zu müssen.
Vielen Dank übrigens nochmal für eure Antworten!