Hallo zusammen,
ich habe folgendes Problem. Ich habe einen Datensatz mit 423 Fällen (es handelt sich um Gebäude). Für die Fälle liegen Heizenergiekennwerte vor. Leider sind einige Kennwerte unplausibel hoch bzw. niedrig. Bei einigen Fällen kenne ich die Gründe für diese Ausreißer (z.B. defekte Zähler) bei anderen jedoch nicht. Wie gehe ich also mit diesen Ausreißern um? In meinen Augen gibt es zwei Möglichkeiten:
a) versuchen die Extremwerte zu eliminieren. Ich habe versucht die Ausreißer nach der DEfinition in den Boxplots (1,5fache des Quartilabstandes) zu bestimmen. Damit kann ich aber leider nur die zu hohen Werte halbwegs plausibel herausfiltern nicht jedoch die zu niedrigen Werte. Das Problem dabei besteht auch darin, dass ich ggf. reale Werte unberücksichtigt lasse. Also habe ich folgendes versucht
b) für meine Auswertung brauche ich die Mittelwerte der Kennwerte für einzelne Gebäudetypen (Schulgebäude, Verwaltungsgebäude etc.). Also habe ich überlegt nicht das arithmetische Mittel zu verwenden, sondern gewichtete Mittelwerte - also M-Schätzer. Dann laufe ich zumindest nicht Gefahr versehentlich reale Werte zu löschen, oder?
Könnt ihr mir eine Empfehlung geben, welchen M-Schätzer (SPSS gibt 4 Stück aus) man in diesem Fall am besten nutzen kann? Ich will die Mittelwerte dann mit dem arth. Mittelwert des Bundesdurchschnittskennwertes vergleichen. Kann man aber einen M-Schätzer Mittelwert mit einem arith. Mittelwert vergleichen? Oder ist vielleicht die Verwendung des Medians plausibler???
Ich hoffe, ihr könnt mir bei der einen oder anderen Frage weiterhelfen.
Vielen Dank
Steven
arith. Mittelwert - Alternativen M-Schätzer, Median
-
- Beiträge: 5
- Registriert: 08.09.2009, 11:25