Halle alle zusammen!
Ich habe eine dringende Frage: Weiß jemand auf Grund welcher Kriterien man am sinnvollsten Altersgruppen und auch Gruppen generell einteilt?
Natürlich könnte man einen Median-Split machen, aber das ist nicht immer passend. In meinem Fall ist die Verteilung des Alters so, dass ich viele Leute um die 30 und etwas weniger Leute um die 50 habe, so dass bei Trennung in zwei Gruppen, die Variabele pro Gruppe normal verteilt wäre.
Ein Mediansplit würde hier aber zu einer Teilung bei ungefähr 30 führen (weil es davon ja am meisten gibt). Auch eine Einteilung über die Quartile macht nicht immer Sinn.
Ich könnte mir auch überlegen, die Teilung einfach bei 40 anzusetzten, weil es keine Leute in dem Alter gibt. Aber ist das ein gutes Kriterium? Und wie ist das für Variablen, wo die Verteilung nicht so zwei eindeutige Spitzen hat?
Ich würde z.B. meine Variable Identifikation in drei Teile teilen.
Wäre toll, wenn mir jemand was dazu sagen könnte!
Vielen Dank schonmal!
Anna