Hallo,
Ich habe bei meinem Versuch das Alter (3-23) in gruppen eingeteilt, weil es so schön gleichmäßig ist hab ich immer 5 Jahre in eine gruppe gepackt (außer in der der4.da ists eins mehr), also
1=3-7
2=8-12
3=13-17
4=18-23
da das alter aber nicht normalverteilt ist (wär ja auch zu einfach)sondern sehr rechstscheif, sagt mein Prof so geht das nicht, sagt mir aber leider nicht wie es geht.
und in den schlauen büchern steht nix!
gibt es dafür irgendeine regel? muss man dann irgendwie nach Anzahl der Fälle in den einzelnen Altersstufen oder so gruppieren?
danke schon mal für die Hilfe,
MIezekatze
gruppierung bei rechstschiefer verteilung
-
- Beiträge: 31
- Registriert: 22.04.2010, 12:37
-
- Beiträge: 939
- Registriert: 13.05.2008, 10:52
für mich ist es unerheblich, ob das alter in kategorien nicht der normalverteilung entspricht. da es in dieser form eigentlich ordinal skaliert ist, sollte man sowieso auf nonparametrische verfahren ausweichen. die frage ist sowieso: warum das alter auf ein niedrigeres skalenniveau bringen?! das verursacht informationsverlust.
-
- Beiträge: 31
- Registriert: 22.04.2010, 12:37
hallo karinj,
ich hab es in gruppen eingeteilt um zu sehen wie es mit den anderen variablen zusammen verteilt ist, ohne dabei eine tabelle von 50 seiten zu bekommen.
Mein eigentliches problem ist, dass ich eine gleichung mit 4 variablen von nominal bis intervallskaliert habe und eine kovariate, die ich alle gerne in eine multiple lineare regression stecken möchte, dass darf ich aber anscheinend nur wenn die untereinander gleichmäßig verteilt sind, was sie anscheinend nicht sind.
ich habe mittlerweile 5 bücher mehrere statistik skripts und das internet vor mir und das gefühl ich weiß mit jedem klick weniger was ich hier eigentlich tue.
vielleicht hast du ja nen kleinen tip?
vielen dank für die antwort
miezekatze
ich hab es in gruppen eingeteilt um zu sehen wie es mit den anderen variablen zusammen verteilt ist, ohne dabei eine tabelle von 50 seiten zu bekommen.
Mein eigentliches problem ist, dass ich eine gleichung mit 4 variablen von nominal bis intervallskaliert habe und eine kovariate, die ich alle gerne in eine multiple lineare regression stecken möchte, dass darf ich aber anscheinend nur wenn die untereinander gleichmäßig verteilt sind, was sie anscheinend nicht sind.
ich habe mittlerweile 5 bücher mehrere statistik skripts und das internet vor mir und das gefühl ich weiß mit jedem klick weniger was ich hier eigentlich tue.
vielleicht hast du ja nen kleinen tip?
vielen dank für die antwort
miezekatze