Hallo zusammen,
ich hätte eine kleine Frage zu der Normalverteilung von Zahlenwerten.
Zu meinem konkreten Problem:
Wir haben einen Datensatz, der unter anderem das Unternehmensalter und die Mitarbeiterzahl enthält.
Diese sollten nun standardisiert werden, um mit Ihnen Regressionsanalysen durchführen zu können.
Unser Tutor hat nun verschiedene Dinge mit den Werten gemacht, die ich jedoch nicht so richtig nachvollziehen kann:
zunächst wurde eine gewöhnliche z-Standardisierung durchgeführt. Das ist weiter kein Problem und, wenn ich es richtig verstanden habe, schon ausreichend, um die Werte an die Normalverteilungskurve anzupassen.
Außerdem hat er sowohl eine Logarithmierung der normalen
Zahlenwerte, sowie eine Logarithmierung der z-standardisierten Werte durchgeführt. Während die Logarithmierung der normalen Werte noch problemlos funktioniert, habe ich bei der Logarithmierung der z-Werte Schwierigkeiten:
Da die z-Werte im Gegensatz zu den normalen Werten oftmals negativ sein können und die ln_Funktion nur bei Werten >0 funktioniert, erhalte ich nur wenige Resultate und viele Fehler. Jedoch weichen selbst die gültigen Resultate immens von den Ergebnissen des Tutors ab. Außerdem erhielt er bei jedem Wert ein Resultat und hatte somit keinerlei Probleme mit negativen Werten. Als ich jedoch versucht habe, die Logarithmierung mit dem Betrag der Werte durchzuführen, erhielt ich zwar mehr Resultate, diese sind jedoch nach wie vor falsch.
Hier meine verwendeten "Formeln":
variable_z = (variable-mean)/SD
ln_variable = ln(variable)
ln_variable_z = ln(variable_z)
Daher habe ich nun 2 Fragen:
- Wozu benötige ich den ln der normalen bzw. der z-standardisierten Werte?
- Wie kann ich den ln der z-standardisierten Werte berechnen?
Vielen Dank für eure Hilfe!
z-Werte logarithmieren?
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
wichtister Ansprechpartner kann eigentlich nur der Tutor sein. Hier würden man nur hypothetische Antworten geben können, etwa folgende:
Logarithmierung funktioniert bei einer Verschiebung der Werte (durch Addition).
Eventuelle Alternative: eine sog. Box-Cox-Transformation.
Zur Standardisierung reicht eigentlich eine z-Transformation.
Logarithmierung funktioniert bei einer Verschiebung der Werte (durch Addition).
Eventuelle Alternative: eine sog. Box-Cox-Transformation.
Zur Standardisierung reicht eigentlich eine z-Transformation.
drfg2008
-
- Beiträge: 1733
- Registriert: 11.03.2010, 22:28
Das hast Du falsch verstanden.zunächst wurde eine gewöhnliche z-Standardisierung durchgeführt. Das ist weiter kein Problem und, wenn ich es richtig verstanden habe, schon ausreichend, um die Werte an die Normalverteilungskurve anzupassen.
Die z-Standardisierung dient dazu, den Mittelwert auf den Wert 0 und die Stadardabweichung auf den Wert 1 zu setzen.
An der Verteilungsform der Werte ändert das überhaupt nichts.
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
... hier als Beispiel
Code: Alles auswählen
input program.
loop x =1 to 5*10**4 by 1.
end case.
end loop.
end file.
end input program.
EXECUTE.
COMPUTE ZVexponential=RV.EXP(10).
EXECUTE.
DESCRIPTIVES VARIABLES=ZVexponential
/SAVE
/STATISTICS=MEAN STDDEV MIN MAX.
GRAPH
/HISTOGRAM(NORMAL)=ZVexponential.
GRAPH
/HISTOGRAM(NORMAL)=ZZVexponential.
NPAR TESTS
/K-S(EXPONENTIAL)=ZVexponential ZZVexponential
/MISSING ANALYSIS.
drfg2008