binäre logistische Regression

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
katjas2010
Beiträge: 10
Registriert: 25.03.2010, 20:16

binäre logistische Regression

Beitrag von katjas2010 »

Hallo!
Was bedeutet es denn, wenn beim Hosmer-Lemeshow-Test im Feld der Signifikanz nur ein Punkt und kein Wert angegeben ist?
Ab wann ist denn ein Modell brauchbar? Habe erklärte Varianzen von 28 bis 54%...
Kann man denn anhand der erklärten Varianzen Modelle mit unterschiedlichen Regressoren untereinander vergleichen? Also z.B. Modell A ist besser als Modell B, weil die erklärte varianz höher ist?
Silversurfer
Beiträge: 165
Registriert: 05.07.2009, 21:10

Beitrag von Silversurfer »

Die aufgeklärte Varianz würde ich nicht unbedingt als einziges Gütemaß bei einer logistischen Regression nehmen. Insbesondere weil das Pseudo-Maße sind, die nicht wirklich aufgeklärte Varianz im Sinne einer intervallskalierten Variable messen. Schau dir doch mal die Übereinstimmung der anhand deines Modells vorhergesagten Werte und der tatsächlichen Werte an. Das ist meist recht aufschlussreich.
katjas2010
Beiträge: 10
Registriert: 25.03.2010, 20:16

Beitrag von katjas2010 »

Vielen Dank für Deine Antwort!
Du meinst damit doch bestimmt die Klassifizierungstabelle:
Hab hier mal ein beispiel. Könnte man das z.B. so auswerten?:
"Die Ergebnisse der Klassifizierungstabelle zu den vorhergesagten und tatsächlichen Fällen einer Erkrankung lassen auf eine relativ gute Trennfähigkeit des Modells für die Variablen schließen. Die Fälle aus der Gruppe „keine keine Erkrankung“ wurden zu 60,3% und die Fälle mit einer Erkrankung zu 70,0 % richtig klassifiziert. Insgesamt wurden 65,4% aller Fälle von diesem Modell richtig eingeordnet. Für beide Gruppen war die Güte etwa gleich hoch."
Ist eine Vorhersage von 65% denn schon gut?
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

"Ist eine Vorhersage von 65% denn schon gut?"

Das kann man so allgemein nicht beantworten. Wenn beispielsweise 62% einer Stichprobe krank sind, würde man den Status "krank" für die gesamte Stichprobe
vorhersagen und hätte eine Trefferquote von eben 62%. Mit einem mehr oder minder aufwändigen Modell dann eine Verbesserung um 3% zu erzielen, wäre nicht
sehr beeindruckend. Ist das Verhältnis gesund/krank 50% zu 50%, dann erscheint eine Steigerung auf 65% hingegen schon als sehr ordentlich.
katjas2010
Beiträge: 10
Registriert: 25.03.2010, 20:16

Beitrag von katjas2010 »

Sorry, aber das versteh ich leider nicht ganz....
ich habe z.B. ein Modell mit 4 Risikofaktoren. Jeder einzeln betrachtet klassifiziert die Erkrankung zwischen 63 und 72% richtig. Gemeinsam sind es allerdings knapp über 72%. das ist doch eine gute Verbesserung und spricht für das gemeinsame Modell, oder?
katjas2010
Beiträge: 10
Registriert: 25.03.2010, 20:16

Beitrag von katjas2010 »

Hilft es Dir, wenn ich Dir sage, dass bei meinem "Krankheitsfall" 55,3% der Probanden erkrankt sind und der Rest nicht?
Danke für Deine Hilfe!
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Wie hoch die Trefferquote eines Modells ist, ist nur bedingt relevant. Man muss auch schauen, wie gut man ohne Modell vorhersagen würde. Wenn 90% krank sind und man sagt für jeden Fall "krank" vorher, hat man auch schon ohne eine Regression eine 90% Trefferquote.

Ob eine Steigerung von 55% Trefferquote auf 72% gut ist, dies zu beurteilen liegt bei Dir. Ob eine 72% Trefferquote gut ist, dies zu beurteilen liegt bei Dir.
katjas2010
Beiträge: 10
Registriert: 25.03.2010, 20:16

Beitrag von katjas2010 »

Ich hab gleich noch eine dringende Frage:

Ich habe in meinem Statistikbuch endlich eine Formel gefunden, mit der ich über den Umweg eines z-Wertes die Wahrscheinlichkeiten und Gruppenzugehörigkeiten für jeden Fall ausrechnen kann...allerdings ist das eine beispielformel und für meine "Methoden" brauch ich ja die "Rohform"... Kannst Du mir vielleicht sagen, wie die Formel heißt oder sogar, wie ich sie in variablenform schreiben kann?

z"tiefgstellt" i= 2,077 - (0,035 x Alter) + (0,204 x syst.RR) - (0,202 x diast.RR)

2,077=Regressionskoeffizient B der Konstante
-0,035= Regressionskoeffizient B des Prädiktors "Alter"
+0,204= Regressionskoeffizient B des Prädiktors "syst.RR"
-0,202= Regressionskoeffizient B des Prädiktors " diast.RR"

dann wird z "tiefgestellt" i in p eingesetzt: p=1/(1+e "hochgestellt" z i)....

Wie heißen denn nur die beiden Formeln und was ist "e"???

Danke!
katjas2010
Beiträge: 10
Registriert: 25.03.2010, 20:16

Beitrag von katjas2010 »

@Generalist: Was meinst Du denn damit, wenn Du sagst "ohne Modell vorhersagen"? Womit kann man denn noch vorhersagen? Raten? Sorry, aber ich hab doch keine Ahnung...
katjas2010
Beiträge: 10
Registriert: 25.03.2010, 20:16

Beitrag von katjas2010 »

Ahhhhhhhhhhhhhhhhh, hab grad gelesen, dass es für kategoriale Variablen eine leicht veränderte Gleichung (hier stand was von Logit-Gleichung??) gibt......ich hab doch einen Mix aus metrischen und kategorialen Variablen! Was nun?
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten