binäre logistische Regression

Beitrag von **katjas2010** » 25.03.2010, 20:21

Hallo!
Was bedeutet es denn, wenn beim Hosmer-Lemeshow-Test im Feld der Signifikanz nur ein Punkt und kein Wert angegeben ist?
Ab wann ist denn ein Modell brauchbar? Habe erklärte Varianzen von 28 bis 54%...
Kann man denn anhand der erklärten Varianzen Modelle mit unterschiedlichen Regressoren untereinander vergleichen? Also z.B. Modell A ist besser als Modell B, weil die erklärte varianz höher ist?

Beitrag von **Silversurfer** » 26.03.2010, 16:48

Die aufgeklärte Varianz würde ich nicht unbedingt als einziges Gütemaß bei einer logistischen Regression nehmen. Insbesondere weil das Pseudo-Maße sind, die nicht wirklich aufgeklärte Varianz im Sinne einer intervallskalierten Variable messen. Schau dir doch mal die Übereinstimmung der anhand deines Modells vorhergesagten Werte und der tatsächlichen Werte an. Das ist meist recht aufschlussreich.

Beitrag von **katjas2010** » 28.03.2010, 20:49

Vielen Dank für Deine Antwort!
Du meinst damit doch bestimmt die Klassifizierungstabelle:
Hab hier mal ein beispiel. Könnte man das z.B. so auswerten?:
"Die Ergebnisse der Klassifizierungstabelle zu den vorhergesagten und tatsächlichen Fällen einer Erkrankung lassen auf eine relativ gute Trennfähigkeit des Modells für die Variablen schließen. Die Fälle aus der Gruppe „keine keine Erkrankung“ wurden zu 60,3% und die Fälle mit einer Erkrankung zu 70,0 % richtig klassifiziert. Insgesamt wurden 65,4% aller Fälle von diesem Modell richtig eingeordnet. Für beide Gruppen war die Güte etwa gleich hoch."
Ist eine Vorhersage von 65% denn schon gut?

Beitrag von **Generalist** » 29.03.2010, 12:12

"Ist eine Vorhersage von 65% denn schon gut?"

Das kann man so allgemein nicht beantworten. Wenn beispielsweise 62% einer Stichprobe krank sind, würde man den Status "krank" für die gesamte Stichprobe
vorhersagen und hätte eine Trefferquote von eben 62%. Mit einem mehr oder minder aufwändigen Modell dann eine Verbesserung um 3% zu erzielen, wäre nicht
sehr beeindruckend. Ist das Verhältnis gesund/krank 50% zu 50%, dann erscheint eine Steigerung auf 65% hingegen schon als sehr ordentlich.

Beitrag von **katjas2010** » 31.03.2010, 21:23

Sorry, aber das versteh ich leider nicht ganz....
ich habe z.B. ein Modell mit 4 Risikofaktoren. Jeder einzeln betrachtet klassifiziert die Erkrankung zwischen 63 und 72% richtig. Gemeinsam sind es allerdings knapp über 72%. das ist doch eine gute Verbesserung und spricht für das gemeinsame Modell, oder?

Beitrag von **katjas2010** » 31.03.2010, 21:26

Hilft es Dir, wenn ich Dir sage, dass bei meinem "Krankheitsfall" 55,3% der Probanden erkrankt sind und der Rest nicht?
Danke für Deine Hilfe!

Beitrag von **Generalist** » 01.04.2010, 09:38

Wie hoch die Trefferquote eines Modells ist, ist nur bedingt relevant. Man muss auch schauen, wie gut man ohne Modell vorhersagen würde. Wenn 90% krank sind und man sagt für jeden Fall "krank" vorher, hat man auch schon ohne eine Regression eine 90% Trefferquote.

Ob eine Steigerung von 55% Trefferquote auf 72% gut ist, dies zu beurteilen liegt bei Dir. Ob eine 72% Trefferquote gut ist, dies zu beurteilen liegt bei Dir.

Beitrag von **katjas2010** » 05.04.2010, 21:11

Ich hab gleich noch eine dringende Frage:

Ich habe in meinem Statistikbuch endlich eine Formel gefunden, mit der ich über den Umweg eines z-Wertes die Wahrscheinlichkeiten und Gruppenzugehörigkeiten für jeden Fall ausrechnen kann...allerdings ist das eine beispielformel und für meine "Methoden" brauch ich ja die "Rohform"... Kannst Du mir vielleicht sagen, wie die Formel heißt oder sogar, wie ich sie in variablenform schreiben kann?

z"tiefgstellt" i= 2,077 - (0,035 x Alter) + (0,204 x syst.RR) - (0,202 x diast.RR)

2,077=Regressionskoeffizient B der Konstante
-0,035= Regressionskoeffizient B des Prädiktors "Alter"
+0,204= Regressionskoeffizient B des Prädiktors "syst.RR"
-0,202= Regressionskoeffizient B des Prädiktors " diast.RR"

dann wird z "tiefgestellt" i in p eingesetzt: p=1/(1+e "hochgestellt" z i)....

Wie heißen denn nur die beiden Formeln und was ist "e"???

Danke!

Beitrag von **katjas2010** » 05.04.2010, 21:14

@Generalist: Was meinst Du denn damit, wenn Du sagst "ohne Modell vorhersagen"? Womit kann man denn noch vorhersagen? Raten? Sorry, aber ich hab doch keine Ahnung...

Beitrag von **katjas2010** » 05.04.2010, 22:03

Ahhhhhhhhhhhhhhhhh, hab grad gelesen, dass es für kategoriale Variablen eine leicht veränderte Gleichung (hier stand was von Logit-Gleichung??) gibt......ich hab doch einen Mix aus metrischen und kategorialen Variablen! Was nun?