lineare oder logistische Regression??

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
ahnungslos
Beiträge: 32
Registriert: 14.09.2007, 09:29

lineare oder logistische Regression??

Beitrag von ahnungslos »

Hallo zusammen!

Ich bin grad ein wenig verzweifelt, weil ich nicht weiß, mit welcher Regression ich rechnen muss. Eigentlich rechnet man ja eine logistische Regression bei dichotomen Variablen, oder?

Ich möchte als aV eine Variable benutzen, die die Ausprägungen ja, nein und weiß nicht besitzt. Die weiß nicht-Antworten sollen ausgeschlossen werden, so dass nur ja/nein übrig bleibt. Zählt das jetzt als dichotome Variable oder nicht?? Denn ich habs mal als logistische Regression versucht, das klappt nicht. Als lineare kommt schon was raus. Aber ich weiß nicht, ob das richtig ist... Bin total verzweifelt und wäre furchtbar dankbar, wenn mir irgendjemand helfen könnte :cry:

Übrigens ergibt die Koeffizienten-Matrix diesen Output (verkürzt):

Modell Signifikanz
Konstante ,000
uV1 ,486
uV2 ,000
uV3 ,824
uV4 ,569

(leider kann ich kein HTML, darum stellt Euch vor, dass die Zahlen unter Signifikanz stehen :) )

Heißt das, dass nur die uV2 signifikant ist??? Bei diesen Outputs ist leider die Signifikanz nicht so schön mit Sternchen gekennzeichnet, oder kann man das irgendwo einstellen?

Vielen, vielen Dank für Eure Hilfe, ich bin echt am Verzweifeln...

LG
diklo
Beiträge: 9
Registriert: 13.09.2007, 21:48

Beitrag von diklo »

Hallo ahnungslos.

Bin leider kein spss+statistik experte, werde mich aber dennoch an die beantwortung deiner fragen wagen.

Bei av mit einer dichotomen ausprägung verwendet man grundsätzlich nicht die lineare reg.

Daher liegst du mit der log. Reg auch richtig. Damit kannst du betrachten, um wie viel die uv die wahrscheinlichkeit erhöht, dass die av die ausprägung ja/nein aufzeigt.

Würde daher auch die weiß nicht – ausschließen. Habe es bisher immer so gemacht. Da, diese kategorie im fragebogen nur gestellt werden soll, damit der befragte nicht irgendetwas bzw. gar nichts ankreuzt. Bitte korrigiert mich wenn ich falsch liege.

Hoffe ich konnte dir ein wenig helfen.

P.s. schau mal in das Buch „Datenanalyse mit Stata“ von Kohler, Kreuter. Hat mir damals viel geholfen, da die logik der log. Reg gut erklärt wird.

Viel erfolg :)

Lg
ahnungslos
Beiträge: 32
Registriert: 14.09.2007, 09:29

Beitrag von ahnungslos »

Hallo diklo!

Vielen Dank für Deine Antwort! :D

Ich hab mir ja auch schon gedacht, dass ich da eine logistische Regression rechnen muss, aber irgendwie kommt da nicht wirklich was raus... :(

Ich krieg immer diese Antwort:

Warnungen
Die abhängige Variable besitzt nur einen gültigen Wert in einem Modell mit einem konstanten Term. Es wird keine Modellanpassung durchgeführt. Ein bedingtes logistisches Regressionsmodell kann angepaßt werden, wenn der konstante Term entfernt wird.
Dieser Befehl wird nicht ausgeführt.

Aber bei ner linearen Regression kommt was raus... Aaaaarghhhhh!! Irgendeine Ahnung, was das heißt?

Ich werd aber mal einen Blick in den Kohler/Kreuter werfen.

Danke jedenfalls schon mal!!!!!!

LG
diklo
Beiträge: 9
Registriert: 13.09.2007, 21:48

Beitrag von diklo »

...

hast du die av auch in 0 1 kodiert?
ahnungslos
Beiträge: 32
Registriert: 14.09.2007, 09:29

Beitrag von ahnungslos »

Die Warnung hat sich erledigt, das lag daran, dass ich die gefilterte Variable als aV benutzt hab, habe dann aber festgestellt, dass SPSS die weiß nicht-Antworten von alleine rauswirft... Mit dem Output kann ich zwar immer noch nicht viel anfangen, aber zumindest hab ich jetzt eins :D Werde das mal nachlesen.

Ist eigentlich für die logistische Regression wichtig, ob die Variablen normalverteilt sind? Sind sie nämlich leider nicht :(

Vielen Dank auf jeden Fall und viel Erfolg bei Deinem Problem, ich kann Dir leider nicht behilflich sein :cry:

LG
diklo
Beiträge: 9
Registriert: 13.09.2007, 21:48

Beitrag von diklo »

...ja super! frait mi.


das mit der interpretation kannst echt super in dem buch nachlesen. die unterscheidet sich nicht wesentlich von der der linearen.
...mit der erhöhung einer X-variable um eine Einheit steigen die vorhergesagten werte - die logarithmierten Chancen- um b einheiten...S.260. Kohler (2001).

die annahmen sind eigentlich auch sehr ähnlich wie bei der linearen, wobei, eine hohe fallzahl, so weit ich weiß, (vorsicht bin kein experte) die normalverteilung relativiert.

lg

p.s. dank, für das bemühen bzgl. meines problems. hoffe es wird sich schon jemand meiner annehmen. :)
Jack Crow
Beiträge: 146
Registriert: 14.12.2006, 18:41

Beitrag von Jack Crow »

Das schöne ist ja an der log.Reg. daß sie insgesamt sehr wenige Vorausssetzungen hat, zu denen Normalverteilung nicht gehört ;).
Zu den gegebenen Informationen ist noch hinzuzufügen daß bei dr log.Reg. auch die unabhängige Variablen kategorial sein können - SPSS gibt dann die Steigerung der Wahrscheinlichkeit für AV=1 für jede Kategorie im Verhältnis zu einer Referenzkategorie (normalerweise UV=0) aus.
"Life is 10% effort and 90% lucky timing"
Scott Adams
ahnungslos
Beiträge: 32
Registriert: 14.09.2007, 09:29

Beitrag von ahnungslos »

SPSS hat bei mir leider 1 und 0 vertauscht, ja ist 0 und 1 ist nein, aber mich interessiert ja die Veränderung im positiven Fall. Kann ich das durch einfaches Umkodieren der aV vorher erreichen oder geht das irgendwie anders???
Das schöne ist ja an der log.Reg. daß sie insgesamt sehr wenige Vorausssetzungen hat, zu denen Normalverteilung nicht gehört .
Na Gott sei Dank!!! :D

Kann man eigentlich auch bei logistischer Regression mit SPSS irgendwie eine Pfadanalyse rechnen? Weiß jemand, wie man das macht? Danke nochmal :)
Jack Crow
Beiträge: 146
Registriert: 14.12.2006, 18:41

Beitrag von Jack Crow »

ahnungslos hat geschrieben:SPSS hat bei mir leider 1 und 0 vertauscht, ja ist 0 und 1 ist nein, aber mich interessiert ja die Veränderung im positiven Fall. Kann ich das durch einfaches Umkodieren der aV vorher erreichen oder geht das irgendwie anders???
Die Umkodierung ist sicher das einfachste, es sei denn du brauchst die ursprüngliche Codierung noch für irgendwas anderes. Aber selbst dann ist das ja eine Sache von einer RECODE-Zeile.
Was meinst du mit Pfadanalyse?
"Life is 10% effort and 90% lucky timing"
Scott Adams
ahnungslos
Beiträge: 32
Registriert: 14.09.2007, 09:29

Beitrag von ahnungslos »

Das mit dem Umkodieren hat leider nicht geklappt. Vorher stand da
ursprünglicher Wert: ja
interner Wert: 0

Jetzt steht da:
ursprünglicher Wert: ,00
interner Wert: 0

Was hab ich falsch gemacht? Denn wenigstens das Rekodieren hat BIS JETZT eigentlich immer geklappt... :(


Mit Pfadanalyse meine ich, dass ich ein großes Modell habe mit einer zentralen aV und vielen uVs, die z.T. über andere uVs wirken.

Was ich meine: uv1->aV<-uV2<-uV3

Hmmm, versteht man diese "Zeichnung"??? Wohl nicht.

Also, meine aV ist dichotom, daher logistische Regression. Ich habe insgesamt 10 uVs, alle metrisch (auf 7stufigrer Likertskala gemessen), die z.T. direkt, z.T. indirekt auf die aV wirken (vermute ich). Alle uVs sind leider nicht normalverteilt, aber das ist ja egal, wie ich jetzt dank Euch weiß :)

Rechne ich jetzt am besten eine "große" Regression mit allen uVs oder rechne ich alles einzeln oder gucke ich erst, wie die uV, von der ich annehme, dass sie nur über eine andere uV auf die aV wirkt, auf diese andere uV wirkt? Oh Gott, versteht irgendeiner, was ich meine???
ahnungslos
Beiträge: 32
Registriert: 14.09.2007, 09:29

Beitrag von ahnungslos »

Jetzt bin ich ein wenig irritiert... Ich hab im SPSS-Buch von Felix Brosius gelesen, dass man auch mit einer Dummy-Variablen eine lineare Regression rechnen kann... Im Grunde ist meine dichotome aV doch eine Dummy-Variable, oder nicht? Darf ich jetzt mit ihr rechnen oder nicht? Und was würde passieren, wenn ich es täte???

HILFE, ICH BIN ECHT AM ENDE... :cry:
Jack Crow
Beiträge: 146
Registriert: 14.12.2006, 18:41

Beitrag von Jack Crow »

Nicht alles was in Büchern steht ist auch automatisch richtig uns sinnvoll... ;)
Ich hatte ja schon woanders geschrieben daß Dummy-Variablen unter Umständen als quasi-metrisch interpretiert werden können und gewisse metrische Maße auch robuste Ergebnisse liefern können. Sowiet ich weiß gilt das nicht unbedingt für multivariate lineare Regressionen, aber hundertprozentig will ich nicht ausschließen daß das u.U. erlaubt sein kann.
Klar ist jedoch, daß die Logik des Verfahrens dafür nicht gedacht ist (mal abgesehen von den sonstigen Voraussetzungen wie Normalverteilung), daher ergeben sich Probleme der Interpretation. Die logistische Regression ist dagegen genau für den Spezialfall entwickelt worden - welchen Grund gäbe es also diese nicht zu benutzen?
Nun zu den anderen Fragen: Was die Codierung angeht bin ich überfragt - wie hast du das denn gemacht? Eigentlich sollten sich mit folgender Zeile keine Probleme ergeben
RECODE var1 (0=1) (1=0) (MISSING=MISSING). Du musst also darauf achten daß die Ausprägung die dich interessiert 1 ist und die andere 0.

Was Pfadanalyse angeht... Zum einen kann man die log.Reg. in Schritten durchführen, d.h. du fügst z.B. erst nur die direkt wirkenden ein und im nächsten Schritt die indirekt wirkenden - wenn letztere quasi die eigentlichen Faktoren hinter den direkten Var sind dürfte sich mit dem zweiten Schritt das Gesamtmodell nur unwesentlich verändern (Klassifikation, R²), die indirekten Vars müssten signifikante und stabile Werte aufweisen und die Vars des ersten Schrittes werden insignifikant oder reduzieren zumindest ihre Werte. Allerdings ist das natürlich nur eine indirekte Art von Test, bei der die indirekten Vars quasi als Kontrollvariablen fungieren.
Sinnvoll ist es auf jeden Fall vermutete Interkorrelationen zu überprüfen, also indirekte und direkte UVs zu regressieren (sind ja beide metrisch). Ergibt sich dann eine sehr hohe Korrelation von der theoretisch die Richtung bestimmbar ist, kann die direkte Var im Gesamtmodell eigentlich gleich weggelassen werden. Sonst ergeben sich auch Probleme der Multikollinearität.
"Life is 10% effort and 90% lucky timing"
Scott Adams
ahnungslos
Beiträge: 32
Registriert: 14.09.2007, 09:29

Beitrag von ahnungslos »

Rekodiert hab ich ganz normal über Transformieren, umkodieren in andere Variable und zuweisen der Werte. Original war die Variable kodiert 1= finde ich gut, 2= finde ich nicht gut, 3= wn.
wn wird gefiltert und SPSS macht aus ja dann 0 und aus nein 1. Umkodieren von 2 in 0 hat nicht geholfen, sondern obigen Output produziert.

Was meinst Du mit "im nächsten Schritt die indirekt wirkenden einfügen"? Was ist denn der nächste Schritt? Meinst Du, erst eine logReg mit meinen vermuteten direkt wirkenden, das Ergebnis speichern und in das Ergebnis dann die indirekt vermuteten aufnehmen?

Weißt Du übrigens, was das Menü Analysieren->loglinear->allgemein bzw. logit zu bedeuten hat?

Ich kann Dir echt gar nicht genug danken... :)
Jack Crow
Beiträge: 146
Registriert: 14.12.2006, 18:41

Beitrag von Jack Crow »

ahnungslos hat geschrieben:Rekodiert hab ich ganz normal über Transformieren, umkodieren in andere Variable und zuweisen der Werte. Original war die Variable kodiert 1= finde ich gut, 2= finde ich nicht gut, 3= wn.
wn wird gefiltert und SPSS macht aus ja dann 0 und aus nein 1. Umkodieren von 2 in 0 hat nicht geholfen, sondern obigen Output produziert.
Hast du wn nur gefiltert oder als Missing definiert? Ansonsten kann ich da leider nix mit anfangen... wenn nicht gut = 0 und gut = 1 und wn = MISSING ist dürften sich eigentlich keine Probleme ergeben... :?
Was meinst Du mit "im nächsten Schritt die indirekt wirkenden einfügen"? Was ist denn der nächste Schritt? Meinst Du, erst eine logReg mit meinen vermuteten direkt wirkenden, das Ergebnis speichern und in das Ergebnis dann die indirekt vermuteten aufnehmen?

Nein, im Menü der binär logistischen Regression (Analysieren -> Regression - > binär logistisch !) kannst du Gesamtregression in einzelne Schritte aufteilen (prinzipiell ist das das gleiche wie unterschiedliche Modelle zu rechnen, aber du hast alles auf einem Haufen ;)). In der Mitte des Menüs kannst du das auswählen (steht irgendwas mit "Schritte" und "weiter" o.ö.).
Nix du danken übrigens, ich sitze selbst grad in den Endzügen meiner MA und hab da auch log.Reg. benutzt . Außerdem nutzt man ja jede Gelegenheit um sich abzulenken...;)
"Life is 10% effort and 90% lucky timing"
Scott Adams
ahnungslos
Beiträge: 32
Registriert: 14.09.2007, 09:29

Beitrag von ahnungslos »

Wie wahr, wie wahr... Nur leider hab ich eigentlich überhaupt keine Zeit zum Ablenken, sondern müsste ranklotzen ohne Ende... Aber ich wünsch Dir auf jeden Fall viel Erfolg für Deine Arbeit :D

Aber diese Sch*** logReg regt mich halt auf. Ich weiß überhaupt nicht, wie ich diesen Mist interpretieren soll...

Missings definiere ich doch nur dann, wenn da Antworten fehlen, oder nicht? Die Antworten sind ja vorhanden, sie sollen nur nicht in die Analyse eingehen. Oder ist das dann Missing? (Oh Gott, meine Blödheit ist echt zu peinlich *seufz*) Ich nutze eigentlich nicht die Syntax, habe jetzt da aber gerade noch 3 als MISSING definiert, ändert aber nichts, dass da immer noch steht: ,00 = 0... s.o.

Ach so, meinst Du dieses Vorwärts und Rückwärts und Wald und so? Tja, da blicke ich auch nicht wirklich durch, weil leider in keinem der SPSS-Bücher, die ich mir zugelegt habe, was dazu drinsteht...
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten