Hallo Forum,
ich arbeite zZ mit dem Buch "SPSS 16 - Einführung in die moderne Datenanalyse" von Achim Bühl und bin gerade im Bereich der Klassifikationsanalyse angekommen. Dabei erstellt der Autor ein Baummodell/Baumdiagramm und interpretiert hierzu: "Der stärkste Prediktor für ein potenzielles Abonnement der Zeitung ist das Nettoeinkommen, den stärksten Prediktor auf der zweiten Ebene bildet die Variable beruf."
Frage: Heißt das, dass mir die Ebenen des Baummodells in absteigender Intensität jene Variablen zeigen, die den stärksten Effekt auf die AV haben? So zumindest interpretiere ich hier Bühls Aussage.
Mein Problem: Zur Erstellung des oben genannten Baummodells wurden 5 verschiedene UVs in das Modell aufgenommen. Ich habe etwas herumprobiert und festgestellt, dass die Ebenen des Baummodells variieren; je nach dem, in welcher Reihenfolge ich die UVs in der Dialogbox in das Feld "unabhängige Variablen" schiebe. Mit anderen Worten habe ich mit den selben Variablen mehrmals ein Baummodell erzeugt und dabei die Reihenfolge der UVs verändert:
Reihenfolge 1: Alter, Geschlecht, Nettoeinkommen, berufliche Position, Schulabschluss. Ergebnis: SPSS schreibt in der Modellzusammenfassung "Aufgenommene unabhängige Variablen: Nettoeinkommen, berufliche Position, Geschlecht". Insgesamt erhalte ich exakt das Ergebnis von Bühl. Im Baum ist die zweite Ebene also "Beruf".
Reihenfolge 2: Alter, Geschlecht, Nettoeinkommen, Schulabschluss, berufliche Position (hier habe ich also zuerst berufl. Position und danach den Schulabschluss aufgenommen). Ergebnis: SPSS schreibt in der Modellzusammenfassung "Aufgenommene unabhängige Variablen: Nettoeinkommen, Schulabschluss, Geschlecht". Zudem ist die zweite Ebene des Baumdiagramms nun der "Schulabschluss".
Ich verstehe das einfach nicht. Wieso werden je nach Reihenfolge der UVs unterschiedliche Variablen in das Modell (nicht) aufgenommen? Die bloße Reihenfolge der in der Dialogbox aufgenommenen UVs darf doch eigentlich nichts daran ändern, welche Variablen nun einen entscheidenden Einfluss auf die AV haben...
Kann mir hierbei jemand helfen? Danke!
Baummodell interpretieren
-
- Beiträge: 2731
- Registriert: 01.02.2018, 10:45
Re: Baummodell interpretieren
Hallo Konkordanz
Du wirst doch wohl nicht das Buch von vorne bis hinten durchlesen?
Diese Baumdings ist mir bisher nur einmal begegnet, in einem Modell auch Griechenland.. sonnenbrille
Du machst gerade eine wichtige Erfahrung.
Die Reihenfolge spiel eine Rolle. Weil die Variablen korrelieren, Beruf und Schulabschluss.
Der Beruf klärt das gleiche auf wie der Schulabschluss, wenn der Beruf im Modell ist bleibt für
Den Schulabschluss nix mehr übrig, was er unabhängig von Beruf erklären könnte.
Dutchie
Du wirst doch wohl nicht das Buch von vorne bis hinten durchlesen?
Diese Baumdings ist mir bisher nur einmal begegnet, in einem Modell auch Griechenland.. sonnenbrille
Du machst gerade eine wichtige Erfahrung.
Die Reihenfolge spiel eine Rolle. Weil die Variablen korrelieren, Beruf und Schulabschluss.
Der Beruf klärt das gleiche auf wie der Schulabschluss, wenn der Beruf im Modell ist bleibt für
Den Schulabschluss nix mehr übrig, was er unabhängig von Beruf erklären könnte.
Dutchie
-
- Beiträge: 81
- Registriert: 25.03.2018, 17:56
Re: Baummodell interpretieren
Danke für deine Antwort!
Griechenland? Sonnenbrille? Was genau meinst du damit? ^^
Jedenfalls: Ja, ich lese das gesamte Buch. Ich will halt wissen, was mit der Software alles möglich ist und bestenfalls merke ich mir das Ganze auch noch Der Grund ist auch, dass ich beruflich damit umgehen werde und nicht nur die Oberflächlichkeiten wissen möchte.
Griechenland? Sonnenbrille? Was genau meinst du damit? ^^
Jedenfalls: Ja, ich lese das gesamte Buch. Ich will halt wissen, was mit der Software alles möglich ist und bestenfalls merke ich mir das Ganze auch noch Der Grund ist auch, dass ich beruflich damit umgehen werde und nicht nur die Oberflächlichkeiten wissen möchte.
Kurze Frage zum Verständnis: Die Baumdiagramm-Berechnung dient doch dazu, aus einer Palette von UVs jene herauszufiltern, die den stärksten Einfluss haben. Jene mit dem stärksten Einfluss befindet sich somit auf der ersten Ebene, die zweitstärkste auf der zweiten Ebene usw. Richtig? Wenn dem so ist, dann dürfte es doch überhaupt keine Rolle spielen, welche Reihenfolge die Variablen in der Dialogbox "unabhängige Variablen" (Klassifizieren->Baum) stehen. Denn die Korrelationen zwischen den einzelnen Variablen sind doch gleich; egal ob "Schulabschluss" über oder unter "Berufliche Position" steht. Also, verstehst du, wo mein Problem ist? Schwierig zu erklären...dutchie hat geschrieben:Die Reihenfolge spiel eine Rolle. Weil die Variablen korrelieren, Beruf und Schulabschluss.
Der Beruf klärt das gleiche auf wie der Schulabschluss, wenn der Beruf im Modell ist bleibt für
Den Schulabschluss nix mehr übrig, was er unabhängig von Beruf erklären könnte.
Dutchie
-
- Beiträge: 2731
- Registriert: 01.02.2018, 10:45
Re: Baummodell interpretieren
hallo
Du hast Recht die Reihenfolge, in der die Variablen in der Dialogbox stehen
dürfte keinen Einfluss haben. Ansonsten versteh ich das Problem, jetzt.
Ich nehme an du hast das öfters gecheckt, also nicht aus Versehen
die Methode gewechselt oder so was.
Ich probiere gerade an der Datei tree_car.sav aus diesem SPSS internen tutorial.
Da hat unter CHAID die Reihenfolge keinen Einfluß.
Ich hab gerade eine Situation erzeugt, bei der das aber anders ist !!!
Bei der die reihenfoge eine rolle spiel, wenn hoch korreliert
Probier mal: Mit CHAID plus erste Variable erzwingen
kopiere Einkommen in Variable xx ändere bei Variable xx eine Zahl,sodass
die KoKo mit Einkommen nicht genau r=1 sonder r<1, dann ist bei mir
in Abhängigkeit von der Reihenfolge Varaibel xx einmal drin und einmal nicht.
gruß
dutchie
Du hast Recht die Reihenfolge, in der die Variablen in der Dialogbox stehen
dürfte keinen Einfluss haben. Ansonsten versteh ich das Problem, jetzt.
Ich nehme an du hast das öfters gecheckt, also nicht aus Versehen
die Methode gewechselt oder so was.
Ich probiere gerade an der Datei tree_car.sav aus diesem SPSS internen tutorial.
Da hat unter CHAID die Reihenfolge keinen Einfluß.
Ich hab gerade eine Situation erzeugt, bei der das aber anders ist !!!
Bei der die reihenfoge eine rolle spiel, wenn hoch korreliert
Probier mal: Mit CHAID plus erste Variable erzwingen
kopiere Einkommen in Variable xx ändere bei Variable xx eine Zahl,sodass
die KoKo mit Einkommen nicht genau r=1 sonder r<1, dann ist bei mir
in Abhängigkeit von der Reihenfolge Varaibel xx einmal drin und einmal nicht.
gruß
dutchie
-
- Beiträge: 2731
- Registriert: 01.02.2018, 10:45
Re: Baummodell interpretieren
Anhang:
aber merkwürdiger weise steht das nur in der Modellzusammenfassung
nicht im Baumdiagramm
aber merkwürdiger weise steht das nur in der Modellzusammenfassung
nicht im Baumdiagramm
-
- Beiträge: 81
- Registriert: 25.03.2018, 17:56
Re: Baummodell interpretieren
Das habe ich leider nicht hinbekommen; wir fehlen die Kenntnisse. Aber probier doch mal die Variable aus dem Buch. Sie wurde (virenfrei) hochgeladen: https://workupload.com/file/4cjwYh9dutchie hat geschrieben:Probier mal: Mit CHAID plus erste Variable erzwingen
kopiere Einkommen in Variable xx ändere bei Variable xx eine Zahl,sodass
die KoKo mit Einkommen nicht genau r=1 sonder r<1, dann ist bei mir
in Abhängigkeit von der Reihenfolge Varaibel xx einmal drin und einmal nicht.
Im Buch (ab Seite 614) stehen hierzu folgende Schritte:
1. Fälle gewichten mit "häufigkeit"
2. Analysieren->Klassifizieren->Baum:
- AV: abonnent
- UV: alle anderen
- Methode: CHAID
- "Kategorie": Abonnent auswählen
- Ausgabe: "Baum im Tabellenformat" auswählen
- Optionen -> Profite: Ertrag 187 (Abonnent) bzw. 0 (Kein Abonennt); Ausgaben jeweils 2,58
Und nun versuch mal bitte, was bei dir herauskommt und spiele das Ganze 1x durch mit:
..und 1x mitKonkordanz hat geschrieben: Reihenfolge 1: Alter, Geschlecht, Nettoeinkommen, berufliche Position, Schulabschluss. Ergebnis: SPSS schreibt in der Modellzusammenfassung "Aufgenommene unabhängige Variablen: Nettoeinkommen, berufliche Position, Geschlecht". Insgesamt erhalte ich exakt das Ergebnis von Bühl. Im Baum ist die zweite Ebene also "Beruf".
Tritt bei dir dasselbe Problem auf?Konkordanz hat geschrieben: Reihenfolge 2: Alter, Geschlecht, Nettoeinkommen, Schulabschluss, berufliche Position (hier habe ich also zuerst berufl. Position und danach den Schulabschluss aufgenommen). Ergebnis: SPSS schreibt in der Modellzusammenfassung "Aufgenommene unabhängige Variablen: Nettoeinkommen, Schulabschluss, Geschlecht". Zudem ist die zweite Ebene des Baumdiagramms nun der "Schulabschluss".
-
- Beiträge: 2731
- Registriert: 01.02.2018, 10:45
Re: Baummodell interpretieren
Hallo Konkordanz
ich kann deine Ergebnisse bestätigen
Und ich weiß auch warum..
korreliere Schule mit Position --> r = 1 (genau eins), ja unglaublich aber war bei n=10105 ... r=1
Korreliere alle mit alle, einfach mal mit Pearson, oder mach eine Kreuztabelle.
dann ist der Einfuß von beiden auf die AV identisch, dann ist das nur ein Programmiereffekt, das die Reihenfogen entscheidet.
d.h. die Daten sind Murks.
Das mailst du dem Autor, und beschwerst dich. Das sollte der wissen.
gute Arbeit Konkordanz.
gruß
dutchie
ich kann deine Ergebnisse bestätigen
Und ich weiß auch warum..
korreliere Schule mit Position --> r = 1 (genau eins), ja unglaublich aber war bei n=10105 ... r=1
Korreliere alle mit alle, einfach mal mit Pearson, oder mach eine Kreuztabelle.
dann ist der Einfuß von beiden auf die AV identisch, dann ist das nur ein Programmiereffekt, das die Reihenfogen entscheidet.
d.h. die Daten sind Murks.
Das mailst du dem Autor, und beschwerst dich. Das sollte der wissen.
gute Arbeit Konkordanz.
gruß
dutchie
-
- Beiträge: 81
- Registriert: 25.03.2018, 17:56
Re: Baummodell interpretieren
Wow, tatsächlich, dutchie! Ich danke dir. Wahrscheinlich war es für den Autoren einfacher, einen solchen Datensatz zu nehmen. Ich werde ihm mal schreiben und werde mich melden, sobald ich mehr weiß
-
- Beiträge: 81
- Registriert: 25.03.2018, 17:56
Re: Baummodell interpretieren
Er hat mittlerweile geantwortet. Er hat sich dafür bedankt und meint, dass er aber erst im September wirklich darauf eingehen bzw. den Datensatz auf das Problem prüfen kann. Derzeit ist er wohl im forschungseinsatz. Ab September aber arbeitet er an einer neuen Auflage.