Logistische Regression eine Kategorie nicht signifikant

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
mari13
Beiträge: 1
Registriert: 11.08.2021, 19:39

Logistische Regression eine Kategorie nicht signifikant

Beitrag von mari13 »

Hallo zusammen,

ich schreibe derzeit an meiner Bachelorarbeit und untersuche hierbei, welche Faktoren einen Einfluss haben, ob eine Kunde ein Produkt kauf oder nicht. Hierbei habe ich eine logistische Regression mit mehreren unabhängigen Variablen berechnet.

Die unabhängige Variable Alter hat folgende vier Kategorien:

1) 18-24
2) 25 - 49
3) 50 - 65
4) > 65

Referenzkategorie ist Kategorie 4.
Für Kategorie 1, 2 und 3 erhalte ich jeweils negative Regressionskoeffizienten. Würde somit also interpretieren dass im Vergleich zur vierten Altersgruppe, für die jüngeren Gruppen die Wahrscheinlichkeit das Produkt zu kaufen abnimmt.

Jedoch ist Signifikanz nur bei Kategorie 1 und 2 gegeben.

Bedeutet dies, dass ich insgesamt die ganze Variable Alter als Einflussfaktor ausschließen sollte, weil eine Kategorie nicht signifikant war? Oder wie gehe ich am besten damit um?

Über Antworten wäre ich sehr dankbar.

Viele Grüße
Mari
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: Logistische Regression eine Kategorie nicht signifikant

Beitrag von dutchie »

hallo
mari13 hat geschrieben:
11.08.2021, 19:58
Oder wie gehe ich am besten damit um?
An besten gehts du damit um, dass du die Variable Alter als metrisch interpretiert (was sie auch ist)
und nicht kategorial, du nimmst die Intervallmitten als besten schätzer des Alters in die Gleichung und nicht
drei dummies. Dann kann man das auch fehlerfrei interpretieren.
mari13 hat geschrieben:
11.08.2021, 19:58
Jedoch ist Signifikanz nur bei Kategorie 1 und 2 gegeben.
Bedeutet dies, dass ich insgesamt die ganze Variable Alter als Einflussfaktor ausschließen sollte, weil eine Kategorie nicht signifikant war? Oder wie gehe ich am besten damit um?
nein, du schließt nicht Alter aus, es gibt ja Unterschiede
Aber nur bei größerer Altersdifferenz!
Kategorie 3 ist der Kategorie 4 zu ähnlich.
mari13 hat geschrieben:
11.08.2021, 19:58
Für Kategorie 1, 2 und 3 erhalte ich jeweils negative Regressionskoeffizienten.
Vorsticht! Da kann man sich heftig irren. Kaufen ist mit 1 kodiert!
Interpretiert wird das odds ratio.

Du bekommst keine Aussage übers Alters generell sondern nur über die dummies.
z.B. nicht: "je älter desto kaufbereiter" bei metrischer interpretation.

...mach auch mal Kategorie 1 zur referenz...


gruß
dutchie
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten