Binäre logistische Regression vs. Fisher Exact Test

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
Franzi2024
Beiträge: 3
Registriert: 08.01.2024, 17:00

Binäre logistische Regression vs. Fisher Exact Test

Beitrag von Franzi2024 »

Hallo zusammen,
bin völlig verwirrt, weil unterschiedliche Infos von der Studienberatung zum
Thema, welcher Test angewendet werden Soll.

Problem:

Umfrage: Gibt es einen Zusammenhang zwischen psychischer Belastung und verschiedenen Ablenkungsmöglichkeiten?

AV: Belastet j/n

UV1: treibt Sport 0 = "gar nicht" bis 3 "sehr viel"
UV2: Nutzt Alkohol 0 = "gar nicht" bis 3 "sehr viel"
UV3: Redet mit anderen 0 = "gar nicht" bis 3 "sehr viel"

Aus den UVs lassen sich durch Summenbildung bzw. Mittelwert-Index aus der nominal-skalierten Liekert-Skala eine
metrische Skala bilden, bzw. ergibt sich "eine Schätzung der latenten Variable in metrischer Form".

Wichtig - Kleiner Stichprobenumfang: Online-Umfrage hat nur 12 verwertbare Antworten ergeben.

Frage (1)

Sechs Voraussetzungen sind für die Anwendung der Binäre logistische Regression erfüllt.

Bei der siebten Voraussetzung hakt es - ich würde wie folgt formulieren:

Mit Hilfe von SPSS wird für die Kovariante anhand des OMNIBUS-Tests die Signifikanz ermittelt.
Der OMNIBUS-Test prüft in diesem Fall, ob das Modell unter Einbeziehung der Kovariante eine bessere Vorhersage liefert als das Null-Modell, also die Vorhersage anhand der Konstanten AV
BELASTUNG Ja/Nein ohne Einbeziehung der UV.
Hierbei zeigt sich, dass keine der gebildeten Subskalen eine Signifikanz unter .05 liefert.
→NICHT erfüllt, somit ist die binominale logistische Regression für diese Untersuchung nicht geeignet.


Ist diese Argumentation und Schlussfolgerung korrekt?

Frage (2)
Kann ich dennoch eine Effektstärke dafür angeben?

Frage (3)
Wie berechne ich die mindestens notwendige Anzahl TeilnehmerInnen, die notwendig gewesen wäre?


Frage (4)

Da Binäre logistische Regression nicht geht und die Anzahl n < 20 liegt, nehme ich den Fisher Exact Test.

Ich reduziere auf zwei ordinal-skalierte Variablen:

AV: Belastet j/n ( Kodiert j=1/n=0)

UV: Ablenkung j/n ( Kodiert j=1/n=0)

Die Kreuztabelle sieht wie folgt aus:


······················· UV
····················· 0 .... 1

····· 0 ············· 7 ···· 3
AV
····· 1 ············· 2 ···· 0


-> Gibt es hierfür eine Effektstärke?

SPSS liefert mir eine "exakte zweiseitige Signifikanz" von 1.0 > .05

Die Nullhypothese muss angenommen werden.
Somit gibt es keinen Zusammenhang zwischen psychischer Belastung und
einer Ablenkung.

Liege ich da so in der Art richtig?

Ich weiss, das war viel input aber ich stehe echt gerade
auf dem Schlauch und bin total verwirrt, ob ich noch das richtige tue...

Erst mal tausend Dank im voraus für Eure Hilfe!!!
dutchie
Beiträge: 2739
Registriert: 01.02.2018, 10:45

Re: Binäre logistische Regression vs. Fisher Exact Test

Beitrag von dutchie »

Hallo

..was ein Durcheinander!
Franzi2024 hat geschrieben:
08.01.2024, 17:42
Sechs Voraussetzungen sind für die Anwendung der Binäre logistische Regression erfüllt.
Mal bitte ein Quelle dieser sechs Vorraussetzungen!
Franzi2024 hat geschrieben:
08.01.2024, 17:42
Mit Hilfe von SPSS wird für die Kovariante anhand des OMNIBUS-Tests die Signifikanz ermittelt.
Der OMNIBUS-Test prüft in diesem Fall, ob das Modell unter Einbeziehung der Kovariante eine bessere Vorhersage liefert als das Null-Modell, also die Vorhersage anhand der Konstanten AV
BELASTUNG Ja/Nein ohne Einbeziehung der UV.
Hierbei zeigt sich, dass keine der gebildeten Subskalen eine Signifikanz unter .05 liefert.
→NICHT erfüllt, somit ist die binominale logistische Regression für diese Untersuchung nicht geeignet.
wo kommt das denn her, hab ich so noch nie gesehen?

AV: psychische Belastung, wer bitte misst sowas dichotom?
das ist intervallskaliert messbar! Warum nicht 1 bis 3
wie die anderen UVs?

Wenn die AV dichotom ist, ist das eine log. Regression
Log. Regression fällt flach bei nur 12 Leuten
das sind pro Variable nur 3.

...also nur korrelieren!

Du kannst ohne Probleme die dichotome AV korrelieren mit den UV 1 bis 3
über Pearson oder Spearman!

das ist dann die Effektstärke, nur bei N = 12 hapert es gewaltig mit dem Signifikanztest
deshalb wohl das Ausweichen zu einem exacten Test, da kannst du aber auch bootstrap machen
(bootstrap bei N = 12) auch ein Problem!

Aber die UV jetzt auch noch beschneiden auf dichtom, würde ich nicht machen,
du bekommst ja Mittelwerte usw.
Franzi2024 hat geschrieben:
08.01.2024, 17:42
Ich reduziere auf zwei ordinal-skalierte Variablen:
..das ist nicht ordinal, das 0 = "gar nicht" bis 3 "sehr viel" schon eher, geht aber auch metrisch

Franzi2024 hat geschrieben:
08.01.2024, 17:42
Wie berechne ich die mindestens notwendige Anzahl TeilnehmerInnen, die notwendig gewesen wäre?
mit gpower, dafür brauchst du aber eine Schätzung der Effektstärke,
und zwar nicht nur aufgrund deiner Ergebnisse, sondern aufgrund aller bisheriger Ergebnisse!
Franzi2024 hat geschrieben:
08.01.2024, 17:42
SPSS liefert mir eine "exakte zweiseitige Signifikanz" von 1.0 > .05
Die Nullhypothese kann nicht abgelehnt werden.
Aber besser du machst Spearman.

Ich würde an deiner Stelle den Fragebogen überarbeiten
und so lange fragen bis N = 150 ist, zumal online!

gruß
dutchie
Franzi2024
Beiträge: 3
Registriert: 08.01.2024, 17:00

Re: Binäre logistische Regression vs. Fisher Exact Test

Beitrag von Franzi2024 »

Danke erstmal !
Ja, ziemliche durcheinander!

Ich melde mich morgen mal in Ruhe mit den Antworten...
Franzi2024
Beiträge: 3
Registriert: 08.01.2024, 17:00

Re: Binäre logistische Regression vs. Fisher Exact Test

Beitrag von Franzi2024 »

Hallo dutchi!

hier die Antworten:
Mal bitte ein Quelle dieser sechs Vorraussetzungen!
Okay, es sind 5, die erfüllt sind, die sechste nicht und weiter habe ich nicht betrachtet:

Hatte bei Box e.a., 1962 oder auch Krafft, M., 1996 folgende Voraussetzungen für die binominale logistische Regression gefunden:


1. Die abhängige Variable ist nominalskaliert mit genau zwei Ausprägungen (dichotom)

2. Die unabhängige Variable ist entweder nominalskaliert oder mindestens intervall­skaliert.

3. Unabhängigkeit der Beobachtungen.

4. Benötigt werden mindestens eine gewisse Anzahl an Fällen pro Prädiktor.

---> Deshalb hatte ich nach der Stichprobengröße gefragt...
Literatur: Die angegebene Bandbreite zur Verhinderung einer Überanpassung (Typ-I-Fehler: Es sind werden zu viele Variablen betrachtet) oder Unteranpassung (Typ-II-Fehler: wichtige Prädiktoren werden nicht berücksichtigt) beläuft sich nach (Vittinghoff e.a., (2007)) auf 5-9 Fälle, eine Obergrenze findet man bei vielen Autoren, so z.B. bei (Peduzzi, P. e.a., 1996), (Moons e.a., 2014) mit 10 Fällen je Prädiktor.

5. Es sollten sich keine Ausreißer in den Daten befinden.

6. Signifikanz ermittelt < .05
SPSS: OMNIBUS-Test .42 und somit > .05


Wenn die AV dichotom ist, ist das eine log. Regression
Log. Regression fällt flach bei nur 12 Leuten
das sind pro Variable nur 3.
Die Idee des Betreuers - also "Gesetz".
Hatte genau so argumentiert wie Du.

Zuletzt hieß es vom einen Betreuer, ich solle die Voraussetzungen prüfen und entscheiden
und vom anderen, ich könnte ja die Voraussetzungen anpassen.
Da hab ich aber gestreikt und nur noch "auf die Schnelle" Fisher exact gemacht, weil nichts konstruktives
kam und echt ratlos und die Zeit drängt.

Ich reduziere auf zwei ordinal-skalierte Variablen:
Sorry, Schreibfehler - meinte "nominal-skaliert"

mit gpower, dafür brauchst du aber eine Schätzung der Effektstärke,
und zwar nicht nur aufgrund deiner Ergebnisse, sondern aufgrund aller bisheriger Ergebnisse!
Okay, also kann ich nichts angeben für diesen meinen fisher exact?

Die Nullhypothese kann nicht abgelehnt werden.
Danke - Wenigstens ist das Ergebnis richtig!

Ich würde an deiner Stelle den Fragebogen überarbeiten
und so lange fragen bis N = 150 ist, zumal online!
Genau Deiner Meinung - aber die Zeit drängt wegen Frist.


Ich schaue mir jetzt auch nochmal Spearman an...

Danke für Deine Antworten!

Franzi
dutchie
Beiträge: 2739
Registriert: 01.02.2018, 10:45

Re: Binäre logistische Regression vs. Fisher Exact Test

Beitrag von dutchie »

Hallo,

Franzi2024 hat geschrieben:
11.01.2024, 10:16
---> Deshalb hatte ich nach der Stichprobengröße gefragt...
Literatur: Die angegebene Bandbreite zur Verhinderung einer Überanpassung (Typ-I-Fehler: Es sind werden zu viele Variablen betrachtet) oder Unteranpassung (Typ-II-Fehler: wichtige Prädiktoren werden nicht berücksichtigt) beläuft sich nach (Vittinghoff e.a., (2007)) auf 5-9 Fälle, eine Obergrenze findet man bei vielen Autoren, so z.B. bei (Peduzzi, P. e.a., 1996), (Moons e.a., 2014) mit 10 Fällen je Prädiktor.
Das gehen aber zwei Sachen durcheinander!

Die Anzahl der UVs in der Regression
und
Die Anzahl der VP pro UV!

Wenn da einer von 5-9 Fällen redet je Prädictor, heiß das nicht, dass man nur 9 VP braucht
wenn man nur einen Prädictor hat!!

Noch mal
AV dichotom
UV1: treibt Sport 0 = "gar nicht" bis 3 "sehr viel"
UV2: Nutzt Alkohol 0 = "gar nicht" bis 3 "sehr viel"
UV3: Redet mit anderen 0 = "gar nicht" bis 3 "sehr viel"

UVs ordinal oder intervall, egal

Wenn deine UVs ordinal sind! nimmt das die log Regression nicht,
die müsstest du in Dumnmies umwandeln.

Du macht Spearman und korrelierst alles mit allem
das ist interpretierbar ! Wenn die UVs z.B nicht korrelieren
kann man sagen, dass bei einer multiplen Regression sich die UVs in ihrem Potential aufzuklären addieren!

dann macht du noch Pearson und korrelierst alles mit allem
(mit intervallskalierter Interpretation der UVs)
dazu machst du gPOwer !

https://ibb.co/DzXShvQ

dabei.. einen kleiner effekt mit 95% nachzuweisen braucht es N =111

https://ibb.co/DLJbn8z

Die Wahrscheinlichkeit einen kleinen Effekt mit N = 12 leuten signfikant zu kriegen ist Power = 26%

Voraussetzungen log reg:

https://ibb.co/QvZqJzf

bei zwei Kategorien (binäre log reg) mind N = 50!
deshalb fällt die bei dir flach, nicht wegen des Verhältnisses VP zu UV1
z.B. aus:
BACKHAUS, ERICHSON, PLINKE, WEIBER,(2016): Multivariate Analysemethoden. 16 Auflage, Seite 347


gruß
dutchie
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten