Hallo zusammen,
für meine Abschlussarbeit bin ich unschlüssig, ob ich meine Hypothesen so formuliere, dass sie die Berechnung einer Korrelation oder einer Regressionsanalyse nahelegen. Inhaltlich würde sich genug theoretische Untermauerung dafür finden lassen, einen gerichteten Einfluss anzunehmen.
Kurz zu den Daten: Ich habe eine intervallskalierte AV sowie 3 intervallskalierte UVs (auch wenn man bei der Korrelation ja nicht zwischen AV und UV unterscheiden würde). Das Problem ist, dass meine Stichprobe nur 23 Personen umfasst. Hat eine Regressionsanalyse dann Aussicht auf Erfolg? Um eine Alpha-Fehler Kumulation zu vermeiden müsste ich ja wahrscheinlich eine multiple Regression mit den 3 UVs berechnen.
Oder sollte ich es aufgrund der geringen Fallzahl bei einer korrelativen Untersuchung belasen?
Falls ich die Regression berechne, gibt es hier eine Empfehlung bzgl. des Vorgehens, also ob hierarchisch oder nicht (meine theoretischen Überlegungen legen eigentlich nicht nahe, dass eine der UVs ein besserer Prädiktor wäre als die übrigen).
Vielen Dank im Voraus für eure Hilfe und liebe Grüße,
Anna
Korrelation oder Regression
-
- Beiträge: 2762
- Registriert: 01.02.2018, 10:45
Re: Korrelation oder Regression
hallo AnnaFR
das eine geht doch nicht ohne das andere...
wenn du korrelativ denkst machst du die bivariaten Korrelationen
dann will man aber auch wissen wie groß der multiplie Korrelationskoeffizient ist
wenn ich die interkorrelationen der Predictoren mit einbeziehe.
regression:
einen gerichteten Einfluss anzunehmen ist nicht zwingend voraussetzung
aber du hast bestimmt irgendwas kausales vor dir und somit eine Richtung.
also du machst aufjedenfall eine Regression auch wenn die Stichprobe klein ist! dann ist das halt so
mit allen drei UVs auf einmal..
der alpha fehler kumuliert so oder so irgendwann! also denk da nicht dran...
schlimmer wäre wenn die predictoren stark korreliert sind.
musst aber vorher Ausreißer, Verteilungen checken...und dann die Residuuen...
Problem ist auch wenn eine Moderation vorliegt z.B. durch geschlecht, dann ist n= 23 schon sehr klein
wenn 50% frauen und 50% männer in der stichprobe.
Und dann einfach mal schauen was rauskommt...
Hierarchisch oder nicht? das hängt von deiner Fragestellung ab, aber eher nein,
weil man normalerweise im Sinne von kausal orientierter Grundlagenforschung denkst.
und nicht einen besten Predictor oder beste Predictormenge suchst.
also mein Vorschlag:
Hypo a: bivariate Korrelationen
Hypo b: Regression
Dann kann man später im Diskussionsteil alles auch z.B bezüglich Stichprobengröße
kritisch diskutieren, und hat was zu erzählen...
gruß
dutchie
das eine geht doch nicht ohne das andere...
wenn du korrelativ denkst machst du die bivariaten Korrelationen
dann will man aber auch wissen wie groß der multiplie Korrelationskoeffizient ist
wenn ich die interkorrelationen der Predictoren mit einbeziehe.
regression:
einen gerichteten Einfluss anzunehmen ist nicht zwingend voraussetzung
aber du hast bestimmt irgendwas kausales vor dir und somit eine Richtung.
also du machst aufjedenfall eine Regression auch wenn die Stichprobe klein ist! dann ist das halt so
mit allen drei UVs auf einmal..
der alpha fehler kumuliert so oder so irgendwann! also denk da nicht dran...
schlimmer wäre wenn die predictoren stark korreliert sind.
musst aber vorher Ausreißer, Verteilungen checken...und dann die Residuuen...
Problem ist auch wenn eine Moderation vorliegt z.B. durch geschlecht, dann ist n= 23 schon sehr klein
wenn 50% frauen und 50% männer in der stichprobe.
Und dann einfach mal schauen was rauskommt...
Hierarchisch oder nicht? das hängt von deiner Fragestellung ab, aber eher nein,
weil man normalerweise im Sinne von kausal orientierter Grundlagenforschung denkst.
und nicht einen besten Predictor oder beste Predictormenge suchst.
also mein Vorschlag:
Hypo a: bivariate Korrelationen
Hypo b: Regression
Dann kann man später im Diskussionsteil alles auch z.B bezüglich Stichprobengröße
kritisch diskutieren, und hat was zu erzählen...
gruß
dutchie
-
- Beiträge: 6
- Registriert: 05.02.2019, 09:47
Re: Korrelation oder Regression
Hallo dutchie,
vielen, vielen Dank für deine ausführliche und hilfreiche Antwort. Ich werde das mit den Hypothesen genauso machen, dieses "gestaffelte" Vorgehen auch so in den Hypothesen direkt zu benennen, ist eine super Idee!
Ich schätze die Korrelation unter den Prädiktoren nicht so hoch ein, im Notfall müsste ich sonst vielleicht mit einer z-Standardisierung arbeiten.
Du scheinst dich ja sehr gut auszukennen: vielleicht kannst du mir noch mit einer weiteren Frage helfen. Mein Prof möchte, dass ich einen Teil meiner Ergebnisse mit den Daten aus einer anderen Studie vergleiche. Hierbei handelt sich um Häufigkeiten (also z.B. 40% erfüllten Kriterium 1, etc.). Von dieser Vergleichsstudie habe ich allerdings nur diese Häufigkeitsangaben sowie das N gegeben. Weißt du von einer anderen Möglichkeit diese Daten miteinander zu vergleichen als das rein deskriptiv zu machen? Normalerweise nimmt man für den Vergleich von Häufigkeiten ja den Chi-Quadrat-Test, aber das geht ja nur wenn es sich um die Daten aus einer Studie/ Stichprobe handelt).
Danke an dich nochmal und viele Grüße
Anna
vielen, vielen Dank für deine ausführliche und hilfreiche Antwort. Ich werde das mit den Hypothesen genauso machen, dieses "gestaffelte" Vorgehen auch so in den Hypothesen direkt zu benennen, ist eine super Idee!
Ich schätze die Korrelation unter den Prädiktoren nicht so hoch ein, im Notfall müsste ich sonst vielleicht mit einer z-Standardisierung arbeiten.
Du scheinst dich ja sehr gut auszukennen: vielleicht kannst du mir noch mit einer weiteren Frage helfen. Mein Prof möchte, dass ich einen Teil meiner Ergebnisse mit den Daten aus einer anderen Studie vergleiche. Hierbei handelt sich um Häufigkeiten (also z.B. 40% erfüllten Kriterium 1, etc.). Von dieser Vergleichsstudie habe ich allerdings nur diese Häufigkeitsangaben sowie das N gegeben. Weißt du von einer anderen Möglichkeit diese Daten miteinander zu vergleichen als das rein deskriptiv zu machen? Normalerweise nimmt man für den Vergleich von Häufigkeiten ja den Chi-Quadrat-Test, aber das geht ja nur wenn es sich um die Daten aus einer Studie/ Stichprobe handelt).
Danke an dich nochmal und viele Grüße
Anna
-
- Beiträge: 2762
- Registriert: 01.02.2018, 10:45
Re: Korrelation oder Regression
hallo
wüßte gerade nicht was eine z-standardisierung bringt soll
daurch ändert sich doch nichts, außer die interpretation der Regressionsgewichte..
zur den häufigkeiten: da kannst du ein vertrauensintervall VI um die differenz der
Häufigkeiten bestimmen, wenn die null nicht im VI unterscheiden sie sich signifkant bei 1-95% z.B.
mal googln...hängt von n ab was man da am besten macht, und darauf wie man lust hat..
erstmal kann man die VI über die Normalverteilung rechnen...
gruß
dutchei
wüßte gerade nicht was eine z-standardisierung bringt soll
daurch ändert sich doch nichts, außer die interpretation der Regressionsgewichte..
zur den häufigkeiten: da kannst du ein vertrauensintervall VI um die differenz der
Häufigkeiten bestimmen, wenn die null nicht im VI unterscheiden sie sich signifkant bei 1-95% z.B.
mal googln...hängt von n ab was man da am besten macht, und darauf wie man lust hat..
erstmal kann man die VI über die Normalverteilung rechnen...
gruß
dutchei
-
- Beiträge: 6
- Registriert: 05.02.2019, 09:47
Re: Korrelation oder Regression
Mh genau erklären kann ich das mit der z-standardisierung nicht, habe es aber schon öfter als Methode gelesen, da müsste ich mich auf jeden Fall nochmal mit auseinandersetzen, falls es dazu kommt.
Bzgl. der Häufigkeiten: ich glaube ich hab verstanden wie du das meinst. Mein n liegt ja bei 23, das der Vergleichsstichprobe bei 137. Würde es dann eventuell mehr Sinn ergeben, wenn ich quasi für beide Häufigkeiten ein Konfidenzintervall bestimme und schaue, ob sich die Konfidenzintervalle überschneiden? Mit welchem n rechnet man sonst, wenn man sich auf die Differenz der Häufigkeiten bezieht?
Wenn man von Normalverteilung der Daten ausgehen kann, lässt sich das VI ja recht einfach berechnen. Beim Googlen bin ich jetzt auf Bootstrapping gestoßen, wenn die Daten nicht normalverteilt sind, wäre das die Alternative?
Viele Grüße,
Anna
Bzgl. der Häufigkeiten: ich glaube ich hab verstanden wie du das meinst. Mein n liegt ja bei 23, das der Vergleichsstichprobe bei 137. Würde es dann eventuell mehr Sinn ergeben, wenn ich quasi für beide Häufigkeiten ein Konfidenzintervall bestimme und schaue, ob sich die Konfidenzintervalle überschneiden? Mit welchem n rechnet man sonst, wenn man sich auf die Differenz der Häufigkeiten bezieht?
Wenn man von Normalverteilung der Daten ausgehen kann, lässt sich das VI ja recht einfach berechnen. Beim Googlen bin ich jetzt auf Bootstrapping gestoßen, wenn die Daten nicht normalverteilt sind, wäre das die Alternative?
Viele Grüße,
Anna
-
- Beiträge: 2762
- Registriert: 01.02.2018, 10:45
Re: Korrelation oder Regression
hallo
aus meiner sicht braucht zu z nicht
standardisierte reg koeffizienten spuckt er dir automatisch aus!
zu den VI oder so: mach die VI und schau ob sie sich überlappen!
bei den differenzen gehen beide n gleichzeitig mit ein:
http://homepage.ruhr-uni-bochum.de/Step ... valle.html
aber da sollten die varianzen ungefähr gleich sein und n sehr unterschiedlich auch ungut.
die daten sind bei Häufigkeiten generell nicht normalverteilt. und NV ist auch keine
gute Näherung!! Häufigkeiten sind immer Mist! also Problematisch
du kann st auch einen Binomialtest machen p aus der größeren stichprobe und
x und n aus der kleineren...boostrap? da n= 23 auch sehr klein!!
aber das mit den Häufigkeiten ist eine Sache für dein Betreuer/in
schlag die Möglichkeiten vor, lass das entscheiden.
für mich wäre das ding aus bochum (oberer link)ok!
gruß
dutchie
aus meiner sicht braucht zu z nicht
standardisierte reg koeffizienten spuckt er dir automatisch aus!
zu den VI oder so: mach die VI und schau ob sie sich überlappen!
bei den differenzen gehen beide n gleichzeitig mit ein:
http://homepage.ruhr-uni-bochum.de/Step ... valle.html
aber da sollten die varianzen ungefähr gleich sein und n sehr unterschiedlich auch ungut.
die daten sind bei Häufigkeiten generell nicht normalverteilt. und NV ist auch keine
gute Näherung!! Häufigkeiten sind immer Mist! also Problematisch
du kann st auch einen Binomialtest machen p aus der größeren stichprobe und
x und n aus der kleineren...boostrap? da n= 23 auch sehr klein!!
aber das mit den Häufigkeiten ist eine Sache für dein Betreuer/in
schlag die Möglichkeiten vor, lass das entscheiden.
für mich wäre das ding aus bochum (oberer link)ok!
gruß
dutchie