Hallo zusammen!
Ich bin neu hier und hoffe ich verärgere niemanden, dass ich ein neues Thema wegen meiner Fragen eröffnet habe. Durch die Forensuche bin ich nicht fündig geworden leider..
Ich führe eine Studie zum Einfluss des Sitzverhaltens auf Faktoren der Gesundheit durch und benötige Hilfe bei der statistischen Auswertung. Ich möchte eine Regressionsanalyse (in SPSS) machen und bin als Statistik-Anfänger unsicher. Deshalb hier - nach einer kurzen Einleitung - meine Fragen:
Als unabhängige Variablen habe ich zum Einen die kumulierte Sitzzeit, des Weiteren die Gesamtaktivität (beides als Gesamtscore). Als abhängige Variablen habe ich den Bauchumfang, den Body-Mass-Index sowie den subjektiven Gesundheitszustand.
1) Welche Art der Regressionsanalyse muss ich in SPSS machen?
2) Mache ich 2 Analysen - also je eine pro unabhängige Variable?
3) Wie viele Probanden sind nötig, damit die angewandte Art der Regressionsanalyse aussagekräftig/möglich ist? (Ich kann mir vorstellen: je mehr, desto besser - aber wo ist die "Schmerzgrenze" oder ab wann ist die errechnete Regression nicht mehr wirklich aussagekräftig?
Ich wäre euch wirklich sehr sehr dankbar für jede Hilfe!!
Grüße,
Simon
Arten von Regressionsanalysen + Stichprobenanzahl
-
- Beiträge: 2
- Registriert: 13.08.2012, 14:23
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
Deine Fragestellung ist immer noch zu allgemein, als dass wirklich seriös ein genaues Modell vorgeschlagen werden könnte. Auch ein Regressionsverfahren ist nich zwingend.1) Welche Art der Regressionsanalyse muss ich in SPSS machen?
Das hängt von der genauen Fragestellung ab, die hier fehlt.2) Mache ich 2 Analysen - also je eine pro unabhängige Variable?
Dazu muss eine sog. relevante Effektgröße vorgegeben werden. Dann würde unter Berücksichtigung des Verfahrens mit Hilfe eines dafür geeigneten Programms (G*Power meist) der sog. "optimale Stichprobenumfang" errechnet.3) Wie viele Probanden sind nötig, damit die angewandte Art der Regressionsanalyse aussagekräftig/möglich ist? (Ich kann mir vorstellen: je mehr, desto besser - aber wo ist die "Schmerzgrenze" oder ab wann ist die errechnete Regression nicht mehr wirklich aussagekräftig?
Zu deiner Fragestellung: Sowohl AVs als auch UVs scheinen als stetige Variablen vorzuliegen. Jetzt müsste erst einmal in der Literatur geprüft werden, welche Verfahren renomierte Autoren eingesetzt haben (und wie die Variablen erhoben wurden). In einer wissenschaftlichen Arbeit sollte man nicht mal eben so Verfahren / Prozeduren einsetzen ohne Bezug auf vorangegangene Forschungsarbeiten.
Ggf. sind Einzelregressionen zu bevorzugen, da sie einfacher zu durchschauen und nachvollziehbar sind. Allerdings werden weitere Variablen relevant (die hier nicht dargestellt wurden). Etwa Geschlecht, Alter, Bildung, etc. Dann wäre ein ALM notwendig. ALM und Regression sind ohnehin verwandte Verfahren.
drfg2008
-
- Beiträge: 2
- Registriert: 13.08.2012, 14:23
re:
Super!! Vielen Dank schon ein Mal für die sehr gut durchdachte Antwort!!! Bringt mich dem Ziel schon um einiges näher!!
Ich versuche die Forschungsfragen für die statistische Auswertung ein wenig zu konkretisieren ohne es zu kompliziert zu machen:
Da ich 2 abhängige Variablen habe, stellen sich 2 Forschungsfragen:
1) Hat die Sitzzeit einen Effekt auf eine/mehrere erhobene Variablen (die da wären: Body-Mass-Index, Bauchumfang sowie die subjektive Gesundheitseinschätzung --> die unabhängigen Variablen)
2) Hat die Gesamtaktivität einen Effekt auf eine/mehrere erhobene Variablen (die da die selben wären: Body-Mass-Index, Bauchumfang sowie die subjektive Gesundheitseinschätzung)
aus den 2 Forschungsfragen würden insgesamt 6 H0 & H1-Hypothesen folgern (für jede der 2 unabhängigen Variable gibt es 3 abhängige Variablen; somit insgesamt 6 Arbeitshypothesen - denke ich!?!)
Die Arbeitshypothesen wären in der Art von: Die Sitzzeit hat keinen bzw. hat einen Einfluss auf den BMI.
Hoffe das stimmt so alles und war jetzt nicht zu kompliziert!
Sehr guter Einwand mit den vorangegangenen Forschungsarbeiten!!
Die für mich relevanten Studien haben sog. "forced-entry linear regression" Modelle verwendet. Ich weiß nicht wie mich das dann weiter bringt. Was heißt das für mich? Welche Art der Regression sollte ich anwenden? Bekomme ich jetzt auch so die relevante Effektgröße raus?
Die Variablen mit Alter, Geschlecht, Bildung usw. wurden dann als Störvariablen ("confounders") mit in den Studien mit berücksichtigt. Ist das dann ein ALM?
Vielen Dank nochmal und wäre toll, wenn du mir ein weiteres Mal hilfst!!
Ich versuche die Forschungsfragen für die statistische Auswertung ein wenig zu konkretisieren ohne es zu kompliziert zu machen:
Da ich 2 abhängige Variablen habe, stellen sich 2 Forschungsfragen:
1) Hat die Sitzzeit einen Effekt auf eine/mehrere erhobene Variablen (die da wären: Body-Mass-Index, Bauchumfang sowie die subjektive Gesundheitseinschätzung --> die unabhängigen Variablen)
2) Hat die Gesamtaktivität einen Effekt auf eine/mehrere erhobene Variablen (die da die selben wären: Body-Mass-Index, Bauchumfang sowie die subjektive Gesundheitseinschätzung)
aus den 2 Forschungsfragen würden insgesamt 6 H0 & H1-Hypothesen folgern (für jede der 2 unabhängigen Variable gibt es 3 abhängige Variablen; somit insgesamt 6 Arbeitshypothesen - denke ich!?!)
Die Arbeitshypothesen wären in der Art von: Die Sitzzeit hat keinen bzw. hat einen Einfluss auf den BMI.
Hoffe das stimmt so alles und war jetzt nicht zu kompliziert!
Sehr guter Einwand mit den vorangegangenen Forschungsarbeiten!!
Die für mich relevanten Studien haben sog. "forced-entry linear regression" Modelle verwendet. Ich weiß nicht wie mich das dann weiter bringt. Was heißt das für mich? Welche Art der Regression sollte ich anwenden? Bekomme ich jetzt auch so die relevante Effektgröße raus?
Die Variablen mit Alter, Geschlecht, Bildung usw. wurden dann als Störvariablen ("confounders") mit in den Studien mit berücksichtigt. Ist das dann ein ALM?
Vielen Dank nochmal und wäre toll, wenn du mir ein weiteres Mal hilfst!!
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
eine umfassende Beratung zum Studiendesign kann diese Plattform natürlich nicht leisten.
Problematisch ist übrigens die Bildungs eines Scores, wie oben anklingt. Scores dürfen nur dann gebildet werden, wenn die einzelnen Items, die diesen Score ausmachen, geometrisch gesehen 'in eine Richtung' gehen, also hoch positiv korreliert sind (besser: siehe klassische Testtheorie Autoren Lienert/Raatz)
Mit "forced entry" wird wohl eine Methode gemeint sein, die die einzelnen Prädiktoren nach einer bestimmten vorgegebenen Reihenfolge ins Modell übernimmt. Das unterscheidet sich von denjenigen Verfahren, die die UVs ihrer Erklärungskraft nach (erklärte Varianz) ins Modell übernimmt. Bei nur zwei UVs ist das allerdings weniger relevant. Methode: Entry.
Wie gesagt, Regression und ALM gehen in einander über. Falls also kategoriale Variablen wie Geschlecht, Bildung, etc. auch ins Modell sollen, dann eben ALM.
Im Prinzip können auch Modelle mit mehreren UVs UND mehreren AVs berechnet werden. Diese sind aber nicht immer unbedingt so anschaulich. Man sollte auch nicht auf Graphiken verzichten (Meansplots oder dgl.). Macht sich immer gut.
Das ist natürlich alles längst untersucht. Problematisch dabei: Aktivität wird einen gegenläufigen Zusammenhang mit Body Mass und / oder Bauchumfang aufweisen, während Sitzzeit einen gleichläufigen. Es wird daher eine Regression mit mindestens zwei UVs notwendig sein. Bauchumfang ist problematisch: Große Personen haben größeren Bauchumfang, während der Body-Mass-Index eine absolute Größe ist.1) Hat die Sitzzeit einen Effekt auf eine/mehrere erhobene Variablen (die da wären: Body-Mass-Index, Bauchumfang sowie die subjektive Gesundheitseinschätzung --> die unabhängigen Variablen)
2) Hat die Gesamtaktivität einen Effekt auf eine/mehrere erhobene Variablen (die da die selben wären: Body-Mass-Index, Bauchumfang sowie die subjektive Gesundheitseinschätzung)
Als unabhängige Variablen habe ich zum Einen die kumulierte Sitzzeit, des Weiteren die Gesamtaktivität (beides als Gesamtscore). Als abhängige Variablen habe ich den Bauchumfang, den Body-Mass-Index sowie den subjektiven Gesundheitszustand.
Problematisch ist übrigens die Bildungs eines Scores, wie oben anklingt. Scores dürfen nur dann gebildet werden, wenn die einzelnen Items, die diesen Score ausmachen, geometrisch gesehen 'in eine Richtung' gehen, also hoch positiv korreliert sind (besser: siehe klassische Testtheorie Autoren Lienert/Raatz)
Mit "forced entry" wird wohl eine Methode gemeint sein, die die einzelnen Prädiktoren nach einer bestimmten vorgegebenen Reihenfolge ins Modell übernimmt. Das unterscheidet sich von denjenigen Verfahren, die die UVs ihrer Erklärungskraft nach (erklärte Varianz) ins Modell übernimmt. Bei nur zwei UVs ist das allerdings weniger relevant. Methode: Entry.
Wie gesagt, Regression und ALM gehen in einander über. Falls also kategoriale Variablen wie Geschlecht, Bildung, etc. auch ins Modell sollen, dann eben ALM.
Im Prinzip können auch Modelle mit mehreren UVs UND mehreren AVs berechnet werden. Diese sind aber nicht immer unbedingt so anschaulich. Man sollte auch nicht auf Graphiken verzichten (Meansplots oder dgl.). Macht sich immer gut.
drfg2008