Antwortstufen und Korrelationen

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
Steffen_Brick
Beiträge: 7
Registriert: 22.05.2020, 12:48

Antwortstufen und Korrelationen

Beitrag von Steffen_Brick »

Hi alle zusammen,

ich gestalte momentan meine quantitative Forschung für meine Bachelor-Thesis.

Was ich tue:
Ich messe Eigenschaft X mit einer Skala bestehend aus 12 Items mit 5 Antwortstufen (1: "stimme überhaupt nicht zu" bis 5: "stimme voll zu" ) und ich messe Fähigkeit Y mit einer Skala bestehend aus 18 Items mit 7 Antwortstufen (1: "stimmt überhaupt nicht" bis 7: "stimmt voll und ganz"). Die Ergebnisse möchte ich korrelieren lassen um einen Zusammenhang zu überprüfen und eine lineare Regression rechnen. Gleichzeitig besteht Eigenschaft X aus zwei Subskalen und ich gehe davon aus, dass die angenommene negative Korrelation stark von nur einer der beiden Subskalen beeinflusst wird. Daher möchte ich die Subskalen jeweils noch separate mit der Fähigkeit Y korrelieren lassen und die Ergebnisse vergleichen.

Meine Hypothesen:
1. Es besteht ein negativer Zusammenhang zwischen Eigenschaft X und Fähigkeit Y.
2. Subskala A sagt Fähigkeit Y stärker negativ voraus als Subskala B.


Meine Fragen:
- Kann ich eine Korrelation von zwei metrischen, intervallskalierten Skalen berechnen, die wie bei mir zwei unterschiedliche Antwortstufen haben? (5-stufig und 7-stufig). Oder müssen die Antwortstufen identisch sein? Mein Prof hatte mir das geraten und ich versteh nicht warum das so sein sollte.
- Spielt es für die Korrelationsberechnung eine Rolle, dass die Antwortstufen minimal unterschiedlich formuliert sind?
- Kann ich für meine zweite Hypothese einfach die Korrelationskoeffizienten irgendwie vergleichen? Oder teile ich meine Stichprobe und gehe da mit einer Unterschiedshypothese ran? Also den Unterschied der Korrelation von Subskala 1 und Fähigkeit Y und die Korrelation von Subskala 2 und Fähigkeit Y berechnen. Ich habe nur eine Stichprobe, daher stehe ich hier irgendwie auf dem Schlauch und denke auch noch über die Formulierung meiner zweiten Hypothese nach.

Ich hoffe mir kann jemand helfen.

Vielen Dank vorab und viele Grüße
Steffen
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: Antwortstufen und Korrelationen

Beitrag von dutchie »

Hallo Steffen

zu 2!
Steffen_Brick hat geschrieben:Kann ich für meine zweite Hypothese einfach die Korrelationskoeffizienten irgendwie vergleichen?
Das nur mit Korrelationen zu testen ist schlecht!
das kann man testen, steht im BORTZ....wie das geht.

Aber besser mit Hilfe einer linearen Regression, dann über die "betas" (standardisierte Reg.Koeffizienten)
die Prädiktoren vergleichen. Kann man auch testen...steht glaub ich im URBAN...

Man kann aber auch anders herangehen, hierarchisch wechselseiting auf hinzunahme testen!
Schau dir mal "Venn Diagramme zur Korrelation" (ggoollgn) an.
das ganze in drei Teile teilen....
Steffen_Brick hat geschrieben:Oder teile ich meine Stichprobe und gehe da mit einer Unterschiedshypothese ran
Ist mir nicht klar!?
Es geht um einen Unterschied, aber um einen Unterschied in der Höhe der Einflusses, der Höhe der Korrelation.
Ein Unterschied im Zusammenhang! Die Zusammenhänge unterscheiden sich, nicht wie üblich Mittelwerte!

zu 1:
Steffen_Brick hat geschrieben: Kann ich eine Korrelation von zwei metrischen, intervallskalierten Skalen berechnen, die wie bei mir zwei unterschiedliche Antwortstufen haben?
na klar! problemlos! zumindest statistisch:

Man kann auch PS mit Kinderanzahl problemlos korrelieren, trotz verschiedener range!
Range und Varianz sind auf intervallskala beliebig transformierbar (nichtabsolute Größen),
ohne das sich die Ergebnisse ändern! Du kannst die 5er so linear transformiere auf eine 7er!

aber Testtheoretisch? ist das auch egal?
Die Skalierung ist Sache des Testautors!
Da kann man im nachhinein nicht dran rummeckern.
5er oder 7er ist aber nicht beliebig!
Im Äbhängikeit vom Merkmal, das gemessen werden soll,
kann eine falsche Skalierung Fehlervarianz produzieren!
Aber 5er und 7er werden andauernd korreliert, ohne dass sich einer dran stört.

Wenn du aber die Skalen selber gebaut hast, dann mach sie einheitlich, weil
innerhalb einer Befragung, das die Teilnehmer verwirrt, wenn die Skalierung sich ändert!

gruß
dutchie
Steffen_Brick
Beiträge: 7
Registriert: 22.05.2020, 12:48

Re: Antwortstufen und Korrelationen

Beitrag von Steffen_Brick »

Hi dutchie,

erstmal vielen, lieben Dank für die schnelle, ausführliche Antwort.
dutchie hat geschrieben:Das nur mit Korrelationen zu testen ist schlecht!
das kann man testen, steht im BORTZ....wie das geht.
Aber besser mit Hilfe einer linearen Regression, dann über die "betas" (standardisierte Reg.Koeffizienten)
Da hast du Recht, ich werde zu 2. mit einer linearen Regression rechnen, das macht viel mehr Sinn. Und die Venn-Diagramme schau ich mir an.

dutchie hat geschrieben:Ist mir nicht klar!? Es geht um einen Unterschied, aber um einen Unterschied in der Höhe der Einflusses, der Höhe der Korrelation. Ein Unterschied im Zusammenhang! Die Zusammenhänge unterscheiden sich, nicht wie üblich Mittelwerte!
Ja, genau. Ich glaube ich hatte da nen Denkfehler drin, ich denke wie du oben geschrieben hast die Prädiktoren (also in meinem Fall beide Subskalen) in der Höhe des Zusammenhangs mit der Fähigkeit zu vergleichen, das war das, was ich gesucht habe. Mir ist dabei nur nicht klar, wie ich darstellen kann ob der Unterschied der Höhe der Zusammenhänge auch signifikant ist. Das hab ich mit der Unterschiedshypothese durcheinander gebracht. Einfach nur zu sagen, dass R unterschiedlich ist je Subskala wär ja nicht wirklich ausreichend, oder?

dutchie hat geschrieben:na klar! problemlos! zumindest statistisch:
Man kann auch PS mit Kinderanzahl problemlos korrelieren, trotz verschiedener range!
Range und Varianz sind auf intervallskala beliebig transformierbar (nichtabsolute Größen),
ohne das sich die Ergebnisse ändern! Du kannst die 5er so linear transformiere auf eine 7er!
Ok, das ist sehr gut zu hören! Verstehe wirklich nicht, warum mein Prof mir das geraten hat. Das heißt, dass die unterschiedlichen Antwortstufen mir in keiner meiner Rechnungen später zum Verhängnis werden können? (Korr., Lin. Reg. und Prädiktorenvergleich) Hab nochmal dazu gelesen: Verstehe ich es richtig, dass das durch die inbegriffene z-Transformation in der Korrelationsrechnung möglich wird, die die Skalen so transformiert, dass ich das rechnen kann, ohne dass sich die Ergebnisse ändern?

Wie meinst du "nicht absolute Größen"? :)

Mich verwirrt bei der Rechnung mit unterschiedlichen Antwortstufen nur, dass dasselbe herauskommt bei unterschiedlichen Antwortstufen, weil Menschen doch evtl. anders ankreuzen wenn sie ein breiteres Spektrum haben. Zum Beispiel dass sie eher zur Mitte tendieren, als zur äußersten Stufe, wenn sie feinere Abstufungen haben.
dutchie hat geschrieben:aber Testtheoretisch? ist das auch egal?
Die Skalierung ist Sache des Testautors!
Die Skala ist seitens des Autors mit 5 Antwortstufen und ich dachte ja bis dato beide Skalen müssten 7 Stufen haben. Mir ist es auch lieber seine 5 Stufen beizubehalten. Wobei ich ihm aber geschrieben habe und auch die Änderung für ihn in Ordnung wäre. Aber dann könnte ich seine Normwerte nicht mehr heranziehen, von daher ist es eine Erleichterung, dass ich seine 5 Stufen beibehalten kann.

Danke dir nochmal vielmals!

Viele Grüße
Steffen
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: Antwortstufen und Korrelationen

Beitrag von dutchie »

hallo Steffen
Steffen_Brick hat geschrieben:Einfach nur zu sagen, dass R unterschiedlich ist je Subskala wär ja nicht wirklich ausreichend, oder?
wie mans nimmt, R oder lin Regg ist was anderes, du hast drei varianzanteile mit der AV, zwei unique nur durch eine UV bedingt
und einen gemeinsamen, den man beiden zuschlagen könnte.

Berechnungen auf intervallniveau sind invariat bezüglich positiv linearer transformation.
probier das aus, nimm die werte, tranformier X2 zu X1 mit X1=3+4*X2 und korreliere nochmal.
Steffen_Brick hat geschrieben:Wie meinst du "nicht absolute Größen"?
das sind zahlen die man nicht transformieren, ändern darf.
Anzahl der Kinder z.B. !
Anderseits wird niemand größer, wenn man die Körpergröße in meter oder inch oder fuss angibt.
Steffen_Brick hat geschrieben:Mich verwirrt bei der Rechnung mit unterschiedlichen Antwortstufen nur, dass dasselbe herauskommt bei unterschiedlichen Antwortstufen, weil Menschen doch evtl. anders ankreuzen wenn sie ein breiteres Spektrum haben. Zum Beispiel dass sie eher zur Mitte tendieren, als zur äußersten Stufe, wenn sie feinere Abstufungen haben.
erstmal ist das ganze nur faulheit und vor computerzeit!
man müsste alles mit einer analogskala messen!!!
5er oder 7er dient nur der schnellen datenerfassung in der paper pencil zeit!!!
da gibt es eigentlich keine begründung für!!!
frage den prof ob er eine analoge skala will, wenn online befragung stattfindet.
das wäre optimal, es gibt keinen unterschied und die diskussion übers skalenniveau endet!

Die haben aber doch auch viel gemeinsam!

12345 vs 1234567

beide haben eine mitte und zwei extreme !

gruß
dutchie
Steffen_Brick
Beiträge: 7
Registriert: 22.05.2020, 12:48

Re: Antwortstufen und Korrelationen

Beitrag von Steffen_Brick »

Hi dutchie,

habe mich nochmal in aller Ruhe mit dem Thema auseinandersetzen können und mit Dummywerten gerechnet, danke dir für die Antworten!
dutchie hat geschrieben:Berechnungen auf intervallniveau sind invariat bezüglich positiv linearer transformation.
probier das aus, nimm die werte, tranformier X2 zu X1 mit X1=3+4*X2 und korreliere nochmal.
Das macht mittlerweile alles Sinn, kann meinen Test umsetzen.
dutchie hat geschrieben:das sind zahlen die man nicht transformieren, ändern darf.
Anzahl der Kinder z.B. !
Auch logisch, jetzt wo es klick gemacht hat :))
dutchie hat geschrieben:Die haben aber doch auch viel gemeinsam!

12345 vs 1234567

beide haben eine mitte und zwei extreme !
Völlig, hab alles mal mit Dummy-Werten gerechnet und lässt sich wunderbar benutzen. Ich muss die 5er und 7er beibehalten, weil die im Originaltext vorgegeben sind und bei einem darf ich es zu 100% nicht ändern. Aber es passt ja nun alles.

Vielen Dank nochmal!

Grüße
Steffen
Steffen_Brick
Beiträge: 7
Registriert: 22.05.2020, 12:48

Re: Antwortstufen und Korrelationen

Beitrag von Steffen_Brick »

Steffen_Brick hat geschrieben:Meine Hypothesen:
1. Es besteht ein negativer Zusammenhang zwischen Eigenschaft X und Fähigkeit Y.
2. Subskala A sagt Fähigkeit Y stärker negativ voraus als Subskala B.
Zu Hypothese 1 noch eine letzte Frage:
Ich werde diese ja rechnerisch mit einer Korrelation überprüfen. Wenn ich nun sowieso für Hypothese 2 zusätzlich die lineare Regression rechne mit Eigenschaft X als UV und Fähigkeit Y als AV, kann ich dann auch die Aussage treffen, dass Eigenschaft X Fähigkeit Y negativ beeinflusst bzw. einer von vielen Einflussfaktoren ist? Oder wird das schon als zu kausale Aussage angesehen? Ich habe gerade überlegt noch eine weitere Hypothese hinzuzufügen z.B. "Hyp 1.1: Eigenschaft X beeinflusst Fähigkeit Y negativ." Macht das Sinn oder ist negativer Einfluss und negativer Zusammenhang inhaltlich dasselbe und es wäre quasi doppelt gemoppelt. Oder spricht man bei den Ergebnissen einer linearen Regression gar nicht vom Einfluss, sondern von der Eignung zur Voraussage der AV.?

Hoffe du kannst mir nochmal weiterhelfen, lese parallel im Bortz.

lg, und danke
Steffen
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: Antwortstufen und Korrelationen

Beitrag von dutchie »

Hallo Steffen

Du hast einen Zusammenhang zwischen X = UV und Y = AV.

Korrelation:
Der Korrelationskoeffizient drückt aus wie groß der Zusammenhang ist und dessen Richtung!
Positiv je größer X desto größer Y, oder negativ je größer X desto kleiner Y.
Das Quadrat des Korrelationskoeffizient beschreibt vieviel Prozent von Y durch X aufgeklärt wird.

Regression:
Y = a+b*X

wenn der Korrelationskoeffizienz negativ ist b auch negativ!
wenn sich X um 1 ändert andert sich Y um b, wenn b negativ ist wird Y kleiner!

Korrelation und Regression sind nur gemeinsam denkbar, das ist nicht was sich ausschließt.
isofern ist die aussage r ist negativ und b ist negativ identisch, aber nur bei einer einfachen Regression!

Ich brauch beides, weil in einer multiplen Regression kann das komplizierter werden!
da kann r positiv sein und b negativ !!! :shock:
Also macht es schon Sinn den "Zusammenhang" (r oder R) und den "Einfluß"( b oder beta) zu unterscheiden.

isofern sind deine Hypothesen nicht vollständig:

Ha: Es besteht ein negativer Zusammenhang zwischen A und Y
Hb: Es besteht ein negativer Zusammenhang zwischen B und Y
Hc: Der lin. Zusammenhang zwischen A und Y ist größer als zwischen B und Y
Hd: In einer lin. Regression ist das Gewicht (b oder beta) von A größer als von B
Y = a+ b*A + c*B

H3 bezieht sich auf die Korrelation, dabei wird aber außer Acht gelassen, dass A und B eventuell miteinander Korrelieren!

in H4 wird dies mit einbezogen,
wenn B konstant ist, ändert A Y um b
wenn A konstant ist, ändert B Y um c

...lass einfach die Sprache weg, oder Wechsel zumindest von der Posie zur Prosa :D
und schreibe für Ha:

Ho: r >= 0 mit der H1: r<0
Das sind nur Zahlen.
r ist eine andere Zahl als b.

Ob die Zahlen was mit Kausalität zu tun haben,
entscheidet die Methode der Datenerhebnung, aber nicht die Statistik.

Kann sein das r kausal interpreiert werden kann, wenn ein passendes Experiment vorliegt.
Ich denke aber du gehst nur korrelativ vor! wobei wenn r = 0 ist auch Kausalität ausgeschlossen ist!
Aber das hängt wieder davon aber was man unter "kausal" verstehen will.

gruß
dutchie
Steffen_Brick
Beiträge: 7
Registriert: 22.05.2020, 12:48

Re: Antwortstufen und Korrelationen

Beitrag von Steffen_Brick »

Ok, mega! Vielen Dank für die ausführliche Antwort, ich möchte mir das mal in aller Ruhe zu Gemüte führen, antworte dir dann nochmal! Danke für deine Zeit!! lg
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten