Frage zu Datenvorbereitung für Faktorenanalyse

Beitrag von **Blob123** » 20.02.2018, 11:59

Hallo!

Ich habe ein paar Fragen zur Vorbereitung der Daten für eine Faktorenanalyse.

1) In meinem Fragebogen verwenden einige Fragen die Likert-Skala, sind haben allerdings nicht alle die gleiche Anzahl an Kategorien – manche haben 4, manche 5… ist das ein Problem für die FA? Muss ich irgendwas machen, oder kann ich die einfach so auswerten?

2) Des weiteren sind diese dann ja ordinal-skaliert. Ist das trotzdem okay für die FA? Gibt es eine Möglichkeit, diese Daten in metrische umzuwandeln?

3) Zu guter letzt, manche Fragen verwenden nicht die Likert-Skala. Es stehen nur die verschiedene Aussagen zur Verfügung und es werden jene, mit denen man zustimmt, lediglich angekreuzt. Kein „Stimme sehr - gar nicht zu“ also. Wie kann ich diese in Kombination mit den Fragen, die eine Likert-Skala verwenden, trotzdem in der FA benützen?

Im Grunde geht’s also hauptsächlich darum, dass die Fragen, von denen ich denke, dass sie ein gemeinsamen Konstrukt messen, alle anders erhoben wurden, und die Frage ist, ob ich das irgendwie vereinheitlichen muss, oder nicht.

Vielen Dank für die Hilfe!

Beitrag von **dutchie** » 20.02.2018, 13:43

hallo blob

Bitte erst mal googln was eine Likert Skala ist....

glaube eher du läst irgend was raten von 1 bis 5
dazu schauen nach äquidistante Skalen nach Rohrmann, und so machen.

manche haben 4 manche 5 .... ja und warum? das muss doch begründet werden, sich doch schräg!
die mit 4 haben dann einen größeren Messfehler als die mir 5

skalen nach rohrmann sind intervallniveau,

also FA setzt intervallniveau vorraus (es gibt bestimmt Mathe Nerds die das auf Ordinal runterbasteln...)
du hast jetzt items mit 4, 5 und 2 rating spots und in unterschiedlicher anzahl,
alle items messen dasselbe ? und in die derselben richtung? alle Items sind intervallskaliert!
gehen tut das.. gut ist das nicht, weil z.B die korrelationen bei nur zwei ausprägungen nicht so frei
variieren könne als bei 5 Stufen, isofern ist die Wahrscheinlichkeit das die "laden" kleiner.

wenn du davon ausgehst, dass das merkmal stetig dimensioniert ist und auch an sich metrisch ist
(also nicht in der Messung sondern in "echt" auf freier Wildbahn sozu sagen)
dann hat jede VP einen leicht anderen Wert, du vergiebst dann, an (sagen wir) 40% der Leute einen indentischen Messwert
der kann dann nur falsch sein,

so weit
gruß
dutchie

Beitrag von **Blob123** » 20.02.2018, 14:54

dutchie hat geschrieben:hallo blob

Bitte erst mal googln was eine Likert Skala ist....

glaube eher du läst irgend was raten von 1 bis 5
dazu schauen nach äquidistante Skalen nach Rohrmann, und so machen.

manche haben 4 manche 5 .... ja und warum? das muss doch begründet werden, sich doch schräg!
die mit 4 haben dann einen größeren Messfehler als die mir 5

skalen nach rohrmann sind intervallniveau,

also FA setzt intervallniveau vorraus (es gibt bestimmt Mathe Nerds die das auf Ordinal runterbasteln...)
du hast jetzt items mit 4, 5 und 2 rating spots und in unterschiedlicher anzahl,
alle items messen dasselbe ? und in die derselben richtung? alle Items sind intervallskaliert!
gehen tut das.. gut ist das nicht, weil z.B die korrelationen bei nur zwei ausprägungen nicht so frei
variieren könne als bei 5 Stufen, isofern ist die Wahrscheinlichkeit das die "laden" kleiner.

wenn du davon ausgehst, dass das merkmal stetig dimensioniert ist und auch an sich metrisch ist
(also nicht in der Messung sondern in "echt" auf freier Wildbahn sozu sagen)
dann hat jede VP einen leicht anderen Wert, du vergiebst dann, an (sagen wir) 40% der Leute einen indentischen Messwert
der kann dann nur falsch sein,

so weit
gruß
dutchie

Danke für deine Antwort, dutchie! Also Likert-Skala ist doch so eine Stimme-sehr-zu bis Stimme-gar-nicht-zu-Skala, wenn ich das jetzt richtig recherchiert habe. Das was du meinst, wäre eher eine Rating-Skala, wenn ich das jetzt richtig nachgeschaut habe. Bei mir sind es immer Stimme-zu / Trifft-zu -Fragen, mit Ausnahmen von einigen, wo es wie du sagst nur 2 Möglichkeiten gibt (Nennung oder keine Nennung).

Laut Wikipedia würden diese Rating-Skalen nach Rohrmann z.B. Häufigkeiten, Intensitäten oder Wahrscheinlichkeiten messen. Bei mir geht’s wie gesagt aber wirklich nur um Aussagen, denen man zustimmt oder nicht. (bzw. inwiefern man ihnen zustimmt)

Würde das etwas an der Sache ändern?

Ansonsten:

• Auf ordinal „runterrasseln“ habe ich gehört. Manche meinen auch, nach 5 Kategorien könnte man die Ordinalskala als Intervallskala betrachten.

• Habe auf mehreren Seiten (auch hier glaube ich), gelesen, dass die Länge (4, 5, gemischt mit gar 10 Möglichkeiten) kein Problem sein soll, da die FA ohnehin „standardisiert“ und dann wieder andere Quellen, die etwas anderes behaupten, und dass das nicht gehen würde, bzw. nur mit z-Transformation.

Beitrag von **dutchie** » 20.02.2018, 15:06

hallo

ach zwei experten und drei meinungen

also ich hab grad ein paper vor mit
Bewertung von aussagen mit

stimmt, oder ich stimme zu, das ist eine intensität
nicht
wenig
mittelmäßig
ziemlich
sehr
mit 5 Stufen

wenn du items hast mit zwei stufen hast du nach zTransformation auch zwei stufen...
gehen wir das anders an ...
konstruierst du eine Skala? oder
verwendest du eine bestehende
und was willst du messen?

erstmal ich bleib online
gruß
dutchie

Beitrag von **Blob123** » 20.02.2018, 15:12

dutchie hat geschrieben:hallo

ach zwei experten und drei meinungen

also ich hab grad ein paper vor mit
Bewertung von aussagen mit

stimmt, oder ich stimme zu, das ist eine intensität
nicht
wenig
mittelmäßig
ziemlich
sehr
mit 5 Stufen

wenn du items hast mit zwei stufen hast du nach zTransformation auch zwei stufen...
gehen wir das anders an ...
konstruierst du eine Skala? oder
verwendest du eine bestehende
und was willst du messen?

erstmal ich bleib online
gruß
dutchie

Was genau bedeutet Skala in diesem Zusammenhang? Das hat jetzt nichts mit der Datenskala (ordinal, metrisch, etc.) zu tun, oder? Ich habe nämlich den Begriff Skala schon mit der FA in Zusammenhang, ich glaube in einem anderen Kontext verwendet, gesehen, aber nicht ganz verstanden, was damit gemeint wird.

Ich will eine liberale Einstellung messen, dafür würde ich eben die FA auf die der beantworteten Fragen anwenden. Ob das Ziel des Fragebogens war, den Grad der liberalen Einstellung zu messen, oder nicht, weiß ich nicht, da ich nur den Fragebogen so bekommen habe, ohne irgendwas darüber zu wissen. Nachdem ich den Fragebogen allerdings Frage für Frage „zerlegt“ habe, ist mir dieses Muster aufgefallen, und man könnte wirklich sehr gut die liberale Einstellung anhand einer Reihe an verschiedenen Themen messen - deshalb die Idee mit der FA.

Danke!

Beitrag von **dutchie** » 20.02.2018, 15:30

weis nicht ob ich das versteht..
was ein item misst, ist nicht durch eine FA feststellbar, sondern nur ob die Antworten verschiedener Items
korrelieren, sonst nix. wenn die alle perfekt korrelieren, heist das nicht dass sie das messen was du willst.
liberale Einstellung.
spontan würd ich sagen das ist zu komplex, alsdass man das so aufgrund zufällig gefundener Items
die eigentlich nicht dafür konstruiert wurden (wenn ich dich richtig verstehe) messen kann.
Einstellungen sind Likert mäßig, der hatte aber in der mittleren Kategorie nicht sowas wie
mittelmäßig (d.h. merkmalsausprägung =3) sondern neutral, an dem Thema der Möglichkeit als antwort zu einer Einstellung
eine neutrale position (quasi unentschieden) einnehmen zu könne, im vergleich zu mittel ist schon ein Thema für sich.

ob ein item das misst, von dem du glaubst das es liberale Haltung misst oder so , würd ich nicht allein
entscheiden wollen.
du hast erstmal kein statistischen problem, sondern ein inhaltliches...
was eine Skala ist weiß auch kein Mensch, man benutz den Begriff und es klapp irgendwie

nenn doch mal ein paar items

gruß

Beitrag von **Blob123** » 23.02.2018, 20:42

dutchie hat geschrieben:weis nicht ob ich das versteht..
was ein item misst, ist nicht durch eine FA feststellbar, sondern nur ob die Antworten verschiedener Items
korrelieren, sonst nix. wenn die alle perfekt korrelieren, heist das nicht dass sie das messen was du willst.
liberale Einstellung.
spontan würd ich sagen das ist zu komplex, alsdass man das so aufgrund zufällig gefundener Items
die eigentlich nicht dafür konstruiert wurden (wenn ich dich richtig verstehe) messen kann.
Einstellungen sind Likert mäßig, der hatte aber in der mittleren Kategorie nicht sowas wie
mittelmäßig (d.h. merkmalsausprägung =3) sondern neutral, an dem Thema der Möglichkeit als antwort zu einer Einstellung
eine neutrale position (quasi unentschieden) einnehmen zu könne, im vergleich zu mittel ist schon ein Thema für sich.

ob ein item das misst, von dem du glaubst das es liberale Haltung misst oder so , würd ich nicht allein
entscheiden wollen.
du hast erstmal kein statistischen problem, sondern ein inhaltliches...
was eine Skala ist weiß auch kein Mensch, man benutz den Begriff und es klapp irgendwie

nenn doch mal ein paar items

gruß

Naja, zufällig gefundene Items waren es nicht, nachdem ich den Fragebogen Frage für Frage „zerlegt“ habe, und mir bei wirklich jeder Frage selber die Frage gestellt habe, was denn genau hier das Forscherteam mit dieser Frage messen / herausfinden wollte, bin ich zum Schluss gekommen, dass es genau auf das hinausläuft.

Es wurden also schon sehr viele Einstellungen abgefragt, wo man dann sagen konnte, okay, der ist eher liberal, der eher nicht, etc. Z.b. Position zur Gleichberechtigung der Frau, oder zur Sterbehilfe, etc. Liberal ist im historischen Kontext ja nichts anderes als „offen“. Und da hätte ich das eben gerne gemessen. Das heißt, was das inhaltliche betrifft, wäre das natürlich schon geregelt. Hab das aufgearbeitet mit Literatur, etc.

Die FA habe ich allerdings bereits probiert (mit Fragen, die alle die gleichen Antwortoptionen hatten, habe nur ein paar umpolen müssen), und der KMO lag bei 0,6, also eigentlich knapp nicht ausreichend, damit man es wirklich als „liberal“ zusammenfassen könnte. Oder die Menschen haben unterschiedliche Ansichten (liberale oder konservative) je nach Thema, das wäre auch möglich. Aber ich denke, die ausgewählten Fragen waren einfach nicht ausschlaggebend genug, aber die, die nicht die gleiche Länge / Antwortkategorien, etc. haben, weiß ich nicht, wie ich sie standardisieren soll, damit sie alle miteinander vergleichbar sind.

Letzten Endes brauche ich die FA doch nicht – habe einen anderen Weg eingeschlagen. Wie es möglich gewesen wäre, diese Fragen alle zu standardisieren, um sie miteinander vergleichen zu können (bzw. um zu sehen, ob sie auf einen Faktor laden) hätte ich dennoch interessant gefunden.

Beitrag von **dutchie** » 24.02.2018, 12:40

hallo blob
eine "standartisierung" ... also irgendwie eine nachträgliche vereinheitlichung der antworten?
ein verwandeln der 2er Antworten irgendwie auf eine 5er Antwort?
naja man könnte die 2er schon auseinander ziehen auf 5er, auf den Mittelwert der 5er hoch skalieren.
(Skala: auf der Skala stehen die Zahlen und insbesondere die Abstände zwischen diesen (bei intervallskala),
die man dem Merkmal zuordnet: thermometer, Lineal usw...)

Machst du jetzt in Liberalismus oder Hilfsbereitschaft?

gruß
dutchie

Beitrag von **Blob123** » 24.02.2018, 15:19

dutchie hat geschrieben:hallo blob
eine "standartisierung" ... also irgendwie eine nachträgliche vereinheitlichung der antworten?
ein verwandeln der 2er Antworten irgendwie auf eine 5er Antwort?
naja man könnte die 2er schon auseinander ziehen auf 5er, auf den Mittelwert der 5er hoch skalieren.
(Skala: auf der Skala stehen die Zahlen und insbesondere die Abstände zwischen diesen (bei intervallskala),
die man dem Merkmal zuordnet: thermometer, Lineal usw...)

Machst du jetzt in Liberalismus oder Hilfsbereitschaft?

gruß
dutchie

Ja, das klingt schon sehr nach „Pfusch“, oder? Wie würde man das ansonsten machen? Was wäre die „korrekte“ Art und Weise, unterschiedliche Variablen, die nicht dieselbe Skalierung haben, einer FA zu unterziehen?

Beides, ist aber unabhängig voneinander

Beitrag von **dutchie** » 24.02.2018, 18:35

hallo blob

es zu machen ist ja kein problem, wenn alle variablen intervallskaliert sind.
es kann nur sein das die mit 5 einen faktor bilden weil alle 5er skalen haben
und die 2er einen faktor bilden, also nicht korrelieren, weil sie dasselbe messen,
sondern aufgrund derselben Methode, gerade wenn die items ihrem eigentlichen umfeld
gewaltsam

(aber in bester absicht

) entrissen wurde.
das gibts und das muss beachtet werden, wenn man so was macht.

Blob123 hat geschrieben:Ja, das klingt schon sehr nach „Pfusch“, oder? Wie würde man das ansonsten machen? Was wäre die „korrekte“ Art und Weise, unterschiedliche Variablen, die nicht dieselbe Skalierung haben, einer FA zu unterziehen?

Die Skalierung unterscheidet sich nicht im Niveau (alles Intervall) sondern in der range (Spannweite) und wohl im messfehler.
Auf jedem Fall würde man an den Zahlen nix ändern, das würde auch nix bringen.
Nein, so wie sie sind, rein in die Faktorenanalyse, und je nachdem, eher bei der interpretation alle Problem berücksichtigen.
Aber in so eine Situation kommt man normal nicht. Wenn, dann würde man eher die Scores der Tests korrelieren, also
score der 5er, mit score der 4er, und score der 2er, als das man auf itenebene rumdaddelt.
aber dafür hast du, glaub ich, nicht genug Items.
wenn ich das richtig verstehe, hast du einen großen datensatz mit allerlei vor dir, und bastels ein wenig rum, oder?

gruß
dutchie