Mehrere Variablen zu einer einzigen zusammenfügen

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
Helsinkilainen
Beiträge: 10
Registriert: 29.01.2012, 22:36

Mehrere Variablen zu einer einzigen zusammenfügen

Beitrag von Helsinkilainen »

Hallo,
eigentlich erscheint die Frage sehr einfach:
Ich möchte z.B. wissen wie bekannt das Thema Marke in Unternehmen ist sind und habe nicht eine einzige Frage gestellt mit Antwortskala "gar nicht bekannt - sehr bekannt" (also ordinale/ metrische Variable), sondern dies durch 3 Einzelfragen erfragt.
Nun möchte ich diese Einzelfragen als eine einzige Variable angezeigt haben lassen: Transformieren-> Variable berechnen-> MEAN.
1. Frage: Dies ist doch auf jeden Fall richtig so, oder kommt es da schon zu Ungenauigkeiten? Würde mich schon über eine Antwort dazu freuen. Jegliche Beiträge erklären das Zusammenfügen von Variablen nur mit IF-Befehlen, die mir leider nicht sehr viel sagen.

Wenn ich jetzt jedoch die Korrelation zwischen dieser Frage und anderen berechne, so ergibt sich für die MEAN-Variable eine andere Korrelation als wenn ich die 3 Einzelfragen getrennt betrachte mit den anderen Fragen. Habe die Korrelation der 3 Einzelfragen zusammengerechnet und durch 3 geteilt- oder kann man das nicht?

Danke für eure Antworten!
Urlaub
Beiträge: 10
Registriert: 24.02.2012, 14:52

Beitrag von Urlaub »

Hallo,

kannst du bitte noch deine drei Fragen mit Antworten schreiben...

Danke
Helsinkilainen
Beiträge: 10
Registriert: 29.01.2012, 22:36

Beitrag von Helsinkilainen »

Hi, die 3 Fragen zur Überfrage "Markenverständnis" sind:
Eine Marke soll
a) das Unternehmen von Wettbewerbern differenzieren
b) den Kunden ansprechen
c) ein erfüllbares Versprechen geben

->> Antwort jeweils mit Likertskala (Ensprechungen sind vll nicht ganz so korrekt, mach das Ganze auf Englisch)
1=stimme überhaupt nicht zu
2 = stimme weniger zu
3= stimme teilweise zu, teilweise nicht
4= stimme sehr zu
5=stimme voll und ganz zu

Wär cool wenn du dazu was weißt! Vielen Dank.
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

würde dir das helfen ... ?

Du baust mit deinen drei Fragen drei Vektoren im n-dimensionalen Raum auf und mit der Mittelung (arithm. Mittel) bildest du einen neuen Vektor. Natürlich ist die Korrelation dieses neuen Vektors mit weiteren Items eine andere, bzw. nicht notwendigerweise die gleiche. Und schon bist du mitten in der Testtheorie. Und auch in der Linearen Algebra.

Schau' mal nach bei Lienert und Raatz. Das ist komplizierte Materie.
drfg2008
Helsinkilainen
Beiträge: 10
Registriert: 29.01.2012, 22:36

Beitrag von Helsinkilainen »

Hallo dfrg2008,
vielen Dank für deinen Beitrag. Habe ich es mir denn so kompliziert gemacht mit meinen Unterfragen? Ich schreibe "nur" eine Bachelorarbeit, und es ist mein erster statistischer Test.
Habe leider keinen Zugang zu Lienert und Raatz, schreibe in Helsinki und da gibt's nur Englischsprachiges wo ich dann leider ganz aussteige.
Aber wenn ich dich richtig verstehe ist es also korrekt so den Mittelwert zu bilden? Sicherlich variiert dieser Mittelwert dann in Abhängigkeit von anderen Variablen, nur es wundert mich dass bei dieser Korrelation der Gesamtwert ein anderer ist als wenn ich nur den Mittelwert nehme. Also ist das normal? Bzw vernachlässigbar bei einer Bachelorarbeit?

Danke.
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Aber wenn ich dich richtig verstehe ist es also korrekt so den Mittelwert zu bilden?
Ja.

Also ist das normal? Bzw vernachlässigbar bei einer Bachelorarbeit?
Nein.
drfg2008
Helsinkilainen
Beiträge: 10
Registriert: 29.01.2012, 22:36

Beitrag von Helsinkilainen »

was kann ich denn dann genau machen wenn es nicht vernachlässigbar ist? Woran liegt es dass andere Korrelationswerte rauskommen? Is der Mittelwert immer etwas ungenau?
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Ich möchte z.B. wissen wie bekannt das Thema Marke in Unternehmen ist sind und habe nicht eine einzige Frage gestellt mit Antwortskala "gar nicht bekannt - sehr bekannt" (also ordinale/ metrische Variable), sondern dies durch 3 Einzelfragen erfragt.
Offensichtlich ist das nicht deine Fragestellung, sondern du stellst auf einen Zusammenhang ab, den du aber nicht erläuterst.

Wenn du das mal genauer darstellst, sage ich dir auch, wie du das lösen kannst.

Vorausgesetzt du hast SPSS.
drfg2008
Helsinkilainen
Beiträge: 10
Registriert: 29.01.2012, 22:36

Beitrag von Helsinkilainen »

Hi dfrg,
ja das war meine erste Fragestellung, ob das mit dem Mittelwert so korrekt ist. Ich habe SPSS, also versuche ich mal genauer zu erklären um was es geht:
Ich habe für "Markenverständnis" die 3 Unterfragen (siehe auch oben Erläuterung)
a) Marke soll differenzieren (Antwortskala 1-5)
b) Marke soll Kunde ansprechen (Antwortskala 1-5)
c) Marke soll nur erfüllbares Versprechen geben (Antwortskala 1-5).
Hier habe ich von den 3 Variablen von allen Fällen den Mittelwert von (a+b+c) gebildet (Mittelwert= 4.39) (ich weiß, sehr hoch, da Befragte voll zustimmen).

Jetzt interessiert mich in welchem Zusammenhang "Markenverständnis" und "Anzahl der Mitarbeiter im Unternehmen" (Ordinal: 1-9 MA, 10-250 MA, über 250 MA) stehen.
Dazu habe ich bivariate Korrelation gewählt, und Variable "Mittelwert Markenverständnis" und "Anzahl Mitarbeiter korreliert mit Spearman's Rho (wenn ich Pearson mache sind die Werte geringfügig anders, aber ich habe das gleiche Problem).
Es ergibt sich eine Korrelation von 0.086.
Zudem habe ich, "einfach mal so" geschaut welche Korrelation sich ergibt wenn ich Frage a, b, c jeweils einzeln mit "Anzahl Mitarbeiter" korreliere.
Für a mit Anzahl Mitarbeiter ergibt sich 0.104, für b) 0.038, für c) 0.059.

Was ich jetzt meine ist: Sollte ((0.104+0.038+0.059)/3) nicht gleich 0.086 sein? Es ist aber 0.067 und damit verschieden von der Korrelation "Markenverständnis" allgemein.

Kann ich diese Korrelationen von a-c nicht einfach so zusammenrechnen und durch 3 teilen, oder ist sogar die Korrelation von einer neu gebildeten Variable "Markenverständnis allgemein" mit Anzahl Mitarbeiter ein unzulässiger Vorgang?
Muss ich bei Korrelation eventuell wirklich jede einzelne Variable betrachten? Wenn ja gilt das gleiche ja auch für Regression, richtig?

Ich hoffe ich konnte mein Problem erläutern. Ich würde mich sehr über eine Antwort freuen.

Grüße.
Helsinkilainen
Beiträge: 10
Registriert: 29.01.2012, 22:36

Beitrag von Helsinkilainen »

Hi,
zu erwähnen wäre vielleicht noch, dass ich bei der Bildung des Mittelwertes "Markenverständnis" die Voreinstellung von SPSS für fehlende Werte übernommen hab, d.h. dass fehlende Werte durch den Mittelwert der anderen Variablen ersetzt werden.
Vielleicht kommt es auch dadurch zu dieser "Ungenauigkeit" wenn der Mittelwert bei a, b, c sich dann nur aus weniger und "wahren" Fällen zusammensetzt, da ja diejenigen Fälle, die fehlen, einfach weggelassen werden.
Wenn ich hier die radikale Methode wähle und alle Fälle entferne, die irgendwo einen fehlenden Wert aufweisen bleibt nur sicher nicht mehr so viel übrig in meiner Datenbank....
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Kann ich diese Korrelationen von a-c nicht einfach so zusammenrechnen und durch 3 teilen

Also geht es nicht um die Bildung eines Mittelwerts von Items sondern von Korrelationen.

Nein. Das geht nicht. Man kann nicht die Pearson Korrelationen addieren und dann durch die Anzahl der Korrelationen dividieren. (siehe Fisher-Z Transformation)

Außerdem wäre die eigentliche Fragestellung zu klären. Hättest du die Unternehmensgröße nicht-klassiert erhoben, hätte man eventuell einfach eine lineare Regression bilden können. Bei drei Items eine Faktorenanalyse mit orthogonaler Rotation vorzuschalten, um der möglichen wechselseitigen Korrelation der Items gerecht zu werden, wäre zwar zu überlegen, aber schon etwas merkwürdig angesichts der geringen Zahl an Items.

Vergleichbare Beispiele findest du bei Achim Bühl: SPSS. Oder bei Backhaus, ... .
drfg2008
Helsinkilainen
Beiträge: 10
Registriert: 29.01.2012, 22:36

Beitrag von Helsinkilainen »

Hi drfg,
vielen lieben Dank für deine Tips. Ich glaube ich versuche das jetzt zu umgehen...
Hast du zufällig eine Idee wie ich 2 Variablen, die jeweils aus mehreren Untervariablen bestehen und daher mehrere Mittelwerte bilden können, als 2 Linien in EINEM Diagramm ohne Abhängigkeit von einer dritten "Kategorievariable" oder so darstelle?
Habe es auch bei Excel versucht, allerdings bekomme ich keine Y-Sekundärachse im Liniendiagramm (Wenn ich Diagramm auf Balken umstelle um Sekundarachse wählen zu können werden die Werte bei der Variablen als Gerade angezeigt...) hin um mir auf beiden Seiten Beschriftungen anzeigen zu lassen....
LG
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten