Stimmt meine Vorstellung meiner statistischen Datenanalyse?

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
jakob_bou
Beiträge: 1
Registriert: 20.07.2019, 12:38

Stimmt meine Vorstellung meiner statistischen Datenanalyse?

Beitrag von jakob_bou »

Hi ihr alle,
ich stehe gerade an einem Punkt, wo ich mir gerne mal eure Meinung oder Hilfe einholen möchte (oder es vielleicht auch muss?!).

Ich schreibe grade meine Masterarbeit an der DHBW und beschäftige mich mit dem Zusammenhang zwischen mobiler Arbeit und Zufriedenheit, Motivation und Leistungsbereitschaft.

Ich bin jetzt in den letzten Zügen und gerade bei der Analyse meiner Umfrage angekommen. Vorab folgende Infos dazu: Aus Zeitgründen musste ich die Umfrage bereits im März vorschalten. Das heißt ich musste sie auch ohne jeglichen theoretischen Hintergrund konzipieren und gestalten. Dementsprechend sind meine Skalen vor allem ordinal. Lediglich für die Motivation habe ich aufgrund diverser abgefragter Ausprägungen einen intervallskalierten Motivationsscore ableiten können.

Ich glaube, was auch noch wichtig ist zum Fragebogen ist folgendes:
Befragt habe ich die Mitarbeiter meines Unternehmens. Allerdings wurde mir unternehmensseitig keine Vollerhebung ermöglicht, weswegen ich mich mit einer nicht repräsentativen Teilgesamtheit abfinden musste
Da in unserem Unternehmen bisher normale Mitarbeiter (lediglich Vorstände und Führungskräfte der zweiten Ebene…) kein mobiles arbeiten nutzen konnten, viele Mitarbeiter dies aber in letzter Zeit gefordert haben, habe ich folgendes Design gewählt:
  • Ich habe den Status quo abgefragt.
  • Anschließend habe ich ein Szenario ausführlich beschrieben, in dem mobiles arbeiten genutzt wird. Daraufhin sollten die Mitarbeiter diese Einschätzungen nochmal vornehmen.
  • Und dann habe ich noch ein weiteres Szenario ausführlich beschrieben. Der einzige Unterschied war die Einführung mobiler Arbeit mit dem Faktor Vertrauensarbeitszeit. Auch hier sollten die Mitarbeiter wieder Werte angeben zu Motivation, Zufriedenheit und Leistungsbereitschaft.
Im Grunde genommen hatte ich mir meine Analyse immer so vorgestellt (lag auch daran, dass wir Statistik nur zum Teil in unseren Vorlesungen behandelt hatten):
  • Herleitung, forschungsdesign etc. im Theorieteil – passt auch soweit
  • Deskriptive und explorative Analyse: Hier wollte ich mit Häufigkeitsverteilungen und Kreuztabellen arbeiten, um erstmal die Ergebnisse zu visualisieren und zu beschreiben. Dafür habe ich dann auch allerlei Lage- und Streuungsmaße ausgeben lassen, die ich im ersten Schritt aber noch nicht wirklich aufgegriffen habe (bspw. Standardabweichung, Varianz oder die Schiefe). Die deskriptive Analyse habe ich jetzt soweit fertig: Allein bei den Abbildungen sieht man relativ deutlich, dass für die Szenarien die Mitarbeiter viel zufriedener, viel motivierter und leistungsbereiter sind. Ich würde es aber ungerne bei der Erkenntnis lassen, dass sich das insgesamt verschiebt, sondern eben auch berechnen, inwiefern diese Zuwächse zusammenhängen.
  • Induktive Analyse – Aus diesem Grund habe ich mir dann Zusammenhangsmaße angeschaut und ein wenig über die induktive Statistik nachgelesen. Dabei bin ich über folgende Verfahren gestolpert, die mir aktuell ein wenig Verständnisprobleme bereiten. Ich würde euch gerne mal vorstellen, wie ich das verstanden habe und wie mein Plan ist:
  • Wenn ich das richtig verstanden habe, hängt mit jeder Kontingenzanalyse auch der Chi-Quadrat-Test als Unabhängigkeitstest zusammen. Damit prüfe ich doch, ob 2 Statistische Merkmale voneinander unabhängig sind, oder? Das wäre jetzt das erste gewesen, was ich im Rahmen der Analyse gemacht hätte. Mache ich den dazugehörigen Arbeitsschritt in spss, wird auch ein Kontingenzmaß abgefragt.
  • Da Ich die Motivation und Zufriedenheit als erklärende Variablen und die Leistungsbereitschaft als erklärte Variable festgelegt habe, arbeite ich ja im Endeffekt ausschließlich mit Ordinalskalen. Dementsprechend wähle ich ja beispielsweise Kendalls Tau b oder c (welches denn nun?). Mir ist allerdings noch nicht klar, wieso ich dieses Maß zusätzlich brauche.
  • Nachdem ich mit dem Chi Quadrat Test festgestellt habe, ob die Merkmale statistisch zusammenhängen, möchte ich natürlich auch die Stärke der Wirkung messen. Also habe ich mir überlegt, Spearmans Rho als Korrelationskoeffizient zu nutzen (Rangkorrelationsanalyse). Dieser Schritt wäre natürlich unnötig, wenn kein statistischer Zusammenhang im Rahmen des Chi Quadrat Tests rauskommt, oder?
  • Jetzt finde ich relativ häufig in der Literatur die Voraussetzung der Nicht-Rangbindung (oder des entsprechenden Maximalwertes). Allerdings werde ich nicht so wirklich glücklich mit den Erklärungen und Definitionen, die ich dazu finde. Heißt das jetzt, dass meine verschiedenen Merkmalsausprägungen nicht gleich heißen dürfen oder wie muss ich das in dem Kontext ordinalskalierter Variablen verstehen?
  • Meiner Verwirrung die Krone aufgesetzt, hat schließlich eine Passage in einem Statistik Buch, die ich eben gelesen habe. Darin steht, das Kendalls Tau eine entsprechende Alternative für Spearmans Rho ist, wenn mehr als ein Fünftel Rangbindung vorliegt. Gehört Kendalls Tau jetzt zum Chi Quadrat Test oder ist das ein Korrelationsmaß?!
Was ich ebenfalls noch häufig gelesen und auf meiner Recherche gesehen habe, sind die Boxplots. Allerdings wurden die an den unterschiedlichsten Punkten angebracht. Ich hätte die Nutzung jetzt zwischen der deskriptiven und vor der induktiven Analyse gesehen. Quasi als Einführung zur Darstellung der Verteilung mitsamt Ausreißern und Extremwerten. Habe ich das richtig verstanden?

Mein Anliegen ist nun: Liege ich mit meiner Richtung grundsätzlich richtig oder mache ich mir unnötig Arbeit? Habe ich vielleicht irgendetwas vergessen oder nicht richtig verstanden? Fällt euch irgendwas zu meiner Analyse ein?

P.S.: Meine Hochschule hat mir SPSS 24 zur Verfügung gestellt, die Arbeit damit funktioniert eigentlich soweit auch ganz gut.
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: Stimmt meine Vorstellung meiner statistischen Datenanaly

Beitrag von dutchie »

hallo jakob

erstmal ist ordinal ungut, besser wäre alles auf intervallniveau zu berechnen
likert = ratingskala = ordinal = meiner meinung nach einfach falsch!!!

spearman ist das maß des zusammehangs auf ordinal (aber eigentlich nicht zu interpretieren)
da gibt es einen eigenen test dafür, du brauchst eigentlich CHI2 nicht, weil der testet auf nominal niveau.

Kendall Tau a,b,c,d,e,..... ist ein weiteres ordinales maß, aber alle sind mist!!!
Man kann diskuieren ob Spearman überhaupt zulässig!

Du hast bestimmt viele Rangbindungen! das betrift nur den Test..
wenn das so ist würde ich alles nominal (bzw. geordnet kategorial) auswerten über CHI2 Test (wie du das auch wohl gemacht hast)
plus irgendein Maß für die größe des zusammenhangs, besser eines auf Nominalniveau lambda z.B.
das hat auch eine richtung. und dann in der interpreation schauen, ob es eine ordinalen zusammenhang gibt
in dem sinne, je mehr dies... desto mehr das...

also signifikanztest : besteht ein zusammenhang? wenn ja wie groß ist der Zusammenhang!
plus interpretation: nominal.. ordinal.. intervall...

du hast ja zwei Arten von Variablen erklärende und zu erklärend, also ursache wirkung
das geht auf ordinal schlecht...
unterscheidung dependenz und interdependenz
ein zusammenhang (Korrelation) feststellen ist was anderes als eine Wirkrichtung zu modellieren (Regression)
aber ohne zusammenhang keine Wirkung..

wenn du mittelwerte, schiefe oder varianz ...berechnest sind die daten für dich intervallskaliert, das geht auf ordinalniveau nicht!!!
das mit dem boxplot siehst du richtig, der teste visuell auf ausreißer, ist teil der deskriptiven statistik.

gruß
dutchie
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten