Frage zur Testauswahl

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
Studi_2121
Beiträge: 2
Registriert: 24.04.2020, 21:35

Frage zur Testauswahl

Beitrag von Studi_2121 »

Hallo zusammen,

ich bin noch völlig neu in der Statistik-Welt und besitze wirklich gar keine Kenntnisse dazu. Im Rahmen einer Hausarbeit muss ich mich allerdings damit auseinandersetzen und bin am verzweifeln. Ich hab die vorgegebene Aufgabe bis auf eine Unteraufgabe gelöst, nur die ist für mich einfach völlig unverständlich.

Ich teile euch jetzt mal die Aufgabenbeschreibung mit und alle Rahmenbedingungen die vielleicht bei der richtigen Analysewahl behilflich sein könnten.

Aufgabenstellung:
Analysieren Sie die Frage, ob die Anwendung präventiver Maßnahmen mit zunehmender Größe des Betriebs ansteigt. (Berechnen Sie dazu fünf getrennte Analysen für die Variablen A603A bis A603E; das Vorgehen und die Ergebnisse können aber zusammengefasst dargestellt werden.) Begründigen Sie die Auswahl Ihrer Analysemethode mit Hilfe geeigneter Methodenliteratur. Falls Sie signifikante Zusammenhänge finden, beschreiben Sie diese.

Die Variable für die Betriebsgröße hat den Namen A207. Darin sind folgende Anwortkategorien vorhanden: 1 = 1-9 Mitarbeiter; 2 = 10-49 Mitarbeiter; 3 = 50-249 Mitarbeiter, 8 = weiß nicht; 9 = Keine Angabe (das ist die Orginalform der Variable und für mich ist das nominalskalenniveau. Falls ich die Items 8 und 9 als fehlend definiere ergibt sich ordinalskalenniveau).

Die Variablen für die präventiven Maßnahmen gleichen sich allesamt in ihrer Form deswegen beschreibe ich euch nur eine davon, nämlich Variable A603A (Betriebe zahlen Zuschüsse für Fitnessstudiobesuche): Die Items lauten: 1 = Trifft voll und ganz zu; 2 = Trifft eher zu; 3 = Trifft eher nicht zu; 4 = Trifft überhaupt nicht zu; 7 = nicht relevant; 8 = weiß nicht; 9 = Keine Angabe. (das ist ebenfalls die Orginalform und dementsprechend ebenfalls nominalskalennvieau. Falls ich aber hier die Werte 7, 8 und 9 als fehlend definiere erhalte ich doch auch Ordinalskalenniveau).


1. Jetzt muss ich für die Beantwortung der Fragestellung eine richtige Testmethode auswählen. Da darin was von Zusammenhängen steht und ich die beiden Variablen in Ordinalskalenniveau ändern kann, könnte ich doch eine Spearman Rang Korrelation verwenden oder?

2. Wenn ich die Variablen aber in Ihrer orginalform, also beides mit nominalskalenniveau, behalte könnte ich allerdings eine Kreuztabelle machen mit dem, CHi-test, Cramer, und Phi (Also den Kontigenzkoeffizienten verwenden, rechnen oder was man da auch tut.)

3. Wenn ich lediglich in der Variable A603A die fehlenden Werte definiere, dann kann ich doch auch einen H-Test machen. (Ich soll ja aber zusammenhänge unterscheiden, hier untersuche ich doch unterschiede, oder?)

4. Eine Kommilitionin hat die Variablen A603A bis A603E zu einer Variable (A603 T) definiert, sodass sie Mittelwerte in dieser Variable hat und diese Variable Intervallskalenniveau besitzt. Daraufhin hat sie eine Varianzanalyse mit A207 durchgeführt. Allerdings steht in der Aufgabenbeschreibung, dass ich für jede Variable eine getrennte Analyse machen soll, was für dieses verfahren ja nicht gegeben ist.


Also ich hab jetzt vier Optionen weiß aber überhaupt nicht was ich nehmen soll, was richtig ist, was falsch ist, ob alles richtig ist oder vielleicht doch was anderes geht. Und falls ich mich für etwas entscheide weiß ich immer noch nicht wie ich es begründen soll, dass ich genau diese Variante genommen habe.

Ich wäre euch unendlich dankbar wenn ihr mir einen Tipp gebt welcher Test jetzt für diese Aufgabe geeignet ist? Ich weiß wirklich nicht weiter und bin echt frustriert weil ich dies aufgabe so kurz vorm ende auch vernüftig abschließen will. Aber aktuell müsst ich einfach rate nach dem prinzip "ene mene muh - und raus bist du".

Ich hoffe es war irgendwie verständlich was ich hier geschrieben habe. Falls nicht gebt einfach bescheid und ich versuche es gnauer zu beschreiben.

Beste Grüße
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: Frage zur Testauswahl

Beitrag von dutchie »

hallo

das klingt alles begründbar!
kein Vorschlag von 1-4 ist falsch und alle sind möglich!

generell sind alle beschrieben Variablen intervallskaliert!

Kategorien 8 = weiß nicht; 9 = Keine Angabe
trägt nichts zur Lösung der Fragestellung bei!
und sollten eliminiert werden!

man kann auch umkodieren zu "mit antwort", "ohne Antwort" und "weiß nicht"
und sich fragen, ob der dropout mit der AV korreliert!
das hat aber nichts mit der hauptfrage zu tun!

wenn man die AVs A-E zu eine Gesmatscor aggregiert sollte man das begründen!
nicht dass man äpfel und birnen addiert! Begründung inhaltlich und mit Faktorenanalyse
oder ähnlichem Verfahren.

also:

UV: Betriebsgröße. an sich intervallniveau aber schlecht gemesen.
interpretation als ordinal ist fraglich, weil spearman ein fraglicher vorgang!
Problem Rangbindungen..

besser als geordnet kategorial ansehen dann ANOVA machen und schauen,
ob die Mittelwerte bei signifikanz in der erwarteter richtung steigen.
alles ohne Kategorien 8 = weiß nicht; 9 = Keine Angabe

AV: A-E, 5 Variablen: Prävention: intervallskaliert!!!
man braucht die arithmetischen Mittelwerte, um das ganze adäquat zu beschreiben!
auswertung multivariat oder über gesamtscore oder einzeln.
auf einzeln kann nicht verzichtet werden, und immer ANOVA und kein H Test!
alles ohne Kategorien 8 = weiß nicht; 9 = Keine Angabe

also:
1a. dropout analyse
8 = weiß nicht; 9 = Keine Angabe; 1= mit angabe
zusammenhang mit den AVs prüfen, wenn überhaupt!

1b. Korrelationen der AVs berechnen!

2. einfaktorielle ANOVA mit drei geordneten kategorien als UV
plus kontraste!
2a. AV über MANOVA aggregieren. Alphainflation kontrolieren!
2b. AV über Gesamtscore aggregieren.
2c. 5 einzelne ANOVA mit wechslenden AVs

3. Vorrausetzunge prüfen der ANOVA!
Normalverteilung der AVs in den Gruppen !
Homoskedastizität.
Residualanalyse.

und sprachlich brauch man nicht zwischen zusammenhang und unterschied unterscheiden!
Die UV gruppen unterscheiden sich hinsichtlich der AV = es gibt einen zusammenhang zwischen UV und AV.

und in der Lösung die ganzen möglichkeiten alternativem Herangehens diskutieren!
es gibt da kein komplett richtig oder komplett falsch, es verlagern sich nur die Probleme, die jedes Verfahren in sich trägt!
1a bis 3 ist aber der beste weg!

gruß
dutchie
Studi_2121
Beiträge: 2
Registriert: 24.04.2020, 21:35

Re: Frage zur Testauswahl

Beitrag von Studi_2121 »

Hallo dutchie,

vielen Dank dir für die umfassende Antwort.

Ich werde mich mal da dran setzen und mein bestes Versuchen. Ich glaube ganz so umfassend, werde ich das gar nicht machen weil vieles davon gar nicht in diesem Fach behandelt wird, wie z.B. Residualanalyse oder Homoskedastizität.
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten