Methodenauswahl - Regression

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
leacaecilia
Beiträge: 8
Registriert: 06.06.2018, 23:39

Methodenauswahl - Regression

Beitrag von leacaecilia »

Guten Abend liebe Mitglieder des Statistik Forums,

Ich muss ein kleinen wenig ausholen sonst macht meine Frage am Ende wenig Sinn.

Also, ich arbeite momentan an einer Projektarbeit zum Thema der Diskriminierung auf dem französischen Arbeitsmarkt. Diese baut auf einer so genannten Korrespondenz-Studie auf. Dh. die Forscher haben im Zuge ihrer Studie fiktive Bewerbungen auf reale Jobausschreibungen versendet, die sich in allem glichen bis auf die Namen der Bewerber. Die Namen wurden quasi benutzt, um die Herkunft des Bewerbers zu signalisieren. Sie waren gleichermaßen Französisch, Nord-Afrikanisch oder ließen sich nicht genau zuordnen. Die Studie hat herausgefunden, dass Bewerber mit ausländischen Namen weniger zurückgerufen (= zum Vorstellungsgespräch eingeladen) wurden als Bewerber mit Französischen Namen. ==> Rückrufrate (angegeben in %)

Und nun komme ich ins Spiel. Da auch innerhalb der Namens-Gruppen unterschiedliche Namen unterschiedlich viele Rückrufe bekamen, wird vermutet, dass Namen nicht nur mit einer Herkunft in Verbindung gebracht werden, sondern eventuell auch mit bestimmten Vorurteile/Characteristica assoziiert sind , die im Berufsleben eine Rolle spielen.

Ich habe einen Fragebogen konzipiert, in dem die Probanden, die Namen die in der Korrenspondenz-Studie verwendet wurde, bezüglich verschiedener Characteristica einschätzen sollten (sozioökomischen Status, Kreativität, Soziale Kompetenz, Arbeitsverhalten und Berufliche Motivation).
- Die Konstrukte wurden mit verschiedenen items abgefragt. Sozioökonomischer Status anhand einer 3-stufen Skala (Hoch, Mittel, Niedrig) und alle anderen Eigenschaften mit einer 9-stufen Skala.

Nun habe ich einen Datensatz mit pro Namen (ich habe insgesamt 6 Namen untersucht) jeweils 50 Werten für jede dieser Variablen.
Dazu habe ich die jeweiligen Rückrufraten aus der Korrespondenzstudie.

Ich möchte gerne wissen, ob der Unterschied in den Rückrufraten durch eine/mehre dieser Variablen mitverursacht wurden (dh. nicht nur die Herkunft eine Auswirkung hatte). Damit dachte ich zunächst an eine Regression. Nun stehe ich aber vor dem Problem, dass ich für die eine Variable pro Namen einen Wert habe (Call-Back rate) und für die anderen Variablen jeweils 50. Das wird wohl nicht funktionieren, deswegen hatte ich gedacht den Mittelwert oder Summenwert dieser Werte für die Variablen zu berechnen, und dann eine normale Regression durchzuführen. Erscheint das sinnvoll für euch? Falls ja, lieber einen Summen anstelle eines Mittelwerts?

Falls das klappen sollte, befinde ich mich dennoch in der Situation, dass ein Attribut wie soziale Kompetenz beispielsweise evt keine Auswirkungen auf die Rückrufrate bei Französischen Namen hat, bei Nord-Afrikanischen Namen aber sehr wohl. Das würde ich durch eine solche Analyse meiner Meinung nicht herausfinden.

Habt ihr Vorschläge? In meinem Kopf hatte sich das zunächst alles sehr gut angehört aber nun wo ich aktiv bei SPSS mal etwas eingeben müsste, bin ich mir auf einmal gar nicht mehr sicher.

Liebe Grüße und Danke im Voraus :)
Lea
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: Methodenauswahl - Regression

Beitrag von dutchie »

Hallo lea

Das Problem ist eher nicht das Verhältnis 1 zu 50, also eine Av und 50 Variabeln die diese AV erklären sollen
sondern, das du nur 6 Namen hast und diese Call-back rate nur eine Zufallsvariable darstellt.
War der unterschied zwische den Call-back der Namen signifikant?
Dann verbindest du ja zwei kulturen ???
Dir liegen die deutschen Namen vor? Der Name hie und da kann doch ganz anders beurteilt werden.
Call-back rate aus Frankreich und deine Studie spielt in Deutschland?
Wie groß ist n bei jedem Namen?

auf den ersten Blick sieht das so aus:
Du hast irgendwie ein gemischtes lineares Model vor dir, = hierarchisches linearen Modell (hlm)???
Du must alle daten in eine Datei packen ohne Mittelwert oder Summen zu bilden.???
Du packst die Dateien untereinander und differenziert in einer neuen Variablen nach Name.
Und Befragungen pro name sind quasi Messwiederholungen auf den Namen.
Die datei hat 6 mal n zeilen.
Du hast ja für jeden Namen n Meinungen von Befragten über den Namen.
Hat denn jeder Befragte jeden Namen bewertet? Jeder gibt 300 urteile ab?
Das geht auch erstmal um Konkordanz Urteilsübereinstimmung pro Namen
also um Inter- und intra Raterrelibilität...

Frag mich gerade : der Name ist UV bewirkt die Daten (AV) -- die Daten sind (UV) für die Call back (AV)
also kompliziert ist das! :?
Dann ist das was du erhoben hast Mediator für die Wirkung des Namen auf den Call back.
Eine nominale UV bewirkt über Mediatoren eine metrische AV!?

so weit
gruß
dutchie
leacaecilia
Beiträge: 8
Registriert: 06.06.2018, 23:39

Re: Methodenauswahl - Regression

Beitrag von leacaecilia »

Hallo!
War der unterschied zwische den Call-back der Namen signifikant?


Dann verbindest du ja zwei kulturen ???
Dir liegen die deutschen Namen vor? Der Name hie und da kann doch ganz anders beurteilt werden.
Call-back rate aus Frankreich und deine Studie spielt in Deutschland?
Wie groß ist n bei jedem Namen?
Die deutschen Namen waren nur ein Beispiel, tatsächlich habe ich dieselben Namen verwendent wie in der Referenzstudie und die Befragung wurde auch in Frankreich durchgeführt, dh. zumindest kommen die Werte aus der gleichen Kultur. :D

[/quote]
Du hast ja für jeden Namen n Meinungen von Befragten über den Namen.
Hat denn jeder Befragte jeden Namen bewertet? Jeder gibt 300 urteile ab?
Das geht auch erstmal um Konkordanz Urteilsübereinstimmung pro Namen
also um Inter- und intra Raterrelibilität...
[/quote]

Genau, jeder Befragte hat jeden Namen auf jede Characteristica hin beurteilt.

auf den ersten Blick sieht das so aus:
Du hast irgendwie ein gemischtes lineares Model vor dir, = hierarchisches linearen Modell (hlm)???

[/quote]

Du must alle daten in eine Datei packen ohne Mittelwert oder Summen zu bilden.???
Du packst die Dateien untereinander und differenziert in einer neuen Variablen nach Name.
Und Befragungen pro name sind quasi Messwiederholungen auf den Namen.
Die datei hat 6 mal n zeilen.

[/quote]

Okay das verstehe ich soweit, wobei ich dann ja wie gesagt immer noch nur eine call-back rate pro Namen habe. Könnte ich diese dann quasi "vervielfältigen"? dh. bei der Variable Call-Back rate dann jeweils beispielsweise 0,1 eintragen?

Ja es ist super kompliziert, und mein Betreuer lässt nichts von sich sehen.. Etwas blöd gerade alles

Sehr vielen Dank für deine Hilfe!
leacaecilia
Beiträge: 8
Registriert: 06.06.2018, 23:39

Re: Methodenauswahl - Regression

Beitrag von leacaecilia »

Wenn ich aber nun ein hierarchisches linearen Modell, dann wäre auf level 1 ganz klar meine AV die Rückrufrate und die UV dann die Herkunft der Namen?
Und dementsprechend auf Level 2 die UV's bspw. Sozioökonomischer Status und Intelligenz

Ich kriege es gerade nicht hin, diesbezüglich einen klaren Gedanken zu fassen. Zudem ich dann auch eben nur 6 Namen habe, dh. mein n wäre doch 6 und das ist etwas klein für eine wirkliche Aussagekraft eines solchen Modells oder?

Ich hatte sonst überlegt erst einmal eine Spearman-Korrelation zu rechnen plus die Mittelwerte zu vergleichen. Dann hätte ich zumindest erst einmal eine Idee, ob die von mir erhobenen Variablen sich überhaupt zwischen den Namen unterscheiden und ob es überhaupt irgendeinen Zusammenhang zur Rückrufrate gibt.

Was hältst du von dieser Idee?

Danke im Voraus! :)
Lea
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: Methodenauswahl - Regression

Beitrag von dutchie »

Hallo lea

Du kannst auch erstmal folgendes machen:
du hast einen Messwiederholung 6 stufen 6 Namen (bau die Stufen austeigend nach callback wert) eine AV (Z.B: sozialer Status)
damit macht du eine Anova within 1 UV (6stufen) 1 AV (eventuell mutivariat)
gehts dann in Kontraste polynominal (lineare Korrelation der 6 Stufen mit der AV)
Definierst die Variabeln klickst aber nicht auf ok sonder auf einfügen und generiest die Sytantx dazu.
dann musst du die call back Daten per Syntax eingeben, da die namen nur nominal sind
und nicht "gleichabständig"
hinter "polynomial" in der Syntax in klammern die Callback Werte aufsteigend einfügen. da steht in der default syntax (1,2,3..)
das korreliert die call back mit der AV, aber linear.
Punkt 2: dazu macht du Spearmann (ordinal) der 6 Call backs und die 6 Mittelwerte der AV
dann macht du noch den Unterscheid (Kontrast) in der AV und zwischen dem Namen mit dem größten und kleinsten Callback.


Dann hast du 4 Test die das Ganze beschreiben
1. ANOVA die Namen unterscheiden sich in der AV
2. je größer call back umso größer AV (linear)
3. je größer call back umso größer AV (monoton)
4. extreme call back unterscheide führen zu einer sig. veränderten AV

n=6 ?? gehen wir mal auf punkt 2 zurück du hast zu jedem Namen mehrere Urteile nn = Anzahl befragter Personen
man könnte auch über nn Paare den Spearman machen...dann hast du zwei Varianten..hätte ich kein problem damit.
das meinst du mit:
leacaecilia hat geschrieben:Könnte ich diese dann quasi "vervielfältigen"
Das Problem ist: du hast viele AVs, oder Mediatoren...und du musst erstmal in deinen AVs wursteln( z.B Faktorenanalyse)
da kannst du für jeden Namen 6 FAs rechnen ? oder irgendwie Multilevel denken!

gruß
dutchie
leacaecilia
Beiträge: 8
Registriert: 06.06.2018, 23:39

Re: Methodenauswahl - Regression

Beitrag von leacaecilia »

Hallo,

okaay ich glaube nun habe ich eine Idee. Ist aber nicht meine AV aber denn nicht die call-back rate?

Weiterhin habe ich auch den sozioökonomischen Status lediglich mit einer 3-stufen Skala hoch, mittel, niedrig abgefragt..geht das dann trotzdem?

Liebe Grüße
Lea
dutchie
Beiträge: 2762
Registriert: 01.02.2018, 10:45

Re: Methodenauswahl - Regression

Beitrag von dutchie »

Hallo
leacaecilia hat geschrieben:st aber nicht meine AV aber denn nicht die call-back rate?
Ja du willst die Call-back rate erklären, das was ich in der letzten Mail beschrieben habe
(ANOVA Messwiederholung) mach die Call-back (CB) rate aber zur UV aus der du Auf deine AVs schließt.
Mann kann auch von der Wirkung auf die Ursache zurückließen und die Güte feststellen!
Du bekommst dann aber die Call-back rate nicht als Funktion deiner AVs:
M1: CB = f(soz. status, IQ usw...) sondern
M2: IQ = f(CB) und soz. Stat =f(CB)
Das ist erstmal unproblematischer als andersherum. Du korreliert nur einzeln und baust nicht multivariates.
Aber die beiden Herangehensweisen haben nicht unbedingt etwas mit einander zu tun, in dem sinn, dass wenn
bei M2 nichts signifikant wird, auch M1 zu nichts führt. Man kann nicht unbedingt vom einen aufs andere schließen.

3 Stufen wird als intervallskaliert deklariert und fertig. Aber natürlich absprechen mit Betreuer.

CB als AV hab ich Probleme mit, das ist ja auch ein Prozentsatz! und aggregiert, normal wäre als outcome ja
dichotom CB ja -nein.
Erstmal festzustellen, dass die Namen unterschiedlich auf die AV wirken, in der Richtung wie von CB vorhergesagt,
ist meiner meinung nach erst mal genug.

Die andere Idee: sag mir deinen Namen und sag mit was dein Entscheider des Callbacks über dich denkt, und ich reche dir
die Wahrscheinlichkeit deines Callback aus ( das meint ja M1) ist irgendwie schwierig weil die individuelle (ja -nein) nicht
vorliegt. Du kannst ja mal multiple Regg andenken Variabel CB(name) ist messwiederholt, das ist dann irgendwie ein gemischtes Modell?
Kannst ja mal die Fallstudien bei SPSS durchgehen zu mixed Modell, vielleicht ist was dabei.

gruß
dutchie
AntonBLutscht
Beiträge: 1
Registriert: 29.06.2018, 16:20

Re: Methodenauswahl - Regression

Beitrag von AntonBLutscht »

K
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten