Hallo ihr Lieben
ich habe ein Problem beim Hypothesen testen zu meiner Bachelorarbeit. Ich untersuche die Darstellung von Flüchtlingen in Tv Programmen ( sowohl öffentlich rechtlich als auch kommerziell) und vergleiche dann wie die Flüchtlinge, die zu Gats sind in den Programmen und sich über die Flüchtlingsthematik aussprechen, via Twitter von anderen kommentiert werden. Ich mache also eine Inhaltsanalyse von den Programmen und den Twitter Tweetws pro Minute. Meine Hypothesen die ich testen will sind folgende:
H1: “Flüchtlinge werden im Vergleich zu Deutschen negativer kommentiert auf Twittern, wenn diese über die Flüchtlingsproblematik sprechen"
H2: “Flüchtlinge werden im Vergleich zu Deutschen negativer kommentiert auf Twitter, wenn diese über die Flüchtlingsproblematik in einem Programm sprechen, dass dem privatsendern angehörig ist. "
H3: “Männliche Flüchtlinge werden negativer kommentiert auf Twitter als weibliche Flüchtlinge, wenn diese über die Flüchtligsthematik im privaten Sender sprechen"
Meine abhängige Variabel ist die Art und Weise der Twitter Tweets (positiv und negativ). Meine unabhängigen Variabelen sind Geschlecht und Etnischer Hintergrung. Meine Moderatorvariabel ist der Typ Programm ( Also öffentlich rechtlich oder privat).
Ich habe bei Spss bereits eine Liste gemacht die die Tweetws in positiv und negativ aufsplittet. Außerdem habe ich die Programme pro minute codiert. Trotzdem bin ich total überfragt, wie ich nun meine Hypothesen genau testen kann ..
Eine Regressionsanalyse sollte es sein, allerdings weiß ich nicht genau wie ich das angehen muss. Kann mir vielleicht einer helfen?
Hier meine bisherige Syntax :
GET DATA /TYPE=TXT
/FILE="\\CNAS.RU.NL\s4331133\Documents\practicum 2 spss\Luccatotnieuw.txt"
/ENCODING='UTF8'
/DELCASE=LINE
/DELIMITERS=";"
/QUALIFIER='"'
/ARRANGEMENT=DELIMITED
/FIRSTCASE=2
/IMPORTCASE=ALL
/VARIABLES=
id F3.0
text A148
created_at A30
time F10.0
type A12
twdate A19
y F4.0
m F1.0
d F2.0
twdate2 A10
twtime A19
hrs F2.0
min F2.0
sec F2.0
twtime2 A19.
* in dit geval worden er 72 variabelen aangemaakt, één voor elke indicator die naar een algemeen thema verwijst
do repeat a = th001 to th072.
compute a=0.
end repeat print.
do repeat a = th001 to th072 /
b= "bagger" "dom" "domme" "gelul" "huilpartij" "idioot" "idioten" "aansteller" "bah" "bullshit" "drama" "eng" "ergeren" "fail" "flauw"
"flauwe" "helaas" "om te huilen" "om te janken" "jammer" "kut" "lul" "moeilijk" "ongemakkelijk" "onzin" "pijnlijk" "sip" "shit" "slecht"
"slechte" "slechter" "slechtste" "tenenkrommend" "verschrikkelijk" "verschrikkelijke" "vreselijk" "waardeloos" "zeuren" "zeurderig" "zielig"
"zielige" "verdrietig" "geschrokken" "bang" "bange" "geïrriteerd" "irritant" "irritante" "saai" "ontevreden" "aangrijpend" "geroerd" "gefrustreerd"
"stom" "stomme" "haat" "raar" "rare" "treurig" "hopeloos" "vervelend" "teleurgesteld" "onveilig" "onsympathiek" "onuitstaanbaar" "storend"
"afschuwelijk" "onacceptabel" "nare" "gestoord" "lullig" "negatief" .
* deze syntax zoekt op welke positie binnen de tekst één van deze 72 woorden staat .
compute a=a+char.index(lower(text),b).
end repeat print.
* we zijn niet geinteresseerd in de positie van het woord binnen de tekst Alleen of het er in voorkomt.
* daarom wordt alles wat groter dan nul is gecodeerd naar 1 (aanwezig).
recode th001 to th072 (0=0)(1 thru hi =1).
delete variables th001 to th072.
do repeat a = th001 to th071.
compute a=0.
end repeat print.
* in dit geval worden er 71 variabelen aangemaakt, één voor elke indicator die naar een algemeen thema verwijst.
do repeat a = th001 to th071 /
b= "lieve" "aanstekelijk" "aantrekkelijk" "bijzonder" "blij" "briljant" "briljante" "cool" "eerlijk"
"fan" "fantastisch" "fantastische" "fijn" "fijne"
"gelukkig" "gelukkige" "geniet" "genieten" "geweldig" "geweldige" "goed" "goede" "goeie"
"grappig" "heerlijk" "heerlijke" "held" "helden" "hilarisch" "interessant" "interessante" "leuk" "leuke" "leukste" "leuker"
"legendarisch" "mooi" "mooie" "plezier" "prachtig" "prachtige" "prima" "respect" "slim" "slimme" "top" "topper"
"trots" "vrolijk" "enthousiast" "opgewonden" "tevreden" "geliefd" "liefde"
"optimistisch" "hoopvol" "verrast" "beter" "veilig" "sympathiek" "sympathieke" "schitterend"
"vriendelijk" "intelligent" "voorbeeld" "voorbeeldig" "sympathiek" "mogen" "behagen" "goedkeuren" "positief ".
* deze syntax zoekt op welke positie binnen de tekst één van deze 71 woorden staat .
compute a=a+char.index(lower(text),b).
end repeat print.
* we zijn niet geinteresseerd in de positie van het woord binnen de tekst Alleen of het er in voorkomt.
* daarom wordt alles wat groter dan nul is gecodeerd naar 1 (aanwezig).
recode th001 to th071 (0=0)(1 thru hi =1).
* het aanwezig zijn van alle indicatorwoorden binnen de tekst worden bij elkaar opgeteld.
* in dit geval is de theoretische range 0-72.
compute tweetsnegatief=sum(th001 to th072).
freq var = tweetsnegatief.
* als je enkel geinteresseerd bent in of minimaal een van de woorden in de tekst voorkomt kunen de range 0-72 terugcoderen naar
* 0=geen indicatorwoorden komen in de tekst voor, en 1=minimaal een van de 72 woorden is aanwezig in de tekst.variable label tweetsnegatief 'tweetsnegatief'.
recode tweetsnegatief (0=0)(1 thru hi=1).
variable label tweetsnegatief 'tweetsnegatief'.
EXECUTE.
FORMATS tweetsnegatief(F1) .
EXECUTE.
descriptives var = th001 to th072 tweetsnegatief /sort mean (d).
* informatie over de indicatoren hebben we niet meer nodig en worden uit de datamatrix verwijderd.
delete variables th001 to th072.
* het aanwezig zijn van alle indicatorwoorden binnen de tekst worden bij elkaar opgeteld.
* in dit geval is de theoretische range 0-71.
compute tweetspositief=sum(th001 to th071).
freq var = tweetspositief.
* als je enkel geinteresseerd bent in of minimaal een van de woorden in de tekst voorkomt kunen de range 0-71 terugcoderen naar
* 0=geen indicatorwoorden komen in de tekst voor, en 1=minimaal een van de 71 woorden is aanwezig in de tekst.variable label tweetspositief 'tweetspositief'.
recode tweetspositief (0=0)(1 thru hi=1).
variable label tweetspositief 'tweetspositief'.
EXECUTE.
FORMATS tweetspositief(F1) .
EXECUTE.
descriptives var = th001 to th071 tweetspositief /sort mean (d).
* informatie over de indicatoren hebben we niet meer nodig en worden uit de datamatrix verwijderd.
delete variables th001 to th071.
* het aanwezig zijn van alle indicatorwoorden binnen de tekst worden bij elkaar opgeteld.
* in dit geval is de theoretische range 0-71.
SORT CASES BY twdate2 hrs min.
AGGREGATE
/OUTFILE="\\CNAS.RU.NL\s4331133\Documents\practicum 2 spss\negatiefaggr.sav"
/PRESORTED
/BREAK=twdate2 hrs min
/tweetsnegatief_sum=SUM(tweetsnegatief)
/nbreak =n.
DATASET DECLARE positiefaggr.
AGGREGATE
/OUTFILE='positiefaggr'
/BREAK=twdate2 hrs min
/tweetspositief_sum=SUM(tweetspositief)
/nbreak =n.
get file ="\\CNAS.RU.NL\s4331133\Documents\practicum 2 spss\negatiefaggr.sav".
get file = "\\CNAS.RU.NL\s4331133\Documents\practicum 2 spss\negatiefaggr.sav".
Match files file ="\\CNAS.RU.NL\s4331133\Documents\practicum 2 spss\negatiefaggr.sav".
/file = ""\\CNAS.RU.NL\s4331133\Documents\practicum 2 spss\positiefaggr.sav
/by twdate2 hrs min.
* programma type umkodieren
RECODE type ('dwdd'=0) INTO dwdd.
EXECUTE.
RECODE type ('dwdd'=0) ('rtllatenight'=1) INTO rtllatenight.
EXECUTE.
RECODE type ('dwdd'=0) ('rtllatenight'=1) ('pauw'=2) INTO pauw.
EXECUTE.
* nach tweets selecteren , die am 21.9.2015 von dwdd wurden getweetet .
freq var = m d hrs .
compute selfrag =0.
if type = 'dwdd' and m=9 and d=21 and hrs=19 and (min >= 30 and min <= 46) selfrag = 1.
* nach tweets selecteren , die am 28.9.2015 von dwdd wurden getweetet .
if type = 'dwdd' and m=9 and d=28 and hrs=19 and (min >= 18 and min <= 29) selfrag = 2.
* nach tweets selecteren , die am 07.10.2015 von dwdd wurden getweetet .
if type = 'dwdd' and m=10 and d=7 and hrs=19 and (min >= 3 and min <= 20) selfrag = 3.
* nach tweets selecteren , die am 12.10.2015 von dwdd wurden getweetet .
if type = 'dwdd' and m=10 and d=12 and hrs=19 and (min >= 4 and min <= 20) selfrag = 4.
* nach tweets selecteren , die am 15.10.2015 von dwdd wurden getweetet .
if type = 'dwdd' and m=10 and d=15 and hrs=19 and (min >= 5 and min <= 16) selfrag = 5.
* nach tweets selecteren , die am 20.10.2015 von dwdd wurden getweetet .
if type = 'dwdd' and m=10 and d=20 and hrs=19 and (min >= 7 and min <= 23) selfrag = 6.
* nach tweets selecteren , die am 27.10.2015 von dwdd wurden getweetet .
if type = 'dwdd' and m=10 and d=27 and hrs=19 and (min >= 5 and min <= 18) selfrag = 7.
* nach tweets selecteren , die am 17.11.2015 von dwdd wurden getweetet .
if type = 'dwdd' and m=11 and d=17 and hrs=19 and (min >= 1 and min <= 25) selfrag = 8.
freq var = selfrag.
* nach tweets selecteren , die am 07.10.2015 von RTL Late night wurden getweetet .
freq var = m d hrs .
compute selfrag =0.
if type = 'rtllatenight' and m=10 and d=7 and hrs=22 and (min >= 32 and min <= 46) selfrag = 9.
* nach tweets selecteren , die am 12.10.2015 von RTL Late night wurden getweetet .
if type = 'rtllatenight' and m=10 and d=12 and hrs=22 and (min >= 29 and min <= 38) selfrag = 10.
freq var = selfrag.
* nach tweets selecteren , die am 21.9.2015 von pauw wurden getweetet .
freq var = m d hrs .
compute selfrag =0.
if type = 'pauw' and m=9 and d=21 and hrs=23 and (min >= 5 and min <= 13) selfrag = 11.
* nach tweets selecteren , die am 28.9.2015 von pauw wurden getweetet .
if type = 'pauw' and m=9 and d=28 and hrs=23 and (min >= 2 and min <= 17) selfrag = 12.
* nach tweets selecteren , die am 07.10.2015 von pauw wurden getweetet .
if type = 'pauw' and m=10 and d=7 and hrs=23 and (min >= 7 and min <= 28) selfrag = 13.
* nach tweets selecteren , die am 12.10.2015 von pauw wurden getweetet .
if type = 'pauw' and m=10 and d=12 and hrs=23 and (min >= 7 and min <= 16) and (min >= 35 and min <= 55) selfrag = 14.
* nach tweets selecteren , die am 15.10.2015 von pauw wurden getweetet .
if type = 'pauw' and m=10 and d=15 and hrs=23 and (min >= 3 and min <= 6) and (min >= 11 and min <= 24) selfrag = 15.
* nach tweets selecteren , die am 20.10.2015 von pauw wurden getweetet .
if type = 'pauw' and m=10 and d=20 and hrs=23 and (min >= 17 and min <= 37) selfrag = 16.
* nach tweets selecteren , die am 27.10.2015 von pauw wurden getweetet .
if type = 'pauw' and m=10 and d=27 and hrs=23 and (min >= 3 and min <= 23) selfrag = 17.
* nach tweets selecteren , die am 17.11.2015 von pauw wurden getweetet .
if type = 'pauw' and m=11 and d=17 and hrs=23 and (min >= 2 and min <= 52) selfrag = 18.
freq var = selfrag.