Prüfungsvorbereitung - Korrelation, Regression

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
asdfjklö
Beiträge: 2
Registriert: 24.06.2008, 11:00

Prüfungsvorbereitung - Korrelation, Regression

Beitrag von asdfjklö »

Hallo!
Da ich bald zur prüfung antreten muss (es ist mein 3. Antritt :( ) und mir noch einige dinge unklar sind, die ich bis dahin unbedingt wissen müsste, würde ich euch bitten, mir weiterzuhelfen – ihr wäret mir eine echt große hilfe…

hier meine fragen:
1. Korrealtionen: um die geeignete korrelation zu berechnen, muss ich ja oft darauf schauen, ob meine variablen jeweils eingipfelig und symmetrisch sind und keine Ausreißer haben - um ein histogramm zu zeichnen ist bei der prüfung allerdings zu wenig zeit... deshalb frage ich mich, wie ich meine daten sonst noch darauf prüfen kann?
was mir am plausibelsten erscheint: Ausreißer durch ansehen der daten, Eingipfeligkeit: auch hier scheint mir der "Augentest" die einzige möglichkeit; Symmetrie: mittelwert und median vergleichen, und je nachdem ob >, < oder = bestimmen, wie die variable verteilt ist. (sollte dies die bestmögliche methode sein, um meine daten auf symmetrie zu prüfen: wo liegt die toleranzgrenze? also bis wohin kann ich noch sagen die variable ist symmetrisch? Wär nett wenn ihr mir ein beispiel dazu geben könntet, bei welchem Mittelwert mit dazugehörigem Median man NOCH symmetrie annehmen kann und eines, bei dem es sich schon um eine schiefe handelt)
is das totaler blödsinn bzw. gäbe es bessere möglichkeiten? ich bitte euch um verbesserungsvorschläge.
2. Korrelation: im Zweifelsfall (also wenn ich mir nicht sicher bin ob ich die eine oder andere berechnung wählen soll - z.B. wenn ich mir nicht sicher bin, ob ein wert schon als ausreißer angesehen wird oder nicht - is ja immerhin interpretationssache) sollte man sich immer für das mächtigere Verfahren entscheiden (also für das, in dem angenommen wird dass die daten eingipfelig, symmetrisch sind und keinen ausreißer haben), stimmt das?
3. Regression - Koordinatensystem: ich hab mir mal notiert, dass sich auf der x-achse immer die unabhängige, und auf der y-achse die abhängige variable befindet, stimmt das?
6. Regressionsgerade zeichnen: wenn y geschätzt wird, ist ja a der schnitt mit der y-achse und b der anstieg - wenn ich x schätze muss ich zuerst meinen wert a auf der x-achse nach rechts gehen - dann 1 cm hinauf zeichnen, und von dort meinen wert b nach rechts gehen, stimmt das so?
7. Ist die Variable „Selbsteinschätzung anhand einer 10-stufigen Skala“ metrisch oder rangskaliert?
8. Binomialtest: man nimmt das größere k und rechnet dann die wahrscheinlichkeit für k bis n, also P(k)+…+P(n) – anhand dieses ergebnisses kann man dann die nullhypothese verwerfen oder auch nicht - habe ich das richtig verstanden?
9. Binomialtest: Es gab ein Bsp. bei dem Schülern 2 Filme gezeigt wurde. Mittels eines Fragebogens wurde erhoben, ob die Filme den Schülern gefallen (+) oder nicht (-). Dann war folgende Vierfeldertafel gegeben:
Film A
+ -
Film B + 20 4 24
- 11 34 45
31 38 69

Und die Frage lautete: „Kommen die Filme bei den Schülern gleich gut an?“
Als Lösung wurde angegeben:
H0: p = 0.5: Gleich viele (+,-) wie (-,+) bzw.
H1: p ≠ 0.5 (d.h. die Filme gefallen nicht gleich gut)
Wie (un)wahrscheinlich ist es, unter der Voraussetzung µ = n*p (15 * 0.5)= 7.5 zu erwarten, in den tatsächlichen Daten nur 4 (oder weniger) Personen zu finden, die Film B bevorzugen?

P(k ≤ 4) = P(k=0) + P(k=1) + P(k=2) + P(k=3) + P(k=4) = 0.0592
P(k ≤ 4) nicht ≤ Alpha/2 (da zweiseitige Fragestellung) => H0 beibehalten

Warum berechne ich P(k ≤ 4)?
Ich will ja wissen, ob sie gleich gut ankommen – darum hätte ich theoretisch P(k größergleich 31) oder P(k größergleich 24) bis P(69) berechnet – das ist zwar irrsinnig, weil man dafür eine ewigkeit brauchen würde, aber es erscheint mir logisch – die korrekte version allerdings überhaupt nicht…. vielleicht kann mir das jemand erklären?

Vielen lieben Dank für eure Hilfe im voraus :)
Hwoarang_KOIFT
Beiträge: 3
Registriert: 28.06.2008, 09:44

Beitrag von Hwoarang_KOIFT »

1. +2. Verstehe ich leider nicht was du meinst.

3.Regression-Koordinatensystem: Es ist problematisch bei einer regression von UV und AV zu sprechen, weil die regression nur eine Anpassungskurve für Messdaten darstellt. Z.B. kann ich IQ und Körpergröße messen und dann versuchen zu sehen ob es einen zusammenhang gibt. Du siehst hier gibt es keine UV oder AV.
Von UV und AV spricht man nur wenn man eine Kausalitätsrichtung hat. Aber die Regression gibt keine aussagen darüber aus (siehe Korrelation).

6. Regressionsgerade zeichnen:
Du hast ja als regressionsgerade: y_i=a_0+a_1*x_i
Jetzt setzst du erst für x_i Null ein dann hast du den Dazugehörigen y_0 wert. Dann setzts du einen beliebigen weiteren wert x_b ein und bekommst den dazugehörigen y_1 wert. Nun hast du zwei Punkte P(0|y_0) und Q(x_b|y_1). Diese Zeichnest du in dein Koordinatensystem und zeichnest eine Gerade durch die Punkte ==> voila schon hast du deine Regressionsgerade.
Z.B: y=1+2*x;
ich gebe x=0 ein und erhalte y=1 ==>P(0|1)
ich gebe x=1 ein und erhalte y=3 ==>Q(1|3)
Punkte einzeichnen und gerade druchlegen. Du musst nur aufpassen, dass du deine gerade nur auf dem Definitionsbereich laufen lassen darfst.

7. Sie ist rangskaliert (Ordinalskala)

8. Ja so kann man das machen aber wenn du das kleinere Wählst ist es besser: Dann rechnest du P(X=0)+P(X=1)+...+P(X=k).

9. Ich kapier deine Vierfelder Tafel nicht ganz, darum kann ich dir hier auch nicht helfen.
Tipp: Vierfeldertafeln sollten so aussehen:
| A | B
+ | h(+|A) | h(+|B) |
- | h(-|A) | h(-|B) |
asdfjklö
Beiträge: 2
Registriert: 24.06.2008, 11:00

Beitrag von asdfjklö »

Vielen Dank für deine Hilfe!
LG
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten