Berechnung von Phi in SPSS

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
stkl
Beiträge: 9
Registriert: 10.07.2007, 13:54

Berechnung von Phi in SPSS

Beitrag von stkl »

Hallo Forum,

ich arbeite gerade mit dem Buch "Statistische Datenanalyse" von Wolf-Michael Kähler und bin verwirrt. Es geht um den Abschnitt 9.2 in dem der Phi-Koeffizient für 2x2 Tabellen beschrieben wird.
Dort wird die Berechnung beschrieben, nämlich als die Wurzel des Quotienten des Chi-Quadrat-Wertes und der Gesamtmenge "n". Nach dem Buch soll der Wert 0,15 sein und wenn ich es per Hand nachrechne komme ich auch auf den Wert.
hier steht nochmal die Formel dafür.

Aber SPSS gibt -0,15 aus.
Wieso tut es das?

Falls jemand das nachvollziehen möchte, um vielleicht antworten zu können:
http://www-user.uni-bremen.de/~cppkurs/ngo.zip - das ist der Datensatz.
Der SPSS-Befehl ist:

Code: Alles auswählen

crosstabs tables=abschalt by geschl
 /statistics= phi .
viele Grüße,
Stephan
Jack Crow
Beiträge: 146
Registriert: 14.12.2006, 18:41

Beitrag von Jack Crow »

Phi ist ein Richtungsmaß, d.h. es zeigt in SPSS die Richtung der (linearen) Beziehung zweier dichotomer (und damit quasi-metrischer) Variablen durch das Vorzeichen an. In deinem Fall wäre die Beziehung umgekehrt proportional, d.h. je höher A, desto niedriger B.
stkl
Beiträge: 9
Registriert: 10.07.2007, 13:54

Beitrag von stkl »

Hallo Jack Crow,


vielen Dank für die Antwort (die mich allerdings noch mehr verwirrt).

Die eigentliche Frage ist, warum SPSS -0,15 errechnet, wenn das Buch und ich bei meiner Berechnung nach oben verlinkter Formel für Phi auf 0,15 kommen.

> dichotomer (und damit quasi-metrischer)

das kommt mir seltsam vor. das beispiel benutzt die in der tat dichotomen variablen "abschalten im unterricht" und "geschlecht". Was bitte soll die quasi-metrik von geschlecht sein?
punkt ist ja gerade bei den statistiken, die auf chi-quadrat basieren (und damit für nominal-skalierte variablen geeignet sind), dass man lediglich nachweist, das ein statistischer zusammenhang besteht oder eben nicht. richtung kann man mit dem koeffizienten nicht angeben und schon garnicht linear, weil sie eben nominal-skaliert sind.
Jack Crow
Beiträge: 146
Registriert: 14.12.2006, 18:41

Beitrag von Jack Crow »

Es gibt zwei verschiedene Formeln für Phi, die von dir benutzte die für Berechnungen "per Hand" wegen der Einfachheit geeigneter ist, und eine "direkte" Variante, die ohne Chi2 auskommt und direkt aus den Werten der Vierfeldtabelle berechnet wird. SPSS benutzt die letztere Variante, die ein Vorzeichen besitzt. Die Formel dazu ist Phi = ad - bc / Wurzel aus (a + b) (c + d) (a+ c) (b + d) ; wobeo abcd jeweils die Zellhäufigkeiten sind.
Mit den nominalen Variablen hast du im Prinzip und inhaltlich natürlich recht, statistisch (!) sind dichotome Variablen jedoch quasi-metrisch, da sie als Kontinuum von 0 bis 1 (also quasi von 0 - 100%) interpretiert werden können. Aus diesem Grund sind bei Vierfeldtabellen Phi und das Regressionsmaß r identisch. Bei zwei dichotomen Variablen bezeichnet die Richtung genaugenommen natürlich kein "je - desto", sondern ein "wenn - dann" - also z.B. "wenn Geschlecht = männlich, "Abschalten im Unterricht" eher = ja.
(vgl. z.B. Benninghaus: Deskriptive Statistik
stkl
Beiträge: 9
Registriert: 10.07.2007, 13:54

Beitrag von stkl »

Hey Jack Crow,

vielen Dank für die Antwort. Das war sehr aufschlussreich.
Nur wenn du es gerade parat hast, habe ich eine weitere Frage
aus Neugierde. In dem Buch was ich mir anschaue, werden
Phi, Cramers-V und Pearsons C als aus Chi2 abgeleitete
Kennwerte für unterschiedliche Anwendungen vorgestellt.
Phi ist gut für 2x2 Tabellen, Cramers-V für Tabelle mit anderen
Dimensionen und Pearsons C für Tabellen, die größer 2x2 und
quadratisch sind.

Nach dem Buch ist die Berechnung von Cramers-V eine kleine
Erweiterung von Phi in dem im Divisor "n" noch mit dem höheren
Wert von Zeilen- und Spaltenanzahl multipliziert wird.

Ich deute mal die Formel an: wurzel(chi2 / (n * (min(r-1, c-1)) ) ).
Jetze die Frage, die vielleicht zu garnichts führt: Gibts dafür auch eine
andere Berechnungsmöglichkeit?

Danke, wegen dem Literaturhinweis. Ich werde es mir mal leihen.

grüße,
Stephan
Jack Crow
Beiträge: 146
Registriert: 14.12.2006, 18:41

Beitrag von Jack Crow »

Soweit ich weiß gibt es für Cramers V keine andere Formel, die etwa auf der anderen Phi-Formel basieren würde - deswegen ist V auch vorzeichenlos (was insofern egal ist weil man bei nominalen Variablen mit mehr als zwei Ausprägungen ja tatsächlich keine Richtung angeben kann).
Das Buch kann ich übrigens auch sonst empfehlen, zumindest für Sozialwissenschaftler ist das ein echter Klassiker ;)
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten