Ich habe den Datensatz einer Forschungsgruppe zur Analyse erhalten (sie verwendeten Stata, ich kenne mich besser mit SPSS aus). Innerhalb dieses Satzes haben die Forscher eine in meinen Augen etwas absurde Kodierung vorgenommen: Die Kernvariable, welche eine Abweichung von "normalem" Verhalten darstellt, entspricht den Missing Values

Für die Regression heisst das, dass ich jeweils meine restlichen Variablen (genetische Daten) mit den Missing values pro Task allein verarbeiten möchte. Wir haben insgesamt 16 Tasks, welche ich jeweils mit den genetischen Daten abgleiche. Innerhalb jeder dieser Tasks (a1 bis a16) sind aber NUR die Missing Values für mich relevant, alle anderen values/Zahlen SOLLTEN nicht in die Rechnung miteinbezogen werden.
Mein Ansatz soweit: Einen Filter erstellen, welcher alle Daten löscht, die nicht Missings sind und dann die Regressionen mit "include Missings" durchführen. Bisher habe ich keinerlei Erfolge mit dieser Strategie gehabt.
Ich habe mehrere Stunden gegoogelt und finde einfach nicht heraus, wie ich explizit auf die Missing Values zugreifen kann, sodass ich diese entweder als Variable abspeichern kann oder mit einem Filter, der "~ Missing" ("not Missing") enthält, den Datensatz bereinigen kann.
Ich wäre um jede Hilfe sehr froh
