ich stehe gerade vor der Herausforderung der Datenauswertung meiner Masterarbeit, ohne eine solide Grundlage in Statistik zu haben. Schon bei der richtigen Methode bin ich mir nicht sicher. Aus folgendem Szenario stammen die Daten:
Ich habe zwei unterschiedliche Sprachmodelle (GPT-3.5 und GPT-4), die Begriffe generieren. Diese werden dann von anderen KI-Modellen (A und B) weiterverarbeitet. Pro Durchlauf messe ich 6 abhängige Variablen. Nach meinem eher unzureichenden Verständnis hätte ich in diesem Fall die unabhängigen Variablen Sprachmodell und KI-Modell, was nach meinen Recherchen eine multivariate multiple Regressionsanalyse nach sich ziehen würde. Allerdings bin ich nicht sicher, ob ich tatsächlich zwei UVs habe. Die KI-Modelle A und B geben bei gleicher Eingabe zuverlässig die gleiche Ausgabe zurück. Also hat das benutzte Sprachmodell keinerlei Einfluss auf das KI-Modell, außer dass die Eingabe variiert. Wäre es hier möglich, die beiden UVs zu einer kombinierten UV zusammenzufassen und trotzdem 4 Gruppen zu haben? Und wenn das möglich sein sollte, wäre dann eine MANOVA der richtige Ansatz? Oder könnte ich auch 6 ANOVAs rechnen, wenn ich sowieso davon ausgehe, dass die Null-Hypothese zutrifft?
Kann mir da jemand weiterhelfen? Ich bin nach 2 Stunden Recherche immer noch völlig planlos.
