Ich quäle mich seit paar Tagen durch das Internet und auch hier durchs Forum, aber bin leider noch nicht ganz schlau geworden

Ich möchte gerne die Wirksamkeit von einem Förderprogramm testen. Dazu habe ich eine Versuchs- und eine Kontrollgruppe (jeweils 4 Schulklassen mit ca. 100 Schülern an jeweils unterschiedlichen, am Programm interessierten Schulen -> nicht randomisiert?), die am Anfang und am Ende einen Test (intervallskaliert) ablegen müssen.
Hab also 2 Messzeitpunkte, zwei (nicht randomisierte?) Gruppen und möchte gerne wissen:
- hat sich die Fördergruppe im Testergebnis verbessert?
- hat sie sich mehr verbessert als die Kontrollgruppe?
Brauche ich da mehr Tests?
Muss das ganze glücklicherweise nur theoretisch aufbauen, hab also auch keine Testergebnisse, die ich auf Normalverteilung etc. prüfen kann/muss (bzw. bei so vielen Testpersonen ist das sowieso normalverteilt?).
Bin super verwirrt und wäre wirklich super, wenn ihr mir da kurz auf die Sprünge helfen könntet!
Danke!!!
