ROC-Analyse, einige Untersuchungen immer negativ.
-
- Beiträge: 5
- Registriert: 31.12.2023, 21:32
ROC-Analyse, einige Untersuchungen immer negativ.
Hallo,
ich möchte eine ROC-Analyse durchführen. Ich bin mir nicht sicher ob das in meinem Fall überhaupt möglich ist, daher würd ich das ganze gern einmal vorstellen. Ich hoffe ich kann mich verständlich ausdrücken (kein Statistiker).
Wir führen in unserem Labor Sequenzierungen durch. Eine Sequenz von ca. 100 Positionen wird viele Male (ca 1.000.000) abgelesen. Eine der 100 Positionen ist die Zielposition an der versucht wird eine Mutation nachzuweisen. An dieser Position wird die Anzahl der abweichenden Basen von der Referenz gezählt. Da die Messmethode mit einem Fehler behaftet ist werden die übrigen 99 Positionen genutzt um das Signifikanzniveau zu etablieren. Über diese 99 Positionen wird der Mittelwert und die Standardabweichung des Hintergrundrauschens berechnet.
Aktuell werten wir die Zielposition als positiv wenn sie mehr als 3 Standardabweichungen vom Mittelwert abweicht. Da der Hintergrundfehler aber nicht wirklich normalverteilt ist, ist das eher eine Näherung. Es fehlt aber auch eine bessere mathematische Beschreibung des Fehlers, sodass wir weiter die Normalverteilung verwenden. Daher wollte ich eine ROC-Analyse erstellen und untersuchen, ob die 3-fache Standardabweichung tatsächlich am besten zwischen positiven und negativen Proben trennt oder ob nicht mehr oder weniger Standardabweichungen ein besserer cut-off sind.
Dabei ergibt sich aber eine Problem. Da etwa die Hälfte der Proben an der Zielposition sogar unter dem Mittelwert des Hintergrundrauschens liegen werden diese quasi nie positiv, es sei denn man akzeptiert auch eine negative Standardabweichung als cut-off, was auch irgendwie nicht logisch erscheint. Dadurch ergibt sich eine "Lücke" in der ROC-Kurve.
Ich habe euch den Plot der ROC-Kurve mal angehängt. Falls ihr bis hierhin gelesen habt schonmal vielen Dank. Also kurz gefragt kann man in diesem Fall überhaupt eine ROC-Analyse machen und wie geht man dann mit den immer negativen Proben um?
Vielen Dank und guten Rutsch!
Christian
Plot: https://ibb.co/b3tmJ4q
ich möchte eine ROC-Analyse durchführen. Ich bin mir nicht sicher ob das in meinem Fall überhaupt möglich ist, daher würd ich das ganze gern einmal vorstellen. Ich hoffe ich kann mich verständlich ausdrücken (kein Statistiker).
Wir führen in unserem Labor Sequenzierungen durch. Eine Sequenz von ca. 100 Positionen wird viele Male (ca 1.000.000) abgelesen. Eine der 100 Positionen ist die Zielposition an der versucht wird eine Mutation nachzuweisen. An dieser Position wird die Anzahl der abweichenden Basen von der Referenz gezählt. Da die Messmethode mit einem Fehler behaftet ist werden die übrigen 99 Positionen genutzt um das Signifikanzniveau zu etablieren. Über diese 99 Positionen wird der Mittelwert und die Standardabweichung des Hintergrundrauschens berechnet.
Aktuell werten wir die Zielposition als positiv wenn sie mehr als 3 Standardabweichungen vom Mittelwert abweicht. Da der Hintergrundfehler aber nicht wirklich normalverteilt ist, ist das eher eine Näherung. Es fehlt aber auch eine bessere mathematische Beschreibung des Fehlers, sodass wir weiter die Normalverteilung verwenden. Daher wollte ich eine ROC-Analyse erstellen und untersuchen, ob die 3-fache Standardabweichung tatsächlich am besten zwischen positiven und negativen Proben trennt oder ob nicht mehr oder weniger Standardabweichungen ein besserer cut-off sind.
Dabei ergibt sich aber eine Problem. Da etwa die Hälfte der Proben an der Zielposition sogar unter dem Mittelwert des Hintergrundrauschens liegen werden diese quasi nie positiv, es sei denn man akzeptiert auch eine negative Standardabweichung als cut-off, was auch irgendwie nicht logisch erscheint. Dadurch ergibt sich eine "Lücke" in der ROC-Kurve.
Ich habe euch den Plot der ROC-Kurve mal angehängt. Falls ihr bis hierhin gelesen habt schonmal vielen Dank. Also kurz gefragt kann man in diesem Fall überhaupt eine ROC-Analyse machen und wie geht man dann mit den immer negativen Proben um?
Vielen Dank und guten Rutsch!
Christian
Plot: https://ibb.co/b3tmJ4q
-
- Beiträge: 2739
- Registriert: 01.02.2018, 10:45
Re: ROC-Analyse, einige Untersuchungen immer negativ.
Hallo,
spannend!
woher weiß man denn, dass die 99 Positionen, die zur
Bestimmung des "Rauschens" dienen, keine Mutation tragen?
Wenn doch, dann ist da ein Signal im Rauschen.
also ist drunter eventuell nur das Rauschen der 100ten Position, die zufällig drunter liegt.
Die Hälfte ist viel, wenn sie das eigentlich nicht so sein soll.
wieso sogar?
da stellt sich die Frage wie ein Mutation sich bemerkbar macht, durch eine
"Erhöhung" von ..pips...was wird denn gemessen, denke mal ...
was mit elektroladungsfeldmagodings, ...gibt es da was negatives?
sondern eine Abweichung nach unten, oder?
aber eine Abweichung nach unten, kann keine Mutation sein.
...ich weiß nicht, ob ich das alles verstanden hab,
insofern ist mein Beitarg etwas brainstormig und ...
gruß
dutchie
spannend!
woher weiß man denn, dass die 99 Positionen, die zur
Bestimmung des "Rauschens" dienen, keine Mutation tragen?
Wenn doch, dann ist da ein Signal im Rauschen.
vermutlich liegt es aber generell stärker drüber als drunter!christian29 hat geschrieben: ↑31.12.2023, 21:48Da etwa die Hälfte der Proben an der Zielposition sogar unter dem Mittelwert des Hintergrundrauschens liegen
also ist drunter eventuell nur das Rauschen der 100ten Position, die zufällig drunter liegt.
Die Hälfte ist viel, wenn sie das eigentlich nicht so sein soll.
wieso sogar?
da stellt sich die Frage wie ein Mutation sich bemerkbar macht, durch eine
"Erhöhung" von ..pips...was wird denn gemessen, denke mal ...
was mit elektroladungsfeldmagodings, ...gibt es da was negatives?
du meinst keine negative SD also sd = -3
sondern eine Abweichung nach unten, oder?
aber eine Abweichung nach unten, kann keine Mutation sein.
...ich weiß nicht, ob ich das alles verstanden hab,
insofern ist mein Beitarg etwas brainstormig und ...
gruß
dutchie
-
- Beiträge: 5
- Registriert: 31.12.2023, 21:32
Re: ROC-Analyse, einige Untersuchungen immer negativ.
Hi,
danke für deine Antwort. Ich versuch mal die Fragen zu beantworten:
danke für deine Antwort. Ich versuch mal die Fragen zu beantworten:
Guter Einwand, weiß man leider nicht. Es gibt aber aktuell zu wenig Sequenzierdaten von sicher negativen Proben um diese als Baseline zu verwenden. Daher ist das die einzige Möglichkeit. Wird bei einer zukünftigen Umsetzung im "echten Leben" aber mit Sicherheit mit sicher negativen Referenzdaten umgesetzt.
Ja hast Recht. Die wirklich positiven Proben erreichen natürlich in den meisten Fällen auch ein Signal über dem Mittelwert. Daher ist es nur die Hälfte der tatsächlich negativen Proben die statistisch unter dem Mittelwert bleiben.christian29 hat geschrieben: ↑31.12.2023, 21:48Da etwa die Hälfte der Proben an der Zielposition sogar unter dem Mittelwert des Hintergrundrauschens liegen
vermutlich liegt es aber generell stärker drüber als drunter!
also ist drunter eventuell nur das Rauschen der 100ten Position, die zufällig drunter liegt.
Die Hälfte ist viel, wenn sie das eigentlich nicht so sein soll.
wieso sogar?
Das ganze wird mittels Next generation Sequencing gemacht. Kurz gesagt bekommt man eine Textdatei am Ende heraus, wo untereinander ca. 1.000.000 mal die Sequenz der DNA-basen (A,C,G,T) an diesen 100 aufeinander folgenden Positionen aufgeführt ist. Die Referenz des Genoms ist bekannt und lässt sich nachschauen. Der Sequenzierer gibt auch eine "Wahrscheinlichkeit" an, dass die gelesene Base stimmt. Da die relevantesten Fehlerquellen aber in der Vorbereitung der Proben im Labor entstehen und für den Sequenzierer daher "unsichtbar" sind lohnt es nicht diese Wahrscheinlichkeit in die Berechnung mit einzubeziehen. Nur Proben mit insgesamt schlechter Sequenzierqualität werden herausgenommen.christian29 hat geschrieben: ↑31.12.2023, 21:48da stellt sich die Frage wie ein Mutation sich bemerkbar macht, durch eine
"Erhöhung" von ..pips...was wird denn gemessen, denke mal ...
was mit elektroladungsfeldmagodings, ...gibt es da was negatives?
Korrekt, genau da liegt meine Frage. Wie gehe ich mit den Proben um die eine negative SD haben. Die können in der ROC-Analyse ja nie sinnvollerweise positiv werden.christian29 hat geschrieben: ↑31.12.2023, 21:48negative Standardabweichung als cut-off,
du meinst keine negative SD also sd = -3
sondern eine Abweichung nach unten, oder?
aber eine Abweichung nach unten, kann keine Mutation sein.
-
- Beiträge: 2739
- Registriert: 01.02.2018, 10:45
Re: ROC-Analyse, einige Untersuchungen immer negativ.
Hallo,
symbolisiert jeder Kreis in der ROC einen Zustand des cut off Wertes.
Das ist dann aber keine "klassische" ROC.
Ist das nicht nur ein Streudiagramm in dem Spezi und Sensi
abgebildet werden für verschiedene cut-off Werte?
Hört die Kurve da auf, wo der cut-off unter den Mittelwert springt?
etwas verworren..
gruß
dutchie
symbolisiert jeder Kreis in der ROC einen Zustand des cut off Wertes.
Das ist dann aber keine "klassische" ROC.
Ist das nicht nur ein Streudiagramm in dem Spezi und Sensi
abgebildet werden für verschiedene cut-off Werte?
Hört die Kurve da auf, wo der cut-off unter den Mittelwert springt?
etwas verworren..
gruß
dutchie
-
- Beiträge: 5
- Registriert: 31.12.2023, 21:32
Re: ROC-Analyse, einige Untersuchungen immer negativ.
Hi dutchie,dutchie hat geschrieben: ↑01.01.2024, 14:26symbolisiert jeder Kreis in der ROC einen Zustand des cut off Wertes.
Das ist dann aber keine "klassische" ROC.
Ist das nicht nur ein Streudiagramm in dem Spezi und Sensi
abgebildet werden für verschiedene cut-off Werte?
Hört die Kurve da auf, wo der cut-off unter den Mittelwert springt?
Ja genau. Man kann ja für jede Probe errechnen wieviele Standardabweichungen die Zielposition über dem Mittelwert liegt. Für Proben mit Zielposition unter dem Mittelwert hab ich den cut-off auf 0 gesetzt. Dann hab ich die cut-offs absteigend sortiert und entsprechend für jeden cut-off Sensitivität und Spezifität errechnet und damit die Grafik erstellt.
Ich dachte das wäre eine "klassische" ROC, aber wie gesagt kein Statistiker.
LG Christian
-
- Beiträge: 2739
- Registriert: 01.02.2018, 10:45
Re: ROC-Analyse, einige Untersuchungen immer negativ.
hallo,
ich bin immer noch ratlos
solche Daten
https://ibb.co/Y88Lc9P
führen zu solch einer ROC:
https://ibb.co/ZBBvw2F
wenn du z.B bei SPSS die Routine aufrufst
die Variable Mutation ist die Wahrheit, mit der man die Hits
füttern muss, die 5 Mutationen haben zu 25 41 41 eine aber nur zu 5 hits geführt
(irgend eine Zahl)
diese eine ist von nicht-Mutationen kaum zu unterscheiden.
wie entsteht jetzt eine ROC, der PC verschiebt von selber den cut off,
ein cut-off bei 3,5 macht 100 Sensitivität, bringt aber auch drei falsch positiv!
du prüfst eiegntlich nicht den cut off auf Güte, sondern das Verfahren der Diagnose.
gruß
dutchie
ich bin immer noch ratlos
solche Daten
https://ibb.co/Y88Lc9P
führen zu solch einer ROC:
https://ibb.co/ZBBvw2F
wenn du z.B bei SPSS die Routine aufrufst
die Variable Mutation ist die Wahrheit, mit der man die Hits
füttern muss, die 5 Mutationen haben zu 25 41 41 eine aber nur zu 5 hits geführt
(irgend eine Zahl)
diese eine ist von nicht-Mutationen kaum zu unterscheiden.
wie entsteht jetzt eine ROC, der PC verschiebt von selber den cut off,
ein cut-off bei 3,5 macht 100 Sensitivität, bringt aber auch drei falsch positiv!
du prüfst eiegntlich nicht den cut off auf Güte, sondern das Verfahren der Diagnose.
gruß
dutchie
-
- Beiträge: 5
- Registriert: 31.12.2023, 21:32
Re: ROC-Analyse, einige Untersuchungen immer negativ.
Hi,
das ist eigentlich fast das was ich gemacht habe. So sehen meine Daten aus:
https://ibb.co/xmKtCBM
SD_Pos ist der Faktor an Standardabweichungen mit dem der gemessene Wert über dem Mittelwert liegt. Relapse entspricht ob eine Mutation vorliegen soll oder nicht. Überall wo SD_Pos 0 ist war der Zielwert kleiner/gleich dem Mittelwert.
Dass die ROC nicht direkt die Güte eines cut-offs bewerten kann stimmt. Aber auch eine AUC lässt sich ja beispielsweise nicht sinnvoll berechnen mit den Daten wie ich sie im Moment habe oder?
LG Christian
das ist eigentlich fast das was ich gemacht habe. So sehen meine Daten aus:
https://ibb.co/xmKtCBM
SD_Pos ist der Faktor an Standardabweichungen mit dem der gemessene Wert über dem Mittelwert liegt. Relapse entspricht ob eine Mutation vorliegen soll oder nicht. Überall wo SD_Pos 0 ist war der Zielwert kleiner/gleich dem Mittelwert.
Dass die ROC nicht direkt die Güte eines cut-offs bewerten kann stimmt. Aber auch eine AUC lässt sich ja beispielsweise nicht sinnvoll berechnen mit den Daten wie ich sie im Moment habe oder?
LG Christian
-
- Beiträge: 2739
- Registriert: 01.02.2018, 10:45
Re: ROC-Analyse, einige Untersuchungen immer negativ.
Hallo
AUC kannst du ja nicht mit der Hand rechnen!
und wenn du dir deine ROC mal anschaust
1- Spenzi ist ja falsch positiv! oder?
gesund als Mutation zu lablen.
dann hast du eine Sensi von nur 60%
und falsch positiv von 40 %
das ist doch sehr viel Fehler!!!!
da stimm doch was nicht.
setzt mal die negativen Werte wieder ein (das sind ja gar keine Varianzen)
und lass die ROC mal den PC berechnen
der PC setzt alle möglichen cut-off selber,
dann kann du gucken welcher cut-off 3 sigma ist
gruß
dutchie
AUC kannst du ja nicht mit der Hand rechnen!
und wenn du dir deine ROC mal anschaust
1- Spenzi ist ja falsch positiv! oder?
gesund als Mutation zu lablen.
dann hast du eine Sensi von nur 60%
und falsch positiv von 40 %
das ist doch sehr viel Fehler!!!!
da stimm doch was nicht.
setzt mal die negativen Werte wieder ein (das sind ja gar keine Varianzen)
und lass die ROC mal den PC berechnen
warum nimmst du nicht die gemessenen Wertechristian29 hat geschrieben: ↑06.01.2024, 15:01SD_Pos ist der Faktor an Standardabweichungen mit dem der gemessene Wert über dem Mittelwert liegt.
der PC setzt alle möglichen cut-off selber,
dann kann du gucken welcher cut-off 3 sigma ist
gruß
dutchie
-
- Beiträge: 5
- Registriert: 31.12.2023, 21:32
Re: ROC-Analyse, einige Untersuchungen immer negativ.
Hey, musste ein wenig schmunzeln
ja die Ergebnisse sind nicht perfekt. Tatsächlich liegen wir damit aber in der erwartbaren Range. Unser aktueller cut-off kommt ca. bei 40% Sensitivität und 90% Spezifität heraus, give or take. Geht eben um biologische Prozesse und zwischen dem, was wir im Labor messen und dem biologischen Outcome liegen eine Menge unbekannter Variablen, sodass eine bessere Korrelation zum jetzigen Zeitpunkt ein Wunder wäre. Muss man eher als Grundstein für weitere Arbeit verstehen.
https://ibb.co/2nfGY7Y
Außerdem entfernen wir uns damit von meiner eigentlichen Fragestellung. Im Grunde gehts mir ja darum zu untersuchen ob 3 mal SD überhaupt der beste cut-off ist. Vielleicht ist dann die ROC doch einfach nicht die beste Herangehensweise. Irgendwie erschien es mir eine interessante Untersuchung zu sein für die Fragestellung, aber vielleicht macht das mathematisch doch keinen Sinn so.
LG Christian
ja die Ergebnisse sind nicht perfekt. Tatsächlich liegen wir damit aber in der erwartbaren Range. Unser aktueller cut-off kommt ca. bei 40% Sensitivität und 90% Spezifität heraus, give or take. Geht eben um biologische Prozesse und zwischen dem, was wir im Labor messen und dem biologischen Outcome liegen eine Menge unbekannter Variablen, sodass eine bessere Korrelation zum jetzigen Zeitpunkt ein Wunder wäre. Muss man eher als Grundstein für weitere Arbeit verstehen.
Dann bekomm ich auch ne vollständige ROC:
https://ibb.co/2nfGY7Y
Dafür müsste man die gemessenen Werte erstmal irgendwie normalisieren. Die absolute Anzahl an Reads und damit auch die Anzahl an mutierten Reads kann zwischen einzelnen Messungen variieren.
Außerdem entfernen wir uns damit von meiner eigentlichen Fragestellung. Im Grunde gehts mir ja darum zu untersuchen ob 3 mal SD überhaupt der beste cut-off ist. Vielleicht ist dann die ROC doch einfach nicht die beste Herangehensweise. Irgendwie erschien es mir eine interessante Untersuchung zu sein für die Fragestellung, aber vielleicht macht das mathematisch doch keinen Sinn so.
Warum nicht? Die ROC sind doch nur Rechtecke nebeneinander, das ist doch easy gemacht oder nicht?
LG Christian
-
- Beiträge: 2739
- Registriert: 01.02.2018, 10:45
Re: ROC-Analyse, einige Untersuchungen immer negativ.
Hallo,
.....(der PC kann das auch!)
Gruß
dutchie
...na wenn du das so siehst, dann mal los!christian29 hat geschrieben: ↑06.01.2024, 23:21dutchie hat geschrieben: ↑
06.01.2024, 15:29
AUC kannst du ja nicht mit der Hand rechnen!
Warum nicht? Die ROC sind doch nur Rechtecke nebeneinander, das ist doch easy gemacht oder nicht?
.....(der PC kann das auch!)
Gruß
dutchie