Die Unschärfe falsch-positiver Testergebnisse
http://doi.org/10.24945/MVF.3.21.1866-0533.2309
>> In unserem Kommentar möchten wir auf Fehler bei der Berichterstattung hinweisen, die in nahezu allen Medien zu finden sind und zu unzutreffenden wissenschaftlichen und politischen Schlussfolgerungen führen können. Zur Beschreibung der Häufigkeit von Ereignissen gibt es zwei Möglichkeiten: die Prävalenz und die Inzidenz.
Die Prävalenz beschreibt den Anteil jener Personen, die zu einem bestimmten Zeitpunkt innerhalb einer definierten Grundgesamtheit eine definierte Bedingung erfüllen, z. B. an einer bestimmten Erkrankung leiden. Die Prävalenz wird berichtet, um eine Momentaufnahme eines Zustands in einer definierten Population für den Vergleich mit anderen Populationen zu erstellen.
Die Inzidenz beschreibt die Anzahl von neu eingetretenen Ereignissen innerhalb eines definierten Zeitraums, meist bezogen auf 100.000 Personen einer definierten Grundgesamtheit. Die Streuung des Inzidenz-Wertes nimmt zu, je kleiner die Grundgesamtheit und/oder der Beobachtungszeitraum gewählt wird. Abhängig von der Frage, die zu beantworten ist, kann es sinnvoll sein, Veränderungen in täglichen und jährlichen Intervallen zu berechnen.
Beide Ergebnisse, die Prävalenz und die Inzidenz beruhen auf Testergebnissen, die positiv oder negativ und zudem richtig oder falsch sein können.
Wenn die Prävalenz oder Inzidenz von Todesfällen berichtet wird, können falsch-positive Ergebnisse vernachlässigt werden, weil falsch-positive Todesfälle selten auftreten. Diese Aussage gilt nicht für die Feststellung der Todesursache oder für die Bestätigung einer bestehenden Erkrankung oder Infektion. Todesursachen, Erkrankungen und Infektionen lassen sich nur mit detaillierten Zusatzinformation bestätigen, weil dazu durchgeführte Tests keineswegs frei von falschen Ergebnissen sind und eine medizinische Diagnose – von wenigen Ausnahmen abgesehen – nicht durch ein einzelnes Zeichen, ein Symptom oder einen einzelnen Test bewiesen werden kann. Weder ein positiver PCR-Test noch eine positive Mammographie können die vermutete Erkrankung ohne zusätzliche Information beweisen, weil falsch-positive von richtig-positiven Ergebnissen nur durch einen Vergleich mit einem Goldstandard unterschieden werden können. In der Medizin bezeichnet man als Goldstandard eine Bedingung, die der derzeit gültigen Wahrheit am nächsten kommt. Andere bezeichnen „eine bewährte, nützliche Referenzbedingung“ als sogenannten Goldstandard.
Zwei häufig zitierte statistische Analysen bestätigen, dass falsch-
positive Ergebnisse der Mammographie (1) und der Ferritin-Messung im Rahmen der Diagnostik einer Eisenmangel-Anämie bei etwa 10%
der Teste (2) auftreten. Für den Aussagewert eines Tests ist problematisch, dass in nahezu allen Tests „falsch-positive“ Ergebnisse deutlich häufiger (5 bis 274-fach) als „falsch-negative“ Ergebnisse zu finden sind. Problematisch ist auch, dass die „falsch-positiven“ Testergebnisse ein höheres Risiko für die Fehlinterpretation eines
Testergebnisses darstellen als die „falsch-negativen“.
Als „falsch-negativ“ wird das Ergebnis eines Tests dann bezeichnet, wenn auf eine Testperson eine Bedingung zutrifft (z. B. Brustkrebs oder SARS-CoV-2), obwohl der Test diese Bedingung nicht erkannt hat. In der Praxis lassen sich „falsch-negative“ Ergebnisse einfach erklären, weil man durch den weiteren klinischen Verlauf recht schnell erkennt, was der Test nicht erkannt hat. Dazu ein Beispiel: Wenn eine Patientin zwei Wochen nach einer unauffälligen Mammographie ein neues Zeichen – z. B. einen neuen Knoten in der Brust tastet, der dann bei Wiederholung der Mammographie erkennbar ist und auch durch eine Sonographie nachgewiesen sowie durch eine histologische Untersuchung als maligner Tumor bestätigt werden kann – wird das Ergebnis der ersten (negativen) Mammographie als „falsch-negativ“ klassifiziert.
Es ist nicht unwesentlich zu betonen, dass sich in vielen Fällen durch den Vergleich der beiden Mammographien im Nachhinein der zunächst nicht erkannte Tumor in beiden Aufnahmen identifizieren lässt. Man kann daraus aber nicht zwingend ableiten, dass der Tumor bei der ersten Befundung übersehen wurde, weil vor der zweiten Befundung des ersten Röntgenbildes bereits eine zusätzliche Vorinformation vorlag. Im Fachjargon bezeichnet man diesen Unterschied als unterschiedliche „pre-test probabilities“ bei der ersten und zweiten Befundung. Dieses Argument der unterschiedlichen „pre-test probabilities“ wird deutlich, wenn man die Szenarien „falsch-negativer“ und „falsch-positiver“ Testergebnisse auf das Beispiel des PCR-Tests anwendet.
Grundsätzlich entsteht ein „falsch-positives“ Ergebnis, wenn ein Test das Vorliegen einer Bedingung (z. B. Brustkrebs oder SARS-Cov-2) anzeigt, obwohl diese Bedingung mit sehr hoher Wahrscheinlichkeit nicht vorliegt, d. h. mit allen anderen verfügbaren Methoden bisher nicht bestätigt werden kann. Deshalb können erwartete „falsch-positive“ Testergebnisse zwar einfach erkannt (weil eine Bedingung nicht zu erkennen ist) werden, sind aber nicht einfach zu erklären. Ein Beispiel: Wenn ein Mammographie-Test einen tumorverdächtigen Bezirk anzeigt, der durch die Ultraschall-Untersuchung und eventuell zusätzlich durch eine histopathologische Untersuchung (Goldstandard) nicht bestätigt werden kann, wird der positive Befund der Mammographie letztlich als „falsch-positiv“ klassifiziert. Demnach gilt: Das Ergebnis eines Tests wird dann als „falsch-positiv“ bezeichnet, wenn ein positives Testergebnis vorliegt, das durch den Goldstandard nicht bestätigt wird.
Diese Gegenüberstellung bestätigt, dass im Falle eines „falsch-negativen“ Ergebnisses der zunächst nicht entdeckte Befund durch eine zusätzliche Information, der – in unserem Beispiel der neu aufgetretene Knoten – im weiteren klinischen Verlauf korrigiert werden kann. Aus wissenschaftlicher Perspektive kann die Wahrscheinlichkeit, dass es sich um ein „falsch-positives“ Ergebnis einer Mammographie handeln könnte, durch ein weiteres nicht-invasives Verfahren, z. B. eine Ultraschall-Untersuchung gesteigert werden und bei weiterhin bestehendem Verdacht auf eine maligne Erkrankung durch eine zusätzliche negative histopathologische Untersuchung mit hinreichender Wahrscheinlichkeit als „falsch-positives“ Ergebnis ohne Nachweis eines Substrats klassifiziert werden.
Im Falle eines PCR-Tests ist die Unterscheidung eines „richtig-positiven“ von einem „falsch-positiven“ Test allerdings schwieriger als bei der Mammographie, weil bei einer Mammographie neben der Röntgen-Technik weitere Methoden (Ultraschall, Histologie) zur Verfügung stehen, um den Verdacht eines „richtig-positiven“ Befundes zu entkräften. Im Falle eines „falsch-positiven“ PCR-Tests gibt es hingegen bisher keine weitere Methode, mit welcher die Unterscheidung zwischen „richtig-positiven“ und „falsch-positiven“ PCR-Tests erhärtet werden kann.
Die hier offensichtlich werdende „Unkenntnis des Unbekannten“ (ignorance of the unknown) beschreibt einen Beweisnotstand, mit dem sich Ärzte durch Anwendung zusätzlicher Untersuchungsmethoden ständig auseinanderzusetzen haben. Erfahrene Kliniker können dieses Problem mit geringem Aufwand lösen, während klinische Anfänger erhebliche diagnostische Kosten verursachen. Ob PCR-Tests wegen dieses Beweisnotstands für die Diagnostik geeignet sind, wird von verschiedenen Wissenschaftlern unterschiedlich diskutiert. Wegen der Ableitung nicht unerheblicher Einschränkungen durch Verordnungen und Gesetze wird eine juristische Klärung erforderlich sein.
Die Zeit bis zur Entscheidung könnte genutzt werden, um die von verschiedenen Wissenschaftlern bereits vorgeschlagene Dokumentation
des Versorgungsbedarfs nachzuholen. Dazu ist bei allen getesteten Personen einer oder mehrerer definierten Kohorten neben dem Ergebnis des PCR-Tests der Versorgungsbedarf zu dokumentieren. Die Testergebnisse liegen den Testzentren vor und der Versorgungsbedarf kann von den Betroffenen (keine oder stationäre oder intensivmedizinische Versorgung innerhalb von drei Monaten nach Durchführung des PCR-Tests) in Erfahrung gebracht werden. Diese Daten sind aus ethischen, medizinischen, epidemiologischen und ökonomischen Gründen zu erheben.
Verantwortungsvolle Wissenschaftler könnten allerdings der politischen Willensbildung zuvorkommen, indem von definierten Stichproben einer zu bestimmenden Kohorte alle (positive und negative) Testergebnisse innerhalb eines definierten Test-Zeitraums zusammen mit dem tatsächlichen stationären Versorgungsbedarf (Allgemein- oder Intensivversorgung) innerhalb der ersten drei Monate seit Durchführung des Tests berichtet werden. Mit dieser einfachen Korrelation könnte ein nicht unbedeutender Beitrag zur Bewertung der Tauglichkeit des PCR-Tests als diagnostisches Werkzeug verifiziert werden. Der zusätzliche Aufwand ist allemal gerechtfertigt. <<
Zitationshinweis:
Porzsolt, F., Legrum, P.: „Die Unschärfe falsch-positiver Testergebnisse“ in „Monitor Versorgungsforschung“ (03/21), S. 16-17. http://doi.org/10.24945/MVF.03.21.1866-0533.2309
Literatur
1. Breast Cancer Surveillance Consortium tool. https://tools.bcsc-scc.org/BC5yearRisk/calculator.htm Letzter Download 8.1.2021
2. Sackett DL et al. Evidence-based Medicine. Churchill Linvingstone 1997. Seite 120