KI gegen hohe Dunkelziffer unentdeckter Erkrankungen
http://doi.org/10.24945/MVF.06.20.1866-0533.2261
>> Chronische Infektionen mit dem Hepatitis C-Virus (HCV) sind die häufigste Ursache für Leberzirrhose, Leberkrebs, Lebertransplantationen und für einen Tod aufgrund von Lebererkrankungen. Als Risikofaktoren, um sich mit HCV zu infizieren, gelten vor allem intravenöse Arzneimittel, Bluttransfusionen (vor 1992), ungeschützter Geschlechtsverkehr mit wechselnden Sexualpartnern, eine Hämodialyse oder Tätowierungen, falls Studios grundlegende Hygieneregeln missachten.
Das Robert Koch-Institut, Berlin, berichtet zwischen 2000 (5.091 Patienten) und 2019 (6.633 Patienten) von einem deutlichen Anstieg der gemeldeten Neuinfektionen, bei unbekannt hoher Dunkelziffer. Folglich rückt das erklärte Ziel der Weltgesundheitsorganisation (WHO), Virushepatitis bis 2030 in allen Ländern zu eliminieren, in weite Ferne. Neue Strategien sind gefragt, etwa der Einsatz von Algorithmen aus dem Bereich der künstlichen Intelligenz (KI).
Alle HCV-Patienten sollen von
innovativen Therapien profitieren
Zum Hintergrund: Aus medizinischer Sicht ist die hohe Dunkelziffer bei HCV-Infektionen besonders ärgerlich, weil es mittlerweile innovative Therapien gibt. Das war nicht immer so. Lange Zeit hatten Hepatologen nur die Möglichkeit, HCV mit pegyliertem Interferon α plus Ribavirin zu behandeln. Dieses Regime führte nicht immer zum Erfolg, war aber mit etlichen Nebenwirkungen behaftet.
Mittlerweile stehen Direct-Acting Antiviral Agents, also direkt wirksame antivirale Arzneistoffe zur Verfügung. Sie hemmen virale Proteasen oder Polymerasen. Ärzte erreichen je nach Genotyp der HCV und Pharmakon bei 90% aller Patienten oder mehr eine Heilung – vorausgesetzt, sie erkennen die Erkrankung rechtzeitig.
„Um die potenziellen Vorteile neuartiger Behandlungen zu nutzen, muss die Größe der nicht diagnostizierten Population verringert und eine frühzeitige Diagnose gestellt werden, damit Patienten behandelt werden können, bevor langfristige Folgen einer HCV-Infektion auftreten“, schreiben Dr. Orla M. Doyle und Kollegen in Scientific Reports. Sie arbeiten bei IQVIA im Bereich Predictive Analytics, Real World Solutions.
Innovative Ansätze, um
Risikopatienten zu erkennen
Das Problem hoher Raten an Patienten mit unentdeckter HCV ist nicht neu. Schon vor Jahren haben die Centers for Disease Control and Prevention (CDC) in Atlanta deshalb ein risikobasiertes Screening-Programm eingeführt. Ihre Zielgruppe waren Patienten, die intravenös zu verabreichende Medikamente verwendeten oder bestimmte Diagnosen wie eine HIV-Infektion hatten. Hinzu kamen Patienten, die vor 1992 Bluttransfusionen erhalten hatten. Im Jahr 2012 erweiterten die CDC ihre Empfehlung um Personen, die zwischen 1945 und 1965 geboren worden waren. In dieser Population findet man 75 Prozent aller diagnostizierten HCV-Infektionen. Trotzdem ist die Zahl an nachgewiesenen HCV-Infektionen nur marginal gestiegen.
Was tun? Doyle und Kollegen sehen große Chancen in Screening-Programmen mit Tools der künstlichen Intelligenz (KI) und des maschinellen Lernens. Grundlage sind Daten aus elektronischen Patientenakten. Zu Beginn ist kein direkter Kontakt mit Patienten erforderlich.
Das geht so: Im ersten Schritt trainiert man einen Algorithmus mit Patientendaten inklusive der Angabe, ob HCV-Infektionen vorliegen oder nicht. Die Leistung des Programms wird im zweiten Schritt an einem unabhängigen Satz von Patientendaten getestet, bei denen Angaben zum HCV-Status bekannt waren, aber von den Wissenschaftlern entfernt worden sind.
Setzt man solche Algorithmen später in der Praxis ein, gelingt es, in kurzer Zeit Patienten mit hohem Risiko einer unentdeckten HCV-Infektion zu finden. Nur mit ihnen führen Ärzte dann Labortests durch. Sie müssen aber keine große Zahl an Patienten mit virologischen Tests screenen. Außerdem kann KI möglicherweise die Anzahl falsch-positiver Testungen, sprich Personen, die aufgrund vermeintlicher Risiken im Labor untersucht werden, aber HCV-negativ sind, verringern. Das spart Kosten im Gesundheitssystem.
Datenquellen für die Analyse
Doyles Team arbeitete mit bestehenden longitudinalen Datenbanken von IQVIA. Dazu zählten die LRx-Datenbank mit ärztlichen Verordnungen (Rx-Präparate) und die Dx-Datenbank mit ärztlichen, jedoch nicht von dritter Seite verifizierten Diagnosen. Einträge kamen aus der Zeit zwischen Januar 2001 und September 2016.
Die LRx-Datenbank umfasst zwei Milliarden Rezepte pro Jahr mit einer Abdeckung von bis zu 92 Prozent für öffentliche Apotheken, 70 Prozent für den Versandhandel und 70 Prozent für die Langzeitpflege. Basis sind elektronische Daten, die von Apotheken, Versicherungen, Softwareanbietern und Transaktions-Clearingstellen ohnehin generiert oder bearbeitet werden. Darin enthalten sind Informationen über das Produkt, den Anbieter, die Bezahlung – privat oder als Erstattung einer Versicherung – und den Wohnort des Patienten.
Dx-Daten wiederum enthalten Felder zur Demografie des Patienten, also zu seinem Alter, seinem Geschlecht, und auch hier zu seinem Wohnort. Hinzu kommen Einzelheiten über Zahlungen der Leistungen über Versicherungen oder Zahlungen aus der eigenen Tasche. Auch ob Patienten beim niedergelassenen Arzt oder im Krankenhaus waren, ist vermerkt.
Alle Informationen blieben während des gesamten Datenerhebungs-, Verknüpfungs- und Analyseprozesses anonymisiert. Persönliche Gesundheitsinformationen wurden entfernt oder verschlüsselt, bevor sie von IQVIA gesammelt wurden. Sowohl die LRx- als auch die Dx-Datensätze sind mit einem anonymen Patienten-Token rückverknüpft.
Auswahl der Patienten für die Studie
Im weiteren Verlauf der Analyse wurden HCV-Patienten über einen diagnostischen Code oder über eine spezifische Behandlung definiert. Das Kriterium, zusätzlich Therapien aufzunehmen, war wichtig, weil in den Daten nicht immer eine Erkrankung genannt wurde. Hinzu kam der früheste Zeitpunkt einer Diagnose oder einer Verordnung. Patienten ohne HCV hatten dementsprechend weder HCV-Diagnosen noch HCV-Medikationen bekommen.
Doyles Team arbeitete mit einem Fall-Kontroll-Design. Für jeden HCV-Patienten wurde ein Patient ohne HCV, aber mit vergleichbaren Charakteristika, ausgewählt. Durch dieses Matching versuchten die Wissenschaftler sicherzustellen, dass Unterschiede in der Verteilung der Prädiktoren zwischen HCV- und Nicht-HCV-Patienten medizinische Phänomene widerspiegeln und nicht nur aufgrund von unterschiedlich langen Beobachtungszeiträumen entstanden sind.
Gleichzeitig arbeiteten die Forscher mit einer Stratifizierung ihrer Daten. Sie wollten verhindern, dass ihr Algorithmus nur allgemeine, hinlänglich bekannte Risikofaktoren wie eine Versorgung beim Hepatologen, einen intravenösen Drogenkonsum, Alkoholmissbrauch, andere chronische Virusinfektionen wie HIV, aber auch Nieren- und Atemwegserkrankungen sowie weitere innere Erkrankungen als Kriterien verwendet, um Risikopatienten zu identifizieren. Mit genau diesem Herangehen waren die CDC zuvor gescheitert.
Zusätzlich zu dieser Stratifikation mussten alle Patienten die folgenden Auswahlkriterien innerhalb des verknüpften LRx- und Dx-Datensatzes erfüllen: Sie sollten ein Indexdatum zwischen Oktober 2015 und September 2016 haben. Gemeint ist hier der erste Kontakt zum Arzt wegen unklarer Beschwerden. Hinzu kam eine mindestens 24-monatige Aktivität, sprich mehrere Arztkontakte im Zeitraum. Personen waren zum Indexdatum zwischen 20 und 79 Jahre alt und es sollten in beiden Datenbanken Arztbesuche oder Verordnungen registriert sein.
Gleichzeitig entwickelten Experten 98 klinische Konzepte, um Assoziationen zwischen einer HCV-Infektion und möglichen Komorbiditäten abzubilden, beispielsweise Risikofaktoren (ein intravenöser Drogenkonsum), Symptome (Gelbsucht), Behandlungen (gegen den Opioidkonsum) und Komorbiditäten (Depressionen). Um den longitudinalen Charakter der Daten auszunutzen, wurden Merkmale anhand von zwei Metriken dargestellt: der Häufigkeit des Auftretens und dem Zeitpunkt des ersten Auftretens.
Statistische Methoden
Um sicherzustellen, dass die Modellschätzung, -auswahl und -bewertung unabhängig voneinander durchgeführt wurden, wurden die Daten nach dem Zufallsprinzip in drei Sätze aufgeteilt: ein Trainingssatz (80 Prozent der HCV-Patienten) für die Modellentwicklung, ein Validierungssatz (10% der HCV-Patienten) zur Modellbewertung und -auswahl sowie ein Testset (10 Prozent der HCV-Patienten) zur Beurteilung der Leistung des endgültigen Modells.
Die Forscher wendeten konventionelle parametrische Methoden wie die logistische Regression (LR) auf ihre Daten an. Hinzu kamen nichtparametrische Methoden des maschinellen Lernens wie Random Forest (RF), Gradient Boosting Tree (GBT) oder Ensemble Learning auf Basis von GBT. Diese Algorithmen wurden gewählt, um einen klassischen Ansatz aus der statistischen Modellierung sowie zwei der populärsten baumbasierten Ansätze des maschinellen Lernens zu integrieren. Ergebnisse aus LR, RF und GBT wurden mit weiteren statistischen Methoden verglichen.
Ergebnisse der Datenanalyse
Für die HCV-Kohorte erfüllten 120.023 Patienten die Stratifizierungs- und Auswahlkriterien. In der Subgruppe ohne HCV waren es rund 60 Millionen, von denen 9.601.900 nach dem Zufallsprinzip ausgewählt wurden.
Alter und Geschlecht waren in allen
Kohorten ähnlich. In der HCV-Kohorte wurden 11% mit HCV-Medikamenten behandelt. Ein wesentlich höherer Anteil der HCV-Patienten hatte eine Diagnose von HIV oder AIDS (5% der HCV-Patienten gegenüber 1% der Nicht-HCV-Patienten) und/oder intravenösem Drogenkonsum in der Vorgeschichte (26% der HCV-Patienten gegenüber 3% der Nicht-HCV-Patienten).
Die Auswertung der Daten ergab, dass Patienten im Durchschnitt zwei bis drei Jahre vor ihrer eigentlichen HCV-Diagnose bereits Symp-
tome wie Gelenkschmerzen, Bauchschmerzen, Unwohlsein, Müdigkeit oder Fibromyalgie hatten. Sie erhielten drei bis vier Jahre vor ihrer HCV-Diagnose nichtsteroidale Antirheumatika (NSAID), systemische Steroide oder Opioide. Patienten kontaktieren den Arzt wegen ihrer Beschwerden schon recht frühzeitig. Mehrere Untersuchungen folgen, doch bis zur HCV-Diagnose vergeht viel Zeit (Abb. 1).
Ergebnisse der prädiktiven
Modellierung
Diese Zeitspanne könnten KI-Algorithmen verkürzen. Doch was möchte man später in der Praxis erreichen? Wenn das Ziel darin besteht, 10% oder weniger der HCV-Patienten ohne Diagnose zu finden, die Autoren bezeichnen diesen Wert als Recall, schneiden alle drei untersuchten Modelle ähnlich ab. Bei Recall-Levels von über 30% brachte GBT die besten Ergebnisse. Bei einem Wert von 50% waren pro 100 Patienten, die vom Modell identifiziert wurden, 74 HCV-positiv. Bei einem Recall-Level von mehr als 50 Prozent jedoch verringerte sich die Präzision stark.
Das GBT-Modell wurde danach anhand zeitlicher Merkmale neu trainiert. Konkret erhöhte sich die Präzision beim 50-prozentigen Recall von 74 auf 87%.
Auf alle Modelle wurden Methoden des Ensemble Learnings angewendet, um ein Stacked Ensemble als Kombination zu trainieren. Es wurde anschließend auf den Testdatensatz angewendet. Bei höheren Recalls übertraf das Stacked Ensemble alle Modelle. Es erreichte eine Spezifität von 99,9% und eine Präzision von 97% bei einem Recall-Niveau von 50%.
Das bedeutet: Ungefähr 97 von 100
Patienten werden korrekt als HCV identifiziert, wenn das Ziel darin besteht, mindestens 50% der HCV-Patienten zu finden.
Das Stacked Ensemble arbeitet mit 284 Variablen. Als besonders relevant zur Unterscheidung zwischen HCV- und Nicht-HCV-Patienten erwiesen sich neben dem Alter und dem Gebrauch intravenöser Medikamente vor allem Schmerzmittel, nämlich NSAID und Opioide. Auch Behandlungen im Zusammenhang mit Osteoarthritis und rheumatoider Arthritis wurden als relevant eingestuft (Abb. 2).
Limitationen der Studie
„Die Evidenz in dieser Studie weist auf den beträchtlichen potenziellen Nutzen der KI bei der Bewältigung von Problemen der Unterdiagnose im Zusammenhang mit komplexen Krankheitsmerkmalen hin“, schreiben die Autoren. Sie verweisen auf vier Einschränkungen:
• Erfasst wurde nur die Vorgeschichte von HCV-Patienten bis zu dem Punkt unmittelbar vor der Diagnose oder Behandlung. Patienten könnten von einem früheren Start womöglich noch stärker profitieren.
• Experten haben im ersten Schritt klinische Merkmale bewertet und aggregiert. Dieser hypothesengetriebene Ansatz kann fehlerbehaftet sein.
• Eine externe prospektive Validierung der KI Tools steht noch aus.
• Patienten mit eingeschränktem Zugang zum Gesundheitssystem waren in der Stichprobe unterrepräsentiert: ein Problem, dass in den USA sicher mehr Relevanz hat als in Deutschland.
• Einige Patienten mit HCV erhielten im Zeitraum weder eine Diagnose noch eine Therapie, was zur Verzerrung der Ergebnisse geführt haben könnte.
KI: Neue Ansätze für
Forschung und Praxis
„Lösungen aus dem Bereich der künstlichen Intelligenz haben Potenzial, die Identifizierung von HCV-Patienten zu verändern und das WHO-Ziel der Eliminierung der Virushepatitis bis 2030 zu erreichen“, schreiben Doyle und ihre Koautoren. Sie sehen mehrere Möglichkeiten, um Systeme nach deren Evaluierung einzusetzen.
KI-Tools könnten Ärzte dabei unterstützen, in digitalen Patientenakten Personen mit hohem HCV-Risiko ohne Diagnose zu identifizieren, ohne sie überhaupt in die Praxis einzubestellen. Nur bei Hinweisen auf ein erhöhtes Risiko folgen Bluttests. Solche Anwendungen könnten dauerhaft im Hintergrund laufen, um ständig Patientendaten zu screenen – sowohl im Krankenhaus als auch in der Arztpraxis. Nicht zuletzt sehen die Autoren Einsatzmöglichkeiten bei der Rekrutierung von Teilnehmern für klinische Studien – sei es, um Patienten mit hohem Risiko zu finden oder auszuschließen, ohne dass im ersten Schritt Laboruntersuchungen erforderlich sind.
„Die Aussicht ist zweifellos spannend“, so das Fazit im Artikel. Aber es gebe viele Hürden, die überwunden werden müssen, von der Infrastruktur über die Interoperabilität bis hin zur Informationsverwaltung und zur klinischen Einführung. Zumindest der erste Schritt ist getan: KI-Algorithmen eignen sich, um in routinemäßig erhobenen Gesundheitsdaten Patienten mit erhöhtem HCV-Risiko aufzuspüren. Das haben die Forscher gezeigt. <<
von: Dr. Gisela Maag, IQVIA Commercial GmbH & Co. OHG, Frankfurt
Zitationshinweis:
Maag, G.: „KI gegen hohe Dunkelziffer unentdeckter Erkrankungen“, in „Monitor Versorgungsforschung“ (06/20), S. 38-41; doi: 10.24945/MVF.06.20.1866-0533.2261