Real-World-Data und -Evidenz in der Regulatorik
http://doi.org/10.24945/MVF.03.19.1866-0533.2140
>> „Real World Data beziehen sich auf Daten über die Verwendung oder die potenziellen Vorteile oder Risiken eines Arzneimittels, das aus anderen Quellen als aus traditionellen klinischen Studien stammt.“ Diesen Satz, mit dem Jacqueline Corrigan-Curay, J.D., M.D., Direktorin des Office of Medical Policy-Centers der FDA, die Online-Vorstellung des „Framework for FDA‘s Real-World Evidence Program“ im März 2019 einleitete, umschreibt ganz gut, um was es der FDA eigentlich geht: Ein Programm zur Bewertung der potenziellen Verwendung von Beweisen aus der realen Welt (RWE) zu erstellen.
Von welchen Daten sprechen wir hier eigentlich? Gleich zu Beginn des veröffentlichten Papiers zum Real-World-Evidence-Programm der FDA liefert die Institution Definitionen von zwei Begriffen. Von Real-World-Evidenz (RWE) und Real-World-Daten (RWD) ist im Papier die Rede. Bei dem letzten Begriff handele es sich um Daten zur Anwendung von Medikamenten, aus denen potenzieller Nutzen oder Risiken abgeleitet werden können. Diese Daten stammen allerdings aus anderen Quellen als Daten in „traditionellen“ klinischen Studien. Die Real-World-Evidenz leitet sich wiederum genau aus diesen Daten ab, stellt die FDA klar.
„Real-World Data sind Daten, die sich auf den Gesundheitszustand des Patienten und/oder die Gesundheitsversorgung beziehen und die routinemäßig aus einer Vielzahl von Quellen gesammelt werden“, heißt es im Framework-Papier. Bei „Real-World Evidence (RWE)“ handele es sich hingegen um die klinische Evidenz zur Anwendung und potenziellem Nutzen oder Risiken eines medizinischen Produktes oder Arzneimittels, die aus der Analyse der RWD abgeleitet wurde.
Als Beispiel für RWD führt die FDA Daten aus EHR (Electronic Health Records) und Routinedaten (Health Claims) der Krankenversicherungen an, darüber hinaus Daten aus Produkt- und Krankheitsregistern, aber auch von Patienten selbst generierte Daten (etwa im Hausumfeld), sowie Daten, die aus anderen Quellen gesammelt wurden und die Informationen über den Gesundheitsstatus liefern können – zum Beispiel von mobilen Anwendungen (Apps).
Die Quellen zur Sammlung von RWD sind laut FDA Register, EHR-Archive sowie Datenbanken mit Routinedaten der Versicherten. Vor diesem Hintergrund soll eine Analyse-Infrastruktur etabliert werden: Dabei sollen viele Typen von Studiendesigns unterstützt werden mit dem Ziel, die Real-World-Evidenz abzuleiten. Dazu zählt die FDA randomisierte Studien (etwa große einfache Studien und pragmatische klinische Studien) sowie Beobachtungsstudien (prospektiv oder retrospektiv).
Die FDA legt Wert auf den Unterschied zwischen bisherigen Studiendesigns und Studien, die vom RWE-Programm abgedeckt werden. Im Rahmen des RWE-Programms werde die Evidenz aus den herkömmlichen klinischen Studien nicht als RWE betrachtet. Obgleich verschiedene hybride oder pragmatische Studiende-
signs sowie Beobachtungsstudien sehr wohl RWE generieren können. Das RWE-Programm der FDA soll klinische Studien abdecken, „die RWE mit einer bestimmten Kapazität und Funktion generieren“, (z. B. Quellen mit Ausnahme von „traditionellen“ klinischen Studien) und Beobachtungsstudien.
Im Rahmen des Frameworks definiert die FDA eine klinische Studie als eine Forschungsstudie, in der einem oder mehreren Menschen eine oder mehrere Interventionen prospektiv zugeteilt werden (diese können Placebo oder andere Kontrollen einschließen), um die Auswirkung solcher Interventionen zu evaluieren.
Auch wenn es keine einzelne Definition einer „traditionellen“ klinischen Studie gebe, räumt die FDA ein, so unterschieden sich die Studien dennoch beträchtlich im Design und in der Ausführung. Für das FDA-Programm betrachtet die FDA eine traditionelle klinische Studie generell als solche, die
• üblicherweise von einer Forschungsinfrastruktur unterstützt wird,
• größtenteils von der klinischen Routinepraxis getrennt ist und
• designed ist, um die Variabilität und die Datenqualität zu maximieren.
Eine „traditionelle“ klinische Studie hat auch nach Meinung der FDA eher restriktive Auswahlkriterien, die sicherstellen sollen, dass die Teilnehmer tatsächlich die Krankheit haben, die von Interesse ist oder über spezielle Eigenschaften verfügen, sodass der Nachweis der Arzneimittelwirksamkeit (wenn es tatsächlich eine gibt) wahrscheinlicher ist, als wenn die Population weniger genau definiert wäre.
Als „traditionelle“ klinische Studien nennt die FDA randomisierte und Double-Blind-Studien, in denen der Forscher und der Patient die Behandlung nicht kennen. Bei diesen Studien kämen typischerweise separate Verfahren und spezielles Forschungspersonal zum Einsatz, um bestimmte Daten sammeln zu können. Diese fielen beim Gebrauch von standardisierten Verfahren an, dazu gehörten detaillierte Fallberichte (Case Report Forms, CRF), die von routinemäßigen Aufzeichnungen (Medical Records) getrennt seien, wenn auch einige Daten (etwa lokal erworbene Labordaten) von diesen Aufzeichnungen in die CRF übertragen werden können. Das Personal folge beim Monitoring und den Studienverfahren speziellen Protokollrichtlinien.
Aktivitäten des FDA-Programms
Die FDA will nun im Rahmen des RWE-Programms das Potenzial von RWD und RWE erforschen, um regulatorische Entscheidungen zur Produktwirksamkeit unterstützen zu können. Die Aktivitäten des FDA-Programms beinhalten:
- Ermittlung und Bewertung von Datenstandards und
- Umsetzungsstrategien, die für die Verwendung von RWD/RWE erforderlich sind.
- Ermittlung von Lücken zwischen RWD/RWE-Daten-Standards und bestehenden FDA-Systemen,
- Zusammenarbeit mit Stakeholdern zur Anpassung oder Weiterentwicklung von Standards und Umsetzungsstrategien.
Im Besonderen soll das Programm den potenziellen RWE-Einsatz evaluieren, um Veränderungen im Labeling der Produktwirksamkeit, einschließlich des Hinzufügens oder Modifizierens einer Indikation, der Veränderungen in der Dosis, im Regime oder der administrativen Route, im Hinzufügen einer neuen Population oder einer erhöhten Wirksamkeit etc. zu prüfen. Folgende Fragen sollen dabei beantwortet werden:
- Sind die RWD für den Gebrauch geeignet?
- Kann die Studie oder das Studiendesign, die zur Generierung von RWE verwendet wurden, adäquate wissenschaftliche Evidenz liefern, um regulatorische Fragen zu beantworten?
- Werden bei der Studiendurchführung die regulatorischen FDA-Anforderungen erfüllt (etwa für Studienmonitoring und Datenerfassung)?
Evaluation künftiger Data Standards
Im Zuge der Umsetzung des RWE-Programms sollen zum einen „Vorzeigeprojekte“ angeschoben und zum anderen Stakeholder eingebunden werden. Darüber hinaus sind eine Evaluation künftiger Data Standards sowie Empfehlungen zur Qualität und Zuverlässigkeit der Gesundheitsdaten wichtige Punkte des Programms. Ein weiterer Bestandteil sind außerdem Leitlinien zu verschiedenen Themen, die die FDA herauszugeben plant – beispielsweise zu den Quellen, die RWE liefern sollen.
Daten aus anderen Ländern seien etwa eine wertvolle Quelle für RWD. Jedoch sei durch die großen Unterschiede der Healthcare-Systeme ihre Eignung für den Gebrauch in der regulatorischen Entscheidungsfindung der FDA eingeschränkt. Die Verwendung von Daten aus anderen Ländern könnten jedoch nach FDA-Meinung weitere Analysen erfordern, die die Unterschiede in der medizinischen Praxis, in der Gesundheitsversorgung und der Relevanz im Vergleich zu den USA berücksichtigen.
In diesem Zusammenhang verweist die FDA auf ihre pharmako-epidemiologischen Leitlinien, die bereits Überlegungen zum Einsatz von internationalen elektronischen Healthcare-Daten in Studien zur Arzneimittelsicherheit liefern würden. Die FDA will aber im Rahmen des neuen Programmms auch zusätzlich prüfen, wie internationale elektronische Healthcare-Daten eingesetzt werden könnten, um RWE zu generieren und Aussagen zur Wirksamkeit von Arzneimitteln für die regulatorische Entscheidungsfindung zu treffen.
Im Weiteren geht die FDA in ihrem „Framework for Real-World Evidence Program“ auf Patientenregister ein, die eine weitere wichtige Quelle für RWD zur Generierung der Evidenz seien. Unter solchen Registern versteht die FDA „organisierte Systeme“, in denen Daten einheitlich gesammelt werden und die Methoden von Beobachtungsstudien nutzen; mit dem Ziel, klinische oder andere spezifische Outcomes für eine Population mit einer bestimmten Erkrankung oder in einer bestimmten Gesundheitsverfassung abzuschätzen. Register seien allgemein entweder durch die Diagnose einer Erkrankung oder den Einsatz eines Arzneimittels definiert. Ihre Eignung für den Gebrauch zur Generierung von RWE verlange entsprechende Verfahren, bei denen beispielsweise auch Follow-up-Informationen bei Bedarf gesammelt werden könnten. Dadurch solle die Datenqualität sichergestellt und die Zahl an unvollständigen Datensätzen minimiert werden.
Auswahl je nach Fragestellung
Unterschiedliche RWD-Quellen hätten unterschiedliche Stärken, aber auch Einschränkungen, betont die FDA. Die Auswahl von geeigneten RWD-Quellen sollte daher immer von der regulatorischen Fragestellung ausgehen und immer ein entsprechendes Level an Validität liefern.
Im Rahmen des Programms will die FDA, auf bestehenden Leitlinien zur Pharmakoepidemiologie aufbauend, neue Leitlinien dazu erstellen, wie die Verlässlichkeit und die Relevanz aus Routinedaten und EHR bewertet werden kann, die zur Generierung von RWE im Hinblick auf die Wirksamkeit von Arzneimitteln genutzt wurden. Die FDA will außerdem untersuchen, welche Bewertungskriterien für die Zuverlässigkeit und Relevanz von Registerdaten und internationalen Healthcare-Daten gelten.
Als weiteren wichtigen Punkt in diesem Kontext geht die FDA auf mögliche Lücken in Daten der RWD-Quellen ein. EHR und Routinedaten der Krankenversicherungen enthielten unter Umständen nicht alle Elemente, die nötig seien, um gestellte Fragen zu beantworten. Zwar würden in diesen Quellen größere Maßnahmen wie Krankenhauseinweisungen dokumentiert, doch würden sich viele wichtige Veränderungen nicht darin spiegeln: wie etwa individuelle Erfahrungen der Patienten, Veränderungen im medizinischen Status (etwa Verschlechterung der Depression oder Ängsterkrankung, Hinzukommen von weiteren Schmerzen usw., Veränderungen in der Reaktion auf ein Medikament oder leichte Nebenwirkungen). Diese würden in den EHR nicht zuverlässig und konsistent genug dokumentiert, „wenn überhaupt“. Und selbst wenn diese erfasst würden, so setze die Art und Weise, wie Datenelemente im EHR erfasst werden, ihrer Bewertbarkeit Grenzen. Zum Beispiel könnten Symptome eines Patienten als unstrukturierte Daten dokumentiert werden, etwa in der Akte des Arztes, ohne eine standardisierte Sprache oder Symptomskala.
Auch Daten zur Veränderung des Schweregrades von chronischen Erkrankungen über eine bestimmte Zeit hinweg seien wahrscheinlich nicht in den Routinedaten enthalten. Ein effektiver Einsatz von RWE setze jedoch voraus, dass Informationen innerhalb der EHR bewertbarer und vernetzter werden. Es müssten nach Ansicht der FDA daher Tools entwickelt werden, um die Suche nach solchen Datensätzen zu vereinfachen.
Ein weiteres Problem ist für die FDA die fehlende internationale Interoperabilität. Auch wenn standardisierte Daten in den EHR enthalten seien, könnten unterschiedliche Healthcare-Systeme EHR in verschiedenen Formaten nutzen, so dass es schwierig werde, die gleichen Daten aus unterschiedlichen Formaten herauszufiltern. Häufig seien Systeme zudem weder interoperabel noch in andere Systeme integrierbar.
Besonders schwer werde es, glaubt die FDA, Daten zu sammeln, wenn Patienten den Versicherer wechseln. Darüber hinaus fehle es den Routinedaten der Krankenversicherungen oft an Detailgenauigkeit, um bestimmte Fragen zu beantworten.
Die FDA will daher Strategien entwickeln, um die genannten Mängel in den aktuellen EHR- und Routinedaten auszubessern. Betrachtet werden soll auch der Einsatz von mobilen Technologien, Tools zu Electronic Patient Reported Outcomes, Wearables und Biosensoren.
Eine darüber hinausgehende Herausforderung besteht nach Meinung der FDA darin, die unterschiedlichen Datenquellen mit Informationen zu einem einzelnen Patienten zu verknüpfen. Im Gegensatz zu anderen Ländern hätten die Patienten in den USA keine einzelne Identifikationsnummer, die von verschiedenen privaten Healthcare-Systemen beziehungsweise Versicherern genutzt wird. Es müssten in diesem Kontext Wege entwickelt werden, Doppelungen von Informationen in verschiedenen Datenquellen zu vermeiden. Im aktuellen Programm will die FDA Leitlinien erarbeiten und klären, wie potenzielle Mängel in den RWD-Quellen angegangen werden können.
Die FDA sieht aber trotz der Lücken auch großes Potenzial in den RWD für das Design von Klinischen Studien. Die RWD könnten helfen, die Effektivität der Studiendesigns zu verbessern. So könnten diese Daten in unterschiedlichen Studiendesigns verwendet werden, vor allem in pragmatischen Klinischen Studien gehe damit großes Potenzial einher. Pragmatische Studien beinhalteten breitere Inklusions- oder Exklusionskriterien sowie eine stromlinienförmige Datenerfassung.
In Abhängigkeit von der Art der Erkrankung, der Patienten-Population, der Interventionen sowie anderen Faktoren, wäre es aber laut FDA auch möglich, hybride Studien zu designen, die beides enthalten: Elemente aus traditionellen und pragmatischen Klinischen Studien. Die FDA wird deshalb die Stärken aber auch die Grenzen von pragmatischen Ansätzen im Hinblick auf die RWD-Nutzung evaluieren, indem folgende Faktoren betrachtet werden:
- Welche Arten von Interventionen und therapeutischen Gebieten könnten besonders geeignet sein, um Versorgungssituationen mit Hilfe von Daten abzubilden?
- Wie steht es um die Qualität der Daten aus diesen Situationen?
- Wie viele Patientenfälle können bewertet werden (vor allem, wenn es wenig Ergebnisse gibt)?
- Welche Variationen gehören nicht zur klinischen Praxis?
Aufgabe: Bias-Kontrolle
Wenn die Verblindung bei einer Behandlung nicht machbar ist, will die FDA versuchen, Situationen zu identifizieren, wo Bias, die Folge eines Verblindungmangels sind, potenziell kontrolliert werden können, indem Outcomes verwendet werden, die am wenigsten durch die Kenntnis der Behandlungszuordnung beeinflusst sind, wie etwa objektive klinische Ergebnisse (z. B. Schlaganfall, Größe des Tumors). Die FDA wird die Machbarkeit von unterschiedlichen Ansätzen zur Randomisierung in pragmatischen Klinischen Studien untersuchen, inklusive der Randomisierung von Clustern durch eine Institution oder Praxis, heißt es im Programm weiter.
Darüber hinaus wird im Framework angekündigt, dass die FDA Leitlinien zum Design von Klinischen Studien entwickeln wird, die pragmatische Design-Elemente enthalten. Die FDA will pragmatische Ansätze zu jeder Etappe der Klinischen Studie untersuchen, inklusive Rekrutierung und Aufnahme von Patienten, Strategien zur Unterstützung von Interventionen und Ansätze zur Bewertung von Outcomes.
Die FDA geht daraufhin auch auf externe Konrollen der Klinischen Studien ein. Diese nutzten Daten aus vergangenen Klinischen Studien, doch in einigen Fällen seien RWD auch als Basis für externe Kontrollen genutzt worden. Externe Kontrollen dieser Art seien aufgrund folgender Probleme begrenzt akzeptabel:
- Schwierigkeiten bei einer zuverlässigen Auswahl einer vergleichbaren Population,
- potenzielle Veränderungen in der medizinischen Praxis,
- Mangel an standardisierten diagnostischen Kriterien oder äquivalenten Outcome-Messungen sowie
- Variabililtät in den Follow-up-Verfahren.
Das Sammeln der aktuellen RWD von Patienten, die derzeit weitere Behandlungen erhielten, könnte mit Hilfe von statistischen Methoden die Qualität von Daten aus externen Kontrollen verbessern, die genutzt werden, wenn eine Randomisierung nicht machbar oder ethisch vertretbar ist. Auch zum Gebrauch von RWD in externen Studien-Kontrollarmen will die FDA Leitlinien auflegen.
Darüber hinaus setzt sich die FDA auch mit dem Einsatz von RWD in Beobachtungsstudien auseinander. Hier habe die Behörde bereits grundlegende Erfahrungen gesammelt, indem sie Leitlinien zu Pharmakoepidemiologie-Studien aufgelegt hat, die RWD im Kontext der Arzneimittel-Sicherheit nutzen. Diese Leitlinien seien primär auf Studien gerichtet, die designed sind, um vorgegebene Hypothesen zu prüfen – als Gegensatz zu Studien, die Hypothesen erst generieren.
Im Hinblick auf die Frage, ob Daten, die in den retrospektiven Beobachtungsstudiendesigns gesammelt werden, geeignet sind, um RWE zu generieren, hat die FDA vor, folgende kritische Punkte zu klären:
- Welche Eigenschaften haben die Daten (Enthalten sie relevante Endpunkte, gibt es eine Konsistenz in der Dokumentation? Gibt es fehlende Datenelemente?), die die Chance auf valide Ergebnisse erhöhen?
- Welche Eigenschaften hat das Studiendesign und die Analyse, die die Chance auf valide Ergebnisse erhöhen könnten?
- Welche Sensitivitätsanalysen und welche Methoden der statistischen Diagnostik sollten für Beobachtungsstudien mit RWE-Zielen vordefiniert werden?
Kritik übt die FDA beim Design und der Durchführung von retrospektiven Beobachtungsstudien. Hier mangele es an Transparenz. Hinzu komme die Tatsache, dass retrospektive Analysen in elektronischen Datasets relativ günstig mit variierenden Elementen des Studiendesigns mehrmals durchgeführt werden können. Dies mache es möglich, zahlreiche retrospektive Studien solange durchzuführen, bis das gewünschte Ergebnis gewonnen werden kann, wobei aber nur das günstige Ergebnis eingereicht werde, und damit vorgebe, das einer einzelnen Studie mit einem vorgegebenen Protokoll zu sein.
Die FDA wird daher Strategien entwickeln, um solchen Praktiken vorzubeugen, inklusive Empfehlungen von Experten und anderen Stakeholdern. Die FDA will ebenfalls untersuchen, ob Unterschiede in retrospektiven und prospektiven Designs von Beobachtungsstudien unterschiedliche Herangehensweisen erfordern. Aufbauend auf den pharmakoepidemiologischen Leitlinien plant die FDA daher auch, Leitlinien zu RWD nutzenden Designs von Beobachtungsstudien zu erstellen. Das Ziel: Die Antwort auf die Frage zu finden, ob und wie diese Studien RWE liefern können, um die Wirksamkeit von Arzneimitteln im Rahmen der regulatorischen Entscheidungsfindung zu bewerten. <<
Autorin: Olga Gilbers
Zitationshinweis:
Gilbers, O., „Real-World-Data und -Evidenz in der Regulatorik“ in „Monitor Versor-
gungsforschung“ (03/19), S. 14-17; doi: 10.24945/MVF.03.19.1866-0533.2140