Register für Nutzenbewertungen prinzipiell möglich
http://doi.org/10.24945/MVF.02.20.1866-0533.2208
>> Für die Autorenschaft des IQWiG-Reports und so auch für Windeler haben generell nach wie vor „versorgungsnahe vergleichende Studien mit Randomisierung immer eine höhere Aussagekraft als solche ohne Randomisierung“ und blieben denn auch der Goldstandard, weil hier eine Quantifizierung des Zusatznutzens zuverlässiger möglich sei. Doch, so räumen die Autoren ein, hätte die Durchführung von registerbasierten vergleichenden Studien mit Randomisierung innerhalb eines Registers durchaus „ein zusätzliches Potenzial, die Studien zu beschleunigen und weniger aufwendig zu gestalten“. Auch sei die Generierung versorgungsnaher Daten und deren Auswertung zum Zwecke der Nutzenbewertung von Arzneimitteln „absehbar möglich“. Jedoch eben mit der Einschränkung auf „studienindividuelle Datenerhebungen nur über Datenerhebungen in Registern“, wie Windeler resümiert, der darum im vorgelegten Report aufschreiben ließ, „welche Daten dafür in welcher Qualität in den Registern abrufbar sein müssen“.
Die Rede ist hier jedoch immer nur von Registern, wobei hier ebenso immer nur absolute Qualitätsregister gemeint sind, von denen es bisher in Deutschland zwar einige, aber auch nicht allzu viele gibt. Die Rede ist jedoch nicht von Real-World-Daten per se. „Das IQWiG kann mit seinem Vorschlag seine bekannten Vorbehalte gegen die Nutzung von Versorgungsdaten nicht überwinden“, rügt darum Dr. Markus Frick, Geschäftsführer Markt und Erstattung des vfa. Er weist darauf hin, dass „die künftige Berücksichtigung versorgungsnaher Daten aus elektronischen Patientenakten und aus Abrechnungsdaten der Krankenkassen“ vom IQWiG gänzlich ausgeschlossen werde. Dabei richteten sich die Hoffnungen auf Qualitäts- und Evidenzverbesserungen im Gesundheitswesen „gegenwärtig genau auf diese Art von Daten“. Frick befürchtet darum, dass, falls sich der G-BA diesem Methodenvorschlag anschließe, „Versorgungsdaten künftig kaum in die Zusatznutzenbewertung einfließen“ werden. Dies mit der Konsequenz, dass dies auf lange Sicht eine Abkopplung vom medizinischen Fortschritt bedeuten könne.
Das ist sicher etwas schwarz gemalt.
Denn das Deutsche Netzwerk Versorgungs-
forschung, das sich seit vielen Jahren dafür engagiert, die in Registern vorhandenen Daten für Forschungs- und Versorgungsfragen nutzbar zu machen, begrüßt den Grundtenor des Rapid Report durchaus. Damit werde es zukünftig endlich möglich, in die Nutzenbewertung versorgungsnahe Daten einzubeziehen, die außerhalb von randomisiert kontrollierten Studien (RCT) erhoben würden.
Auch hat das DNVF überhaupt nichts gegen die hohen, qualitativen Ansprüche an Register, die eine erweiterte Nutzenbewertung im Sinne des IQWiG ermöglichen. Dies wären bereits im Memorandum „Register“ des DNVF von 2009 in Abstimmung mit den Fach- und Arbeitsgruppen des DNVF erarbeitet und veröffentlicht worden. Hier seien klare Kriterien aufgestellt worden, an denen sich Register orientieren sollen, um ihre Qualität transparent und nachvollziehbar aufzuzeigen. Auch würde die vom DNVF Anfang 2020 publizierte Aktualisierung des Memorandums2 die qualitativen Anforderungen des IQWiG ausdrücklich unterstützen, weshalb das DNVF anbietet, „hier gerne Verantwortung für die qualitative Weiterentwicklung von Registern“ zu übernehmen und und die bisher entwickelten Kriterien für die Qualität von Registern, aber auch die methodisch notwendigen Grundlagen weiter zu spezifizieren und zur Verfügung zu stellen. „Qualitativ hochwertige Register bieten für die Zukunft eine valide Basis, um Evidenz auch aus Real-World-Daten (RWD) zu generieren und zu etablieren“, kommentiert Prof. Dr. Monika Klinkhammer-Schalke, Vorstandsvorsitzende des DNVF. Sie leitet seit 1998 als Direktorin das Tumorzentrum Regensburg der Universität Regensburg, welches das Baye-rische Krebsregister des Bayerischen Landesamts für Gesundheit und Lebensmittelsicherheit führt. Sie ist sich absolut sicher, dass „Registerdaten dabei helfen, Fragestellungen zu adressieren, die mit RCT nicht beantwortet werden können“. Auch wenn – wie sie einschränkt – „der Goldstandard RCT dabei weiterhin erhalten“ bleibt.3
„Grundlage jeder Aussage über Effekte ... ist ein Vergleich“
Doch kann es künftig per Register quasi einen Gold-Standard zweiter Klasse geben, dies aber nur, wenn – wie das IQWiG formuliert – ein Vergleich möglich ist. Sollen versorgungsnahe Daten zum Zweck der Nutzenbewertung herangezogen werden, ist nach Meinung des IQWiG zu berücksichtigen, „dass die Grundlage jeder Aussage über Effekte von Interventionen ein Vergleich ist“. Denn nur auf Basis eines Vergleichs sei die für eine kausale Aussage notwendige Differenzierung zwischen „nach Intervention A“ und „wegen Intervention A“ möglich. Aus dieser Überlegungen folgt – wenn man der Argumentation folgt – der für das Institut logische Schluss, dass „die alleinige Betrachtung einarmiger Studien oder einzelner Studienarme für die Nutzenbewertung nicht relevant“ ist. Damit sagt das IQWiG nichts anderes, als dass einarmige Studiendesigns per se (in Abb. 1 rot markiert) gänzlich wegfallen würden, weil für die Fragestellung der Nutzenbewertung ausschließlich vergleichende Studiendesigns relevant seien.
Zudem würden, abhängig vom vergleichenden Studiendesign, das für die Generierung versorgungsnaher Daten zum Zweck der Nutzenbewertung gewählt wird, unterschiedliche Anforderungen an die Durchführung und Auswertung der Studie entstehen, die das IQWiG denn auch in einer sehr ausführlichen Tabelle (Tab. 1) darstellt. Hier werden die Schritte von der Festlegung der Fragestellung der Nutzenbewertung bis zum Ergebnis der Untersuchung dieser Fragestellung aufgezeigt und die in diesem Ablauf bestehenden Anforderungen zusammengefasst. Dabei betonen die Autoren des IQWiG, dass – während generelle wissenschaftliche Prinzipien wie die Formulierung der zu beantwortenden Fragestellung oder die Interpretation der Ergebnisse unter Berücksichtigung der erreichten Ergebnisqualität unabhängig vom gewählten Studiendesign vorgenommen würden – sich andere Schritte der Nutzenbewertung je nach Studiendesign unterscheiden. Denn abhängig vom Studiendesign könne ein fairer, kausal zu interpretierender Vergleich angenommen werden oder sei durch spezifische Schritte in der Studienplanung, der Datenerhebung und der Auswertung anzunähern. Dabei gelte: „Die Entscheidung für ein Studiendesign sollte berücksichtigen, ob mit dem jeweils gewählten Design aus-
reichend valide Ergebnisse für eine Nut-
zenbewertung erreicht werden können“.
Auch sei eine adäquate und auch in ihrem zeitlichen Ablauf nachvollziehbare Studienplanung für die Aussagekraft der Ergebnisse einer Studie von entscheidender Bedeutung. Vor Studienbeginn wären daher ein Studienprotokoll und ein statistischer Analyseplan zu erstellen: ebenso sollte die Studie in einem Studienregister registriert werden.
Für die Planung von vergleichenden Studien ohne Randomisierung zum Zweck des Vergleichs von Therapieeffekten empfiehlt das IQWiG zudem die „explizite Nachbildung der Planung von vergleichenden Studien mit Randomisierung“ (emulation of target trials).
Wesentlich für die Datenanalyse von Studien ohne Randomisierung sind laut IQWiG aber auch Adjustierungen, die den Einfluss der Strukturungleichheit der Behandlungsgruppen ausgleichen sollen. Um eine ergebnisgesteuerte Analyse zu vermeiden, müssen nach Ansicht des Instituts „die relevanten Confounder und der Ablauf der Adjustierung während der Analyse in der Studienplanung nachvollziehbar und in der notwendigen Detailtiefe präspezifiziert“ sowie die relevanten Confounder systematisch identifiziert (z. B. auf Basis wissenschaftlicher Literatur unter Einbindung von Fach-Experten) und in der Studienplanung präspezifiziert werden.
Generell setzt das IQWiG voraus, dass die Verfügbarkeit ent-
sprechender Daten in der gewählten Datenquelle vor der Entscheidung für eine vergleichende Studie ohne Randomisierung sicherzustellen ist. Hier sei eine Adjustierung lediglich für die im Datensatz verfügbaren Confounder nicht ausreichend, falls diese die relevanten Confounder nicht abdecken würden.
„Notwendige Daten in der
erforderlichen Qualität“
Bei der Durchführung einer vergleichenden Studie ohne Randomisierung besteht die Möglichkeit, die Daten retrospektiv oder prospektiv oder kombiniert teils retrospektiv und teils prospektiv zu erheben. Die retrospektive Datenerhebung ist nach Ansicht des Instituts nur dann sinnvoll, wenn der Datenkörper, auf dessen Grundlage die retrospektive Datenerhebung erfolgen soll, die notwendigen Daten in der erforderlichen Qualität enthält. Auch hier sei die Verfügbarkeit der relevanten Daten vor der Entscheidung für ein retrospektives Design sicherzustellen.
Historische Kontrollen seien dann möglich, wenn die in der Vergangenheit beobachteten Patientenpopulationen hinreichend ähnlich zur aktuell behandelten Patientenpopulation sind und wenn in der Vergangenheit Daten in ausreichender Qualität für einen aussagekräftigen Vergleich gesammelt worden seien. Darüber hinaus müssten aus dem historischen Datensatz auch die für die aktuelle Untersuchung relevanten spezifischen Daten verfügbar (z. B.
patientenindividuelle Daten zu Confoundern) und die Daten ausreichend ähnlich sein
(z. B. Endpunkte und Confounder ausreichend ähnlich definiert und erhoben).
Sind die notwendigen Daten jedoch nicht in ausreichendem Umfang oder in ausreichender Qualität verfügbar, ist nach Aussage des Rapid Reports eine prospektive Datenerhebung notwendig, wobei gegebenenfalls auf bestehende Datenquellen zurückgegriffen werden (z. B. indikationsspezifisches kli-
nisches Register) kann, indem der betreffende Datensatz in der prospektiven Erhebung um die fehlenden Daten (z. B. einzelne Endpunkte) ergänzt wird.
Nach Ansicht der Report-Autoren können die verschiedenen Instrumente zur Datenerhebung (studienindividuelle Datenerhebung, Datenerhebung in Registern, in elektronischen Patientenakten und aus Abrechnungsdaten von Krankenkassen) grundsätzlich jeweils sowohl für vergleichende Studien ohne Randomisierung als auch für solche mit Randomisierung eingesetzt werden. Jedoch erscheint ihnen die Erhebung von versorgungsnahen Daten zum Zwecke der Nutzenbewertung aus elektronischen Patientenakten und Abrechnungsdaten von Krankenkassen derzeit und absehbar nicht realistisch durchführbar zu sein. Doch legt die gewählte, sehr vorsichtig gewählte Formulierung („erscheint“) nahe, dass dies eine rein zeitliche Einschränkung sein könnte. Denn die Hauptgründe würden in der eingeschränkten Abbildung relevanter Daten für die Nutzenbewertung (Patientencharakteristika und Endpunkte) und in der eingeschränkten Datenqualität dieser Quellen liegen.
Generell kommen für das IQWiG bei der studienindividuellen Datenerhebung für die versorgungsnahe Datenerhebung zum Zwecke der Nutzenbewertung insbesondere indikationsweite Patientenregister infrage. Der Grund: Von den nicht primär auf vergleichende Studien ausgerichteten Instrumenten zur Datenerhebung würden nach Meinung des Instituts solche Register am ehesten die Möglichkeit der Anpassung an die notwendige Datenerhebung für diese Studien bieten. Dies betreffe sowohl die Spezifizierung der notwendigen Daten als auch die Datenqualität. So seien in den vergangenen Jahren Zielsetzung und Dokumentationsumfang von Registern erweitert worden. Auch sei insbesondere die zunehmende Dokumentation klinischer Informationen in Registern, die für die Beschreibung von Patientenpopulationen, Interventionen (einschließlich Komparatoren) und Endpunkten (PICO) für die Nutzenbewertung herangezogen werden können, in diesem Zusammenhang relevant. Ebenso sei bei prinzipieller Erweiterbarkeit eines Registers auch die Kombination mit einer ergänzenden studienindividuellen Datenerhebung für die jeweilige Registerstudie denkbar.
Konzeptionell ist es dem IQWiG wichtig, zwischen Registern (aktive, prospektive, stan-
dardisierte Dokumentation von Beobachtungseinheiten zu vorab festgelegten, aber im Zeitverlauf erweiterbaren Fragestellungen) und Studien in diesen Registern (Registerstudien) zu unterscheiden. Grundsätzlich seien in Registern nicht interventionelle und interventionelle vergleichende Studien möglich und könnten sowohl vergleichende Studien ohne Randomisierung als auch mit Randomisierung durchgeführt werden.
Zur Beschreibung der Anforderungen an die Datenqualität in Registern werden mehrere nationale und internationale Leitlinien, Übersichten und Positionspapiere angeführt, die in ihren Grundzügen in weiten Teilen übereinstimmen würden. Letztlich sei jedoch nicht entscheidend und auch nicht erforderlich, dass alle dort genannten Maßnahmen vollständig umgesetzt sind, sondern dass die für die konkrete Fragestellung relevanten Daten in einer solchen Qualität vorliegen, damit die Auswertungen im Rahmen einer Registerstudie ausreichend sicher interpretierbar sind. Um dies zu gewährleisten, ließen sich verschiedene Kategorien von Kriterien zur Datenqualität eines Registers unterscheiden (s. Tab. 2).
Im Rahmen der Eignungsprüfung eines spezifischen Registers, regt das IQWiG an, sollte mithilfe dieser Kriterienliste für die jeweilige konkrete Fragestellung evaluiert werden, ob und in welchem Ausmaß die einzelnen Kriterien erfüllt sind, welchen Einfluss eine mögliche Nichterfüllung auf die Ergebnisqualität vermutlich hat, und ob im Rahmen einer registerbasierten Studie eventuelle Defizite in einem für die Beantwortung der Fragestellung sinnvollen Rahmen und mit vertretbarem Aufwand korrigiert werden können. Aus den Interviews mit den Registerbetreibern (Tab. 3) habe sich nämlich ergeben, dass die Eignung des jeweiligen Registers für die Nutzenbewertung von Arzneimitteln in der Regel nicht pauschal zu beantworten ist, sondern von der konkreten Fragestellung abhängt. Die Register seien jedoch zumeist technisch und organisatorisch darauf vorbereitet, ggf. notwendige Erweiterungen des Datensatzes zu implementieren. Aus den Interviews ließen sich zudem verschiedene förderliche und hinderliche Faktoren für einen Registerbetrieb ableiten. So schreiben die Autoren (Sascha Abbas, Ralf Bender, Raphaela Gorris, Elke Hausner, Katharina Hirsch, Thomas Kaiser, Stefan Lange, Jörg Lauterberg, Guido Skipka, Beate Wieseler, Jürgen Windeler), dass sich daraus und allgemein aus den Ergebnissen der Interviews Handlungsempfehlungen für Registerbetreiber, Verantwortliche für Registerstudien sowie Entscheidungsträger im Gesundheitswesen und in der Politik ableiten lassen. <<
Zitationshinweis:
Stegmaier, P.: „Register für Nutzenbewertungen prinzipiell möglich“, in: „Monitor Versorgungsforschung“ (02/20), S. 14-19.; doi: 10.24945/MVF.02.20.1866-0533.2208