OA MVF 03/11: Die neue Evidenz ist da, aber zu spät
>> Wer die Historie der Blutzuckermessung (BZM) betrachtet, sieht seit 1965, als der erste Teststreifen zur Blutzuckerselbstbestimmung aus den Laboratorien von Ames-Miles auf den Markt kam, einen Siegeszug. Als „Meilenstein in der Diabetestherapie“ bezeichnete PD Dr. Bernhard Kulzer (Diabetes Zentrum Bad Mergentheim, FIDAM-Forschungsinstitut Diabetes) in seinem Vortrag „Der G-BA-Beschluss zur Erstattung von Urin- und Blutzuckerteststreifen und seine Folgen“ diese Erfindung, die im Laufe der Jahre zur Grundlage aller modernen Therapiestrategien geworden ist.
Nun hat sich der G-BA für die Einschränkung der Verordnungsfähigkeit von Harn-/Blutzuckerteststreifen für nicht insulinpflichtige Diabetiker ausgesprochen. Wobei erfahrenen Diabetesspezialisten nicht nur die Tatsache der negativen Entscheidung quer kommt. Denn in Begründung und entsprechender Pressemitteilung des G-BA vom 17.3.2011 wird aus Arztsicht ein Bild vermittelt, das der Realität nicht entspricht, wohl aus Sicht der Ökonomie so gesehen werden kann.
So spricht der G-BA in seiner Begründung davon, dass die Einschränkung der Verordnungsfähigkeit von Harn- und Blutzuckerteststreifen ausschließlich für nicht insulinpflichtige Diabetiker gelte, weil - und nun kommt O-Ton G-BA - „diese Patienten mit leichteren Formen des Diabetes mellitus – hierzu gehört ein großer Teil der Typ-2-Diabetiker – ihre Krankheit bereits mit einer entsprechenden Ernährungsumstellung, Gewichtsabnahme und Erhöhung der körperlichen Aktivität sowie der Einnahme oraler Medikamente (sogenannter Antidiabetika) gut in den Griff bekommen könne“. Und weiter: „Diese Patientengruppe kann von einer Blutzuckerselbstmessung nicht profitieren, weil sich daraus keinerlei direkte Konsequenzen für die Therapie ergeben.“
An der Realität vorbei
Leider geht diese Begründung, auch wenn sie faktisch vielleicht sogar annähernd richtig sein mag, an der Realität vorbei. Wenn es denn so einfach wäre, über Ernährungsumstellung, Gewichtsabnahme und Erhöhung der körperlichen Aktivität sowie der Einnahme oraler Medikamente seinen Diabetes in den Griff zu bekommen, gäbe es nicht alleine nur in Deutschland rund 4,7 Millionen Typ-2-Diabetiker ohne Insulin. Von denen werden 1,7 bis 2 Millionen mit insulinotropen Medikamenten, vor allem Sulfonylharnstofftabletten, behandelt, die eine Hypoglykämie auslösen können, diese Patienten muss man darum dezidiert als hypoglykämie-gefährdet bezeichnen.
Klar: Viele dieser Diabetiker könnten ihre Erkrankung mit anderen Ernährungsgewohnheiten und mehr Sport in den Griff bekommen. Aber: Tun Sie das? Mitnichten!
Wenn es denn so wäre, wäre aus Diabetes keine Epidemie geworden und Deutschland hätte bei dem oft mit Diabetes assoziierten Bodymass-Index europaweit nicht eine traurige Führungsrolle eingenommen. Das ist das traurige Faktische der Realität.
Nun spricht der G-BA in seiner Begründung von Harn- und Blutzuckermesstreifen. Warum das so ist, kann niemand so recht beantworten, denn Harntestung ist so gut wie von Markt verschwunden und macht im Vergleich zur BZM weit unter 1% (s. S. 13) des Marktes aus.
Doch das ist eine Petitesse im Vergleich zu den Passi innerhalb des G-BA-Beschlusses, bei dem es um - aus Sicht der Patienten durchaus positive - „weitreichende Ausnahmeregelungen“ geht, die in Abstimmung mit den im G-BA mitberatenden Patientenvertretern getroffen worden sind. Demnach können Ärzte Harn- und Blutzuckerteststreifen auch weiterhin verordnen, wenn eine „instabile Stoffwechsellage“ vorläge. Diese könne gegeben sein bei „interkurrenten Erkrankungen, Ersteinstellung auf oder Therapieumstellung bei oralen Antidiabetika mit hohem Hypoglykämierisiko“. Wenn dem so ist, können Ärzte nach wie vor je Behandlungssituation bis zu 50 Teststreifen verordnen.
Zudem sei laut G-BA eine von der Verordnungseinschränkung ausgenommene Verordnung von bis zu 50 Teststreifen bei Ersteinstellung auf oder Therapieumstellung bei oralen Antidiabetika mit hohem Hypoglykämierisiko im Rahmen der Teilnahme an strukturierten Schulungsprogrammen in DMP möglich. Wann genau, verrät der G-BA indes nicht. Immer und bei jeder Schulung? Oder nur bei der Ersteinstellung oder bei einer Therapieumstellung?
Viel wichtiger wäre allerdings die Antwort auf die Frage, was denn nun eine instabile Stoffwechsellage und eine interkurrente Erkrankung genau ist. Noch besser wäre die ergänzende Antwort auf die Frage: Wie soll denn ein Arzt eine instabile Stoffwechsellage erkennen, wenn sein Patient vor dem Arztbesuch keine Blutzuckermessung macht? Soll er ihn dann etwa wieder heimschicken, ein Rezept ausstellen, ein paar Tage lang messen lassen und wieder einbestellen?
Eigenartig ist zudem der Umgang mit Begrifflichkeiten. Wenn der G-BA von „leichten“ und „schweren“ Formen des Diabetes redet, beginnen einem Diabetes-Spezialisten wie Kulzer die Haare zu Berge zu stehen. Denn mit der Versorgungs-Realität hat die Einteilung des G-BA in einen „leichten“ Typ-2-Diabetes und den „schweren“ Typ-1-Diabetes recht wenig zu tun. Denn der Typ-2 ist laut Kulzer die viel kompliziertere Erkrankung, weil sich eben über viele Jahre keinerlei direkt spürbare Konsequenzen ergeben. „Da sind Leute am Werk, die sich mit dem Fachthema nicht so gut auseinandersetzen, wie es eigentlich sein sollte“, beurteilt Kulzer die Arbeit von IQWiG und G-BA. Er, der sowohl bei verschiedenen Anhörungen beim IQWiG zugegen war, sich bei Stellungnahmen aktiv beteiligt hat und sogar persönlich bei G-BA-Vorstand Dr. Rainer Hess vorstellig geworden ist, sei „nachhaltig frustriert“, dass es zum einen immer nur um Kosten geht, und zum anderen „wissenschaftliche Argumente vorgeschoben werden“.
Damit meint Kulzer vor allem die Art und Weise, wie Studien vom IQWiG ausgesucht wurden, die in die Bewertung einfließen und welche nicht. Und wie innerhab dieser bewerteten Studien dann gewichtet wurde, welche Effekte nun als signifikant eingestuft werden.
Dass das IQWiG seine negative Beurteilung lediglich auf die Ergebnisse von nur fünf RCT-Studien gestützt hat, wurmt ihn zutiefst. Nicht so sehr, weil es auch um die Diskussion geht, ob die Ergebnisse dieser Studien nun klinisch relavant sind oder nicht, sondern weil die Art des Studiendesigns über den Forschungszweck gestellt worden ist.
Kulzer geht es vor allem um die Sinnhaftigkeit der Studien über Blutzuckerselbstkontrolle (BZSK). Denn in den meisten der in die Bewertung des IQWiG eingeflossenen Studien wurde nur die BZM an sich erforscht. Kulzer: „Ohne Schulung macht es aber wenig Sinn, Selbstkontrolle tatsächlich messen zu wollen.“
Ohne Konsequenz sinnlos
Es müsste seiner Meinung nach vielmehr so sein, dass diese Studien - wenn sie schon über die Zukunft der BZM herangezogen werden - wenigstens sichergestellt hätten, dass die Patienten gut geschult sind, zudem wissen, wie sie BZM anwenden und dann auch noch in der Lage sind, selbst die Konsequenzen aus dieser Messung zu treffen. Kulzer: „Es wäre doch eigentlich die Mindestanforderung für Studien dieser Art, dass ein Patient weiß, wie er testet, warum er testet und was er nach der Testung macht.“ Denn sonst mache Testung an sich auch keinen Sinn, damit entstünde ein bloßer Wert, den man sich „ohne Konsequenzen auch schenken kann“.
Genau dieser Meinung ist eben das IQWiG und demzufolge auch der G-BA, welcher der vom IQWiG zuvor festgestellten anscheinenden Nicht-Evidenz folgt. Dass die zur Bewertung herangezogenen RCT-Studien meist kleine Fallzahlen haben und zudem kurzzeitige Studien von sechs, höchstens zwölf Monaten sind, auch das stört die Kritiker enorm.
Bei den eingeschlossenen Studien bekamen die Patienten obendrein teilweise überhaupt keine Schulung und durften das Testergebnis nur aufschreiben und dann dem Arzt übergeben, der dann für sie daraus die Konsequenzen zog. „Das ist doch kein Selbstmanagement, sondern Selbsttestung mit Fremdkontrolle“, ärgert sich Diabetologe Kulzer. Denn so etwas habe mit dem State-of-the-Art des Diabetes-Selbstmanagements und der realen Schulungssituation in Deutschland herzlich wenig zu tun. Kein Wunder: Denn die Situation der internationalen Studien ist eben nicht so einfach auf die Versorgungsrealität der Patienten in Deutschland zu übertragen.
Immerhin: Trotz des fehlerhaften Settings haben fast alle Studien einen Effekt gezeigt, wenn zum Teil auch sehr kleine, die in Summe 0,23 Prozentpunkte HbA1c Senkung zwischen Interventions und Kontrollgruppe ergaben. Da jedoch dieser Wert unter der üblichen Nichtunterlegenheitsgrenze von 0,4% lag, gingen die Statistiker einfach davon aus, dass dieser Effekt wohl klinisch nicht relevant wird. Selbst die in Augen Kulzers einzig gute Studie aus Deutschland lag mit 0,44 Prozentpunkten HbA1c-Absenkung nur knapp darüber - aber hatte damit immerhin den größten in die IQWiG-Bewertung eingeflossenen Effekt.
Doch heißt nun klein automatisch klinisch nicht relevant? „Man kann sich natürlich fragen, ob 0,23 Prozentpunkte HbA1c-Absenkung klinisch relevant sind oder nicht“, weiß auch Kulzer. Für das IQWiG spielt der Unterschied anscheinend keine Rolle. Kulzer: „Wenn ein gewisses Konfidenzintervall nicht überschritten wird, gibt es auch auch keinen signifikanten Effekt, weil es dem Statistiker egal ist, ob der Unterschied klinisch bedeutsam ist oder nicht.“ Doch ist das so einfach?
Klinisch relevant oder nicht?
Eben nicht. Einem Statistiker mag es, einem Diabetes-Spezialisten kann der Unterschied nicht egal sein. Denn der kann selbst einen minimalen Effekt von 0,23 Prozentpunkten HbA1c-Absenkung hochrechnen und kommt damit immerhin auf eine etwa fünfprozentige Reduktion aller diabetesbezogenen Endpunkte und ungefähr auf eine achtprozentige Reduktion von mikrovaskulären Komplikationen. Kulzer: „Das wiederum würde ich durchaus als einen recht bedeutsamen Effekt sehen.“ Verglichen mit den Effektstärken von Diabetes-Medikamenten sei das gar kein so schlechtes Ergebnis. Selbst Schulung an sich hat einen durch Studien sehr gut belegten Effekt auf den HbA1c-Wert von (nur) 0,8 Prozent.
Nun könne man laut Kulzer trefflich beginnen aufzurechnen, dass in diesem 0,8er-Effekt die 0,23 Prozentpunkte HbA1c-Absenkung der Blutzuckerselbstkontrolle integriert seien, zudem 0,3 aus der Steigerung der körperlichen Bewegung, nochmal 0,1 aus der Steigerung der Motivation und weitere 0,3 Prozent Absenkung aus der damit einhergehenden Gewichtsreduktion stammen. Will heißen: Wer selbst den durch Studien gut belegten positiven Gesamteffekt der Schulung in Einzeleffekte zu zerlegen beginnt, kommt schlussendlich zur Aussage, dass Gewichtsreduktion nichts bringt, körperliche Bewegung auch nichts, die Motivation man gleich sein lassen kann und die Blutzuckerselbstkontrolle sowieso. „Wenn man ein System in kleine Teile aufteilt, bringt jedes Teil für sich wenig, gesamthaft aber viel“, sagt Kulzer. Was umso mehr für ein Diagnoseinstrument wie die BZSK gelte, die für sich genommen überhaupt keinen Effekt haben kann, solange man mit den nur durch sie gewinnbaren Werten nichts macht.
Auf all diese Fakten sei das IQWiG hingewiesen worden - mit wenig Erfolg. „Das waren alles Methodiker, die sich mit Diabetes ganz wenig ausgekannt haben“, zeigt sich Kulzer enttäuscht. Auch die positiven Ergebnisse der STeP-Studie (Structured Testing Program) fanden keinen Eingang in IQWiG-Bewertung und G-BA-Beschluss. Laut Roche wurden dem IQWiG schon im Herbst 2009 die 6-Monate-Zwischenergebnisse und eine Synopse zur Kenntnis gebracht, flossen aber nicht in die Bewertung ein. Kein Wunder, denn für „eine suffiziente Bewertung“ sieht das IQWiG „zumindest eine alle wesentlichen Details zu Design und Ergebnissen enthaltene Publikation (in der Regel in einer wissenschaftlichen Fachzeitschrift) oder ein Studien-Bericht“ als erforderlich an, wie der Stv. Institutsleiter PD Dr. Stefan Lange auf Anfrage mitteilte.
Und das G-BA stützt sich eben nur auf die Bewertung des IQWiG. So hätte es auch beim G-BA nach Auskunft von Roche trotz Information durch den Verband der Diagnostikahersteller (VDGH) im Stellungnahmeverfahren sowie nach Abschluss der Studie keine Möglichkeit gegeben, die neue Evidenz bei der Entscheidung zu berücksichtigen.
Nun aber wurde vor wenigen Wochen eine von Roche Diagnostics initiierte Studie publiziert, die durchaus deutlich aufzeigt, dass Blutzuckerselbstmessung tatsächlich den HbA1c-Wert signifikant reduzieren kann.
Man kann bemängeln, dass damit im Zweifel viel zu spät für mehr Evidenz gesorgt worden ist. Dem ist nur zum Teil auch so, wie Ralf Kai Decker, Head of Marketing & Sales Diabetes Care Deutschland von Roche Diagnostics Deutschland erkärt. Denn immerhin wurde schon kurz nach dem Begutachtungsauftrag des G-BA an das IQWiG am 22. Februar 2005 begonnen, die Studie zu planen. Doch zuerst sollte sie als übergreifendes Werk vieler Anbieter von Blutzuckermess-Systemen angelegt werden; mit dem Effekt, dass lange Zeit kein Konsens zu Stande kam.
Bis schießlich Roche die Studie alleine begann, ein Jahr in den USA Ärzte und Patienten akquirierte, ein Jahr beobachtete und ein weiteres auswertete. Danach wurde die Studie beim US-Journal „Diabetes Care“ eingereicht und endlich im Februar 2011 veröffentlicht - aber eben vor der G-BA-Entscheidung!
Und was macht nun das BMG mit der jetzt endlich offiziell vorliegenden neuen Evidenz? Antwort: Gar nichts. Das BMG winkte den Richtlinienbeschlusss durch und merkte nur an, dass es davon ausgehe, dass den im Beschluss formulierten Ausnahmen Rechnung getragen würde.
Dabei ist die STeP-Studie immerhin eine prospektive, zweiarmige und multizentrische RCT-Studie. Jedoch wurde eben nicht in dem einen Kontrollarm ein Patientenkollektiv mit Blutzuckermessung (BZM), in anderem das ohne BZM gemessen. Das aber wiederum passt nicht so ganz ins Raster jener Studien, die vom IQWiG in die Bewertung mit einbezogen wurden: Denn die fünf bewerteten Studien waren Nullstudien: Hier wurde Blutzuckertestung gegenüber keiner Blutzuckertestung verglichen.
Doch Roche geht eben davon aus, dass BZM per se sinnvoll ist und wollte daher nur herausfinden, welcher Messansatz denn nun besser sei: die bisher in der Diabetestherapie übliche Messung (zu eher undefinierten Zeitpunkten und ohne Anleitung, welche Schlüsse man aus den Werten ziehen kann) oder ein recht neuer Ansatz in Form einer strukturierten Blutzuckertestung. Dabei wird nicht mehr jeden Tag, sondern eben in einer „strukturierten Blutzuckermessung“ an drei Tagen hintereinander zu bestimmten Zeiten gemessen. Damit sollen nach Worten Kulzers die gewonnenen Ergebnisse wesentlich aussagekräftiger werden als bisher, weil die entstehenden Tagesprofile eine noch dichtere Datenlage ergeben: Der Patient (und bei Konsultationen auch der Arzt) sieht sofort und visualisiert, ob es Unterzuckerungen, ob es nüchtern Blutzucker gibt etc. - und kann damit viel besser als bisher Verhalten und Therapie anpassen.
Bei STeP haben zwei Gruppen Blutzuckerselbstkontrolle durchgeführt; die einen eben struktuierter als die anderen. In der Analyse (Abb. 1) sieht man den Effekt: Im Durchschnitt konnte die eine Gruppe den HbA1c um -1,3, die andere um -0,8 senken. Kulzer: „Das heißt, wir haben bei beiden Gruppen eine sehr viel deutlichere HB1Ac-Reduktion als im IQWiG-Bericht im Durchschnitt angegeben wurde.“ Das waren nämlich nur - 0,23!
Außerdem zeige sich, dass eben nicht nur der HB1Ac, sondern sich auch die mittleren prä- und postprandialen Glukosewerte verbessert hätten. Für Kulzer sind die Ergebnisse aber vor allem deshalb interessant, weil mit dem neuen Testansatz ein menschlicher wie auch ökonomischer positiver Effekt einher geht: „Die Patienten müssen weniger testen und trotzdem werden die Ergebnisse besser.“ Da sei endlich das, was er als „intelligentes Testen“ bezeichne: strukturiert mit Analyse und Konsequenz, womit sich auch „die tägliche Zahl der Tests signifikant“ verringere. <<
Open Access-PDF zum Zitieren (Zitationshinweis: Stegmaier, P.: „Die neue Evidenz ist da, aber zu spät“. In: "Monitor Versorgungsforschung" (MVF) 03/11, S. 14 ff.)