Dr. Bastian Thaa, Dr. Marc Esser, Dr. Carsten Schwenke (veröffentlicht in Market Access & Health Policy 2018; 8(6): 22–24)

Indirekte Vergleiche in der Nutzenbewertung

Wenn direkte Vergleiche des zu bewertenden Arzneimittels mit der vom G-BA festgelegten zweckmäßigen Vergleichstherapie nicht möglich sind, sind indirekte Vergleiche oft die einzige Chance für die Anerkennung eines Zusatznutzens.

Randomisierte kontrollierte Studien (RCTs), in denen das zu bewertende Arzneimittel (A) direkt mit der zweckmäßigen Vergleichstherapie (zVT) verglichen wird, sind der Goldstandard in der Nutzenbewertung. Die von den pharmazeutischen Unternehmen durchgeführten Studien erfüllen aber nicht immer dieses Kriterium: Oft werden pivotale Studien gegen Placebo durchgeführt oder gegen eine andere Therapieoption als die vom G-BA festgelegte zVT. Die Studienplanung richtet sich in der Regel nach den Erfordernissen für die Zulassung; die Kriterien für die Nutzenbewertung sind daher oft nachrangig. Zudem werden Studien häufig global geplant und durchgeführt – ohne besondere Rücksichtnahme auf die deutsche Nutzenbewertung, z. B. wenn die zVT nicht global verfügbar ist, eine andere Vergleichstherapie aber schon.

Immer dann, wenn es keinen direkten Vergleich gibt, in dem A direkt gegen die zVT getestet worden ist, muss zwangsläufig zu einem indirekten Vergleich gegriffen werden, wenn ein Zusatznutzen von A gegenüber der zVT darstellt werden soll. Dieser Fall ist nicht selten – seit Einführung des AMNOG (2011) bis Oktober 2017 ist in etwa jedem vierten Verfahren ein indirekter Vergleich vorgelegt worden.¹

Welche Typen indirekter Vergleiche zur Nutzenbewertung gibt es?

Es gibt verschiedene Möglichkeiten für indirekte Vergleiche: nicht adjustierte (historische) Vergleiche, adjustierte indirekte Vergleiche sowie Netzwerk-Meta-Analysen (schematisch in Abb. 1 gezeigt).

In einem nicht adjustierten (historischen) Vergleich werden einzelne Studienarme aus verschiedenen Studien einander gegenübergestellt. Bei einarmigen Studien ist dies die einzige Möglichkeit, überhaupt einen Vergleich mit einer anderen Therapie vorzunehmen. Bei einem historischen Vergleich liegt keine Randomisierung vor, sodass die Studien bezüglich des Designs, der Populationen und weiterer Kriterien sehr ähnlich sein müssen. Da eine solche Konstellation in den wenigsten Fällen vorliegt, gelten historische Vergleiche allgemein nicht als adäquat und werden somit auch von G-BA und IQWiG im Allgemeinen nicht anerkannt.^2-4 Das IQWiG spezifiziert dabei genauer, dass auch bei sehr ähnlichen Studien ein historischer Vergleich nur dann akzeptiert werden kann, wenn ein dramatischer Effekt vorliegt – ein Unterschied von mindestens einem Faktor 5 bis 10; das heißt, der relative Effekt, z.B. die Hazard-Ratio, liegt unterhalb von 0,2 bis 0,1. In den seltensten Fällen sind historische Vergleiche tatsächlich anerkannt worden. Die meisten davon betreffen die Indikationen Chronische Hepatitis C und HIV-Infektion, daneben auch ein Verfahren in der Onkologie (Vismodegib zur Behandlung des Basalzellkarzinoms, Zulassung unter »exceptional circumstances«). Insgesamt haben historische Vergleiche nur in absoluten Ausnahmekonstellationen Aussicht auf Erfolg.

Ein statistisch solideres Verfahren ist ein adjustierter indirekter Vergleich. Dabei wird A über einen sogenannten »Brückenkomparator« (B) mit der zVT verglichen. Dafür werden RCTs herangezogen, in denen A mit B verglichen wird, sowie Studien, in denen B mit der zVT verglichen wird. Der Brückenkomparator kann dabei jede Art Therapie sein, solange sie in beiden Studien in gleicher Weise, z.B. mit gleicher Dosis, verwendet wurde. Auch Placebo kommt als Brückenkomparator infrage. Liegen mehrere Studien vor, müssen zunächst Meta-Analysen gerechnet werden, die anschließend indirekt verglichen werden. Auch hier müssen die Studien ausreichend ähnlich sein, um in den Vergleich aufgenommen werden zu können. Die Methode der Wahl für den adjustierten indirekten Vergleich ist die Methode nach Bucher et al.⁵ Vereinzelt sind solche adjustierten indirekten Vergleiche anerkannt worden, wenn die hohen Anforderungen gemäß IQWiG-Methodenpapier erfüllt waren.²

Eine weitere Art des adjustierten indirekten Vergleichs ist die Netzwerk-Meta-Analyse (mixed treatment comparison, multiple treatment meta-analysis). Solche Analysen sind möglich, wenn es mindestens drei verschiedene Interventionen im Anwendungsgebiet gibt. Es werden Effektschätzer für alle möglichen paarweisen Vergleiche aller Interventionen im Netzwerk bestimmt. Hierfür gibt es verschiedene methodische Ansätze, diese sind aufwendig und auch Gegenstand intensiver methodischer Diskussionen. Solche Vergleichsverfahren werden immer wichtiger, da es je nach Anwendungsgebiet inzwischen eine Vielzahl von Therapieoptionen gibt, von denen aber nicht jede mit jeder anderen in einer jeweils eigenen Studie untersucht worden ist. Zudem bieten sich Netzwerk-Meta-Analysen an, wenn mehrere zVT-Optionen benannt sind und die Studien für A und diese Vergleichstherapien ähnlich genug sind. Nach IQWiG-Methodenpapier sind Netzwerk-Meta-Analysen grundsätzlich geeignet zur Darstellung eines Zusatznutzens.² Sie sind aber sehr schwer zu bewerten; bislang ist noch keine Netzwerk-Meta-Analyse anerkannt worden.

Typen von Vergleichen zur Darstellung des Zusatznutzens

Abbildung 1: Typen von Vergleichen zur Darstellung des Zusatznutzens. A: zu bewertendes Arzneimittel; Z: zweckmäßige Vergleichstherapie (zVT); B, C, D, E, F: andere Vergleichstherapien.

Worauf es bei indirekten Vergleichen im Nutzendossier allgemein ankommt

Ein indirekter Vergleich wird nur selten anerkannt, nämlich in weniger als 10 % aller Verfahren, in denen ein indirekter Vergleich vorgelegt wird.¹ Es kann sich dennoch lohnen, einen indirekten Vergleich durchzuführen und darzustellen, und zwar immer dann, wenn der indirekte Vergleich die bestverfügbare Evidenz zum (Zusatz-)Nutzen eines Arzneimittels gegenüber der zVT ist. Daher ist es meist ratsam, den indirekten Vergleich darzustellen, selbst wenn die Chance auf Akzeptanz nur sehr gering ist. So enthält die AM-NutzenV die Aufforderung, »Nachweise der bestverfügbaren Evidenzstufe einzureichen« (§ 5 Abs. 3) – es sollte somit zumindest immer der Versuch unternommen werden, »das Beste herauszuholen«. Zu bedenken ist jedoch, dass die Ergebnissicherheit bei indirekten Vergleichen selbst im Falle der Anerkennung grundsätzlich geringer ist als beim direkten Vergleich (meist nur »Anhaltspunkt«).

Richtschnur bei der Durchführung des indirekten Vergleichs ist grundsätzlich das IQWiG-Methodenpapier.² Eine der wichtigsten Voraussetzungen ist, dass die für den indirekten Vergleich ausgewählten Studien ideal zur Dossierfragestellung passen. Fast jeder dritte vorgelegte indirekte Vergleich wird abgelehnt, weil aus Sicht von IQWiG und G-BA eine nicht passende Patientenpopulation oder Therapie betrachtet wird.⁶ Daher sollten möglichst stringente Auswahlkriterien formuliert und verwendet werden, um passende Studien zu identifizieren. Maßgeblich sind dabei immer die Studien zum eigenen Arzneimittel sowie der Wortlaut der Indikation. Eine solide Literaturrecherche ist eine Grundvoraussetzung für die Akzeptanz eines indirekten Vergleichs; dafür sollte ausreichend Zeit eingeplant werden. Etwa 40 % der indirekten Vergleiche werden abgelehnt, weil die Vollständigkeit der Literaturrecherche, des Studienpools und/oder des Ergebnisberichts aus Sicht des IQWiG nicht hinreichend gegeben ist.¹ Das größte Manko ist dabei, dass die Liste der verwendeten Suchbegriffe oft nicht adäquat ist (zum Beispiel nicht breit genug). Solche Mängel im Zusammenhang mit der Literaturrecherche sind häufig vermeidbar; ein erfahrener Dienstleister kann hier helfen.

Weiterhin müssen bei einem indirekten Vergleich die Kriterien Homogenität, Konsistenz und Ähnlichkeit erfüllt sein, um interpretierbare Ergebnisse zu liefern.^{1, 2, 6} Das Kriterium Homogenität besagt, dass die Effekte in allen gleichartigen Studien gleichgerichtet sein sollen; dies ist relevant für Meta-Analysen. Konsistenz bedeutet, dass es keine bedeutsame Diskrepanz zwischen indirektem und direktem Vergleich geben sollte. Dies lässt sich nicht leicht überprüfen – läge für A vs. zVT ein direkter Vergleich vor, würde man diesen für die Nutzendarstellung heranziehen und würde den indirekten Vergleich nicht benötigen. Ähnlichkeit bedeutet, dass die Patientencharakteristika und die Studiendesigns der verglichenen Studien möglichst übereinstimmen müssen. Indirekte Vergleiche werden häufig abgelehnt, weil die Patientenpopulationen nicht hinreichend ähnlich sind – dies betrifft mehr als ein Drittel aller Fälle.¹ Es gibt prinzipiell statistische Methoden der Adjustierung, zum Beispiel »matching-adjusted indirect comparisons« (MAIC).⁷ Solche Methoden werden vom IQWiG jedoch mit dem Hinweis abgelehnt, dass möglicherweise nicht für alle wichtigen Faktoren adjustiert wurde (und auch nicht für die Faktoren, die nicht erhoben wurden). Vom britischen Pendant NICE hingegen werden MAIC akzeptiert.¹ In Fällen, wo es keine bessere Evidenz gibt, wäre es wünschenswert, wenn alternative statistische Analysemethoden wie MAIC einbezogen werden könnten, um die Unterschiede bei nicht ausreichend ähnlichen Studien zu beurteilen.

Es bestehen also hohe methodische Anforderungen an den indirekten Vergleich. Dessen Güte hängt wesentlich von der Qualität und der Vollständigkeit der Datenbasis ab. Unter anderem wird von G-BA und IQWiG immer wieder bemängelt, dass nicht für alle vier Endpunktdimensionen – Mortalität, Morbidität, Lebensqualität und Sicherheit – Daten für den indirekten Vergleich vorliegen. Zudem ist eine transparente und ausführliche Dokumentation essentiell.¹ In diesem Zusammenhang kann die »Checkliste« von Kiefer et al.⁸ hilfreich sein. Sie umfasst im Wesentlichen die oben genannten Punkte (Fragestellung und Begründung, Literaturrecherche, Studiendarstellung, Ähnlichkeit/Homogenität/Konsistenz, Beschreibung des statistischen Verfahrens).

Grundsätzlich sollte bereits bei der Planung der pivotalen Phase-III-Studien darauf geachtet werden, als aktive Kontrolle Therapien auszuwählen, für die qualitativ hochwertige und bezüglich der Endpunktdimensionen möglichst vollständige Publikationen verfügbar sind, und das Studiendesign idealerweise an diese Studien anzupassen. Wenn die aktive Kontrolle vom G-BA nicht als zVT bestimmt wird, kann dann zumindest ein guter indirekter Vergleich gegen die zVT durchgeführt werden.

Strategie und Projektmanagement

Die Darstellung des Zusatznutzens gegenüber der zVT ist das A und O des Nutzendossiers – entsprechend sollte die strategische Entscheidung für oder gegen einen bestimmten indirekten Vergleich relativ früh getroffen werden. In diesem Zusammenhang ist eine frühzeitige Beratung beim G-BA sinnvoll, um je nach festgelegter zVT einen indirekten Vergleich rechtzeitig einplanen zu können. So bleibt auch genug Zeit für die Analysen und deren Darstellung. Häufig sind weitere Analysen der eigenen Studie(n) notwendig, insbesondere wenn der indirekte Vergleich nur gegen eine Teilpopulation möglich ist. Dies ist zum Beispiel dann der Fall, wenn in den Studien mit der zVT nur therapienaive Patienten eingeschlossen wurden, in der eigenen Studie aber therapienaive und bereits vorbehandelte Patienten. In solchen Fällen sind weiterführende Analysen auf Basis der therapienaiven Patienten notwendig und müssen in der Zeitplanung abgedeckt sein.

Mögliche Vergleichsstudien für indirekte Vergleiche stammen oft von der Konkurrenz, sodass die Informationen zur zVT nur aus Publikationen extrahiert werden können. Einfacher ist es, wenn die zVT bereits vom G-BA bewertet wurde und damit ein Nutzendossier, die Bewertung, die Stellungnahmen, etwaige Addenda vom IQWiG und der Beschluss vorliegen. Um die Aussage eines indirekten Vergleiches zu verstärken, kann es vorteilhaft sein, einen indirekten Vergleich mit geeigneten Sensitivitätsanalysen zu »unterfüttern«.

Die Darstellung eines indirekten Vergleichs kann selbst dann strategisch sinnvoll sein, wenn man erwarten muss, dass der Vergleich nicht akzeptiert wird – so steht der Vergleich als bestverfügbare Evidenz im Dossier und kann zumindest in die Preisverhandlungen einbezogen werden.

Fazit: Indirekte Vergleiche sind generell im Rahmen der Nutzenbewertung durchführbar, werden aber sehr häufig nicht akzeptiert. Zu große Unähnlichkeit der Studien und inadäquate Literaturrecherchen führen häufig zur Ablehnung. Dennoch ist die Zuerteilung eines Zusatznutzens auf Basis von indirekten Vergleichen nicht ausgeschlossen. Die Durchführung eines indirekten Vergleichs sollte also zumindest geprüft werden. Hierfür ist es ratsam, einen erfahrenen Dienstleister zu konsultieren.

Referenzen

1 Böhme S, Kupas K, Leverkus F, Schwenke C: Indirekte Vergleiche in Nutzenbewertungsverfahren: Problemfelder und Lösungsansätze. In: AMNOG-Report 2018 (Herausgeber: A. Storm). Heidelberg: medhochzwei Verlag. ISBN 978-3-86216-478-3. 2018.

2 Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG): Allgemeine Methoden, Version 5.0 vom 10.07.2017. Verfügbar unter: https://iqwig.de/de/methoden/methodenpapier.3020.html. 2017.

3 Gartlehner G, Moore CG: Direct versus indirect comparisons: a summary of the evidence. International journal of technology assessment in health care 2008; 24: 170-7.

4 Bender R, Schwenke C, Schmoor C, Hauschke D: Stellenwert von Ergebnissen aus indirekten Vergleichen - Gemeinsame Stellungnahme von IQWiG, GMDS und IBS-DR. Verfügbar unter: https://www.iqwig.de/download/12-03-07_Gemeinsame_Stellungnahme_IQWiG_GMDS_IBS-DR_zum_indirekten_Vergleich.pdf. 2012.

5 Bucher HC, Guyatt GH, Griffith LE, Walter SD: The results of direct and indirect treatment comparisons in meta-analysis of randomized controlled trials. J Clin Epidemiol 1997; 50: 683-91.

6 Bender R, Kromp M, Sturtz S, Kiefer C, Vervölgyi V, Lange S: Stellenwert von indirekten Vergleichen und Netzwerk-Meta-Analysen im Rahmen der frühen Nutzenbewertung. In: AMNOG-Report 2018 (Herausgeber: A. Storm), Heidelberg: medhochzwei Verlag. ISBN 978-3-86216-478-3. 2018.

7 Signorovitch JE, Sikirica V, Erder MH, et al.: Matching-adjusted indirect comparisons: a new tool for timely comparative effectiveness research. Value in health : the journal of the International Society for Pharmacoeconomics and Outcomes Research 2012; 15: 940-7.

8 Kiefer C, Sturtz S, Bender R: Indirekte Vergleiche und Netzwerk-Metaanalysen: Schätzung von Effekten bei fehlenden direkten Vergleichsstudien; Teil 22 der Serie zur Bewertung wissenschaftlicher Publikationen. Deutsches Ärzteblatt 2015; 112: 803-8.