05.01.2026
RCTs in der klinischen Forschung – (fast) immer der Goldstandard
Serie zur Neujustierung der Mechanik des AMNOG, Teil 1
Dr. Robert Welte
Dr. Thorsten Pisch
Seit der Einführung des AMNOG sind pharmazeutische Unternehmen in Deutschland verpflichtet, für neue Arzneimittel einen Zusatznutzen gegenüber bestehenden Therapien nachzuweisen. Das dahinterliegende Prinzip: Eine neue Behandlung darf teurer sein als der bisherige Therapiestandard – vorausgesetzt, sie verschafft den Patienten einen nachweislich höheren Nutzen.
In der Praxis stößt dieses Verfahren jedoch zunehmend an seine Grenzen. Neue, hochspezialisierte und personalisierte Therapien für kleine Patientenpopulationen passen oft nicht in die standardisierten Bewertungsmuster – was dazu führen kann, dass die Kosten von Forschung, Entwicklung und Produktion in den Erstattungspreisen nicht mehr richtig abgebildet werden. Die mögliche Folge: Innovative Therapien erreichen nicht rechtzeitig die Patienten, die sie dringend benötigen.
Mit einer dreiteiligen Serie sollen Impulse für eine moderne Nutzenbewertung für innovative, personalisierte Therapien geben – wissenschaftlich fundiert, praxisnah und patientenorientiert. In drei Teilen wird sich mit der Frage beschäftigt: Welche Neujustierung braucht die Mechanik des AMNOG, damit es mit dem medizinischen Fortschritt Schritt halten kann?
Der erste Teil dieser Serie beschäftigt sich mit randomisierten kontrollierten Studien (randomized controlled trials, RCTs). Wie aussagekräftig ist der Goldstandard RCT bei extrem kleinen Patientenpopulationen?
Wenn neue Medikamente in Deutschland auf den Markt kommen, müssen sie zunächst zwei zentrale Hürden überwinden: die Zulassung durch die EMA und die anschließende Bewertung des Zusatznutzens im Rahmen des AMNOG (Arzneimittelneuordnungsgesetz)-Prozesses. Während die EMA die Wirksamkeit und Sicherheit von Arzneimitteln mit neuen Wirkstoffen überprüft, wird im AMNOG-Prozess bewertet, welchen Zusatznutzen die neue Therapie gegenüber einer vom G-BA festgelegten zweckmäßigen Vergleichstherapie bietet. Grundlage für die Zulassung und die Nutzenbewertung sind die Ergebnisse klinischer Studien.
In diesem Kontext haben sich RCT als Goldstandard in der klinischen Forschung durchgesetzt. Bei einer RCT werden die Teilnehmenden per Zufallsprinzip der Interventions- oder der Kontrollgruppe zugeteilt, wobei die Interventionsgruppe die zu untersuchende Behandlung und die Kontrollgruppe den aktuellen Therapiestandard bekommt. Die zufällige Zuteilung der Teilnehmenden sorgt dafür, dass idealerweise Störfaktoren gleichmäßig verteilt werden und das Ergebnis nicht durch bewusste oder unbewusste Einflüsse verfälscht wird. Da die Gruppen möglichst vergleichbar sind und sich nur in der Therapie unterscheiden, werden statistische Verzerrungen minimiert. Folglich können Veränderungen im Ergebnis kausal auf die Behandlung zurückgeführt werden. Das standardisierte Vorgehen bei RCTs ermöglicht es außerdem, die Studie unter gleichen Bedingungen zu wiederholen und die Ergebnisse zu überprüfen.
Zusammengefasst: Die RCT hat sich zum Goldstandard in der klinischen Forschung entwickelt, weil sie eine methodisch saubere Evidenzbasis liefert. Doch gerade in der modernen Arzneimittelentwicklung stoßen klassische RCTs zunehmend an ihre Grenzen.
Praxisprobleme und Limitationen
Obwohl sich RCTs bewährt und zurecht als Goldstandard etabliert haben, zeigt sich in der klinischen Realität, dass RCTs nicht immer das praktikabelste Studiendesign darstellen. Gerade bei kleinen Patientenpopulationen ist die Planung von RCTs eine Herausforderung: Seltene Erkrankungen oder personalisierte Therapien betreffen oft nur wenige Patient:innen. Das erschwert es, eine ausreichende Anzahl an Proband:innen für eine statistisch belastbare RCT zu rekrutieren. Studien mit niedrigen Stichproben haben eine geringere statistische Power und gelten daher als weniger aussagekräftig.
Da also für aussagekräftige Ergebnisse viele Patient:innen rekrutiert werden müssen, sind RCTs überdies nicht nur kostenintensiv, sondern auch zeitaufwendig. Gerade in dynamischen Therapiegebieten ist das ein Problem, da die Therapie der Kontrollgruppe bei langer Studiendauer am Ende der Beobachtungszeit ggf. nicht mehr dem Therapiestandard entspricht. Auch das schmälert die Aussagekraft der Studie.
Zudem können auch ethische Bedenken bei der Umsetzung einer RCT auftreten. Wenn es schon vor Studienbeginn eindeutig ist, dass das neue Medikament deutlich besser wirkt als das Vergleichsmedikament, kann den Patient:innen im Vergleichsarm das neue Medikament nicht vorenthalten werden. Stattdessen dürfen sie z.B. nach Auftreten der Krankheitsprogression den Studienarm wechseln und erhalten dann ebenfalls das neue Medikament. Ein solcher „Cross-Over“ schwächt die Aussagekraft der Studie: Es verwischt den Unterschied zwischen den Gruppen, was die Vergleichbarkeit der Behandlungseffekte erschwert und zu massiven Verzerrungen in der Nutzenbewertung führen kann. Cross-Over ist vor allem bei Sprunginnovationen zu beobachten und führt vielfach dazu, dass diese keine Vorteile im Gesamtüberleben zeigen können. Mithilfe von biostatistischen Verfahren kann für Cross-Over adjustiert werden – diese Methoden weisen jedoch alle Limitationen auf und werden bisher weder vom IQWiG noch vom G-BA genutzt.
Aufgrund dieser Herausforderungen kann es vorkommen, dass ein pharmazeutisches Unternehmen sich gegen eine RCT entscheidet oder im Rahmen der Studiendurchführung keine reine RCT zustande kommt. Für die Nutzenbewertung im AMNOG-Verfahren hat dies weitreichende Folgen.
Der Umgang mit nicht-RCTs im AMNOG-Prozess
Nach der Zulassung werden neue Arzneimittel gemäß der Arzneimittel-Nutzenbewertungsverordnung grundsätzlich vom Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG) anhand ihrer eingereichten Studien auf ihren Zusatznutzen geprüft. Das IQWiG-Gutachten dient als Grundlage für die Nutzenbewertung des Gemeinsamen Bundesausschuss (G-BA). Diese Nutzenbewertung ist Grundlage für die Erstattungsbeitragsverhandlungen (EBV) zwischen Pharmaunternehmen und dem GKV-Spitzenverband. Da die Nutzenbewertung die wirtschaftliche Attraktivität des Inverkehrbringens in Deutschland beeinflusst, hat die wissenschaftliche Bewertung durch das IQWiG und die Nutzenbewertung des G-BA direkten Einfluss auf die Verfügbarkeit neuer Arzneimittel in Deutschland.
RCTs stellen in der Arzneimittel-Nutzenbewertungsverordnung die höchste Evidenzstufe dar. Die Arzneimittel-Nutzenbewertungsverordnung erlaubt jedoch ausdrücklich die Einreichung von Studien niedrigerer Evidenzstufen, wenn RCTs nicht durchführbar sind. Allerdings ist der G-BA in der Praxis nachweislich mit der best-verfügbaren Evidenz aus nicht-RCTs bislang vorwiegend ablehnend umgegangen.[1]
Das IQWiG vertritt die Auffassung, dass nur in absoluten Ausnahmefällen von RCTs abgewichen werden sollte: In der Regel seien RCTs „möglich und praktisch durchführbar“. Das gelte auch für kleine Patientenpopulationen. Ein mögliches Abweichen vom klassischen RCT-Studiendesign verknüpft das IQWiG überdies mit beträchtlichen Berichts- und Dokumentationspflichten, die in der klinischen Praxis schwierig zu handhaben sind.[2]
Problematisch ist vor allem, dass bislang keine verbindlichen Kriterien vorliegen, wann eine RCT im Rahmen eines klinischen Entwicklungsprogramms nicht anwendbar ist und wie bei Nutzenbewertungen von Arzneimitteln ohne RCT auf Basis der best-verfügbaren Evidenz vergleichende Aussagen zum Zusatznutzen möglich sind. Fehlen diese Regeln, kann das also direkte Auswirkungen auf die Medikamentenverfügbarkeit haben. Wenn bereits zu Beginn der Entwicklung unklar ist, ob die gewählte Evidenzform für die Nutzenbewertung akzeptiert wird, droht ein strategisches Investitionsrisiko – zum Nachteil der Patient:innen.
Höchster wissenschaftlicher Standard oder bessere Versorgung?
Das IQWiG verfolgt das Ziel, den höchsten wissenschaftlichen Standard für die Nutzenbewertung anzulegen und saubere Studiendaten heranzuziehen. In der Praxis darf methodische Strenge jedoch nicht dazu führen, dass Patient:innen wirksame Therapien vorenthalten werden, wenn aufgrund besonderer Therapiesituationen keine RCT möglich ist.
Die gesetzliche Möglichkeit, auch alternative Evidenzformen anzuerkennen, muss daher im AMNOG-Prozess systematischer Anwendung finden. Dafür braucht es klare und verlässliche Regeln, die pharmazeutischen Unternehmen Planungs- und Rechtssicherheit geben und Innovationen für besondere Therapiesituationen nicht benachteiligen.
Ein Blick ins Ausland zeigt, dass ein Ausgleich zwischen wissenschaftlichen Standards und Versorgungsgerechtigkeit möglich ist. Das britische NICE (National Institute for Health and Care Excellence) etwa akzeptiert in besonderen Fällen auch alternative Evidenzquellen, wie statistische Modelle, innovative Studiendesigns und Real-World-Daten. Es sollte klare und verlässliche Regeln geben, die den Einsatz solcher Evidenzquellen auch in Deutschland ermöglichen und strukturieren.
Zum einen können statistische Modelle eingesetzt werden, um indirekte Vergleiche zu ermöglichen. Dazu zählen Methoden wie Matching-Adjusted Indirect Comparisons (MAIC), Propensity Score Matching, bayesianische Verfahren sowie extrapolative Modellierungen. Diese Techniken erlauben es, unterschiedliche Datensätze miteinander in Beziehung zu setzen und valide Aussagen zum therapeutischen Nutzen abzuleiten, auch wenn keine direkten Vergleichsstudien vorliegen.
Zum anderen sollten auch alternative Studiendesigns stärker anerkannt werden, insbesondere in speziellen Therapiesituationen, in denen RCTs aus ethischen oder praktischen Gründen nicht durchführbar sind. Hierzu gehören einarmige Studien oder sogenannte Basket-Studien, die bei seltenen Erkrankungen oder zielgerichteten Therapien oft die beste verfügbare Evidenz liefern.
Darüber hinaus gewinnt die Nutzung von Real-World-Evidence (RWE) zunehmend an Bedeutung. RWE ergänzt die Ergebnisse klinischer Studien durch Langzeitdaten und Informationen aus der Versorgungsrealität. Sie bietet wertvolle Einblicke in die Wirksamkeit und Sicherheit von Therapien unter Alltagsbedingungen und trägt damit zu einer umfassenderen Bewertung des patientenrelevanten Nutzens bei. Dafür braucht es ein Registergesetz, das standardisierte und qualitätsgesicherte Indikationsregister ermöglicht.
Wege zu einer modernen Nutzenbewertung
RCTs sind immer noch die wissenschaftlich robusteste Evidenzquelle in der klinischen Forschung. Es darf in der Nutzenbewertung aber kein One-Size-Fits-All geben – RCTs sind in der Praxis nicht bei allen Indikationen das adäquate Studiendesign, insbesondere bei kleinen Patientenpopulationen. Die deutsche Nutzenbewertung könnte davon profitieren, auch alternative Evidenzquellen analog zu anderen Ländern systematisch zu berücksichtigen. Mit einer Kombination aus RCTs, Real-World-Evidence und alternativen Studiendesigns, die bestverfügbare Evidenz generieren, könnte eine ausgewogene, praxisnahe und patientenorientierte Entscheidungsgrundlage schaffen. Die aktuelle Diskussion um die Weiterentwicklung des AMNOG-Prozesses, der im Koalitionsvertrag der neuen Bundesregierung vereinbart wurde, bietet die Chance, methodische Anforderungen, Versorgungsgerechtigkeit und Innovationsförderung neu auszubalancieren.
[1] Julian, E., Rasch, A., Bussilliat, P., & Ruof, J. (2023, October 12). Umgang mit best-Verfügbarer Evidenz in der Nutzenbewertung von Arzneimitteln: Eine Analyse von Verfahren ohne Vorliegen einer randomisiert-Kontrollierten Studie. Gesundheitsökonomie & Qualitätsmanagement. https://www.thieme-connect.com/products/ejournals/abstract/10.1055/a-2142-0794
[2] IQWiG (2023). Allgemeine Methoden, Version 7.0. S. 65
Dr. Robert Welte
Senior Director Market Access & Reimbursement, Gilead Sciences
Dr. Thorsten Pisch
Associate Director Cell Therapy Government Affairs, Gilead Sciences
Die weiteren Beiträge der Serie, die folgen:
- Ethisches Cross-Over bei klinischen Studien – Benachteiligung besonders innovativer Therapien im AMNOG?
- AMNOG „Fit for Future“ – was können Registerdaten und anwendungsbegleitende Datenerhebungen leisten?
Alle Beiträge Management/Trends ansehen

