19.02.2026
Wie mit „unseren“ Daten alles besser wird …
Forschung mit Daten im Zentrum – Daten im Zentrum der Forschung?
Prof. Dr. med. Jürgen Windeler
Als Anfang Oktober 2025 bekannt gemacht wurde, dass am Bundesinstitut für Arzneimittel und Medizinprodukte (BfArM) das Forschungsdatenzentrum Gesundheit (FDZ) seinen Betrieb aufgenommen hatte, mag sich der eine oder die andere gefragt haben: Oh, schon? Denn bei der Entstehungsgeschichte fühlt man sich durchaus an einen Berliner Flughafen und einen Stuttgarter Bahnhof erinnert.
Langer Anlauf
Bereits seit 2006 gab es eine gesetzliche Regelung zu einer „Datenaufbereitungsstelle“ (§ 303d SGB V), bis 2020 angesiedelt am damaligen DIMDI. Aus diesem Vorläufer wurde durch das Digitale Versorgungs-Gesetz (DVG) das Forschungsdatenzentrum (das im Gesetz den Zusatz „Gesundheit“ nicht trägt). Seit Anfang 2020, als das DIMDI in das BfArM eingegliedert wurde, „sitzt“ (so die Internetseite) das FDZ nun „am BfArM“.
Im Februar 2023 teilte das FDZ in einem Gerichtstermin, in dem es um eine Klage gegen die Weitergabe der Daten ohne Widerspruchsmöglichkeit ging, mit, „dass es noch immer nicht wie vorgesehen arbeite, dass noch kein Sicherheitskonzept vorliege und dass der Dienstleister, der zum Betrieb der Datenbank erforderlich sei, ausgetauscht werden müsse.“ Im November 2024, also knapp 5 Jahre nach seiner gesetzlichen Neugründung, konnte man auf der Seite die Information lesen, das FDZ „befindet sich im Aufbau“, und es wurde angekündigt, dass Anträge „voraussichtlich“ Anfang 2025 über die Webseite gestellt werden könnten. Nun also, noch ein knappes Jahr später, ist dieses Zentrum anscheinend in Betrieb.
Ein Grund für die langwierige Aufbauarbeit war, so der Leiter des FDZ, Steffen Heß, in einem aktuellen Interview des Deutschen Ärzteblatts, dass man „die Komplexität anfangs unterschätzt“ habe. Das kommt einem irgendwie bekannt vor. Der Leiter hebt dann die Sicherheitsvorkehrungen für diese Daten hervor, wo man auch „einige Sicherheitsstufen mehr eingezogen (habe) als ursprünglich geplant“. Als weiteren Sicherheitsaspekt verweist er auf die Pseudonymisierung der Daten, die dort verarbeitet werden. Ein kleiner Satz lässt dann aufhorchen: „Insbesondere bei Personen mit sehr vielen medizinischen Informationen wird es relativ schnell einzigartig“ – auf deutsch: Die Pseudonymisierung kann durchbrochen werden. Überraschung! Und da gleichzeitig besonders herausgestellt wird, dass im FDZ Daten aller gesetzlichen Krankenkassen seit 2009 vorliegen und diese bis zu 100 Jahre aufbewahrt werden dürfen, ist davon auszugehen, dass für so gut wie jeden Versicherten dort „sehr viele medizinische Informationen“ vorliegen werden. Man liest dann weiter, dass mit einer Erweiterung der Daten auf ein europäisches „Gesundheitsdaten-Ökosystem“ noch mehr Informationen „aus verschiedenen Datensätzen zu einer Person zusammengebracht werden können“. Was das zusammen mit den Lobpreisungen für KI bzgl. der „Haltbarkeit“ der Pseudonymisierung bedeutet, liegt für jeden sichtbar auf der Hand.
Überhaupt werden in den Ankündigungen aus dem (und über das) FDZ vor allem Mengen thematisiert. Schon die Überschrift zu dem genannten Interview „Unsere Daten bilden 90 % der deutschen Bevölkerung ab“ zielt auf den Umfang der Informationen. 11 Milliarden war die beeindruckende Angabe auf einer digitalen Veranstaltung des FDZ am 9.2.2026 – auch wenn es dann „nur“ Zeilen pro Jahr waren. An verschiedensten Stellen wird herausgehoben, dass noch viele Daten aus unterschiedlichen Quellen (ePA, Krebsregister, europäischer Datenraum, Medikationsliste, Daten zu Heil- und Hilfsmitteln) in das Forschungsdatenzentrum eingespielt werden sollen. Es wird ausgeführt, dass man diese Daten dann alle miteinander verbinden kann. Massen an Daten, aber sehr wenig dazu, welche Fragen mit welchem Aufwand und welchen Methoden mit diesen Daten sinnvoll beantwortet werden könnten. „Viel hilft viel“ ist eigentlich in der Medizin ironisch gemeint.
Daten = Forschung?
Die Sicherheit der Daten ist für ein Datenzentrum von besonderer Bedeutung und auch ein wesentlicher Grund, warum nur aggregierte Daten sozusagen „das Haus verlassen“. Für ein Forschungsdatenzentrum ist jedoch die durchaus ebenbürtige Frage, ob und wie man mit diesen Daten eben Forschung betreiben kann.
Daten zu haben, viele Daten, ganz viele, Massen von Daten, verbunden mit anderen Daten, scheint zur Zeit als der Gipfel der Erkenntnisgewinnung. Zusammen mit modernen digitalen Möglichkeiten scheint dies das bisher verschlossene Tor zur umfassenden Einsicht, u.a. in die Geheimnisse eines Gesundheitssystems. Nur sehr langsam dämmert es dem einen oder anderen, dass mit den Riesendatenmengen der Heuhaufen schneller wächst, als die Sucher der Nadel fündig werden. Nein, nicht allein Daten, sondern Methoden, mit denen eine Frage gezielt und angegangen und robust beantwortet werden kann, sind der Weg zur Kenntnis.
Was also kann man mit den Daten, die das FDZ weitgehend ohne Widerspruchsmöglichkeit der Versicherten über sie sammelt, anfangen? Welche Forschung kann man damit betreiben, welche Fragen kann man beantworten, auch, wer darf mit welchen Zielsetzungen mit diesen Daten arbeiten? Und wie stellt das FDZ sicher, dass neben der Datensicherheit auch die Forschungsqualität der Anträge kompetent geprüft und im Ergebnis gewährleistet ist?
Der Leiter des FDZ äußert sich dazu so, dass man „mit unseren Daten vor allem beobachtende Studien durchführen (kann)“. Abgesehen davon, dass es, mit Verlaub, unsere Daten und nicht die des FDZ sind, ist der Begriff „beobachtende Studien“ allerdings auslegungsfähig. Einerseits bestehen diese Daten natürlich aus nichts anderem als Beobachtungen, so dass man auch nichts anderes als beobachtende Studien damit durchführen kann, also: was sonst? Andererseits hat der Begriff „Beobachtungsstudien“ jedoch eine sehr spezifische epidemiologische Bedeutung, die mit wichtigen Zielsetzungen der vom FDZ angekündigten Forschung allerdings nicht vereinbar ist.
Zumal es ziemlich euphemistisch erscheint, dass man bei diesen Daten, die „aus Abrechnungsgründen erhoben worden (sind) … bei gewissen Fragestellungen mögliche Verzerrungen beachten“ (müsse). Diesen Satz darf man getrost umdrehen und damit das realistische Bild zeichnen, das man überall in der einschlägigen Literatur nachlesen kann: Die in Abrechnungsdaten sicher anzutreffenden Verzerrungen können bei gewissen Fragestellungen vernachlässigt werden.
Kriterien liegen im Dunkeln
Als Reaktion auf Kritik an der geplanten Neuregelung, wonach auch (Pharma-)Firmen mit diesen Daten arbeiten dürfen (Neufassung des § 303a im GDNGEG), sagte der damalige Minister Lauterbach im August 2023 in einem Interview in der Rheinischen Post: „Es müssen Forschungsanträge gestellt werden, und wenn die wissenschaftlich relevant sind, dürfen sie die Daten auswerten. Das prüft und entscheidet das Forschungsdatenzentrum.“ Nun hätte man gerne gewusst, was sich der Minister unter „wissenschaftlich relevant“ vorgestellt hat, aber jedenfalls ist es nach dieser Äußerung – und eigentlich als Grundlage jeder Forschung – Aufgabe des FDZ, diese Anforderung sicher zu stellen. Dazu gibt es ein Antragsverfahren, und, wie das bei Anträgen so üblich ist, eine Prüfung dieser Anträge. „Wissenschaftlich relevant“ ist eine inhaltliche, keine formale Anforderung. Nur, was das FDZ für „relevant“ hält, welche Kriterien es dafür sieht und heranzieht, nach welchen Kriterien es also Anträge ablehnt oder genehmigt, liegt im Dunkeln. Auf der Internetseite des FDZ gibt es dazu keinerlei Informationen. Ein Methodenpapier, das es in anderen, in öffentlichem Interesse agierenden Institutionen gibt, sucht man vergeblich.
Der Abschnitt „6 Inhaltliche Prüfung des Antrags durch Mitarbeitende des FDZ Gesundheit“ im „Nutzerhandbuch für Forschende“ umfasst genau eine Seite. Diese enthält keinerlei Informationen dazu, welche Inhalte dort geprüft werden sollen. Man findet nur die allgemeine Formulierung, „ob die beantragten Daten und Ergebnismenge in Umfang und Struktur geeignet und erforderlich sind, um das Forschungsziel zu beantworten ..“. Aber „Umfang und Struktur“ ist ein bisschen wenig, wenn es, wie Berge von methodischer Fachliteratur deutlich machen, eigentlich darauf ankommt, eine geeignete Methodik auf genau dafür geeignete Daten anzuwenden.
Der einzige Anhaltspunkt dafür, was dort geprüft wird, ist, dass die Daten „nicht für jeden beliebigen Zweck genutzt werden (dürfen). Die Nutzungszwecke liegen im Interesse der Allgemeinheit und sind gesetzlich festgelegt.“ Der kleine Einschub „im Interesse der Allgemeinheit“ ist interessant, weil a. genau diese Orientierung am „Gemeinwohl“ das Gesetzgebungsverfahren gar nicht überlebt hat und b. die „Forschungs“frage einer Firma, wie häufig eine bestimmte Erkrankung vorkommt (sorry: abgerechnet wurde), ausschließlich im (Marketing-)Interesse der Firma liegt. Ob das FDZ so einen Antrag also ablehnt? Nein, das tut es nicht, wie man auf der schon erwähnten Veranstaltung hören konnte, wo ein entsprechender Antrag der Fa. Bayer vorgestellt wurde.
Weiter heißt es dann: „Ob dieser Nutzungszweck zu dem Antrag und dem beantragten Datenzuschnitt passt, wird von Mitarbeitenden am FDZ Gesundheit geprüft.“ Solch eine Information geht kaum über den Gesetzestext hinaus, lässt alle Anforderungen und Kriterien vermissen und ist umso bemerkenswerter, als die in § 303e beschriebenen Nutzungszwecke faktisch eben genau „jeden beliebigen Zweck“ abbilden. Der denkbar „beliebigste“ Zweck steht in Nummer 4 der gesetzlichen Regelung (§ 303e (2)). Dort heißt der Zweck, der es Nutzungsberechtigten erlaubt, mit den Daten zu arbeiten: „wissenschaftliche Forschung zu Fragestellungen aus den Bereichen Gesundheit und Pflege, …“. Es erschließt sich daraus allein nicht im Ansatz, welche Kriterien hier für die Frage herangezogen werden könnten, einen Antrag zu beurteilen und ihn positiv oder negativ zu bescheiden. Anders ausgedrückt: Eine Ablehnung wäre nur als K.O.-Schlag für die Fantasie und Kreativität des Antragstellers zu verstehen.
Nun mag man für reine Häufigkeitsangaben auf differenzierte Angaben zur Methodik verzichten – Zählen wird man ja können. Aber die Versprechen des FDZ, Forschungsfragen beantworten zu können, gehen weit darüber hinaus.
Illusionäre Forschungsziele
Die gesetzlich festgelegten Zwecke sollen also der entscheidende Maßstab für die Prüfung und Genehmigung von Anträgen sein. Das FDZ führt auf seiner Internetseite diese zehn Zweck(bereich)e auf und gibt hierzu jeweils Erläuterungen sowie ein Beispiel. Ohne hier in alle Details einsteigen zu können, stellt sich für eine ganze Reihe dieser Erläuterungen, insbesondere aber bezüglich der angeführten Beispiele die Frage, ob hier eine aktuelle bzw. eine in, sagen wir, den nächsten 2 bis 3 Jahren absehbare Situation beschrieben wird oder eine in ferner Zukunft liegende Vision, man könnte es auch Wünsche nennen.
Ein Beispiel hierfür sind die Erläuterungen zu Zweck 2, der die „Verbesserung der Qualität der Versorgung …“ betrifft. Für die Messung von Qualität sind etablierte und validierte Qualitätsindikatoren Grundlage und erforderlich. Dass diese in üblichen Abrechnungsdaten zuverlässig abgebildet sind, erscheint wenig plausibel, wird jedenfalls nicht beschrieben. „Für eine gute Auswertung braucht es möglichst viele Daten über diese Tätigkeiten“ – Nein, „viel“ macht es nicht „gut“! „Diese Daten sind am FDZ Gesundheit zu finden.“ Man fragt sich nur, wo? Denn Daten zur Qualitätssicherung werden im deutschen System natürlich erhoben, stehen dem FDZ aber gar nicht zur Verfügung.
Neben dieser fehlenden Bodenhaftung ist interessant, welche Zielsetzungen das FDZ den verschiedenen Nutzungszwecken zuordnet und wie es – mutmaßlich – Anträge bewertet. Als ein – sehr bedeutsames – Beispiel kann der schon erwähnte Zweckbereich 4. „Wissenschaftliche Forschung zu Fragestellungen aus den Bereichen Gesundheit und Pflege …“ herangezogen werden. Dort wird in einem Beispiel ausgeführt, dass Daten im FDZ „von entscheidender Bedeutung für die Forschung von chronischen Erkrankungen“ seien – da können sich die bisher dafür zuständigen Universitäten ja auf die Lehre beschränken. Das Beispiel wird dann so konkretisiert, dass bei der Erforschung von Arthrose „mit den FDZ–Daten … der Verlauf der Erkrankung, die Wirksamkeit verschiedener Therapien, wie Physiotherapie oder Arzneimittel gegen Schmerzen … analysiert werden“ können.
Wenn solche Forschungsfragen als Anträge eingebracht werden, muss man eigentlich davon ausgehen, dass das FDZ sie alle ablehnt. Denn methodisch ist das, was da geschrieben steht, eine Illusion.
Es muss anscheinend wieder und wieder und dann noch einmal und ein viertes Mal ins Bewusstsein gerufen werden: Aussagen zur Wirksamkeit oder zum Nutzen von Therapien erfordern einen Vergleich. Dieser Vergleich muss bestimmte Anforderungen erfüllen, insbesondere muss es ein fairer Vergleich sein. Einen fairen Vergleich erreicht man am einfachsten durch Randomisierung, was in FDZ-Daten ausgeschlossen ist. Eine alternative Möglichkeit ist eine nicht-randomisierte Studie, die einer umfassenden Confounder-Kontrolle bedarf, zum Beispiel auch als Target Trial Emulation. Informationen zu diesen Confoundern sind aber in den derzeit und auf (un)absehbare Zeit vorliegenden Daten im FDZ schlicht nicht existent.
Die logische Kette zurückverfolgt bedeutet dies: Daten zur angemessenen Confounderkontrolle sind nicht vorhanden, eine Confounder-Kontrolle ist daher nicht möglich, damit ist ein fairer Vergleich nicht sicherzustellen und damit sind Wirksamkeitsaussagen gar nicht bzw. nur in unbekannt (und zwar in Ausmaß und Richtung) verzerrter Form möglich. Solche fehlerträchtigen Aussagen braucht niemand. Sie sind Ressourcenvergeudung, Research Waste. Es kommt hinzu, dass für Wirksamkeitsaussagen ganz besonders so genannte Patient-Reported-Outcomes (PROs), unter anderem die gesundheitsbezogene Lebensqualität, von Bedeutung sind. Sie sind natürlich weder in den derzeit vorhandenen Daten noch in zukünftigen Daten, auch nicht in ePA oder Registern enthalten und abgebildet. Allein deshalb können wesentliche Aspekte von Wirksamkeitsaussagen gar nicht bedient werden.
Die gleichen Vorbehalte und die gleichen Konsequenzen bzgl. der Prüfungspraxis betreffen den Zweck Nr. 10 „Nutzenbewertung von Arzneimittel, Medizinprodukten, Untersuchungs- und Behandlungsmethoden ….“. Hier ist das grundlegende Problem sogar unmittelbar zu erkennen. Man liest, dass neue Arzneimittel „weniger Nebenwirkungen, eine bessere Wirksamkeit“ oder „eine längere Überlebensdauer erwirken“ sollen. Weniger, besser, länger – Komparative, die die Notwendigkeit eines Vergleichs in sich tragen. Dieser Vergleich ist aber in aussagefähiger Form aus Beobachtungsstudien, die zudem bisher gar keine klinischen oder Outcome-Daten umfassen können, nicht möglich. Eine Nutzenbewertung von was auch immer ist mit den Daten zurzeit überhaupt nicht möglich, in einer in sehr weiter Ferne liegenden Ausbaustufe vielleicht denkbar, jedenfalls aber mit enormem Aufwand (siehe die deutsche Studie zur Evaluation des Mammographie-Scrennings) verbunden und letztlich nicht ohne unkalkulierbare Verzerrungsmöglichkeiten machbar.
Es ist zweifellos wichtig, „zu analysieren, ob zum Beispiel neue Medikamente wirklich sicherer oder effektiver sind als die vorher zugelassenen“, wie es in der weiteren Erläuterung zu diesem Zweck heißt. Aber mit FDZ-Daten ist dies in aller Regel nicht zu leisten.
Es ist nicht dem FDZ anzulasten, dass diese absurden, vollkommen unrealistischen Zwecke in ein Gesetz geschrieben wurden. Die Verantwortlichen sitzen im Ministerium. Aber die Umsetzung kann und darf sich nicht an politischen Wünschen, sondern muss sich an methodisch-epidemiologischen Standards orientieren, wenn sie die Bezeichnung „Wissenschaftliche Forschung“ für sich in Anspruch nehmen will. Und das gilt natürlich auch für die inhaltliche (!) Prüfung der Anträge.
Geht es auch etwas bescheidener?
Und dann gibt es da noch eine Rubrik „Bürgerinnen und Bürger“ mit einem „Überblick über das FDZ Gesundheit“. „Warum ist diese Forschung so wichtig?“ wird da gefragt. Die Antwort lasse man sich auf der Zunge zergehen: Forschende „könnten beispielsweise herausfinden, welche Behandlungsmethoden bei bestimmten Vorerkrankungen am effektivsten sind oder welche Umweltfaktoren das Krebsrisiko erhöhen könnten.“ Mit Abrechnungsdaten der GKV?
Steht da irgendwo drin, in welcher Umwelt die einzelnen Versicherten vor 20 Jahren gelebt haben? „Diese Erkenntnisse sind entscheidend, um individuellere, effektivere Therapien zu entwickeln und letztlich Leben zu retten.“ Wie wäre es denn, wenn das FDZ einmal ein allererstes ernst zu nehmendes Forschungsergebnis vorwiese, das über das Zählen von Abrechnungsziffern hinausgeht – vielleicht in einem hochrangigen Journal publiziert? So könnte es Kompetenz und Machbarkeit unter Beweis stellen – statt sich gleich am Wohle der Menschheit zu verheben.
Grundsätzlich ist weder etwas dagegen einzuwenden, Werbung zu machen noch Utopien zu skizzieren. Aber es ist taktisch eher unklug, sich in den nächsten Jahren immer wieder an unerfüllten – und unerfüllbaren – Ankündigungen messen lassen zu müssen. Und es darf bezweifelt werden, dass eine Institution, zudem, wenn sie mit „Forschung“ ernst genommen werden will, gut beraten ist, den „Bürgerinnen und Bürgern“ Wolkenkuckucksheime als bewohnbare Gemäuer zu verkaufen.
Fazit
Für einige Forschungsfragen, die versuchen, Einblicke in die Versorgung zu gewinnen, mag man mit guten Routinedaten Antworten finden, und in diese Richtung mögen sich auch die Daten und die Antrags- und Methodenprüfungen des FDZ entwickeln. Dort jedoch, wo es um Zusammenhänge und die Frage „What works in healthcare“ geht, werden auch noch so große Datenmengen nichts reißen. Ohne hochkarätige Methodik, die nicht mal eben in ein paar R-Programmen abbildbar ist, läuft hier nichts, ohne Kompetenz und Willen, Anträge auf diese Methodik hin zu prüfen, auch nicht. Der Gesetzgeber mag irgendwelche Ideen als Datennutzungs“zwecke“ definieren. Aber das Schicksal des amerikanischen „Outcomes Research“-Programms sollte ein warnendes Beispiel sein: Ohne international etablierte methodische Standards, deren Erfüllung ein Forschungsdatenzentrum sicherstellen müsste, ist Forschung zu „Wirksamkeit“ und „Nutzen“ nicht möglich. Der Medizinstatistiker Richard Peto hat es so zusammengefasst: „ … the claim was made that it (nonrandomized outcomes research) was going to give us reliable comparisons between the main effects of different treatments … It has utterly, totally, and predictably failed to do so“.
Leider ist dabei “predictably“ der bedeutendste Begriff.
PS:
Kuriosität am Rande: Der Leiter des FDZ gibt an: „Wir führen außerdem ein Antragsregister, in dem alle positiv beschiedenen Anträge aufgelistet werden. Damit wollen wir Transparenz reinbringen und zeigen, wofür und mit welchen Daten geforscht wird.“ Wenn man dieses Register einsehen möchte, wird man (Stand 02/2026) nicht fündig werden, aber das kommt wohl noch. Interessanter ist, dass die entsprechende Regelung im Gesetz (Paragraph 303d (1)) „ein öffentliches Antragsregister mit Informationen … zu den Vorhaben, für die Daten beantragt wurden …“ verlangt. „Beantragt“ steht da! Von einer Beschränkung auf „positive Anträge“ ist keine Rede. Aber vielleicht wird ja gar nichts abgelehnt?
Literatur
- https://www.forschungsdatenzentrum-gesundheit.de/ (alle Zugriffe dort vor dem 15.2.2026)
- https://freiheitsrechte.org/themen/freiheit-im-digitalen-zeitalter/gesundheitsdaten
- https://www.observer-mis.de/events/20053?mode=report
- Interview Steffen Heß im Deutschen Ärzteblatt https://tinyurl.com/4ppweu3k
- https://www.derstandard.at/story/2000107328669/mathematiker-gerd-antes-big-data-fuehrt-uns-in-eine-falle
Lesen Sie von diesem Autor auch:
„Impulse zur Neujustierung des AMNOG? – Kamellen!“, Observer Gesundheit, 20. Januar 2026,
„Sparolympiade – warum nur billiger, nicht besser?“, Observer Gesundheit, 17. Dezember 2025,
„Forschung mit ePA-Daten – ein Blick in die trübe Zukunft“, Observer Gesundheit, 3. März 2025,
„ePA – die Opt-out-Lösung ist so nicht vertretbar“, Observer Gesundheit, 3. Dezember 2024,
„Hautkrebs-Screening – ein Leerstück“, Observer Gesundheit, 26. August 2024.
Alle politischen Analysen ansehen
