Das FDZ-Gesundheit im Methodenmix der Versorgungsforschung

Dr. Katja Gehrke, Institut für deskriptive Gesundheitsdatenanalyse (DGDA)

Wer glaubt, mit dem Live-Gang des Forschungsdatenzentrums (FDZ) Gesundheit gibt es nunmehr für jeden einen einfachen und explorativ nutzbaren Zugang zu pseudonymisierten Abrechnungsdaten der gesetzlichen Krankenversicherung, der irrt.

Richtig ist, es ist eine breite Datenbasis der GKV-Versicherten sowie ein standardisiertes Verfahren zur Beantragung der Daten und eine in Teilen bereits bekannte Infrastruktur für Forschung [1-6] geschaffen worden. Dennoch können nicht alle Forschungsfragen hierüber beantwortet werden und es gibt zweckgebundene Nutzungs- und Schutzvorgaben. Das FDZ-Gesundheit kann daher als wichtiger, aber nicht immer hinreichender Baustein eines multiperspektivischen Forschungsdesigns verstanden werden.

 

1. Hintergrund und Ziel des Beitrages

Mit dem Gesundheitsdatennutzungsgesetz und der FDZ-Gesundheit-Verordnung wurde der Zugang zu Gesundheitsdaten für gemeinwohlorientierte Forschungszwecke neu geordnet [2,3]. Das Bundesministerium für Gesundheit beschreibt das FDZ-Gesundheit als Teil einer dezentralen Gesundheitsdateninfrastruktur, in der Datenzugang, Koordination und sichere Verarbeitung stärker standardisiert werden [1,4]. Für die Versorgungsforschung ist dies relevant, weil administrative Routinedaten damit breiter, nachvollziehbarer und in geregelten Verfahren nutzbar werden.

Eine methodische Einordnung ist dennoch notwendig. Das FDZ-Gesundheit ist in erster Linie eine Infrastruktur, über die GKV-Analysen angestoßen, Anträge geprüft, Analysen in einer geschützten Umgebung durchgeführt und Ergebnisse kontrolliert ausgeliefert werden [2-5]. Viele Chancen und Grenzen, die dem FDZ-Gesundheit zugeschrieben werden, beruhen daher nicht auf dem FDZ-Gesundheit selbst, sondern auf den Eigenschaften der zugänglichen GKV-Abrechnungsdaten. Leitfrage dieses Beitrags ist, welchen spezifischen Beitrag das FDZ-Gesundheit für Versorgungsanalysen in Deutschland leistet und welche Fragestellungen weiterhin ergänzende Datenquellen oder Linkage-Ansätze erfordern.

 

2. Methodische Einordnung des FDZ-Gesundheit

Die offiziellen Informationen für Antragsteller machen deutlich, dass eine Nutzung des FDZ eine sehr genaue Vorarbeit verlangt. Für die Antragsvorbereitung stehen Datensatzbeschreibung, Public Use File (PUF) und Nutzerhandbuch zur Verfügung; zugleich müssen Nutzungszweck, benötigte Merkmale, Bezugsjahre und Analysepfad früh festgelegt werden [4-6]. Diese Struktur ist wissenschaftlich sinnvoll, weil sie Transparenz, Nachvollziehbarkeit und Datenschutz stärkt. Sie erhöht jedoch den Planungsaufwand und ermöglicht keine explorative Arbeit. Eine vorherig klar und detailliert definierte sowie technisch ausgestaltete Fragestellung ist unentbehrlich.

FDZ-spezifisch sind vor allem die sichere Verarbeitungsumgebung, formalisierte Antrags- und Prüfprozesse sowie die kontrollierte Ergebnisausleitung [2-5]. Routinedatentypisch sind dagegen die bekannten Eigenschaften von GKV-Abrechnungsdaten: eine hohe Populationsabdeckung, gute Abbildung von Leistungsinanspruchnahme, Diagnosen, Verordnungen und Sektorübergängen, zugleich aber eine begrenzte klinische Tiefenschärfe und eine Abhängigkeit von Kodier- und Abrechnungslogiken [7,8]. Für robuste Sekundärdatenforschung ist daher nicht nur Fachwissen zur Versorgung, sondern auch Kenntnis administrativer Datenmodelle, Kodesysteme und statistischer Auswertungsstrategien erforderlich [5,7,9] und vor allem der Umgang mit den verschiedenen Datenmodellen für die Vorbereitung eines programmierfähigen Skripts.

Die häufig geäußerte Einschätzung, das FDZ-Gesundheit sei für komplexe longitudinale Analysen nur eingeschränkt geeignet, muss präzisiert werden. Möglicherweise liegt der Einschätzung ebenfalls zugrunde, dass die Ergebnismenge derzeit stark beschränkt ist, Grafiken nicht erzeugt und heruntergeladen werden können und damit ein eng begrenzter technischer-administrativer Rahmen besteht. Längsschnittanalysen mit administrativen Daten sind grundsätzlich gut möglich und seit Jahren etabliert, sofern man im identischen Datenmodell bleibt. Eingeschränkt ist vielmehr die Eignung für klinisch tiefe Verlaufsanalysen, wenn Laborwerte, funktionelle Scores, Bildgebung oder patientenberichtete Endpunkte benötigt werden [7,8]. Für einige Indikationen sind dennoch für Schweregrade mit viel medizinischem Wissen rund um die Erkrankung Leitlinien ableitbar.

 

3. Vergleich zentraler Datentöpfe

Die Auswahl einer Datenquelle sollte von der Forschungsfrage ausgehen. Für Fragen der Wirksamkeit unter idealen Bedingungen, der Versorgungsrealität im Alltag, der Patientenselektion, der Langzeitbeobachtung oder der Kostenbewertung werden jeweils unterschiedliche Datenstärken benötigt. Die Tabelle 1 vergleicht wichtige Datentöpfe entlang typischer Stärken, Grenzen und Einsatzfelder.

 

Tabelle: Vergleich zentraler Datenquellen für Versorgungsanalysen

 

Quelle: eigene Zusammenstellung.

 

4. Warum Linkage verschiedener Datenquellen aufwändig bleibt

Die Verknüpfung mehrerer Datenquellen gilt als methodisch attraktiv, weil dadurch die jeweiligen blinden Flecken einzelner Datentöpfe verringert werden können. GKV-Abrechnungsdaten können zum Beispiel mit Registern, Primärdaten oder klinischen Dokumentationen kombiniert werden, um klinische Tiefe und Alltagsperspektive zusammenzuführen [1,11,12]. Der administrative Aufwand bleibt hoch.

Ein erster Grund ist die Governance, denn unterschiedliche Datenhalter, Rechtsgrundlagen, Zuständigkeiten und Prüfverfahren müssen zusammengebracht werden. Schon die Koordination der Zugangswege ist zeitintensiv; hinzu kommen Anforderungen an Datenschutz, Vertrauensstellen, Dokumentation und Ausleitungsregeln [2,3,11,12]. Ein zweiter Grund ist die semantische Heterogenität. Die Variablen, Kodiersysteme, Beobachtungsfenster und Ereignisdefinitionen sind zwischen GKV-Abrechnungsdaten, Registern, Patientenakten oder Primärdaten selten deckungsgleich. Ein dritter Grund ist die analytische Komplexität: Linkage erzeugt oft neue Missingness-Muster, Selektionsprobleme und potenzielle Verzerrungen, etwa wenn nur ein Teil der Zielpopulation erfolgreich verknüpft werden kann [11,12].

Für Deutschland kommt hinzu, dass viele Linkage-Projekte historisch unter fragmentierten Datenschutz- und Einwilligungsanforderungen entwickelt wurden. Das hat Fortschritte nicht verhindert, aber Planbarkeit und Skalierung erschwert [11]. Neuere Regelungen verbessern die institutionelle Grundlage, heben den Aufwand jedoch nicht auf. Linkage bleibt ein eigenständiger methodischer Arbeitsschritt und ist weder technisch noch wissenschaftlich trivial.

 

5. Diskussion

Für die Versorgungsforschung ist das FDZ-Gesundheit ein Infrastrukturgewinn. Es erleichtert den geregelten Zugang zu Daten, die für populationsbezogene Analysen des Versorgungsgeschehens in Deutschland von zentraler Bedeutung sind [1-6]. Sein Mehrwert liegt besonders dort, wo reale Inanspruchnahme, sektorübergreifende Versorgungspfade, Arzneimittelanwendung, regionale Unterschiede oder Kostenfolgen untersucht werden sollen bzw. großen Datenmengen sinnvoll sind, wie bspw. bei der Analyse von seltenen Erkrankungen [7,8].

Die Grenzen des FDZ-Gesundheit sollten jedoch nicht mit Defiziten der Institution verwechselt werden. Vieles, was als Begrenzung erscheint, ist Ausdruck der Natur administrativer Abrechnungsdaten. Diese bilden Versorgung breit, aber nicht klinisch vollständig ab. Für Fragestellungen mit Bedarf an Laborwerten, Bildgebung, funktionellen Scores, Lebensqualität oder differenzierter Endpunktvalidierung bleiben Register, Patientenakten oder Primärdaten unverzichtbar. Ebenso bleiben RCT für Fragen mit hoher interner Validität zentral, auch wenn ihre externe Validität begrenzt sein kann [10].

Publikationsreif und wissenschaftlich belastbar wird Forschung mit Routinedaten dann, wenn Herkunft, Aufbereitung und Limitationen transparent berichtet werden. Das RECORD-Statement bietet dafür einen geeigneten Referenzrahmen [9]. Für nichtinterventionelle Studien gilt zudem, dass das Protokoll, Datenqualität, Bias-Kontrolle und Transparenz nicht nachrangig sind, sondern die Glaubwürdigkeit der Ergebnisse wesentlich bestimmen [14,15].

Professor Jürgen Windeler bezweifelt in seinem Observer-Beitrag vom 19. Februar 2026 die Forschungsmöglichkeiten mit den Daten des FDZ-Gesundheit und sieht wenig Nutzen für viele Forschungsziele bzw. -fragen. Er fordert zudem eine hochkarätige Methodik bei den Nutzern sowie bei der Prüfung der Anträge ein. [16]

Die FDZ-Daten sind nicht als Ersatz für RCT-basierte Wirksamkeitsnachweise gedacht, sie sind vielmehr dafür geeignet, um Auswirkungen in der Realversorgung zunächst zu beschreiben. Wie bei den meisten Datenquellen gibt es auch hier methodische Grenzen von GKV-Abrechnungsdaten, die bekanntermaßen zunächst für andere Zwecke erhoben wurden, zu beachten. Daher sind fundierte Kenntnisse in der Nutzung von GKV-Routinedaten bzw. Sekundärdatenanalysen unerlässlich, und die Analysen sollten veröffentlicht werden, um einen methodischen Diskurs zu ermöglichen. Ungeachtet dessen ist es wahrscheinlich noch zu früh, den Wert der neuen Datenquelle abschließend zu bewerten, denn einerseits gibt es einen Fahrplan zur Erweiterung der Datenumfänge, und andererseits zeigen die ersten Analysen, dass der Weg von der Übersetzung der Forschungsfrage in programmier- bzw. lauffähige Skripte derzeit bereits eine erste Hürde für viele Datenprojekte darstellt. Dies begrenzt wahrscheinlich schon allein dadurch mögliche Zugänge bzw. Anträge. Ferner scheinen sehr komplexe Fragestellungen aufgrund der technischen Restriktionen derzeit nur schwer umsetzbar.

 

6. Fazit

Der Beitrag ordnet das FDZ-Gesundheit methodisch ein, grenzt FDZ-spezifische Prozessanforderungen von allgemeinen Eigenschaften von GKV-Abrechnungsdaten ab und vergleicht das FDZ-Gesundheit mit Einzelkassendaten, randomisierten klinischen Studien, Registern, ambulanten und stationären Patientenakten, Anwendungsbeobachtungen beziehungsweise nichtinterventionellen Studien sowie weiteren Datentöpfen. Gezeigt wird, dass das FDZ-Gesundheit besonders für populationsbezogene Analysen von Prävalenz und Inzidenz sowie Validierung statistischer Daten und Methoden geeignet ist.

Nicht jede Versorgungsfrage lässt sich mit einem einzigen Datentopf beantworten. Das FDZ-Gesundheit ist eine wichtige neue Datenquelle und vor allem eine erweitere Infrastruktur für den wissenschaftlich kontrollierten Zugang zu GKV-Routinedaten. Es ersetzt weder klinisch tiefe Dokumentation noch Registerdaten, Primärerhebungen oder randomisierte Studien. Für belastbare Analysen von Versorgung sollten daher unterschiedliche Perspektiven analysiert oder gar zusammengeführt werden, um sowohl die klinische Sicht als auch die Versorgung im Alltag angemessen abzubilden bzw. besser zu verstehen. Gerade darin liegt der methodische Mehrwert eines reflektierten Methodenmixes. Daten allein sind kein Selbstzweck, sondern die Basis für strategisch fundierte Entscheidungen und können genutzt werden, um die Steuerung der Ressourcen in eine effiziente Verwendung zu erreichen.

Die derzeitigen Beschränkungen der Ergebniszellenanzahl erschwert derzeit vor allem komplexe Analysen von Inanspruchnahmen, Versorgungspfaden, Arzneimittelanwendung und Sektorübergängen. Klinisch umfassende Endpunkte, patientenberichtete Ergebnisse, Laborwerte oder Bilddaten fehlen regelmäßig oder sind nur mittelbar in den FDZ-Daten [7-9] enthalten. erfasst

Für komplexe Versorgungsfragen bleibt deshalb die Kombination mehrerer Datenquellen zentral. Datalinkage ist in Deutschland zwar grundsätzlich möglich, bleibt aber rechtlich, organisatorisch, semantisch und analytisch ressourcenintensiv [2,3,11,12].

 

 

Literatur

[1] Bundesministerium für Gesundheit. Daten für die Forschung und Versorgung. Verfügbar unter: bundesgesundheitsministerium.de/themen/digitalisierung/daten-fuer-die-forschung-und-versorgung. Abruf: 25.03.2026.

[2] Gesetz zur verbesserten Nutzung von Gesundheitsdaten (Gesundheitsdatennutzungsgesetz – GDNG) vom 22.03.2024, BGBl. 2024 I Nr. 102. Verfügbar unter: gesetze-im-internet.de/gdng. Abruf: 25.03.2026.

[3] Verordnung zur Regelung der Verfahren beim Forschungsdatenzentrum Gesundheit (Forschungsdatenzentrum Gesundheit-Verordnung – FDZGesV) vom 04.02.2025, BGBl. 2025 I Nr. 28. Verfügbar unter: gesetze-im-internet.de/fdzgesv. Abruf: 25.03.2026.

[4] Forschungsdatenzentrum Gesundheit. Allgemeine Informationen über das FDZ Gesundheit. Verfügbar unter: forschungsdatenzentrum-gesundheit.de/informationen-fuer/antragstellende. Stand: 02.02.2026. Abruf: 25.03.2026.

[5] Forschungsdatenzentrum Gesundheit. Public Use File. Verfügbar unter: forschungsdatenzentrum-gesundheit.de/infoportal/datenbereitstellungsformen/public-use-file. Stand: 07.08.2025. Abruf: 25.03.2026.

[6] Forschungsdatenzentrum Gesundheit. Datensatzbeschreibung FDZ Gesundheit; sowie: Nutzerhandbuch für Forschende. Verfügbar unter: fdz-gesundheit.github.io/datensatzbeschreibung_fdz_gesundheit/ und forschungsdatenzentrum-gesundheit.de/fileadmin/user_upload/Dateien_zum_Download/Nutzerhandbücher/FDZ_Nutzerhandbuch_fuer_Forschende.pdf. Abruf: 25.03.2026.

[7] Kreis K, Neubauer S, Klora M, Lange A, Zeidler J. Status and perspectives of claims data analyses in Germany – a systematic review. Health Policy. 2016;120(2):213-226. doi:10.1016/j.healthpol.2016.01.007.

[8] Neubauer S, Kreis K, Klora M, et al. Access, use, and challenges of claims data analyses in Germany. Eur J Health Econ. 2017;18(5):533-536. doi:10.1007/s10198-016-0849-3.

[9] Benchimol EI, Smeeth L, Guttmann A, et al. The REporting of studies Conducted using Observational Routinely-collected health Data (RECORD) Statement. PLoS Med. 2015;12(10):e1001885. doi:10.1371/journal.pmed.1001885.

[10] Kennedy-Martin T, Curtis S, Faries D, Robinson S, Johnston J. A literature review on the representativeness of randomized controlled trial samples and implications for the external validity of trial results. Trials. 2015;16:495. doi:10.1186/s13063-015-1023-4.

[11] March S. Individual Data Linkage of Survey Data with Claims Data in Germany – An Overview Based on a Cohort Study. Int J Environ Res Public Health. 2017;14(12):1543. doi:10.3390/ijerph14121543.

[12] Domhoff D, Seibert K, Stiefler S, Wolf-Ostermann K, Peschke D. Data linkage of German statutory health insurance claims data and care needs assessments preceding a population-based cohort study on nursing home admission. BMJ Open. 2022;12(6):e063475. doi:10.1136/bmjopen-2022-063475.

[13] PharmNet.Bund. Non-interventional studies. Verfügbar unter: pharmnet-bund.de/PharmNet/EN/Public/Non-interventional-studies/_node.html. Abruf: 25.03.2026.

[14] Acha V, Barefoot B, Juarez Garcia A, et al. Principles for Good Practice in the Conduct of Non-interventional Studies: The View of Industry Researchers. Ther Innov Regul Sci. 2023;57:1199-1208. doi:10.1007/s43441-023-00544-y.

[15] Lao KSJ, Kelman CW, van Driel ML, McGeechan K, Preen DB, Pearson SA. Medication safety research by observational study design. Int J Clin Pharm. 2016;38(3):676-684. doi:10.1007/s11096-016-0295-2.

[16] Windeler, J. (2026) Wie mit unseren Daten alles besser wird … Forschung mit Daten im Zentrum – Daten im Zentrum der Forschung? In: Observer Gesundheit 4.0, https://observer-gesundheit.de/wie-mit-unseren-daten-alles-besser-wird/; Abruf: 01.04.2026.


Observer Gesundheit Copyright
Alle Beiträge Management/Trends ansehen