Forschung mit ePA-Daten – ein Blick in die trübe Zukunft

Prof. Dr. med. Jürgen Windeler

Betrachtet man die Äußerungen, die den Einstieg in die elektronische Patientenakte (ePA) begleiten, so erstaunt das Ignorieren von Sicherheitsbedenken und unverändert vollkommen ungenügenden Informationen der Versicherten. Daneben irritiert, wie unbeirrt viele daran glauben, dass mit Datenhaufen, unter anderem aus der ePA zu erwarten, sinnvolle Forschung betrieben werden kann. Ein aktuelles Beispiel zeigt, was tatsächlich zu erwarten ist.

Ganz im Zentrum und von allen als besonders „sexy“ empfunden stehen im Gesundheitssystem – und nicht nur dort – Fragen nach kausalen Zusammenhängen. Aus ihrer Beantwortung können Entscheidungen über erfolgversprechende Einflussmöglichkeiten getroffen werden. Ursachenforschung würde man es allgemein nennen. In der Medizin geht es dabei oft um die wichtige Frage nach dem Nutzen von Interventionen – „What works in health care“.

Für die Meinung, mit ePA-Daten für diese wichtigen Fragen sinnvolle Forschung betreiben zu können, spricht – nichts. Sinnvolle Forschung bedeutet, dass sie Fragen zu relevanten Gesundheits- und Versorgungsproblemen angeht und – entscheidend – diese beantwortet. Dafür, dass dies mit unstrukturierten Datenbergen gelingt, gibt es weder überzeugende Beispiele noch eine theoretische Begründung, was, so ist es 400 Jahren Wissenschaftsgeschichte und unzähligen methodischen Lehrbüchern zu entnehmen, mit den Anforderungen zusammenhängt, die an die Aufdeckung von kausalen Zusammenhängen zu stellen sind.

 

Kein Nutzen, aber Nebenwirkungen

Der verbreitete Glaube und daraus begründete Aktivitäten haben aber erhebliche, in aller Regel nicht thematisierte Nebenwirkungen.

  • Da weder die Qualität der Daten noch die verwendete Methodik belastbare Antworten erlauben, bleiben mit dieser Art von „Forschung“ die für wichtig erachteten Fragen offen.
  • Die Beantwortung dieser Fragen wird dadurch verhindert, verzögert oder behindert, was ein gravierendes ethisches Problem darstellt, weil so die Weiterentwicklung und Verbesserung der Versorgung blockiert wird.
  • Für absehbar (!) sinnlose Forschung werden Gelder verbraucht, die sinnvoller Forschung fehlen.
  • Die „Erkenntnisse“ aus solcher Forschung geben Anlass zu weiterführenden Forschungen; Überprüfungen, Erklärungsversuche – wo es oft gar nichts zu überprüfen oder zu erklären gibt.
  • Die Publikationen über diesen „Research Waste“ überschwemmen die wissenschaftlichen Zeitschriften und verstopfen die Kanäle für seriöse Informationen.
  • Diese Publikationen suggerieren wissenschaftliche Erkenntnisse, obwohl schon mit einfachen Mitteln erkennbar und begründbar ist, dass sie eklatante Mängel aufweisen.
  • Dies verhindert aber nicht, dass sekundäre Berichterstattung diese Ergebnisse kritiklos verbreitet,
  • so zu einer Irreführung der Leser, ob Fachleute oder Laien, und
  • u. U. zu äußerst problematischen Konsequenzen beiträgt.

Forschung, die auf unzulänglichen Daten und unzureichender Methodik basiert, ist teuer, ineffizient, ineffektiv und unethisch – in einem Wort: verantwortungslos. Es ließen sich locker mindestens 20 Seiten mit Beispielen füllen, die geeignet sind, alle diese Punkte zu illustrieren und aus der täglichen Praxis zu belegen. Hier soll ein aktuelles Beispiel genügen, an dem sich alle Aspekte a.-i. finden. Leider ist es nicht konstruiert, sondern Realität.

 

Endometriose durch Traumata?

Das Deutsche Ärzteblatt, wesentliche Informationsquelle für die Deutsche Ärzteschaft, referierte in seinem Newsletter vom 17.2.2025 eine Studie mit der Überschrift „Traumata in der Kindheit sind mit einem erhöhten Risiko für Endometriose verknüpft“. Wissenschaftler hätten in einer Fall-Kontroll-Studie mit Daten aus verschiedenen europäischen Quellen herausgefunden, dass Frauen mit einer Endometriose häufiger als Kontrollen über Traumata berichteten, vor allem durch direkten physischen Kontakt, also Misshandlung in der Kindheit oder sexueller Missbrauch. Das Ärzteblatt wertet dies als „Belege dafür, dass … traumatische Erlebnisse … mit einem erhöhten Risiko für Endometriose assoziiert sind.“ Während es hier noch „assoziiert“ heißt, lautet die Abschnittsüberschrift aber ganz knackig: „Traumata wirken unabhängig von genetischer Prädisposition.“ Welche fatalen Konsequenzen „Traumata wirken …“ in Familien von Endometriose-Patientinnen haben könnten, liegt unmittelbar auf der Hand.

Sagen wir es so: Das Deutsche Ärzteblatt hat offenbar großen Bedarf an Sachverstand, was die Bewertung einer Studie angeht, und einige unbesetzte Stellen für epidemiologische Expertise, die in der Lage wäre, zu verhindern, dass aus einer solchen (Fall-Kontroll-)Studie kausale Interpretationen abgeleitet werden. Es sucht anscheinend dringend Autoren, die statistische Assoziationen von „Belegen“ unterscheiden können, und die auf die Idee kommen, dass in Sichtweite einer Verknüpfung von irgendwas mit irgendwas jedenfalls ein Gedanke (nennen wir es gerne: eine Theorie) über den Mechanismus stehen sollte, hier, wie ein Trauma zu einer Endometriose führen könnte.

Nun könnte es trotz der kritiklosen Darstellung und unhaltbaren Interpretation des Ärzteblattes so sein, dass in dieser Studie eine „Verknüpfung“ oder „Assoziation“ gefunden wurde, die so gut abgesichert ist, dass sie auch etwas bedeutet. Ein genauerer Blick in die Publikation bestätigt leider das, was man als einigermaßen erfahrener Methodiker bereits beim Lesen des Abstracts ahnt.

Für diese Studie wurden die Daten von insgesamt ca. 50.000 Patientinnen mit Endometriose und etwa 800.000 Kontrollen aus vier großen europäischen Datenbanken oder -quellen herangezogen. Für die Assoziation Trauma-Erkrankung sind es 8.200 Patientinnen und 240.000 Kontrollen aus der UK Biobank (UKB) bzw. die 2.800 Patientinnen und 79.000 Kontrollen daraus, die den Fragebogen zu psychischer Gesundheit online beantwortet haben – immer noch beeindruckende Fallzahlen.

Man kann sich von Riesenfallzahlen blenden lassen (der Aberglaube, dass Größe etwas mit Qualität und Aussagekraft zu tun hat, ist wohl unausrottbar). Man kann sich von der Statistik beeindrucken lassen, die man aber sowieso kaum kontrollieren/hinterfragen kann, oder meinen, dass p-Werte mit 15 Nullen hinter dem Komma doch nun „Belege“ seien. All dies ist aber geeignet, die einfachen Fragen zu vergessen, die eigentlich zum epidemiologischen Basiswissen gehören.

1. Fall-Kontroll-Studien sind eine der bewährten Methoden in der Epidemiologie. Gleichzeitig ist allgemein bekannt, dass sie u.a. wegen ihres retrospektiven Charakters besonders anfällig für vielfältige verzerrende Einflüsse sind, die teilweise sehr versteckt sein können und auch kaum zu beseitigen sind. In dem Bemühen, in dieser undurchsichtigen Lage „signal from noise“ zu trennen, also ein „echtes“, relevantes Signal aus dem lauten Grundrauschen herauszuhören, muss das OR so groß sein, dass es mutmaßlich nicht mehr durch die – in ihrem Einfluss unbekannten – Confounder erklärt werden kann. Dies gilt erst recht, wenn dieses Odds Ratio als Indiz für Kausalität interpretiert werden soll. Das Odds Ratio sollte daher mindestens 3 bis 5 betragen, um als bedeutsam eingestuft zu werden und näher diskutiert werden zu können (s. auch Glasziou et al). In der vorliegenden Studie betragen die OR ca. 1,2. Das mag – wg. der großen Fallzahl – „signifikant“ sein, bedeutet wegen der nicht kontrollierbaren Biasquellen aber – so gut wie – nichts. Und vielleicht hilft dieser Vergleich bei der Einordnung: Die Fall-Kontroll-Studie von Doll und Hill, die 1950 publiziert wurde und erstmals den Zusammenhang zwischen Rauchen und Lungenkrebs nahelegte, kam (für die Männer) zu einem Odds Ratio von 14!

2. Eine der zahlreichen Verzerrungsquellen ist das sogenannte recall bias. Damit ist gemeint, dass sich Menschen, bei denen ein bestimmtes Ereignis (z.B. eine Erkrankung) auftritt, sich mit der Vorgeschichte anders, motivierter, genauer beschäftigen als Menschen, die diesen Anlass gar nicht haben. Erstere mögen auch ihre Geschichte anders bewerten, „mit anderen Augen sehen“. Dies führt dazu, dass sie sich eher oder anders an Ereignisse erinnern – oder zu erinnern meinen –, die nach ihrer Auffassung mit dem jetzigen Ereignis in Zusammenhang stehen. Bei einer Erkrankung wie der Endometriose, für die überall zu lesen ist, dass ihre Ursachen nicht ausreichend bekannt sind, und dass dabei auch psychische Komponenten von Bedeutung sein könnten, ist offensichtlich, dass solche Mechanismen eine Rolle spielen. Liest man, dass hier Frauen im mittleren Alter von 55 Jahren nach Kindheitserlebnissen gefragt werden (z.B. „Child hated by family“), dann wird noch deutlicher, dass Erinnerung und ihre Wertung für diese Studie eine herausragende Rolle spielen. Eine Anpassung dieser Erinnerungsdifferenzen zwischen Fällen und Kontrollen ist aber offensichtlich nicht möglich. Kein Wort dazu von den Autoren.

3. Die Endometriose ist eine Erkrankung mit sehr unterschiedlicher Schwere, Symptomatik und auch pathologischer Ausgestaltung. Sowohl die Diagnose als auch ihr Ausschluss ist nach allgemeiner Auffassung nur durch eine Bauchspiegelung möglich. Diese Frage der Diagnosesicherung kommt in der Publikation gar nicht vor. Im Gegenteil: von den Frauen, die als „Endometriose“ bezeichnet werden, geschieht dies bei etwa der Hälfte aufgrund des Eintrags in den elektronischen „health records“, bei der anderen Hälfte auf der Basis einer „self-reported diagnosis“ – bei ca. 10 % stimmen die beiden Angaben überein (die ePA lässt grüßen). Ob und bei wie vielen Frauen die Erkrankung durch eine Laparoskopie gesichert wurde, erfährt man nicht, nur: „we cannot exclude that self-reported endometriosis was not as accurate in UKB“. Konsequenzen? Diskussion? Folgeabschätzung? Keine.
Umgekehrt ist es praktisch ausgeschlossen – und wird in der Publikation auch nirgends erwähnt – dass bei den „Kontroll“-Frauen ebenfalls eine Spiegelung durchgeführt wurde – hatten sie also wirklich keine Endometriose? Die Autoren weisen in Zusammenhang mit Altersunterschieden und Unterschieden im Sozialstatus zwischen Fällen und Kontrollen darauf hin, dass es undiagnostizierte Fälle gebe. Zur Größenordnung und zu Konsequenzen äußern sie sich nicht.
Diese Unschärfen durch falsche Zuordnungen (Missklassifikation) könnte man dann vielleicht gelassen hinnehmen, wenn hier ein Odds Ratio von 10 herausgekommen wäre. Hätte man ein deutliches Odds Ratio und eine Theorie über die Zusammenhänge, also Indizien, dass die gefundene Assoziation etwas bedeutet, dann könnte man auch spekulieren, dass der Nicht-Ausschluss eher zu einer Unterschätzung des Risikos geführt haben könnte. Bei diesen praktisch nicht von „Noise“ zu unterscheidenden Effekten bleibt nur Achselzucken.

4. Während in der Publikation an zahlreichen Stellen von „traumatic experiences“ gesprochen wird, steht an den weniger exponierten Stellen „Women with endometriosis were more likely to report … traumatic experiences“. Ohne tatsächliche Ereignisse in irgendeiner Weise bagatellisieren oder gar in Frage stellen zu wollen, ist jedenfalls festzustellen, dass ein dokumentiertes Ereignis etwas anderes ist als der Bericht über die Erinnerung an ein Ereignis, das mehr als 30 Jahre zurück liegt.

5. Dazu, dass eine solche Auswertung ernst genommen und als Forschung bezeichnet werden kann, gehört zuvorderst eine stringente Methodik (z.B. auch durch den Einsatz von Negativ-Kontrollen), mindestens aber die Benennung möglicher Biasquellen, eine Auseinandersetzung mit diesen Quellen und Abschätzung, ob und wie sie das Ergebnis beeinflussen könnten, am besten mit geeigneten Sensitivitätsanalysen. Die Publikation enthält von all dem keine Spur.

Die Kombination aus Biasquellen, Unschärfen und winzigen Effekten (die etwa in RCT durchaus von Bedeutung wären) führt dazu, dass man das Ergebnis nur bedeutungslos nennen kann. Und das kann jeder wissen: Das erste (von 9) der von Bradford-Hill 1965 vorgeschlagenen, anerkannten Kriterien, um von einer Assoziation auf einen kausalen Zusammenhang zu schließen, heißt „strength“.

Üblicherweise wird an dieser Stelle eingewandt, es handele sich „nur“ um explorative Forschung. Aber:

  • Auch explorative Forschung braucht methodische Qualität und Standards.
  • Berichte über ihre Ergebnisse und Interpretationen müssen den explorativen Charakter deutlich werden lassen.
  • Und: explorative Forschung braucht es zu einem Thema ein Mal, um neue Thesen zu formulieren. Wenn aber in der Einleitung der Arbeit darauf hingewiesen wird, dass es bereits verschiedene Arbeiten gibt, die einen Zusammenhang zwischen psychischen Belastungen und Endometriose postulieren – wobei genaugenommen die Richtung noch offenbleibt –, dann braucht es Forschung, die geeignet ist, diese These zu prüfen, sie zu bestätigen oder zu widerlegen. Was es sicher nicht braucht, ist „Forschung“, nach der man absehbar genauso schlau ist wie vorher, um dann die nächste „explorative“ Aktion zu unternehmen.

Nach einem knappen und alle wesentlichen Punkte verpassenden Abschnitt zu „limitations“ folgt die „conclusion“; und als ob man es geahnt hätte: „This suggests that endometriosis screening programs may be developed by assessing genetic predisposition, contact traumas, and other risk factors.“

Diese Studie und viele andere geben einen Ein- oder besser Ausblick, was uns mit den Auswertungen der großen Datenhaufen blüht. „Assoziationen“, wohin das Auge blickt, theoriefreie, kritiklose Darlegungen, „explorative“ Forschung, auf die keine Überprüfung folgt, unkritische, weil kenntnisarme oder interessengeleitete Berichterstattung – aber weitreichende Handlungsempfehlungen auf dünnstem vorstellbaren Eis.

Wenn Pepe, kleiner Sohn des hispanischen Häuptlings Costa y Bravo und nach seinen Angaben eigentlich Perikles getauft, etwas wollte, drohte er, die Luft anzuhalten. Und wenn das noch nicht genügte, hielt er wirklich die Luft an, so lange, bis er dunkelrot anlief. Spätestens dann bekamen es die Legionäre, die auf ihn achten sollten, mit der Angst und taten (alles) was Pepe wollte (s. „Asterix in Spanien“).

Aber auch wenn man tagelang die Luft anhält, es unbedingt möchte, es in Gesetze schreibt und alle kritischen Argumente ignoriert – die ePA in ihrer jetzigen Form wird kein Datenschatz werden. Vielleicht für Meta und Google und Elon Musk, aber nicht für das deutsche Gesundheitssystem. Vielmehr wird die zielgerichtete Weiterentwicklung der Gesundheitsversorgung durch sinnvolle Forschung auf dem Altar der Geschäftsinteressen geopfert. Die ePA-Daten werden genau die Quelle für Assoziations-Forschungsschrott werden wie viele andere Routinedaten auch.

 

Literatur:

  • Koller D, Løkhammer S, Goroshchuk O, et al. Observational and Genetic Analyses of Traumatic Experiences and Endometriosis. JAMA Psychiatry.Published online February 05, 2025. doi:10.1001/jamapsychiatry.2024.4694
  • Glasziou P, Chalmers I, Rawlins M, McCulloch P. When are randomised trials unnecessary? Picking signal from noise. BMJ. 2007 Feb 17;334(7589):349-51. doi: 10.1136/bmj.39070.527986.68
  • Doll R, Hill AB. Smoking and carcinoma of the lung; preliminary report. Br Med J. 1950 Sep 30;2(4682):739-48. doi: 10.1136/bmj.2.4682.739
  • Hill AB. The environment and disease: Association or causation? Proc R Soc Med. 1965 May;58(5):295-300. doi: 10.1177/003591576505800503
  • Lipsitch M, Tchetgen Tchetgen E, Cohen T. Negative controls: a tool for detecting confounding and bias in observational studies. Epidemiology. 2010 May;21(3):383-8. doi: 10.1097/EDE.0b013e3181d61eeb. Erratum in: Epidemiology. 2010 Jul;21(4):589
  • Chalmers I, Glasziou P. Avoidable waste in the production and reporting of research evidence. 2009 Jul 4;374(9683):86-9. doi: 10.1016/S0140-6736(09)60329-9.

 

 

Lesen Sie vom Autor zu diesem Thema auch:

ePA – der nächste Akt im Trauerspiel”, Observer Gesundheit, 8. Januar 2025,

„ePA – die Opt-out-Lösung ist so nicht vertretbar“, Observer Gesundheit, 3. Dezember 2024,

„Digitalistan oder der Tanz um das binäre Kalb“, Observer Gesundheit, 9. April 2024.


Observer Gesundheit Copyright
Alle politischen Analysen ansehen