Anonymisierte und synthetisierte Daten zur Verbesserung der Gesundheitsversorgung in Deutschland
An dem gemeinsamen Forschungsprojekt KI-FDZ sind neben dem InGef das Forschungsdatenzentrum Gesundheit (FDZ) am Bundesinstitut für Arzneimittel und (BfArM), die AG Medizininformatik des Berlin Institute of Health (BIH) an der Charité- Universitätsmedizin Berlin, das Fraunhofer-Institut für Digitale Medizin MEVIS als Konsortialpartner beteiligt. Die Projektpartner freuen sich auf die enge Zusammenarbeit mit MOSTLY AI, die über einen Unterauftrag an das Projekt angebunden wurden.
KI-FDZ soll die sichere Nutzung von Gesundheitsdaten zu Forschungszwecken in Deutschland nachhaltig verbessern. Ziel ist die Generierung synthetischer sowie über klassische Methoden anonymisierter Daten, die eine nachträgliche Re-Identifikation der Originaldaten verhindern und dabei gleichzeitig die Nutzbarkeit der Daten wahren. So kann die Privatsphäre des Individuums, insbesondere bei hochsensiblen Gesundheitsdaten, geschützt und der Datenschutz gewährleistet werden. Die Anwendung klassischer Anonymisierungsverfahren auf die Gesundheitsdaten erfolgt durch die AG Medizininformatik am BIH. Die Synthetisierung der Gesundheitsdaten übernimmt die von MOSTLY AI entwickelte Software.
„Der Bedarf an innovativen Lösungen für eine sichere Nutzung von Gesundheitsdaten für die Forschung ist groß“, erläutert Tobias Hann, CEO von MOSTLY AI. „Die mit unserer Plattform generierten strukturierten synthetischen Daten sollen durch die beteiligten Einrichtungen bezüglich ihrer Nutzbarkeit für wissenschaftliche Analysen und ihres Identifikationsschutzes untersucht werden. Durch das Projekt sollen die Möglichkeiten für eine sichere Datenbereitstellung für Forschende verbessert werden. Wir freuen uns auf die Zusammenarbeit mit dem Projektkonsortium und darauf, einen wertvollen Beitrag zu KI-FDZ zu leisten.“
Jochen Walker, Geschäftsführer des InGef erklärt: „Bislang fehlt in Deutschland Evidenz, ob synthetische Krankenkassendaten als hochwertige Alternative zu anonymisierten Originaldaten eingesetzt werden können. Das Projekt soll aufzeigen welche Möglichkeiten synthetische Daten in diesem Kontext bieten können. Zentrale Herausforderung des Projektes werde es sein, die Sicherheit und den Schutz der Daten zu gewährleisten und gleichzeitig den ursprünglichen, relevanten Informationsgehalt zu erhalten. Dazu soll im Rahmen des Projektes auch untersucht werden, ob klassische Anonymisierungs- bzw. Synthetisierungsverfahren in Kombination mit der Nutzung der Open-Source Datenextraktionsplattform Conquery unter Wahrung der datenschutzrechtlichen Anforderung umsetzbar sind. Damit gehen wir der Frage nach, ob realitätsnahe Versorgungsforschung bei maximalem Datenschutz der Gesundheitsdaten gefördert werden kann.“