DB Podcast

Fraunhofer-Institut für Digitale Medizin Biomarker-Erkennung: Neues Modell ermöglicht KI-Training mit Minimum an Daten

Verantwortliche:r Redakteur:in: Konstantin Pfliegl 3 min Lesedauer

Anbieter zum Thema

Ein neuer Ansatz der Fraunhofer-Forscher ermöglicht es, KI für die Biomarker-Erkennung mit einem Minimum an Daten zu trainieren. Damit überwinden sie die Datenknappheit in der medizinischen Bildgebung.

(Bild:  zakiroff / AdobeStock)
(Bild: zakiroff / AdobeStock)

Künstliche Intelligenz kann in der Medizin Krankheiten frühzeitig diagnostizieren, Therapien verbessern und das medizinische Personal entlasten. Ein Beispiel, bei dem KI helfen kann, ist die Biomarker-Erkennung. Bei Biomarkern handelt es sich um eindeutige Indikatoren, mit denen sich zum Beispiel Krebserkrankungen in pathologischen Bildern aufspüren lassen.

Tissue Concepts-Foundation Model: Das Grundgerüst wird gleichzeitig auf verschiedene Aufgaben (Multitasking) vortrainiert. Erst danach folgen aufgabenspezifische Informationen.(Bild:  Fraunhofer MEVIS)
Tissue Concepts-Foundation Model: Das Grundgerüst wird gleichzeitig auf verschiedene Aufgaben (Multitasking) vortrainiert. Erst danach folgen aufgabenspezifische Informationen.
(Bild: Fraunhofer MEVIS)

Doch eine KI ist immer nur so gut, wie sie trainiert wurde. Doch in der medizinischen Bildgebung haben Forscher mit einer Datenknappheit zu kämpfen. Forschern des Fraunhofer-Instituts für Digitale Medizin MEVIS ist es in Zusammenarbeit mit der RWTH Aachen, der Universität Regensburg und der Hannover Medical School gelungen, ein Modell zu entwickeln, das Gewebeproben anhand eines Bruchteils der üblichen Trainingsdatensätze schnell, zuverlässig und ressourceneffizient analysiert.

Biomarker-Erkennung: Weg von großen Datenmengen

Klassische Basismodelle, etwa Sprachmodelle wie ChatGPT, werden selbstüberwacht mit großen Datensätzen trainiert. Diese liegen jedoch bei medizinischen Bildanalysen meist nicht vor. Tatsächlich stellen die geringen Datenmengen in klinischen Studien eine große Herausforderung für die Künstliche Intelligenz dar.

Das erschwert es, vorhandene Muster und damit diagnostisch relevante Merkmale verlässlich aufzuspüren. Um Künstliche Intelligenz effektiv zu trainieren, werden daher in der Regel große Mengen an Beispiel-Bildern unterschiedlicher Herkunft benötigt. Dabei misst jeder Gewebeschnitt typischerweise mehrere Gigabyte, enthält Tausende unterschiedlicher Zellen und spiegelt doch nur einen winzigen Bruchteil der beschriebenen Variabilität wider.

Erst Grundausbildung, dann Spezialisierung

Der Lösungsansatz der Fraunhofer-Forscher basiert auf überwachtem Vortraining. „Wir entwickeln eine Grundlagenschulung für die KI nach dem Vorbild der Ausbildung, die Pathologen durchlaufen. Sie müssen auch nicht von Fall zu Fall neu lernen, was ein Zellkern ist. Das ist Lehrbuchwissen. Einmal erfasst, sind diese Konzepte vorhanden und auf verschiedene Krankheiten übertragbar“, erklärt Fraunhofer MEVIS-Experte Dr. Johannes Lotz.

Analog dazu erlernt das KI-Modell in seiner Grundausbildung aus einer breiten Sammlung von Gewebeschnitt-Bildern mit verschiedenen Fragestellungen allgemeine Merkmale und Gesetzmäßigkeiten, sogenannte Tissue Concepts. In der Kombination dieser Aufgabenstellungen entstehen die großen Datenmengen, die für das Training eines robusten KI-Basismodells benötigt werden. In einem zweiten Schritt werden die gelernten Konzepte für eine spezifische Fragestellung genutzt. Auf diese Weise können die Algorithmen mit deutlich weniger Daten Biomarker identifizieren, die etwa verschiedene Tumorarten unterscheiden.

Bildregistrierungs-Verfahren Histokat-Fusion: Überträgt Annotationen aus zwei histologischen Färbungen aufeinander.(Bild:  Fraunhofer MEVIS)
Bildregistrierungs-Verfahren Histokat-Fusion: Überträgt Annotationen aus zwei histologischen Färbungen aufeinander.
(Bild: Fraunhofer MEVIS)

Zudem nutzt das Team das am Institut entwickelte Bildregistrierungsverfahren HistokatFusion. Es bietet die Möglichkeit, automatisch annotierte Trainingsdaten etwa aus immunhistochemischen Gewebefärbungen zu generieren, die Proteine oder andere Strukturen mit Hilfe von markierten Antikörpern sichtbar machen. Dazu kombiniert es Informationen aus mehreren histopathologischen Bildern. Diese automatisch erzeugten Markierungen bauen die Fachleute in das Training ihres Modells ein.

Biomarker-Erkennung mit nur sechs Prozent der Trainingsdaten

Der neue Ansatz der Forscher zeigt: In Vergleichstests mit klassischen, nicht-überwacht geschulten Modellen kommen die Fraunhofer-Fachleute mit lediglich sechs Prozent der Trainingsdaten aus. „Da die Anzahl der Trainingsdaten in diesem Bereich des Deep Learning mit Trainingsaufwand und Rechenleistung korreliert, werden auch nur etwa sechs Prozent der Ressourcen generell benötigt. Zudem brauchen wir gerade einmal 160 Stunden Training – ein ganz entscheidender Kostenfaktor. So können wir mit viel weniger Aufwand ein gleichwertiges Modell trainieren“, so Wissenschaftler Lotz.

Die Forscher veröffentlichen das vortrainierte Modell und den Code für das weiterführende Lernen auf verschiedenen Plattformen. So können Fachleute es für nicht-kommerzielle Zwecke nutzen und damit eigene Lösungen entwickeln. Das Team kooperiert darüber hinaus mit klinischen Partnern, um die Lösung in die Zulassung für die medizinische Anwendung zu überführen und sie systematisch zu validieren. 

Die Experten am Fraunhofer MEVIS sind sich sicher: Sobald sie im Klinikalltag ankommen, verringern Systeme mit ihrem Basismodell die Arbeitsbelastung in der Pathologie und verbessern den Therapieerfolg.

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung