Ein neuer Ansatz der Fraunhofer-Forscher ermöglicht es, KI für die Biomarker-Erkennung mit einem Minimum an Daten zu trainieren. Damit überwinden sie die Datenknappheit in der medizinischen Bildgebung.
(Bild: zakiroff / AdobeStock)
Künstliche Intelligenz kann in der Medizin Krankheiten frühzeitig diagnostizieren, Therapien verbessern und das medizinische Personal entlasten. Ein Beispiel, bei dem KI helfen kann, ist die Biomarker-Erkennung. Bei Biomarkern handelt es sich um eindeutige Indikatoren, mit denen sich zum Beispiel Krebserkrankungen in pathologischen Bildern aufspüren lassen.
Tissue Concepts-Foundation Model: Das Grundgerüst wird gleichzeitig auf verschiedene Aufgaben (Multitasking) vortrainiert. Erst danach folgen aufgabenspezifische Informationen.
(Bild: Fraunhofer MEVIS)
Doch eine KI ist immer nur so gut, wie sie trainiert wurde. Doch in der medizinischen Bildgebung haben Forscher mit einer Datenknappheit zu kämpfen. Forschern des Fraunhofer-Instituts für Digitale Medizin MEVIS ist es in Zusammenarbeit mit der RWTH Aachen, der Universität Regensburg und der Hannover Medical School gelungen, ein Modell zu entwickeln, das Gewebeproben anhand eines Bruchteils der üblichen Trainingsdatensätze schnell, zuverlässig und ressourceneffizient analysiert.
Biomarker-Erkennung: Weg von großen Datenmengen
Klassische Basismodelle, etwa Sprachmodelle wie ChatGPT, werden selbstüberwacht mit großen Datensätzen trainiert. Diese liegen jedoch bei medizinischen Bildanalysen meist nicht vor. Tatsächlich stellen die geringen Datenmengen in klinischen Studien eine große Herausforderung für die Künstliche Intelligenz dar.
Das erschwert es, vorhandene Muster und damit diagnostisch relevante Merkmale verlässlich aufzuspüren. Um Künstliche Intelligenz effektiv zu trainieren, werden daher in der Regel große Mengen an Beispiel-Bildern unterschiedlicher Herkunft benötigt. Dabei misst jeder Gewebeschnitt typischerweise mehrere Gigabyte, enthält Tausende unterschiedlicher Zellen und spiegelt doch nur einen winzigen Bruchteil der beschriebenen Variabilität wider.
Der Lösungsansatz der Fraunhofer-Forscher basiert auf überwachtem Vortraining. „Wir entwickeln eine Grundlagenschulung für die KI nach dem Vorbild der Ausbildung, die Pathologen durchlaufen. Sie müssen auch nicht von Fall zu Fall neu lernen, was ein Zellkern ist. Das ist Lehrbuchwissen. Einmal erfasst, sind diese Konzepte vorhanden und auf verschiedene Krankheiten übertragbar“, erklärt Fraunhofer MEVIS-Experte Dr. Johannes Lotz.
Analog dazu erlernt das KI-Modell in seiner Grundausbildung aus einer breiten Sammlung von Gewebeschnitt-Bildern mit verschiedenen Fragestellungen allgemeine Merkmale und Gesetzmäßigkeiten, sogenannte Tissue Concepts. In der Kombination dieser Aufgabenstellungen entstehen die großen Datenmengen, die für das Training eines robusten KI-Basismodells benötigt werden. In einem zweiten Schritt werden die gelernten Konzepte für eine spezifische Fragestellung genutzt. Auf diese Weise können die Algorithmen mit deutlich weniger Daten Biomarker identifizieren, die etwa verschiedene Tumorarten unterscheiden.
Bildregistrierungs-Verfahren Histokat-Fusion: Überträgt Annotationen aus zwei histologischen Färbungen aufeinander.
(Bild: Fraunhofer MEVIS)
Zudem nutzt das Team das am Institut entwickelte Bildregistrierungsverfahren HistokatFusion. Es bietet die Möglichkeit, automatisch annotierte Trainingsdaten etwa aus immunhistochemischen Gewebefärbungen zu generieren, die Proteine oder andere Strukturen mit Hilfe von markierten Antikörpern sichtbar machen. Dazu kombiniert es Informationen aus mehreren histopathologischen Bildern. Diese automatisch erzeugten Markierungen bauen die Fachleute in das Training ihres Modells ein.
Biomarker-Erkennung mit nur sechs Prozent der Trainingsdaten
Der neue Ansatz der Forscher zeigt: In Vergleichstests mit klassischen, nicht-überwacht geschulten Modellen kommen die Fraunhofer-Fachleute mit lediglich sechs Prozent der Trainingsdaten aus. „Da die Anzahl der Trainingsdaten in diesem Bereich des Deep Learning mit Trainingsaufwand und Rechenleistung korreliert, werden auch nur etwa sechs Prozent der Ressourcen generell benötigt. Zudem brauchen wir gerade einmal 160 Stunden Training – ein ganz entscheidender Kostenfaktor. So können wir mit viel weniger Aufwand ein gleichwertiges Modell trainieren“, so Wissenschaftler Lotz.
Die Forscher veröffentlichen das vortrainierte Modell und den Code für das weiterführende Lernen auf verschiedenen Plattformen. So können Fachleute es für nicht-kommerzielle Zwecke nutzen und damit eigene Lösungen entwickeln. Das Team kooperiert darüber hinaus mit klinischen Partnern, um die Lösung in die Zulassung für die medizinische Anwendung zu überführen und sie systematisch zu validieren.
Die Experten am Fraunhofer MEVIS sind sich sicher: Sobald sie im Klinikalltag ankommen, verringern Systeme mit ihrem Basismodell die Arbeitsbelastung in der Pathologie und verbessern den Therapieerfolg.
Stand: 16.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die WIN-Verlag GmbH & Co. KG, Chiemgaustraße 148, 81549 München einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://kontakt.vogel.de/de/win abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.