Eine wesentliche Herausforderung bei der Entwicklung einer KI-basierten Diagnoseunterstützung liegt in der starken Heterogenität der digitalen Gewebeschnitte, welche zum Beispiel durch Unterschiede in der Probenpräparation zwischen verschiedenen Kliniken oder durch Einsatz von Gewebescannern verschiedener Hersteller resultieren. Dadurch unterscheiden sich die Aufnahmen mitunter stark beispielsweise im Farbton, der Sättigung oder der Auflösung.
Wünschenswert ist zudem eine leichte Anpassbarkeit der Verfahren anhand lediglich einer geringen Anzahl von Beispielen, für welche eine Expertenbewertung vorliegt, an neue Fragestellungen in der klinischen Forschung. In der digitalen Pathologie stehen zwar große Datenmengen zur Verfügung, die Bereitstellung von Expertenwissen für diese Daten z.B. in Form von Markierungen in den Daten unter Angabe des Gewebetyps, wie sie für überwachte Lernansätze erforderlich ist, ist allerdings sehr zeitintensiv.
Beide Aspekte werden in unserer Forschung adressiert. Am Anwendungsbeispiel der Diagnostik von kolorektalen Adenokarzinomen (Darmkrebs) werden gezielt robuste und anpassbare KI-Verfahren zur automatischen Erkennung von Gewebetypen (wie beispielsweise Tumorgewebe oder Muskelgewebe) entwickelt und erforscht.
Mit Methoden des Few Data und Few Labels Learning die digitale Pathologie revolutionieren
Die Basis zur automatischen Segmentierung eines Gewebeschnitts in verschiedene Gewebeklassen bildet ein sogenanntes „convolutional neural network“ (CNN). Dieses neuronale Netz wird anhand von Beispielbildern trainiert. Zur Evaluation der Robustheit wurden beispielsweise Gewebeschnitte mit sechs verschiedenen Scannern digitalisiert. Auf diesen Daten wird die Klassifikationsgüte der trainierten Modelle verglichen.
Ein Ansatz robuste Modelle zu generieren ist die domänenspezifische Datenaugmentierung, wie sie in der Kompetenzsäule Few Data Learning des ADA Lovelace Centers weiterentwickelt wird. Bei der Datenaugmentierung werden aus vorliegenden Referenzbildern künstlich weitere Bilder durch vorgegebene Transformationen, wie zum Beispiel Helligkeits- oder Farbtonänderungen, generiert. Die Grundidee dabei ist, die Heterogenität in der späteren Anwendung bereits beim Training durch die gezielte Manipulation der Trainingsbilder zu berücksichtigen. Es werden verschiedene Augmentierungstechniken und deren Kombinationen verglichen. Der Fokus liegt dabei auf Veränderungen der Farbwerte des Bildes. So werden beispielsweise der Kontrast und die Sättigung der Bilder geändert, aber auch anwendungsspezifische Farbveränderungen kommen zum Einsatz.
Ein weiterer Fokus liegt auf der Untersuchung von sog. Few-Shot Verfahren aus der Kompetenzsäule Few Labels Learning. Bei diesem Verfahren können nachträglich die Klassen (in unserem Fall Gewebeklassen wie z. B. Tumor), welche unterschieden werden sollen, anhand von wenigen annotierten Daten angepasst werden, ohne dass ein erneutes Training des neuronalen Netzes erforderlich ist (Kompetenzsäule Few Label Learning). Konkret kommen verschiedene Varianten von sog. Prototypical-Networks zum Einsatz. Auch hier ist der Grundbaustein ein CNN. Durch dieses Verfahren können nun auch neue Klassen nachträglich hinzugefügt werden. Man benötigt jeweils nur wenige Beispiele (Vertreter) der neuen Klasse und berechnet anhand dieser eine Klassenrepräsentation.
Es hat sich gezeigt, dass eine Kombination der beiden Verfahren von Vorteil ist und die Robustheit der Prototypical-Networks auf neuen Daten erhöht.