Nachvollziehbare KI zur multimodalen Zustandserkennung

Multimodale Erkennung von kognitiver Überforderung

© NDABCREATIVITY - AdobeStock

In vielen Anwendungsbereichen kann eine Erfassung von affektiven und kognitiven Zuständen vorteilhaft sein. Beispielsweise in Bereichen wie Usability Testing kann eine Zustandserkennung eine bessere Einsicht über die Wirkung eines Produktes auf den Nutzer schaffen und Auskunft über dessen eventuelle Überforderung mit dem Produkt geben.

Allerdings werden einige Zustände äußerst subtil geäußert, sodass ihre Erfassung eine große Herausforderung darstellt. So reicht eine Modalität, z.B. Video, nicht aus, um eine kognitive Überforderung robust zu erkennen. Erst durch die Fusion von unterschiedlichen Modalitäten, wie Blickerfassung und verschiedenen Biosignalen, kann dies ermöglicht werden.

Die Anforderungen und Modalitäten können sich je nach Einsatzszenario ändern. Auch können Störfaktoren die Signale beinträchtigen und Unsicherheiten in der Erfassung des Zustands erzeugen.

Das Ziel dieser Applikation ist es daher ein modulares und robustes System zur multimodalen Zustandserkennung zu entwickeln. Hierfür spielt neben der Datenfusion insbesondere die Quantifizierung von Unsicherheiten eine wichtige Rolle, die eine Beurteilung der Zuverlässigkeit einzelner Modalitäten ermöglicht, um diese entsprechend in die Gesamtbeurteilung einfließen zu lassen.

 

Zusammenspiel der Kompetenzen für ein geeignetes System

Für die Entwicklung eines robusten multimodalen Systems zur Erkennung von kognitiven und affektiven Zuständen wird ein breites Spektrum an Kompetenzen benötigt.

Sequenzbasiertes Lernen wird genutzt, um Datenströme mit einer zeitlichen Dimension analysieren zu können. Hierfür kommt eine automatische Merkmalsextraktion mithilfe von neuronalen Netzen zum Einsatz. Im Rahmen der Applikation wurde hierfür auch eine Netzwerkarchitektur entwickelt, die für die Analyse von EKG-Signalen optimiert wurde.

Jedoch können Bewegungsartefakte oder sonstige Störfaktoren die Signale beeinflussen, sodass sich diese weniger für die Erfassung des Zustands eignen. Das System soll in der Lage sein, dies zu erkennen und bei der Fusion der einzelnen Signale zu berücksichtigen. Hierfür wird im Rahmen von Erklärbarem Lernen versucht Einzelinterpretationen der Modalitäten durch eine Unsicherheitsquantifizierung anzureichern. Dies soll es ermöglichen das System robuster zu machen, aber auch das Vertrauen in das System zu erhöhen.

Im Rahmen dieser Applikation steht insbesondere die Erkennung Kognitiver Überlastung im Vordergrund. Die Notwendigkeit einer Erkennung dieses Zustands lässt sich in unterschiedlichen Anwendungsfällen, wie Usability Testing oder Mensch-Computer-Interaktion, feststellen. Infolgedessen werden Daten für die kognitive Überforderung in verschiedenen Szenarien aufgenommen. In Zusammenarbeit mit Experten im Bereich der Stressforschung werden die Daten annotiert und diesen dadurch eine entsprechende Bedeutung (Semantik) gegeben. In den nächsten Schritten sollen Modelle mit den gesammelten Daten trainiert und in anwendungsnahen Szenarien validiert werden.