Die vom KI-Agenten gelernte Policy leitet sich daher von den Trainingsdaten, der Repräsentation des Zustands der Umwelt und dem Reward ab. Dies fördert Sicherheit sowie Effizienz und erlaubt das Verhalten an mehrere gewünschte Ziele anzupassen.
Verlässlich heißt Transparent und Sicher
Die Flexibilität im Design des Verhaltens eröffnet die Chance dieses für die Anwendung maßzuschneidern. Um verlässlich zu sein, sind zusätzliche Schritte für die Transparenz und Sicherheit zu unternehmen. Transparenz wird durch nachvollziehbare Aktionen und verständliche Entscheidungen der KI eingeführt. Aus dem gelernten Verhalten werden hierarchische Regeln extrahiert. Sicherheit wird umgesetzt durch explizite Erkennung und Behandlung von Risiken. Nötigenfalls kann die Sicherheit durch formallogische Verifikation von extrahierten Strategien in einer formalen Repräsentation des Anwendungsszenarios und der Sicherheitsbedingungen erfolgen. Durch eine ganzheitliche Entwurfsmethodik, welche die Algorithmen transparent und sicher macht, entsteht eine verlässliche KI.
Anwendungsfall: Autonomes Fahren
Verlässliches Reinforcement Learning lässt sich am besten in einem Framework demonstrieren, das ganz auf Sicherheit ausgerichtet ist. Daher entwickeln wir im ADA Lovelace Center for Analytics, Data and Applications einen verlässlichen Fahrassistenten, um unsere Technologie zu zeigen.
Die typische Verarbeitungskette eines autonomen Fahrzeugs enthält Komponenten zur Perzeption, Verhaltensplanung, Bewegungsplanung sowie Aktoren. Wir fokussieren uns hierbei darauf, mit Reinforcement Learning die Verhaltensplanung (Behavioral Plannning) umzusetzen.