Detektion und Analyse von Objekten und Gesichtern

Fraunhofer-Institut für Integrierte Schaltungen IIS

Technologie

Technologie

Bei den Verfahren zur Detektion und Analyse wird insbesondere darauf geachtet, dass sie robust und effizient arbeiten und generisch für verschiedene Objekte anwendbar sind.

Anforderungen

Moderne Systeme zur Objektdetektion und –analyse sollten unter verschiedensten Bedingungen einsetzbar sein. Hieraus ergeben sich einige Anforderungen, die an ein solches System gestellt werden müssen:

  • Beliebiger Hintergrund
  • Variable Größe des Objekts
  • Viele Objekte gleichzeitig
  • Keine Farbinformation (nur Grauwerte)
  • Robust gegen Beleuchtungsänderungen
  • Robust gegen Verdeckungen
  • Echtzeitfähig

Objektstrukturen als Merkmale

Mit Hilfe sogenannter Merkmale, die Strukturen und Konturen von Gesichtern und anderen Objekten abbilden, wird eine große Robustheit bei beliebigem sich ändernden Hintergrund und unterschiedlichsten Beleuchtungsbedingungen erreicht. Darüber hinaus ist die Berechnung dieser Merkmale hoch-optimiert und arbeitet sehr effizient.

Maschinelles Lernen

Der Einsatz von Verfahren aus dem Bereich des maschinellen Lernens (Lernalgorithmen) ermöglicht die generische Anwendbarkeit auf Objekte, in dem die Verfahren anhand der Objektstrukturen repräsentative Eigenschaften erlernen. Lernalgorithmen fördern zusätzlich die Robustheit, da sie Problemstellungen generalisieren können. Hierdurch können auch in unbekannten Situationen zuverlässig Entscheidungen getroffen werden.

Gesichtsdetektion und Feinanalyse im Detail

Im Forschungs- und Entwicklungsbereich der Objektdetektion bildet die Detektion und Analyse von Gesichtern eine unserer Kerntechnologien. Die Ergebnisse der Entwicklungen münden in unserer Softwarelösung SHORE™. Genauere Beschreibungen zur SHORE™ und den Detektions- und Analysemöglichkeiten finden sie hier .

Die Basis für die vielfältigen Möglichkeiten zur Detektion und Analyse bilden langjährige Erfahrungen in diesem Bereich und ein großer Datenbestand für das maschinelle Lernen. Für das sogenannte Training kann auf einen Datensatz von über 10`000 annotierten Gesichtern zurückgegriffen werden. In Kombination mit den strukturbasierten Merkmalen und Lernalgorithmen sind wir in der Lage sogenannte Modelle zu trainieren, die sehr hohe Erkennungsraten erreichen:

Frontale Gesichtsdetektion91,5% Detektionsrate mit 10 FehldetektionenCMU+MIT Datensatz
Geschlechtserkennung94,3% ErkennungsrateBioID Datensatz
Altersschätzung6,85 Mittlerer Absoluter Fehler in JahrenFG-NET Datensatz

Diverse algorithmische und hardwarespezifische Optimierungen rechenintensiver Komponenten ermöglichen die Verarbeitung von Bildern in Echtzeit. Folgende Tabelle zeigt die Ergebnisse der Verarbeitungsgeschwindigkeit für verschiedene Konfigurationen ( Intel Core 2 Duo 6420 (1 Kern genutzt); BioID Datensatz, 384 x 286 Pixel).

Gesichtsdetektion XXXX
Augenfeinsuche XXX
Geschlechtserkennung  XX
Analyse von 4 Gesichtsausdrücken    X
Zeit pro Bild [ms]  9,4 19,3 19,9 22,0
Bilder pro Sekunden [fps] 107,5 51,850,345,5