HauptseiteTechnologieGesichtserkennungTechnischer Verfahrensablauf

Merkmalsaufnahme

Gegenwärtig funktionieren die meisten Systeme zur Gesichtserkennung 2-dimensional. Videoüberwachungssysteme sind in der Regel nur zwei-dimensional. Anstatt die existierende zwei-dimensionale Videoüberwachungsinfrastruktur kostspielig auszutauschen, versucht man zwei-dimensionale Gesichtserkennungssysteme zu verbessern. Die zweidimensionale Gesichtserkennung hat den Nachteil, dass durch Verwendung eines Fotos, das von der berechtigten Person angefertigt und vor die Kamera gehalten wird, das biometrische Gesichtserkennungssystem getäuscht werden kann. Hierbei war es bei älteren Verfahren nicht einmal erforderlich, das Foto in einer guten Qualität anzufertigen. Fotos eines normalen Laserdruckers reichten für Überwindungen aus. Mittlerweile sind die zweidimensionalen Verfahren verbessert worden sein, so dass eine derartige Überlistung nicht mehr so einfach möglich ist.

Ein Problem der zweidimensionalen Gesichtserkennung sind die Ausrichtung des Bildes des Gesichtes sowie die Lichtverhältnisse. Unterschiedliche Lichtverhältnisse führen zu signifikanten Problemen bei der Personenerkennung von zweidimensionalen Gesichtserkennungssystemen.

Im Gegensatz zur zwei-dimensionalen Gesichtserkennung verwendet die drei-dimensionale Gesichtserkennung die Gestalt und Form des Gesichts zur Erkennung. Die zusätzlichen Tiefen und Oberflächeninformationen führen zu einer höheren Genauigkeit der Verfahren. Verglichen mit der zwei-dimensionalen Gesichtserkennung hat die drei-dimensionale Gesichtserkennung den entscheidenden Vorteil, dass die Form des Gesichts von den Lichtverhältnissen und der Orientierung unabhängig ist. Der Nachteil besteht in der erhöhten Komplexität und in dem erhöhten Preis des Aufnahmegerätes. 

Ausserdem führt die Abtastung eines drei-dimensionalen Objekts zu zwangsläufigen Fehlern, da räumlich verdeckte Teile des Objekts nicht erfasst werden können und zu "Löchern" in der Oberfläche führen, die allerdings teilweise durch spezielle Algorithmen entfernt werden können.

Folgende Aufnahmeformen für die drei-dimensionale Gesichtserkennung sind in der Literatur zu finden: 

  • Laserscanner. Die Abtastung des Gesichts mit einem Laserscanner erlaubt eine zylindrische Repräsentation der Kopfstruktur.
  • Codierter Lichtansatz mit strukturierter Beleuchtung. Eine Alternative zur Methode der Stereo-Optik stellt die Nutzung strukturierten Lichtes dar. Hierbei wird ein Gitter durch Infrarotlicht auf das Gesicht projiziert. Aus der Deformation der Gitternetzlinien des vom Gesicht reflektierten und aufgenommenen Gitters wird die Oberflächenstruktur berechnet.
  • Stereo-Optik-Systeme versuchen, die "drei-dimensionalen Gesichtsinformationen" mit Hilfe von zwei oder mehreren Kameras zu generieren. Die Kameras werden kalibriert und anhand von zwei oder mehreren Bildern wird ein 3D-Bild errechnet.

Gesichtserkennung

Der erste Schritt bei der Gesichtserkennung besteht darin, aus einer Szene oder einem Bild ein Gesicht zu finden, dieses zu lokalisieren und vom Bildhintergrund zu trennen, um anschließend eine Erkennung zu ermöglichen. Die Probleme der Lokalisation wachsen bei verschiedenen Bildwinkeln und -größen sowie bei unterschiedlicher Beleuchtung. Die Verfahrensansätze zur Gesichtserkennung können in zwei Kategorien eingeteilt werden:

  1. die geometrische, merkmalsbasierende Erkennung: Unter der geometrischen, merkmalsbasierenden Erkennung versteht man die Erkennung des Gesichtes anhand individueller Merkmale wie Auge, Nase und Mund und deren Winkel und geometrischen Abstände zueinander. Für viele Gesichtserkennungsalgorithmen ist es von Vorteil, wenn definierte Punkte wie z.B. Augen, Gesichtskontur, Nase, Mund im Gesicht gefunden werden können. Allerdings muss festgehalten werden, dass die Lokalisation der zwei Fixpunkte "Augen" gelegentlich nicht ausgemacht werden kann, wenn sie geschlossen sind. Die aktuellen Verfahren sind wenig akkurat. In der Literatur ist man zu dem Schluss gekommen, dass das Verfahren der geometrischen Merkmale keine ausreichenden Ergebnisse liefert, sondern eher als Zusatz für die erscheinungsbasierenden Methoden zur Verbesserung der Trennschärfe verwendet werden sollte.

  2. die erscheinungsbasierende, holistische Erkennung: Die erscheinungsbasierenden Methoden können wiederum in lokale oder globale Methoden eingeteilt werden. Hierbei wird das Gesicht entweder als Ganzes oder als eine Serie von lokalen Repräsentationen betrachtet. Holistische Vergleichsverfahren nutzen das gesamte Gesicht als Rohdateninput für die Erkennung. Eines der häufig angewendeten Verfahren ist das des Eigenfaces, welches eine Erkennung auf Komponentenbasis durchführt.

In der Praxis werden meist beide Verfahrensansätze miteinander verbunden; dies wird oft als hybrider Ansatz bezeichnet. Durch die Kombination beider Verfahrensansätze wird eine Steigerung der Robustheit und der Genauigkeit erreicht.

Eigenfaces

Der Ansatz verfolgt die Idee, ein Gesichtsbild aus einer linearen Kombination anderer Basisgesichter, sogenannten Eigenfaces, zu approximieren. Die errechneten Eigenvektoren des Gesichtes repräsentieren eine Menge von Merkmalen, die die Variationen zwischen Gesichtern beschreiben. Diese werden dann "Eigenface" genannt. Die "Eigenfaces" werden durch eine Hauptkomponentenanalyse (Principal Component Analysis) aus einer Menge an Beispielbildern gewonnen. Der Vergleich mit "Eigenfaces" kann als Skalarprodukt zwischen den Koeffizienten des Referenzgesichtsbildes und den Koeffizienten des Probengesichtsbildes verstanden werden. Der Vorteil des Verfahrens wird darin gesehen, dass es relativ unempfindlich gegenüber Lichteinfall und Mimik ist, allerdings ergeben sich Probleme bei unterschiedlichen Gesichtsgrößen und aufgrund unterschiedlicher Blickwinkel. Verwandte Verfahrensansätze sind "Fischerfaces" und "Distance-From-Feature Space"

Template matching

Template Matching

Bei dem Verfahren des Template Matching wird die Ähnlichkeit zwischen einem Bild und einem Template berechnet. Ein Template ist eine vorgegebene Maske, die einem Bild oder einem Teil eines Bildes ähnlich ist. Die einfachste Form des Template Matching für die Gesichtererkennung ist es, ein Bild mit einem Template zu vergleichen, welches das ganze Gesicht oder Teile des Gesichts repräsentiert. Dabei kann jede Person in einer Datenbank durch eine Frontalaufnahme des Gesichts, sowie durch vier Templates für die Augen, den Mund, die Nase und das gesamte Gesicht (Region unterhalb der Augenbrauen) dargestellt werden. Für die Identifikation eines unbekannten Gesichts wird ein Vergleich dieses Gesichts mit allen in der Datenbank gespeicherten Bildern durchgeführt. Als Ergebnis erhält man einen Vektor, in dem die Ähnlichkeit der jeweiligen Merkmale enthalten ist. Die unbekannte Person wird dann als die Person mit der höchsten kumulativen Ähnlichkeit aller Merkmale identifiziert. Diese kann beispielsweise über die Summe der Fehlerquadrate berechnet werden. Die Qualität der Ergebnisse beim Template Matching hängt stark von der Qualität der verwendeten Maske ab. Die Maske muss bei möglichst vielen unterschiedlichen Personen "passen" und sollte möglichst unabhängig von Helligkeits- oder Kontraständerungen sein. Das größte Problem beim Template Matching ist jedoch, dass es sehr rechenaufwendig und somit zeitaufwendig ist.

Template Matching ist dann effektiv, wenn die jeweiligen Bilder gleiche Größe, Orientierung und Beleuchtung aufweisen wie die Referenzdaten.

Elastic Bunch Graph Matching

Elastic Bunch Graph Matching

Beim Elastic Graph Matching wird ein Gitternetz über das Gesicht gelegt und an den Knotenpunkten wie Augen-, Mundwinkel oder Nasenspitze ein kleiner lokaler Umkreis betrachtet. Das Gitternetz wird auch als "Labeled Graph" bezeichnet. An den Knoten werden Merkmale mit sogenannten "Jets" extrahiert. Diese "Jets" bestehen aus mehreren Gabor-Wavelets. Es gilt dann innerhalb des Vergleichsbildes diese Gitterpunkte (innerhalb von Toleranzgrenzen) aufzufinden, wobei die Relation der Punkte untereinander aufgrund der Gitterstruktur automatisch erhalten bleibt. Der Vergleichswert wird aus dem Grad der zur Wiedererkennung notwendigen Verbiegungen gewonnen.

Die bei der Gesichtsrepräsentation verwendeten Graphen sind objektangepasst, d.h. die Knoten sind an Punkten angebracht, von denen angenommen werden kann, dass sie gesichtsspezifische Informationen enthalten (z.B. Pupille, Nasenspitze, Kinn, Lippen, nicht aber Haar). Zusätzliche Knotenpunkte können vom System automatisch hinzugefügt werden, beispielsweise in der Mitte der Strecke zwischen Ohrläppchen und Pupille. Die Kanten des Gesichtsgraphen verbinden nicht alle Knoten untereinander, sondern werden nach zwei Kriterien ausgewählt. Zum einen werden benachbarte Knoten verbunden, zum anderen wird versucht, durch die Anzahl der Kanten den Graphen mit speziellen Deformationseigenschaften auszustatten: Knoten an wenig veränderlichen Gesichtsteilen sollen vergleichsweise starr, Knoten an durch Mimik stark veränderlichen Gesichtspunkten beweglich sein. Da Gesichter allgemein geometrische Variationen aufweisen, werden die Knotenabstände mit topologieerhaltenden dynamischen Modellen beschrieben. Bei einem Vergleich zweier Gesichter können die Knoten in gewissen Grenzen verschoben werden, damit eine bessere Übereinstimmung der an den korrespondierenden Knoten ermittelten Merkmale erreicht wird. Die Vergleichsfunktion ist dann eine gewichtete Summe aus dem Unterschied der Merkmale an den Knoten und einem topographischen Term, der die Verzerrung des Gitters quantifiziert.

Zwei Bilder ein und desselben Gesichts oder Gegenstands sind im Allgemeinen sehr verschieden, da sich jeweils eine andere Perspektive ergibt, gewisse Teile verdecken andere Teile, die Bildpunkte sind als Ganzes oder auch relativ zueinander verschoben. Um zwei Bilder vergleichen zu können, ist es wichtig zu wissen, welche Punkte der beiden Aufnahmen denselben Punkt des realen Gegenstands darstellen, d.h. welche Bildpunktepaare der zwei Aufnahmen miteinander korrespondieren.

Fingerabdruckschloss L2000

Biometrische Zutrittskontrolle ohne PC mit dem digiID IV zum Preis von 799,00 EUR zzgl. Versandkosten. Direkt zum Shop

BioLite Solo

Biometrische Zutrittskontrolle ohne PC mit dem BioLite Solo zum Preis von 590,00 EUR zzgl. Versandkosten. Direkt zum Shop