HauptseiteTechnologieSprechererkennung

Ã?Å?ber Sprechererkennung

Im Bereich der Sprechererkennung unterscheidet man zwischen high-level- und low-level-Informationen. High-level-Informationen sind Informationen wie der Dialekt, der Akzent, die Art und Weise wie gesprochen wird und wie die subjektive Verfassung des Sprechers ist. Low-level-Informationen sind Werte wie Tonh�¶he, Periodendauer, Rhythmus, Ton, spektrale Magnitude, Amplitudenausschlag, Frequenzen, Frequenzbereich und Bandbreite der Stimme des Nutzers. Diese Merkmale werden von Sprecherverifikationssystemen zur Erkennung verwendet. High-level-Informationen hingegen werden von Menschen zur Erkennung genutzt.

Sprechererkennung erfasst die Charakteristika wie Rhythmus, Pitch und Frequenz eines jeden Individuums. Zur Aufnahme der Sprache wird ein Mikrofon oder ein regul�¤res Telefon verwendet. Bei Erh�¶hung der Qualit�¤t des Eingabeger�¤ts (Mikrofon/Telefon) steigt die Erkennungsgenauigkeit.

Die Variation der Merkmale, die durch unterschiedliche Personen entsteht, wird Inter-Sprecher-Varianz genannt. Die Inter-Sprecher-Varianz wird verursacht durch unterschiedliche Charakteristika bei verschiedenen Sprechern.

Die Intra-Sprecher-Varianz tritt auf, wenn ein Sprecher das gleiche Wort oder denselben Satz mehrfach hintereinander ausspricht, aber ihn nicht mit der gleichen Betonung, dem gleichen Tonfall wiederholen kann. Eine andere Art der Intra-Sprecher-Varianz entsteht, wenn ein Sprecher dasselbe Wort oder denselben Satz ausspricht, aber ihn nicht mit der gleichen Betonung oder auf die gleiche Weise von Versuch zu Versuch wiederholt. Die Intra-Sprecher-Varianz enth�¤lt verschiedene Sprechgeschwindigkeiten, den emotionellen Zustand des Sprechers und die Ger�¤uschumgebung. Die Intra-Sprecher-Varianz ist die Hauptursache f�¼r die Performance-Schw�¤che von biometrischen Sprechererkennungssystemen.

Deshalb ist es w�¼nschenswert, die Parameter so zu w�¤hlen, dass sie eine niedrigere Intra-Sprecher-Varianz und eine hohe Inter-Sprecher-Varianz aufweisen. In vielen Anwendungen zur Sprechererkennung ist es m�¶glich, die Intra-Sprecher-Varianz zu reduzieren, indem der Nutzer aufgefordert wird, den hinterlegten Referenzdatensatz zu wiederholen, der den identischen Text beziehungsweise die gleichen W�¶rter enth�¤lt. Hierbei handelt es sich um den Fall von textabh�¤ngigen Sprecherverifikationsverfahren.

Es gibt eine Vielzahl von Verfahrensans�¤tzen f�¼r die Sprechererkennung. Die Methoden der Sprechererkennung lassen sich in textabh�¤ngige (statischer Text, oder fest-phrase-Systeme und textunabh�¤ngige Methoden einteilen. Die textabh�¤ngige Wiedererkennung basiert auf einer vorher hinterlegten und dem System bekannten Textphrase des Sprechers. Die textunabh�¤ngige Sprechererkennung hingegen basiert auf einer v�¶llig ungebundenen Textphrase, die von der im System hinterlegten Textphrase abweichen kann. Textunabh�¤ngige Methoden ben�¶tigen in der Regel mehr Trainingsdaten als textabh�¤ngige Methoden. Textabh�¤ngige Methoden sind im Allgemeinen genauer als textunabh�¤ngige Verfahren und erfordern die Kooperation des Benutzers.

Fingerabdruckschloss L2000

Biometrische Zutrittskontrolle ohne PC mit dem digiID IV zum Preis von 799,00 EUR zzgl. Versandkosten. Direkt zum Shop

BioLite Solo

Biometrische Zutrittskontrolle ohne PC mit dem BioLite Solo zum Preis von 590,00 EUR zzgl. Versandkosten. Direkt zum Shop