Page principalTechnologieReconnaissance d'orateur

Sur la reconnaissance d'orateur

Dans le domaine de la reconnaissance d'orateur, on distingue entre des informations de niveaux de niveau défoncé et de low. Les informations de niveaux défoncé sont des informations comme le dialecte, l'accent, la manière, comme on parle et comme la constitution subjective de l'orateur est. Les informations de niveaux Low sont des valeurs comme de la hauteur d'argile, durée de période, rythme, argile, spektrale Magnitude, déviation d'amplitude, fréquences, domaine de fréquence et largeur de bande de la voix de l'utilisateur. Sprecherverifikationssystemen utilise ces caractères pour la reconnaissance. Par contre, des hommes utilisent des informations de niveaux défoncé pour la reconnaissance. Reconnaissance d'orateur saisit les caractéristiques comme du rythme, Pitch et de la fréquence de tout le monde individu. Un microphone ou un téléphone régulier est utilisé pour l'enregistrement de la langue. A l'augmentation de la qualité du périphérique d'entrée (microphone/téléphone), la précision de reconnaissance augmente.

La variation des caractères qui résulte de personnes différentes est appelée Varianz de porte-parole Inter. Le Varianz de porte-parole Inter est causé par les caractéristiques différentes chez différents orateurs. Le Varianz de porte-parole Intra apparaît si derrière l'un l'autre, un orateur prononce à plusieurs reprises le même mot ou la même phrase mais il ne peut pas la répéter avec la même accentuation, la même intonation. Une autre manière du Varianz de porte-parole Intra apparaît si un orateur prononce le même mot ou la même phrase mais avec la même accentuation ou de la même manière, d'essai, en essai, elle ne la répète pas. Le Varianz de porte-parole Intra contient différentes vitesses de parler, l'état de l'orateur emotionellen et les environs de bruit. Le Varianz de porte-parole Intra est la cause principale de la faiblesse de performance de systèmes de reconnaissance d'orateur sciences nat métriques.

Pour cette raison, c'est souhaitable de choisir les paramètres ainsi qu'ils présentent une Varianz plus basse de porte-parole Intra et une Varianz de porte-parole Inter haute. Dans beaucoup d'utilisations à la reconnaissance d'orateur, il est possible de réduire le Varianz de porte-parole Intra en invitant l'utilisateur à répéter l'ensemble de données de référence déposé qui contient le texte identique ou les mêmes mots. Il s'agit dans le cas de cela de la chute de Sprecherverifikationsverfahren dépendants du texte.

Il y a une multitude de tentatives de procédé pour la reconnaissance d'orateur. Les méthodes de la reconnaissance d'orateur se laissent dans dépendant du texte (le texte statique ou les systèmes de phrase solide et les méthodes indépendantes du texte répartissent. La reconnaissance de nouveau dépendante du texte s'appuie sur une phrase de texte déposée avant et connue de l'orateur. Par contre, la reconnaissance d'orateur indépendante du texte s'appuie sur une phrase de texte qui est complètement libre et qui peut différer de la phrase de texte déposée dans le système. Les méthodes indépendantes du texte ont besoin de plus de données d'entraînement que des méthodes dépendantes du texte en général. Les méthodes dépendantes du texte sont en général plus exactes que les procédés indépendants du texte et elles exigent la coopération de l'utilisateur.