¿Cómo funciona la biometría de voz? ¿Es una prueba de mimetismo?

Básicamente, hay una señal que contiene tanto la identidad del altavoz como alguna otra información (sonidos que está haciendo el altavoz, ruido de fondo, distorsión del canal). El software biométrico de voz analiza la señal para factorizar todas las propiedades no importantes como el nivel de audio y produce un vector de características que corresponde a propiedades importantes.

Este análisis factorial se realiza con un marco de álgebra lineal genérico, allí hay muy pocos detalles específicos del discurso, básicamente representa todo con un vector real y luego solo encuentra partes “importantes” de él. Este vector se llama i-vector . Luego, las partes importantes se comparan con impresiones con algún clasificador como SVM o incluso regresión logística.

Si desea obtener conceptos básicos rápidamente, hay un libro muy bueno que cubre todo, desde la teoría matemática básica hasta detalles prácticos:

Fundamentos del reconocimiento de oradores: Homayoon Beigi: 9780387775913: Amazon.com: Libros

Para una introducción más rápida, consulte este tutorial

Un tutorial sobre verificación de oradores

Si está interesado en lo último en verificación de verificación de oradores

NIST 2014 i-Vector Machine Learning Challenge

En general, la biometría de voz no protege de la mímica. Si tiene aproximadamente 2-3 horas de grabaciones de voz de cierta persona, es extremadamente fácil emular la voz de la persona con síntesis de voz para que suene casi igual. Hubo varias publicaciones de investigación sobre el tema que podría interesarle estudiar:

Spoofing y contramedidas para la verificación automática de altavoces

El trabajo en [2] mostró que los personificadores no profesionales pueden adaptar fácilmente su voz para superar el ASV, pero solo cuando su voz natural ya es similar a la del objetivo.

Para la investigación en curso sobre el tema ver

Desafío de suplantación de identidad y contramedidas

El esfuerzo de investigación se concentró en el problema. Los resultados se publicarán en septiembre.

Related Content

Con 2 + 2, ¿cuál es su valor?

¿Qué es [matemáticas] (- 27) ^ {\ frac {1} {3}} [/ matemáticas]?

¿Qué tan probable es que un estudiante de matemáticas no pueda resolver los problemas de la OMI? ¿Hay miedo de la vergüenza de ser un doctorado en matemáticas? ¿Quién no puede resolver los problemas que pueden hacer los estudiantes de secundaria?

¿Por qué son importantes los functores adjuntos?

¿Cuál es el propósito de las matemáticas en las artes liberales?

¿Hay alguna buena conferencia de álgebra abstracta en línea que cubra la teoría del anillo / grupo / Galois lo suficientemente bien como para que yo pueda estudiarla por mi cuenta?

¿Cuál es la operación de escritura única más grande posible en una partición NTFS?

Si está hablando del reconocimiento de altavoces, el habla humana básica consta de dos elementos, la excitación y la información del tracto vocal. Esto forma la base de las características. Puede leer algunos temas interesantes como MFCC, GFCC e i-vectors. Sobre la parte de imitación de la pregunta, no estoy seguro, pero si tuviera que arriesgarme a adivinar, no es absolutamente una prueba de imitación. Tendría que leer sobre literatura relevante para eso. Espero que esto ayude.

Nickolay Shmyrev

More Interesting

¿Qué es una explicación intuitiva de una cuasi-categoría?

Si la magnitud de los vectores A, B y C son 3, 4 y 5 respectivamente, y si A + B = C, entonces ¿cuál será el ángulo entre A y C?

Cómo encontrar la solución general a la ecuación [matemáticas] x ^ 2y ^ {'} = x ^ 2y ^ 2 + xy + 1 [/ matemáticas]

¿Existe tal cosa como la verdadera aleatoriedad?

Si [matemáticas] 8x = 64 [/ matemáticas], ¿cuál es el valor de [matemáticas] x [/ matemáticas]?

¿Cuál es la prueba del último teorema de Fermat?

Si [matemática] | x | <1/2 [/ matemática] y [matemática] | y-2 | <1/2 [/ matemática], ¿cómo puedo probar que [matemática] 1 <2y / (yx) <5 [/matemáticas]?

¿Debo tomar un análisis complejo antes del análisis real?

Si b es la proporción media entre a y c, ¿cuál es la proporción media entre [matemáticas] (a ^ 2 + b ^ 2) \ text {y} (b ^ 2 + c ^ 2) [/ matemáticas]?

¿Cuántos enteros entre 1 y 1,000,000 son cuadrados perfectos pero no cubos perfectos?

¿Los genios saben todo sobre todas las materias de matemáticas?

¿Cuáles son algunos buenos consejos para elegir una cola para unirse?

¿En qué situaciones es deseable que un jugador pierda un juego en un torneo?

¿Qué es una prueba intuitiva del teorema de Dilworth?

¿Qué temas matemáticos debo dominar para competir en la OMI?

Web Analytics