Internacional. Investigadores de la Universidad HSE y la Universidad Estatal de Lingüística de Nizhny Novgorod (LUNN) han desarrollado un nuevo método basado en la inteligencia artificial para recopilar datos biométricos de voz al garantizar la calidad de las grabaciones de voz automáticas.
El método implica un algoritmo resistente al ruido de 10 dB o superior que puede funcionar en tiempo real y podría tener implicaciones significativas para el reconocimiento de voz.
Los hallazgos del investigador se presentan en un nuevo artículo publicado en Measurement Techniques titulado "Un método para medir la frecuencia de tono de las señales de voz para los sistemas de análisis acústico del habla". La baja calidad de las plantillas de referencia de voz, generalmente debido al ruido ambiental, es un factor limitante para la adopción generalizada de sistemas de identificación de voz, según el anuncio.
El método propuesto por el profesor Andrey Savchenko de la Universidad HSE y el profesor Vladimir Savchenko de LUNN puede reducir la tasa de error de los sistemas de identificación de voz al 2 por ciento a una relación señal-ruido de 10 dB o más, dicen.
Además, los investigadores propusieron utilizar un algoritmo que divide el habla grabado en cuadros cortos, midiendo la frecuencia de tono en cada uno de ellos. Su software evalúa la estabilidad de la pronunciación contra su nivel promedio y muestra la dependencia de la calidad del habla medida en el tiempo como una tabla de colores.
El sistema trata las partes iniciales de una grabación como una plantilla, otorgándoles un 100% de calidad. Si las frecuencias de tono estimadas de los siguientes cuadros de voz están más o menos estabilizadas, la grabación se verá de buena calidad. Si hay un amplio rango en los valores, el registro se considerará defectuoso. Tales fallas pueden ser causadas por una voz interferente con una frecuencia de tono diferente.
Según los informes, un importante banco de Rusia tiene interés en la tecnología y ha proporcionado grabaciones de su base de datos de voz para las pruebas iniciales.
Recientemente se pronostica que el mercado mundial de reconocimiento de voz y voz crecerá más de US$28 mil millones para 2026.
Deje su comentario