Internacional. Investigadores de la Universidad HSE y la Universidad Estatal de Lingüística de Nizhny Novgorod (LUNN) han desarrollado un nuevo método basado en la inteligencia artificial para recopilar datos biométricos de voz al garantizar la calidad de las grabaciones de voz automáticas.

El método implica un algoritmo resistente al ruido de 10 dB o superior que puede funcionar en tiempo real y podría tener implicaciones significativas para el reconocimiento de voz.

Los hallazgos del investigador se presentan en un nuevo artículo publicado en Measurement Techniques titulado "Un método para medir la frecuencia de tono de las señales de voz para los sistemas de análisis acústico del habla". La baja calidad de las plantillas de referencia de voz, generalmente debido al ruido ambiental, es un factor limitante para la adopción generalizada de sistemas de identificación de voz, según el anuncio.

- Publicidad -

El método propuesto por el profesor Andrey Savchenko de la Universidad HSE y el profesor Vladimir Savchenko de LUNN puede reducir la tasa de error de los sistemas de identificación de voz al 2 por ciento a una relación señal-ruido de 10 dB o más, dicen.

Además, los investigadores propusieron utilizar un algoritmo que divide el habla grabado en cuadros cortos, midiendo la frecuencia de tono en cada uno de ellos. Su software evalúa la estabilidad de la pronunciación contra su nivel promedio y muestra la dependencia de la calidad del habla medida en el tiempo como una tabla de colores.

El sistema trata las partes iniciales de una grabación como una plantilla, otorgándoles un 100% de calidad. Si las frecuencias de tono estimadas de los siguientes cuadros de voz están más o menos estabilizadas, la grabación se verá de buena calidad. Si hay un amplio rango en los valores, el registro se considerará defectuoso. Tales fallas pueden ser causadas por una voz interferente con una frecuencia de tono diferente.

Según los informes, un importante banco de Rusia tiene interés en la tecnología y ha proporcionado grabaciones de su base de datos de voz para las pruebas iniciales.

Recientemente se pronostica que el mercado mundial de reconocimiento de voz y voz crecerá más de US$28 mil millones para 2026.

Author: Duván Chaverra

OTRAS NOTICIAS

article thumbnailMéxico. Genetec anunció que Alain Bissada, Director Sénior para Canadá, quien cuenta con amplia trayectoria en el liderazgo de ventas dentro de la...
article thumbnailTema: Qué Debe Entender un Integrador sobre la Protección Contra Incendios en un Hotel Por: Jaime A. Moncada, PE, Director, International Fire Safety...
article thumbnailSeco-Larm El nuevo lector de huellas digitales con teclado SK-2612-SFSQ cuenta con lector de huellas dactilares 500DPI, que admite hasta 3.000...
article thumbnailSorhea Las columnas independientes Solaris forman un muro de detección inmaterial con una barrera infrarroja que integra un transmisor / receptor de...
article thumbnailInternacional. Investigadores del Instituto de Investigación de Electrónica y Telecomunicaciones (ETRI) en Corea del Sur afirman haber descubierto cómo...
article thumbnailColombia. La Terminal del Aeropuerto Internacional Alfonso Bonilla Aragón, ubicado en Palmira, cerca a Cali, cuenta con la tecnología de un sistema...
article thumbnailInternacional. Se espera que el gasto en seguridad en la nube en los EE.UU. alcance los US$1,93 mil millones para 2021, según...
article thumbnailInternacional. Milestone lanza una nueva herramienta interactiva que le permite a los sistemas de videovigilancia a través de IP ser mucho más...
article thumbnailEstados Unidos. Una denuncia penal en un tribunal federal de Brooklyn acusó a una compañía de equipos de vigilancia y seguridad con sede en Nueva...
article thumbnailInternacional. Mobotix lanzó su nueva plataforma de solución abierta Mobotix 7 y la cámara de alta gama M73 que utiliza esta plataforma.