Latinoamérica. Los sistemas de videovigilancia empiezan a incluir modelos Visual-Language (VLM) con el fin de facilitar búsquedas e interacciones a través del lenguaje diario, evitando la necesidad de filtros técnicos o capacitación especializada.
Esta tecnología en auge, fundamentada en inteligencia artificial, facilita a los usuarios la emisión de instrucciones en lenguaje natural y la obtención de resultados exactos a partir de imágenes o grabaciones.
Los modelos Visual-Language tienen la habilidad de decodificar lo que el usuario busca, ya sea un objeto, un individuo o una circunstancia particular, incorporando factores como el contexto, el espacio y el tiempo. Esta tecnología tiene como objetivo disminuir la complejidad de manejo de los sistemas convencionales, que demandan el manejo de varios filtros y atributos preestablecidos.
Se observó un caso de esta funcionalidad en una demostración reciente, en la que un sistema de videovigilancia basado en VLM llevó a cabo búsquedas complejas como: "El individuo con traje rojo que ingresó por la puerta principal antes de la noche", sin requerir intervención técnica.
“Imagínese poder pedirle a un sistema de seguridad: ‘Muéstrame un auto Toyota azul en el parque ayer’, y que lo haga, sin filtros complejos, sin menús interminables, sin entrenamiento previo”, señala una de las descripciones presentadas en el contexto de esta tecnología.
Los desarrolladores indican que el potencial del VLM no se limita a búsquedas retrospectivas. También se proyecta su aplicación en alertas generadas en tiempo real, bajo reglas expresadas en lenguaje natural. Por ejemplo: “Avísame si alguien entra con casco en el almacén después de las 8 p.m".
Entre las empresas que ya están trabajando en este tipo de soluciones se encuentra VIVOTEK, fabricante de origen taiwanés con presencia en América Latina.


