Tecnología emergente con nuevos modelos.

por Osvaldo Callegari*

La aplicación de las nuevas tecnologías en modelos ya existentes abren nuevas oportunidades de desarrollo en el mundo actual. Sectores como la Seguridad se ven apoyados por esta tendencia, igualmente es necesario la mesura, ya que intervienen la ética y la moral a la hora de barajar métodos.

- Publicidad -

Significado de Visión Computacional o Artificial
La Visión Artificial (VA) es una disciplina científica que está compuesta de distintos métodos para la adquisición, proceso, análisis de imágenes, logrando una comprensión a través de fórmulas numéricas tratadas por un ordenador.

Tal como los humanos somos nuestros ojos y cerebros para comprender el mundo que nos rodea, la visión artificial trata de producir el mismo efecto para que los ordenadores puedan percibir y comprender una imagen o secuencia de imágenes y actuar según convenga en una determinada situación.

Esta comprensión se consigue gracias a distintos campos como la geometría, la estadística, la física y otras disciplinas. La adquisición de los datos se consigue por varios medios como secuencias de imágenes, vistas desde varias cámaras de video o datos multidimensionales desde un escáner médico.

La predicción en VA es una forma de anticiparse a resolver una situación mediante algoritmos matemáticos.

“No todo lo que brilla es oro”
Cuando deben aplicarse conceptos teóricos en las técnicas de VA nos encontramos con diferentes imponderables relacionados con la visión y el medio ambiente, por ejemplo. Existen factores de deriva que generan la necesidad de procesos adicionales de compensación para lograr un eficaz resultado.

De acuerdo a la dificultad u origen se pueden clasificar con definiciones genéricas las distintas dificultades técnicas.

A.  Ruidos técnicos    
1. Sal y Pimienta (Salt and Pepper)
Ruido impulsivo que hace tender a los píxeles a un máximo (blanco) y a un mínimo (negro). El efecto de este ruido es tener diversos puntos blancos y negros esparcidos aleatoriamente por la imagen.

De ahí el nombre Salt and Pepper (sal y pimienta), debido a que parece que la imagen haya sido rociada por estos          compuestos.

Este ruido puede aparecer a causa de los canales de transmisión de las imágenes. Para solventar este ruido podremos utilizar (pese a perder definición) un filtro de promedio espacial.

2. Ruido uniforme
Ruido que afecta a la imagen tendiendo a blanco y a negro de manera uniforme. El efecto a simple vista de este ruido es percibir interferencias en la imagen, como si esta estuviese codificada. Observamos una pantalla por encima de la imagen llena de pixeles de valores aleatorios y uniformemente expandidos. Este ruido puede aparecer en el procesado de cuantificación de una imagen. Para solventar este ruido podremos utilizar (pese a perder definición) un filtro de promedio espacial.

3. Ruido Gaussiano
Ruido derivado de los equipos de captura que sigue la fórmula (falta fórmula). El efecto en la imagen será parecido al uniforme solo que los valores del ruido no son tan abruptos, tenderán más a grises que a negros y blancos. Para solventar el            problema podríamos utilizar un filtro de promedio espacial con coeficientes Gaussianos.

En todos los casos, para solventar cualquier tipo de ruido deberemos aplicar algún tipo de filtro compatible con nuestro ruido.
Errores en la interpretación de imágenes

Puntos de Vista
Como la imagen está orientada en forma directa al observador, un animal no se ve igual de frente que de espaldas, aunque este sigue siendo el mismo animal.

  • Iluminación: Es la cantidad de luz que recibe el objeto. Un objeto deberá ser distinguible de manera independiente de sí, si el mismo tiene algún lado oscuro debido a la iluminación en el sector.
  • Oclusión: Un objeto puede estar en segundo plano, es decir que otro objeto tape parcialmente nuestro objetivo a la hora de analizarlo o extraerlo. Tendríamos que ser capaces de poder interpretar un objeto diferente que se ubique entre nuestro objeto y el espectador (observador).
  • Escala: Es el factor que determina el tamaño de la imagen respecto de una real. En el caso de un edificio no será el mismo su tamaño acorde al origen de la imagen capturada,  intervienen varios factores ángulo, distancia.  Tendremos que interpretar e identificar el objeto independientemente sea su origen.
  • Deformación: Un objeto puede deformarse debido a múltiples factores.  El caso típico de una carretera en verano, la dilatación del asfalto genera espejismos llamados Fata Morgana, los cuales asemejan el agua o líquido. Pese a estas deformaciones el sistema tiene que tener la capacidad de identificarlo.
  • Fondo alterado: Un objeto puede estar en un contexto desordenado y caótico. En el caso de un piso de mosaicos multicolores. Es necesario distinguirlo también ante este tipo de ocurrencia.

Variaciones dentro de una misma clase
Un objeto puede ser dispar a otro dentro de su misma categoría. El caso de las sillas, podemos observar una multitud de sillas diferentes, pero todas tienen algo en común, sus cuatro patas, la base donde sentarse, el espaldar.

Un sistema será eficiente acorde a como resuelva estas situaciones u otras,  será mas o menos fiable.

Sin adentrarnos específicamente en otras áreas de estas tecnologías donde otros expertos en la revista enseñan muy bien,  queremos sencillamente ir introduciendo conceptos, que con el tiempo será como todas las cosas, moneda corriente.

Lenguaje Corporal
Uno de los métodos que genera controversia de como es aplicado, dado que interviene con la privacidad de las personas, sus hábitos y sus formas.  Es uno de los temas más álgidos a la hora de su implementación, lo cual llevará grandes cantidades de procedimientos y habilitaciones. Igualmente se aplica en forma informal sin decir nada.

Detección de potenciales ladrones
La empresa japonesa  Vaak  ha desarrollado un software de inteligencia artificial (IA) que puede rastrear a los posibles ladrones de tiendas, utilizando imágenes de las cámaras de seguridad. El software puede detectar inquietud y otro posible lenguaje corporal sospechoso.

El año pasado, la puesta en marcha ayudó a atrapar a un ladrón en una tienda de conveniencia, donde había configurado su software como un caso de prueba. El software recogió una actividad de robo en tiendas previamente no detectada.

El software, llamado Vaak Eye, aprovecha el aprendizaje profundo de más de 100,000 horas de datos de vigilancia. Alerta a los propietarios de tiendas basándose en su escrutinio de más de 100 características del sujeto que incluyen su cara, movimiento, vestimenta, dirección, zancada e incluso el propósito.

Además, el software utiliza los datos de macros disponibles, como la tasa de incidencia de delitos y las condiciones climáticas para mejorar la predicción. También registra todos y cada uno de los productos que la persona ha recogido y el tiempo que cada elemento ha sido retenido por esa persona.
Ante un posible robo en una tienda, Vaak Eye alerta a los propietarios de la tienda a través de una aplicación para teléfonos inteligentes.

Por su parte, la compañía Google  utiliza realidad virtual o aumentada para establecer imágenes estereoscópicas las cuales nos dan otro punto de vista de la tecnología que estamos analizando.

Monitor o pantalla
Las pantallas de Realidad Aumentada o Virtual son la ventanas a través de la cual el usuario ve su mundo. Las pantallas pueden ser integradas con  un audífono independiente o la pantalla de su teléfono cuando se coloca dentro de una vista de Daydream.

Una lente delante de la pantalla deforma la imagen que se muestra en la pantalla para llenar la vista del usuario. Las pantallas de realidad virtual deben representar las imágenes rápidamente, de modo que cuando el usuario mueve su cabeza y los controladores alrededor de la pantalla se actualizan de manera correspondiente sin demora notable.
Las pantallas deben ser de baja persistencia para evitar que los usuarios experimenten un desenfoque de movimiento mientras mueven sus cabezas.

Normalmente, una pantalla puede ser "muestrear y mantener" o "baja persistencia". La mayoría de las pantallas tradicionales de teléfonos inteligentes y computadoras son "muestrear y mantener", lo que puede llevar a un desenfoque de movimiento. Las pantallas avanzadas sintonizadas para VR tienen un modo de persistencia baja, lo que reduce el desenfoque de movimiento.

Mostrar persistencia
La persistencia de la visualización se refiere a la duración de la visualización de un cuadro (imagen) en la pantalla hasta que la siguiente imagen se representa en la misma. Las pantallas de alta persistencia provocan un desenfoque de movimiento, ya que cada cuadro de imagen se muestra al usuario para una gran proporción del tiempo total de fotogramas, que en un entorno de realidad virtual es incómodo y rompe la inmersión. La VR se experimenta mejor utilizando pantallas en el modo de baja persistencia, lo que reduce la cantidad de desenfoque de movimiento. En el modo de baja persistencia, cada fotograma se muestra durante un período de tiempo muy pequeño, con una pantalla negra durante el tiempo restante antes de que llegue el siguiente fotograma. Debido a que todo esto sucede en milisegundos, crea la ilusión de un movimiento nítido.
Un pequeño número de usuarios son sensibles al efecto de parpadeo de la pantalla de baja persistencia. Los usuarios pueden desactivar el modo de baja persistencia en la configuración de VR.

Rastreo
El seguimiento es el uso de sensores visuales e inerciales para modelar la posición del usuario en relación con el mundo virtual.

Las aplicaciones deben saber con precisión cómo se mueven la cabeza y los controladores del usuario para asignar la posición y la orientación al mundo virtual. Para que el seguimiento ofrezca una experiencia cómoda y envolvente, el seguimiento debe ser de baja latencia, altamente preciso y muy consistente.

Los sistemas de seguimiento producen lo que se llama una pose: un conjunto de datos que describe la posición y la orientación de un objeto rastreado, como la cabeza y el controlador del usuario. Las aplicaciones pueden usar esa pose para representar correctamente el mundo y usar el audio apropiado.

El seguimiento de los dispositivos 3Dof se realiza a través de la IMU del teléfono. El rastreo para un auricular 6DoF, como el Daydream Standalone, usa un rastreo WorldSense más potente, que utiliza una combinación de visión de computadora y mediciones de IMU.

Predicción
El seguimiento no es perfectamente preciso y no es instantáneo. Si bien las IMU modernas son bastante precisas, el error que proviene de sus mediciones se acumula rápidamente y puede producir resultados ruidosos. Si tuviéramos que utilizar los datos en bruto de la IMU para generar poses y renderizar la escena, el usuario experimentaría muchas vibraciones.
Nota: Los nombres y marcas mencionadas son nombres y marcas registradas de sus propietarios. Fuentes de información Vaak, Wikipedia y Sans. Org.  Las fuentes pueden variar en distintos autores.

* Para comunicarse con el autor de este artículo escriba a Osvaldo.callegari@usa.com

 

 

 

Author: Duván Chaverra

OTRAS NOTICIAS

article thumbnailHikvision El nuevo NVR iDS-9600NXI-I8 / 4F de la serie DeepinMind posee potentes funciones de detección y análisis de rostros, con una potente...
article thumbnailVivotek Smart VCA es la suite de análisis de video de próxima generación que se ejecuta en cámaras VIVOTEK para aplicaciones de seguridad, impulsado...
article thumbnailVideo Mount Products  Los gabinetes de rack de piso VMP EREN-27 y EREN-42E, ofrecen más opciones, con tamaños de 27U y 42U, completamente ensamblados y...
article thumbnailColombia. Con el crecimiento exponencial de tendencias como el almacenamiento en la nube, con sus capacidades exorbitantes para guardar cada vez más...
article thumbnailEstados Unidos. Una nueva encuesta del Centro de Investigación Pew revela que la mayoría de los estadounidenses confía en las agencias de aplicación de...
article thumbnailInternacional. La industria minorista tiene sus propias necesidades únicas de seguridad de video y hay algunos factores en los que no debe...
article thumbnailInternacional. Altronix, destacó en su blog las bondades de los sistemas integrados de control de acceso y videovigilancia, indicando que...
article thumbnailInternacional. HID Global ha desarrollado una novedosa tecnología que le permite a los usuarios comprobar la originalidad de un producto partiendo de...
article thumbnailInternacional. Genetec anunció que Stratocast, su servicio de videovigilancia basado en la nube (VSaaS), impulsado por la plataforma de computación...
article thumbnailEcuador. La Asociación Latinoamericana de Seguridad (ALAS) prepara para el próximo 17 de septiembre un nuevo Desayuno ALAS, que en esta oportunidad se...