¿Qué es Computer Vision o Visión Artificial?

Las Ramas de la Inteligencia Artificial van ganando terreno. Y tú ya sabes ¿Qué es Computer Vision?

¿Qué es Computer Vision? o también conocido como Visión de Computadora

Computer Vision es un campo de Inteligencia Artificial e Informática que tiene como objetivo dar a las computadoras una comprensión visual del mundo, y es el corazón de los poderosos algoritmos de Hayo. Es uno de los principales componentes de la comprensión de la máquina:

Visión de conjunto

El objetivo de Computer Vision o visión por computadora es emular la visión humana utilizando imágenes digitales a través de tres componentes principales de procesamiento, ejecutados uno tras otro:
1. Adquisición de imágenes
2. Procesamiento de imagen
3. Análisis de imágenes y comprensión

A medida que nuestra comprensión visual humana del mundo se refleja en nuestra capacidad de tomar decisiones a través de lo que vemos, proporcionar tal comprensión visual a las computadoras les permitiría el mismo poder:

Adquisición de imágen

La adquisición de imágenes es el proceso de traducir el mundo analógico que nos rodea en datos binarios compuestos de ceros y unos, interpretados como imágenes digitales.

Se han creado diferentes herramientas para compilar tales conjuntos de datos:
1. Cámaras web y cámaras integradas
2. Cámaras digitales compactas y DSLR
3. Cámaras 3D de consumo y telémetros láser

De izquierda a derecha y de arriba a abajo: cámara web, cámara réflex digital, telémetro láser, cámara 3D y cámara integrada.
De izquierda a derecha y de arriba a abajo: cámara web, cámara réflex digital, telémetro láser, cámara 3D y cámara integrada.

La mayoría de las veces, los datos brutos adquiridos por estos dispositivos deben procesarse posteriormente para ser explotados de manera más eficiente en los siguientes pasos.

Procesamiento de imágenes

El segundo componente de Computer Vision es el procesamiento de imágenes de bajo nivel. Los algoritmos se aplican a los datos binarios adquiridos en el primer paso para inferir información de bajo nivel sobre partes de la imagen. Este tipo de información se caracteriza por bordes de imagen, características de punto o segmentos, por ejemplo. Son todos los elementos geométricos básicos que construyen objetos en imágenes.

Este segundo paso generalmente involucra algoritmos y técnicas avanzados de matemáticas aplicadas.

Los algoritmos de procesamiento de imágenes de bajo nivel incluyen:
1. Detección de bordes
2. Segmentación
3. Clasificación
4. detección de funciones y coincidencia

Detección de bordes en una imagen en color.

Segmentación de manzanas en una canasta.

Clasificación de partes de imágenes.

Análisis de imágenes y comprensión

El último paso de la canalización de Visión artificial es el análisis real de los datos, que permitirá la toma de decisiones.
Se aplican algoritmos de alto nivel, utilizando tanto los datos de imagen como la información de bajo nivel calculada en los pasos anteriores.

Ejemplos de análisis de imágenes de alto nivel son:
1. Mapeo de escenas en 3D
2. Reconocimiento de objetos
3. Seguimiento de objetos

Mapeo 3D de una sala de estar.
Mapeo 3D de una sala de estar.

Reconocimiento de objetos en imágenes.
Reconocimiento de objetos en imágenes.

Rastreando personas en una estación de tren.
Rastreando personas en una estación de tren.

Aplicaciones de visión artificial

Las técnicas desarrolladas para Computer Vision tienen muchas aplicaciones en los campos de la robótica, la interacción entre humanos y la visualización, por nombrar algunos:
1. Reconocimiento de movimiento
2. Realidad aumentada
3. Coches autónomos
4. Robots domésticos / de servicio
5. Restauración de imagen como eliminación de ruido

Seguimiento de movimiento usando un esqueleto.

Aumentar una sala de estar antes de comprar un sofá nuevo.

Un auto autónomo.

Un robot doméstico.

Desafíos en la visión por computadora

Al desarrollar algoritmos de Visión por Computadora, uno tiene que enfrentar diferentes problemas y desafíos, relacionados con la naturaleza misma de los datos o evento de la aplicación que se creará y su contexto:
1. Datos ruidosos o incompletos
2. Procesamiento en tiempo real
3. Recursos limitados: poder, memoria

Las investigaciones actuales se centran en abordar estos desafíos para hacer que los algoritmos sean más robustos y eficientes en condiciones difíciles.

Visión por computadora dentro de Hayo
Hayo se basa en algoritmos de visión por computadora de última generación que permiten detectar cada vez que se activa un botón.

Usamos datos extraídos de su sensor para mapear la habitación en 3D y analizar continuamente lo que está delante para detectar la presencia de una mano dentro de cualquiera de los botones.

Gracias a esta tecnología, Hayo puede reconocer instantáneamente las interacciones en cualquier parte de la habitación, para proporcionar a sus usuarios el poder de conectar el mundo que los rodea. Esperamos en IA Ninja haber resuelto tu pregunta sobre ¿Qué es Computer Vision?

Esperamos que te aya gustado este post sobre que es computer vision

Fuente:

What is Computer Vision?

Richard Szeliski, “Computer Vision: Algorithms and Applications”, Springer Science & Business Media, 2010

Karen Reed, “8 maneras en que la tecnología mejora su salud”, Positive Health Wellness, 2017