Mejorar la seguridad y la productividad de la fábrica añadiendo rápidamente la visión artificial a los sistemas industriales

Por Bill Giovino

Colaboración de Editores de DigiKey de América del Norte

A los diseñadores de máquinas en la automatización industrial se les pide que implementen alguna forma de visión artificial para determinar la distancia de todos los objetos en un campo de visión específico. Las razones para implementar esta forma de visión artificial para la distancia pueden variar, incluyendo la detección del entorno general para los cambios o intrusiones, la distancia de los objetos en una línea de producción, o la protección general del operador o del robot contra los peligros. En particular, en los vehículos interiores de las naves industriales se está aplicando la visión artificial para la conducción automatizada, la localización e identificación de objetos y la detección y evitación de obstáculos.

El método más común de visión artificial en interiores para la detección de distancia de objetos es la detección y alcance de luz (LiDAR), que utiliza la luz láser para medir la distancia entre los objetos. El LIDAR mide el tiempo de retorno y la longitud de onda de la luz láser reflejada para determinar la distancia de cada punto. Sin embargo, los algoritmos de visión artificial LiDAR son muy complejos y tienen una curva de aprendizaje muy pronunciada, por lo que se requiere de expertos en visión artificial para codificar la aplicación.

Este artículo mostrará a los desarrolladores cómo utilizar una cámara LiDAR llave en mano de Intel para que estas aplicaciones detecten la distancia de los objetos en el campo de visión. Resuelve el problema de añadir rápidamente la visión artificial a sistemas nuevos o existentes sin aprender las complejidades de la tecnología y los algoritmos de la visión artificial. A continuación, mostrará cómo emparejar la cámara Intel LiDAR con una computadora monoplaca (SBC) de UDOO utilizando una conexión USB 3.1 de alta velocidad.

Visión artificial en entornos de automatización industrial en interiores

Los ambientes interiores de automatización industrial se están volviendo cada vez más dinámicos con más equipos que se añaden al suelo, así como operadores y suministros adicionales. Todas las máquinas, los sensores y el aumento de los niveles de automatización tienen por objeto aumentar la eficiencia y garantizar la seguridad de los operadores.

En muchos casos los sensores adicionales están destinados a detectar objetos, incluyendo personas, en un área objetivo. Un objeto en una línea de producción puede ser detectado de muchas maneras, incluyendo un sensor básico de luz que detecta un cambio en la luz ambiente debido al paso de un objeto, un interruptor mecánico que es presionado por el peso del objeto, o un rayo de luz a través de una línea de producción que se interrumpe cuando pasa un producto. Aunque estos métodos son apropiados para la detección básica de objetos, el aumento de la sofisticación en la automatización ha requerido una detección visual más compleja similar a la del ojo humano.

La visión artificial es más o menos análoga a la adición de la vista a las máquinas para identificar los diferentes colores, diferenciar los objetos entre sí y reconocer los múltiples movimientos. Sin embargo, un tipo común y muy práctico de visión artificial es detectar la distancia de todos los objetos en un campo de visión.

Hay dos métodos comunes para realizar la detección de distancia para múltiples objetos. El primero es el radar, que para un ambiente interior genera la preocupación inmediata de ser peligroso para los operadores humanos bajo exposición constante a señales de alta frecuencia. En ambientes exteriores, las frecuencias de radar rebotan en los objetos antes de disiparse inofensivamente en el ambiente circundante. Cuando se usa en interiores, el radar rebotará repetidamente en múltiples objetos, lo que dará como resultado niveles intensos de interferencia electromagnética (IEM). La exposición prolongada puede tener efectos a largo plazo en la salud de los operadores humanos.

El segundo método común para realizar la detección de distancia de múltiples objetos en un campo de visión es el alcance de la luz láser, también conocido como LiDAR. Uno o más rayos de luz láser se dirigen a los objetos cuya distancia se va a medir. El tiempo que tarda el rayo láser en reflejarse en un receptor en su punto de origen, junto con cualquier desplazamiento de fase del rayo, se compara con el tiempo y la fase del láser emitido. Un algoritmo calcula la distancia a los objetos basándose en el tiempo y la diferencia de fase y la convierte en centímetros o pulgadas.

El cálculo del tiempo y la diferencia de fase para que un solo rayo láser detecte un objeto es bastante sencillo. Sin embargo, una aplicación de visión artificial más compleja implicaría calcular la distancia de docenas de objetos en un campo de visión. La combinación de esos cálculos para crear un mapa visual de las distancias no es trivial y puede llevar mucho tiempo de desarrollo.

Visión artificial con detección de distancia

Una solución práctica para una aplicación de visión artificial que puede ponerse en marcha rápidamente es la cámara de profundidad 82638L515G1PRQ de alta resolución L515 LiDAR de Intel RealSense (Figura 1). La cámara tiene 61 milímetros (mm) de diámetro y 26 mm de profundidad, y contiene una unidad de profundidad de imagen LiDAR, una cámara roja, verde, azul (RGB) y una unidad de medición inercial (IMU). La cámara LiDAR puede devolver un mapa de bits de 1024 x 768 o una imagen de 1920 x 1080 con cada píxel representando la distancia que ese punto está de la cámara.

Imagen de la cámara LIDAR de alta resolución Intel RealSense L515Figura 1: La Intel RealSense L515 es una cámara LiDAR autónoma de alta resolución que también tiene una cámara RGB e IMU. Se conecta fácilmente a una computadora de apoyo mediante USB 3.1. (Fuente de la imagen: Intel)

La cámara LIDAR Intel L515 devuelve una imagen bitmap del área en su campo visual. Sin embargo, en lugar de devolver una imagen fotográfica típica de la zona, la cámara LiDAR devuelve una imagen en la que el valor RGB de cada píxel representa la distancia a la que se encuentra cada píxel de la cámara Intel L515. La cámara tiene una resolución de 0.25 a 9 metros. También contiene una cámara de imagen RGB estándar de 2 megapíxeles (MP) que es útil durante el desarrollo. Se recomienda para situaciones de iluminación en interiores, ya que no fue diseñado para funcionar donde hay mucha luz solar.

En la figura 2 se muestra una imagen de ejemplo del Intel L515. La imagen de la cámara se centra en una planta en primer plano y se divide en dos secciones. El lado izquierdo muestra una imagen de cámara RGB regular de la planta y el fondo en colores naturales. El lado derecho es una representación visual de la distancia de cada objeto a la cámara. La planta en el primer plano se muestra en tonos azules, mientras que la pared en el fondo muestra un naranja brillante. A la derecha, la pared está más lejos del centro de la cámara, así que la imagen se vuelve más profunda en tonos de rojo.

Imagen de la cámara LiDAR Intel L515Figura 2: La cámara LiDAR Intel L515 devuelve tanto una imagen RGB (izquierda), como una imagen de mapa de bits (derecha) que representa la distancia a la que se encuentra un objeto de la cámara. Más cerca de la cámara aparece como azul, mientras que más lejos aparece como rojo intenso. (Fuente de la imagen: Intel)

Usando esta información, el software puede procesar los datos de la imagen para determinar la distancia entre los objetos y la cámara.

Con su tamaño compacto y su alto nivel de integración, la cámara LiDAR L515 de Intel es apropiada para aplicaciones de automatización industrial en interiores, donde la detección de profundidad de visión artificial debe ser rápidamente implementada en sistemas nuevos o existentes. Para los sistemas móviles, el Intel L515 contiene un IMU que puede sentir ±4 g de aceleración y un giroscopio que puede sentir hasta ±1000˚per segundos (˚/s) de rotación. Esto es apropiado para la mayoría de los vehículos interiores o robots utilizados en instalaciones de automatización industrial. Hay que tener cuidado al codificar el firmware para la UMI ya que un vehículo o robot que golpea un obstáculo puede ver momentáneamente más de 4 gs, una excepción que debe ser tenida en cuenta.

Visión artificial en un sistema completo

El Intel L515 puede conectarse a un PC o a una computadora monoplaca (SBC) mediante una interfaz USB 3.1 de alta velocidad. La carcasa de la cámara tiene un conector USB Type-C®, por lo que se pueden utilizar cables estándar con conectores Tipo C para facilitar la integración. Como el procesamiento de imágenes de visión artificial puede ser intensivo en cuanto a la CPU, se recomienda tener mucho rendimiento para que los conjuntos de datos de imágenes puedan ser procesados en tiempo real si es necesario. El UDOO KTMX-UDOOBL-V8G.00 Bolt V8 es un SBC de alto rendimiento basado en un procesador de cuatro núcleos que funciona a 2.0 gigahercios (GHz) (con un aumento de 3.6 GHz) y está soportado por hasta 32 gigabytes (Gbytes) de DRAM. Para la memoria de programa puede utilizar una unidad de estado sólido (SSD) M.2 y también admite una interfaz de disco duro SATA-3 estándar.

Imagen del poderoso SBC UDOO Bolt V8 con un procesador de cuatro núcleosFigura 3: El UDOO Bolt V8 es un potente SBC con un procesador de cuatro núcleos que funciona a 3.6 GHz. Soporta interfaces de unidades externas M.2 y SATA-3, tiene espacio para hasta 32 Gbytes de DRAM, y tiene un conector USB 3.1 Type C para la interfaz con la cámara LiDAR Intel RealSense L515. (Fuente de la imagen: ODOO)

El UDOO Bolt V8 tiene dos interfaces de video HDMI 1.4 para conectar a un monitor. Para la conexión en red, puede conectarse a una red de fábrica mediante un Gigabit Ethernet con un conector RJ-45 incorporado. También se admiten Wi-Fi y Bluetooth. El audio estéreo es soportado a través de un enchufe estándar de 3.5 pulgadas. El SBC ejecutará cualquier sistema operativo compatible con x86 de 64 bits, incluyendo Microsoft Windows y cualquier distribución de Linux de 64 bits. Este poderoso SBC requiere una fuente de alimentación de 19 voltios y 65 vatios para soportar 2 GHz de rendimiento.

Para los algoritmos de datos de visión artificial, el UDOO Bolt V8 tiene mucha potencia de procesamiento. Puede tomar datos del Intel RealSense L515 a través de una interfaz USB 3.1 Type C de alta velocidad y, si es necesario, puede mostrar la imagen en un monitor conectado a cualquiera de las interfaces HDMI. Las alertas o advertencias audibles pueden ser emitidas por altavoces conectados a cualquiera de las tomas de salida de audio.

Conclusión:

La visión artificial con detección de profundidad es un campo en rápida expansión que puede requerir códigos y hardware complejos si se construye desde cero. La incorporación de un sistema de visión artificial que utiliza soluciones llave en mano que realizan los cálculos de profundidad en un firmware preprogramado ahorra tiempo y dinero, lo que da como resultado un sistema de visión artificial de alto rendimiento que puede ponerse a trabajar en un entorno de automatización industrial de forma rápida y fiable.

DigiKey logo

Descargo de responsabilidad: Las opiniones, creencias y puntos de vista expresados por los autores o participantes del foro de este sitio web no reflejan necesariamente las opiniones, las creencias y los puntos de vista de DigiKey o de las políticas oficiales de DigiKey.

Información sobre el autor

Image of Bill Giovino

Bill Giovino

Bill Giovino es ingeniero electrónico con un BSEE de la universidad de Syracuse y es uno de los pocos profesionales capaz de pasar de ingeniería en diseño a ingeniería de aplicación en campo a marketing tecnológico de forma exitosa.

Durante más de 25 años, Bill ha disfrutado promocionar las nuevas tecnologías a audiencias técnicas y no técnicas por igual en muchas empresas, entre ellas STMicroelectronics, Intel y Maxim Integrated. Mientras trabajó en STMicroelectronics, Bill ayudó a dirigir los primeros éxitos de la empresa en la industria de microcontroladores. En Infineon, Bill estuvo a cargo de que el diseño del primer controlador de la empresa tuviera éxito en la industria automotriz de EE. UU. Como consultor de marketing para CPU Technologies, Bill ha ayudado a muchas empresas a convertir sus productos con bajo rendimiento en casos de éxito.

Bill fue uno de los primeros en adoptar el Internet de las cosas, incluso colocar la primera pila de TCP/IP en un microcontrolador. Bill es un ferviente creyente de "Vender a través de la educación" y de la gran importancia de contar con comunicaciones claras y bien escritas a la hora de promocionar productos en línea. Es moderador del grupo en Linkedin denominado Semiconductor Sales & Marketing (Marketing y ventas de semiconductores) y habla sobre el concepto B2E (empresa-empleado) de manera fluida.

Información sobre la editorial

Editores de DigiKey de América del Norte