Utilización de GMSL para aplicaciones de visión robótica de gran ancho de banda

Por Pete Bartolik

Colaboración de Editores de DigiKey de América del Norte

La visión es crucial para diseñar aplicaciones robóticas que perciban y se adapten al mundo físico en tiempo real. Los sistemas robóticos operan en entornos dinámicos, a menudo impredecibles, en los que los datos de los sensores deben captarse, transmitirse, procesarse y traducirse en acciones en cuestión de milisegundos. Cualquier latencia añadida, pérdida de datos o incoherencia en la sincronización puede degradar el rendimiento e incluso crear riesgos para la seguridad.

Estas limitaciones son cada vez más exigentes a medida que los sistemas robóticos se orientan hacia una percepción basada en el aprendizaje automático que se apoya en grandes volúmenes de datos visuales en lugar de en la programación de tareas específicas. Esto permite la adaptabilidad en las aplicaciones robóticas, permitiéndoles percibir nuevos objetos, entornos y tareas con una reprogramación mínima.

Estas tendencias ejercen una presión cada vez mayor sobre la forma en que se transportan los datos visuales dentro de los sistemas robóticos. La tecnología Gigabit Multimedia Serial Link (GMSL) puede ayudar a afrontar los retos de diseño simplificando la conectividad de los sensores, reduciendo la complejidad del cableado y permitiendo una transmisión de datos sólida y de baja latencia entre las cámaras distribuidas y los módulos de cálculo centrales.

Diseñado originalmente para aplicaciones de automoción como los sistemas avanzados de asistencia al conductor (ADAS), el GMSL se utiliza ampliamente en robótica y sistemas de visión artificial para conectar cámaras y sensores remotos con baja latencia y gran inmunidad a las interferencias electromagnéticas.

GMSL, desarrollada por Analog Devices, Inc., es una tecnología de comunicaciones serializadora/deserializadora (SerDes) de alta velocidad que permite la transmisión de video y datos de gran ancho de banda a través de un único cable coaxial o de par trenzado. En lugar de compartir un tejido de red, cada cámara funciona a través de un enlace dedicado de alta velocidad, lo que elimina la contención, el enrutamiento y la variabilidad basada en paquetes. Esto crea una ruta de datos predecible en la que la temporización y la latencia se mantienen constantes, incluso a medida que aumenta el número de sensores.

Un serializador GMSL toma grupos de datos de píxeles que normalmente se transmitirían en paralelo a través de varias líneas de señal y los convierte en un flujo serie continuo de alta velocidad. En el lado del procesador, un deserializador lo convierte de nuevo a su formato original. Dado que cada cámara tiene su propio enlace punto a punto, el ancho de banda aumenta linealmente con el número de cámaras sin introducir contención en la red, sobrecarga de conmutación ni retrasos en la programación de paquetes.

Las ventajas de este enfoque son más pronunciadas a medida que los sistemas de visión se amplían a múltiples cámaras de alta resolución. A diferencia de las aplicaciones de una sola cámara, estos sistemas requieren una cobertura visual densa y sincronizada para apoyar tareas como la navegación, la manipulación y la comprensión de la escena en tiempo real. A medida que aumenta el número de sensores, también lo hace la carga sobre el ancho de banda, el cableado y la precisión de la temporización, lo que revela los límites de las interconexiones tradicionales de corto alcance a nivel de placa.

Los enfoques convencionales, como USB, Ethernet estándar o los enlaces MIPI directos a nivel de placa, conllevan contrapartidas en cuanto a latencia, sincronización o alcance físico. El resultado es un reto de integración cada vez mayor a medida que el número de cámaras aumenta la complejidad del cableado, la gestión de la temporización y el diseño del sistema.

En comparación con otros enfoques de conectividad de la visión, el GMSL ofrece varias ventajas claras:

  • Supera a MIPI CSI-2 en alcance y solidez, al tiempo que mantiene una arquitectura sencilla, de baja latencia y punto a punto que evita la complejidad de las pilas de visión basadas en Ethernet.
  • GMSL favorece la conectividad determinista punto a punto y una sincronización multicámara más sencilla frente a la flexibilidad de red distribuida a gran escala de Ethernet.
  • El rendimiento es comparable, en líneas generales, al de FPD-Link, otra opción SerDes propietaria, y la selección entre ambas suele depender de consideraciones relativas al ecosistema.

GMSL equilibra los sistemas de visión integrados y en red al proporcionar un enfoque práctico para la conectividad de cámaras de alta velocidad con un rendimiento determinista y de baja latencia. Esto simplifica la conectividad de visión de alta velocidad manteniendo los estrictos requisitos de latencia y fiabilidad de los sistemas robóticos en tiempo real.

Alta velocidad, alto volumen

Estas ventajas arquitectónicas son fundamentales, ya que la resolución de las cámaras y el número de sensores siguen creciendo. El GMSL puede mover grandes cantidades de datos, sobre todo de vídeo, a través de un solo cable y desde múltiples cámaras u otros sensores. Utiliza un enlace dedicado punto a punto sin contención de red ni enrutamiento de paquetes. En lugar de utilizar múltiples conexiones para cada punto, los diseñadores pueden utilizar GMSL para transportar flujos de gran ancho de banda a través de cables coaxiales o de par trenzado manteniendo una baja latencia y una gran resistencia al ruido.

Esta tecnología simplificó el cableado de los automóviles y mejoró su solidez y esas mismas características se trasladan directamente a la robótica: Menos cables simplifican el diseño eléctrico y mecánico, lo que se traduce en sistemas más ligeros y fiables y en un montaje más sencillo. Las cámaras distribuidas pueden colocarse lejos del módulo informático, conectarse con un cableado mínimo y, aun así, proporcionar de forma fiable datos sincronizados y de baja latencia que favorezcan la percepción y la toma de decisiones en tiempo real.

Los robots dependen cada vez más de múltiples cámaras de alta resolución, a veces combinadas con sensores de profundidad o LiDAR (detección y alcance de luz), para comprender su entorno (figura 1). Cada cámara por separado puede generar un gran flujo de datos, y cuando se utilizan varias juntas, los requisitos de ancho de banda pueden ser asombrosos. Una cámara con resolución 1080p a 30 fotogramas por segundo (fps) con 24 bits por píxel genera 1.4 Gbps, por lo que cuatro cámaras sumarían 5.6 Gbps, y seis sumarían 8.4 Gbps. Las aplicaciones de mayor resolución y velocidad de fotogramas podrían elevar las necesidades de ancho de banda a decenas de gigabits por segundo.

Ilustración de un sistema de visión robótica multimodal habilitado por GMSLFigura 1: Ilustración de un sistema de visión robótica multimodal habilitado por GMSL que puede procesar datos de imágenes procedentes de múltiples cámaras y otros sensores para permitir la percepción robótica. (Fuente de la imagen: Analog Devices, Inc.)

Soportar este volumen de datos de forma fiable requiere una arquitectura de transporte que se escale de forma predecible sin introducir incertidumbre de tiempo. Los enlaces deterministas y de baja latencia de GMSL garantizan que varias cámaras permanezcan sincronizadas y proporcionen datos de forma predecible, lo que hace práctico el desarrollo de aplicaciones con percepción multicámara sin sobrecargar el sistema ni introducir incertidumbre en la temporización.

Consideraciones adicionales

Los sistemas robóticos avanzan a medida que las empresas se orientan hacia plataformas versátiles capaces de percibir, manipular y tomar decisiones autónomas. Los robots humanoides como el Optimus de Tesla dependen de redes de cámaras en tiempo real con múltiples secuencias de vídeo de alta resolución sincronizadas para navegar e interactuar con entornos complejos.

La visión robótica utiliza cada vez más conjuntos de sensores distribuidos para la navegación y la manipulación en tiempo real, lo que requiere una sincronización estrecha y una conectividad fiable. A medida que crecen las demandas de detección, las aplicaciones deben aumentar el número de sensores y la resolución sin forzar los recursos informáticos ni causar problemas de sincronización. Estos requisitos se implementan mediante dispositivos de borde y agregación que sirven de puente entre los sensores de imagen y las plataformas informáticas para mantener datos sincronizados y de baja latencia, vitales para la autonomía.

En el borde del sistema, dispositivos como el serializador MAX96717 GMSL2 de ADI sirven de interfaz entre los sensores de imagen y el enlace de transporte (figura 2). Situado directamente detrás de la cámara, toma los datos de la cámara MIPI CSI-2 de gran ancho de banda y los convierte en un enlace serializado de alta velocidad para su transmisión a través de un cableado de estilo automovilístico de larga distancia. El dispositivo admite velocidades de datos de enlace directo de 3 Gbps o 6 Gbps, con un canal de control inverso a 187.5 Mbps, y acepta hasta cuatro carriles MIPI CSI-2 a 2.5 Gbps por carril.

Esquema de cuatro dispositivos MAX96717 de Analog Devices en paralelo (haga clic para ampliar)Figura 2: En este esquema, cuatro dispositivos MAX96717 convierten flujos de datos paralelos procedentes de sensores de cámara independientes en una señal serializada que se transmite a través de un enlace GMSL2 al deserializador MAX96724, que la agrega y convierte en MIPI CSI-2 para entregar datos de imagen agregados y sincronizados a un procesador central. (Fuente de la imagen: Analog Devices, Inc.)

El serializador se encarga del formateo en tiempo real y de la transmisión de la salida en bruto de la cámara a un enlace GMSL2 de largo alcance, preservando al mismo tiempo la integridad de los fotogramas, la señalización de control y los metadatos de sincronización. Transforma un sensor de imagen estrechamente acoplado en un nodo de teledetección que puede colocarse en cualquier lugar del robot, lo que permite distribuir varias cámaras en una plataforma robótica sin verse limitado por interconexiones de corto alcance.

En el lado receptor, un deserializador GMSL2 multienlace como el MAX96724 de ADI agrega múltiples flujos de cámaras remotas en un único concentrador de interfaz sincronizado. El dispositivo permite una percepción multicámara escalable sin aumentar la complejidad del sistema, y agrega múltiples flujos de cámaras GMSL2 -hasta cuatro enlaces a 3 ó 6 Gbps- en una única interfaz MIPI CSI-2 para el procesador anfitrión, al tiempo que mantiene la sincronización y el control bidireccional entre los sensores.

Una vez deserializados los datos de la cámara, se entregan al procesador anfitrión como flujos de imágenes estándar, normalmente a través de la interfaz MIPI CSI-2. A partir de ahí, los fotogramas de varias cámaras son ingeridos en paralelo por la pila de visión del sistema, que puede incluir procesamiento ISP, lógica de sincronización y modelos de inferencia de IA para tareas como la detección de objetos, la estimación de la profundidad, el seguimiento y la comprensión de la escena.

Dado que los flujos GMSL llegan con una sincronización coherente, las aplicaciones pueden fusionar datos de forma fiable entre cámaras y con otros sensores como LiDAR o unidades de medición inercial (IMU) que controlan el movimiento y la orientación, dotando al robot de una comprensión coherente y en tiempo real de su entorno. Para el desarrollo y la validación, se puede implementar una cadena de señales completa utilizando plataformas de evaluación que emparejan módulos de cámara del lado del serializador con EVK del lado del deserializador como el MAX96724-BAK-EVK# (figura 3), lo que permite a los desarrolladores probar la sincronización multicámara, el rendimiento del ancho de banda y la integración del procesador antes de pasar a diseños de hardware personalizados.

Imagen del kit de evaluación MAX96724-BAK-EVK# de Analog DevicesFigura 3: La plataforma de evaluación MAX96724-BAK-EVK# proporciona una referencia de desarrollo para sistemas de visión robótica, agregando múltiples flujos de cámara GMSL2 desde serializadores como el MAX96717 y entregando una salida MIPI CSI-2 sincronizada a un procesador central. (Fuente de la imagen: Analog Devices, Inc.)

Tecnología y ecosistema maduros

El GMSL ha evolucionado a través de múltiples generaciones, cada una de las cuales ha ampliado el ancho de banda, el alcance y la flexibilidad del sistema, manteniendo al mismo tiempo la misma arquitectura central basada en SerDes:

  • GMSL1 presentó una solución sólida, apta para automóviles, para la transmisión de video de alta velocidad a largas distancias, compatible principalmente con sistemas de cámaras de clase HD.
  • GMSL2 aumentó significativamente el ancho de banda y la escalabilidad, permitiendo sistemas multicámara 1080p y 4K con una sincronización más ajustada, menor latencia y una agregación multi-stream más eficiente, lo que la convierte en la generación dominante en las plataformas ADAS y robóticas modernas.
  • GMSL3 se basa en estos cimientos con nuevas mejoras en la velocidad de transmisión de datos, la flexibilidad del sistema y la compatibilidad con sensores de alta resolución de última generación y arquitecturas multisensor cada vez más complejas.

GMSL está respaldado por un ecosistema maduro que soporta implantaciones escalables y listas para la producción. Los desarrolladores de robótica pueden beneficiarse de una pila completa de componentes validados diseñados para funcionar de forma fiable en condiciones reales, incluidas cámaras, módulos de cálculo, cables, conectores y soporte de software y controladores. Este ecosistema reduce la complejidad de la integración, acorta los ciclos de desarrollo y disminuye la barrera para pasar de los primeros prototipos a los sistemas de producción.

Conclusión

A medida que los sistemas robóticos evolucionan hacia una mayor densidad de sensores y autonomía en tiempo real, las arquitecturas de conectividad deben escalar sin comprometer el determinismo o la fiabilidad. Al simplificar el cableado, preservar la temporización determinista y permitir la colocación distribuida de los sensores, las arquitecturas basadas en GMSL permiten a los diseñadores de robots aumentar la capacidad de percepción sin rediseñar fundamentalmente el modelo de cálculo o sincronización. Esto proporciona un elemento clave en la transición hacia sistemas de visión robótica de alta densidad y en tiempo real.

DigiKey logo

Descargo de responsabilidad: Las opiniones, creencias y puntos de vista expresados por los autores o participantes del foro de este sitio web no reflejan necesariamente las opiniones, las creencias y los puntos de vista de DigiKey o de las políticas oficiales de DigiKey.

Información sobre el autor

Image of Pete Bartolik

Pete Bartolik

Pete Bartolik is a freelance writer who has researched and written about IT and OT issues and products for more than two decades. He previously was news editor of the IT management publication Computerworld, editor-in-chief of a monthly end-user computer magazine, and a reporter with a daily newspaper.

Información sobre la editorial

Editores de DigiKey de América del Norte