Aceleración del rendimiento de la red: El impacto de RDMA sobre Ethernet convergente (RoCE)
2024-12-27
La rápida evolución de las aplicaciones de cálculo intensivo ha acentuado la necesidad de soluciones de red más rápidas, eficientes y escalables. Entre las tecnologías más innovadoras que están surgiendo para satisfacer esta demanda se encuentra el acceso remoto directo a memoria (RDMA) sobre Ethernet convergente (RoCE). Esta revolucionaria tecnología facilita la transferencia directa de datos entre sistemas sin necesidad de intervención de la CPU, lo que reduce significativamente la latencia y mejora el rendimiento general del sistema. iWave, una destacada empresa de diseño de FPGA, está a la vanguardia de este avance, habiendo implementado una sólida solución Ethernet 100G mediante la integración de la IP ERNIC de AMD (Propiedad Intelectual del Controlador de Interfaz de Red Ethernet RDMA) en su cartera de módulos informáticos integrados. Esta integración mejorará las capacidades RDMA en aplicaciones de alto rendimiento.
Figura 1: RoCE facilita la transferencia directa de datos entre sistemas sin necesidad de intervención de la CPU, lo que reduce significativamente la latencia y mejora el rendimiento general del sistema. (Fuente de la imagen: iWave)
Conocimiento de RDMA sobre Ethernet convergente (RoCE)
RDMA es una tecnología crítica que permite transferencias directas de memoria entre hosts o servidores, evitando la CPU. Esta capacidad permite a las CPU centrarse en la ejecución de aplicaciones y el procesamiento de datos, lo que se traduce en notables mejoras del rendimiento de la red caracterizadas por una latencia reducida, menores cargas de CPU y un mayor ancho de banda, todo ello de forma rentable. RoCE es un protocolo de red específico diseñado para facilitar las operaciones RDMA en redes Ethernet. Al aprovechar la infraestructura Ethernet existente, RoCE presenta una opción atractiva para las organizaciones que buscan mejorar el rendimiento sin revisar sus configuraciones de red actuales.
Tipos de RoCE
RoCE se clasifica en dos versiones distintas en función del adaptador de red utilizado: RoCE v1 y RoCE v2.
- RoCE v1: este protocolo permite la comunicación entre dos hosts situados dentro del mismo dominio de difusión Ethernet (VLAN). Utiliza el Ethertype 0x8915 y restringe las tramas Ethernet estándar a 1500 bytes, al tiempo que permite que las tramas Ethernet jumbo se extiendan hasta 9000 bytes.
- RoCE v2: Para abordar las limitaciones de RoCE v1, RoCE v2 introduce mejoras en la encapsulación de paquetes mediante la incorporación de cabeceras IP y UDP. Esta modificación permite a RoCE v2 operar sin problemas tanto en redes de Capa 2 (Capa de enlace de datos) como de Capa 3 (Capa de red), soportando así el enrutamiento de Capa 3 y la escalabilidad a través de múltiples subredes. A menudo denominado RoCE enrutable (RRoCE), RoCE v2 también agrega compatibilidad con multidifusión IP, lo que amplía aún más su aplicabilidad.
ERNIC IP: mejora de las capacidades RDMA
La IP ERNIC (Embedded RDMA enabled NIC) es un núcleo IP de controlador de interfaz de red Ethernet RDMA personalizable diseñado para una integración perfecta con FPGA, MPSoC e implementaciones IP MAC blandas de AMD. Esta solución se caracteriza por un alto rendimiento, una baja latencia y un mecanismo de transferencia de datos fiable y totalmente descargado de hardware a través de Ethernet estándar. iWave ha ejemplificado su compromiso con el avance tecnológico implantando con éxito una solución Ethernet 100G. Este logro ha sido posible gracias a la utilización del kit de desarrollo Zynq UltraScale+ MPSoC de iWave, que integra la IP ERNIC de AMD.
El kit de desarrollo Zynq UltraScale+ MPSoC está específicamente diseñado para la creación de prototipos y la evaluación de soluciones Ethernet 100G, empleando conectores QSFP-28 de alta velocidad.
Configuración de demostración
Una configuración de demostración típica (Figura 2) consta de:
- Kit de desarrollo alimentado por Zynq UltraScale+ MPSoC ZU19EG de iWave
- NIC Advantech Mellanox ConnectX-5 100G
- Sync 1588 PTP habilitado 1G NIC
- Cable MTP, módulos QSFP-28 y cable Ethernet CAT6 RJ45
- PC servidor Ubuntu 22.04
Figura 2: Configuración típica del kit de desarrollo de Zynq UltraScale+ MPSoC. (Fuente de la imagen: iWave)
Arquitectura del sistema
La arquitectura del sistema está diseñada para optimizar la transferencia de datos, con funciones claramente definidas entre los componentes del Sistema de Procesamiento (PS) y la Lógica Programable (PL). La implementación también incluye sincronización por protocolo de tiempo de precisión (PTP), crucial para aplicaciones en tiempo real. Con métricas de rendimiento notables, como la capacidad de manejar video 8K a más de 100 fotogramas por segundo, las aplicaciones potenciales abarcan diversos sectores, como centros de datos, multimedia y computación de alto rendimiento, lo que subraya la versatilidad e importancia de la tecnología en los entornos informáticos modernos.
La arquitectura de alto nivel del sistema, representada en la Figura 3, destaca las distintas funciones de los componentes PS y PL dentro del Zynq UltraScale+ MPSoC. El PS incorpora un SoC duro basado en ARM Cortex-A53, esencial para la configuración, el control y el diagnóstico del sistema. Los componentes clave de esta arquitectura son:
- Controlador MAC Ethernet 100G: Garantiza un rendimiento sólido y una transmisión de datos de baja latencia a 100 Gb/s
- Controlador ERNIC: Está encargado de gestionar los datos entrantes a la DDR y facilitar la comunicación entre la aplicación de usuario y ERNIC IP mediante intercambios eficientes de timbre
- Bibliotecas RDMA Core y User Space: Garantiza la compatibilidad y el rendimiento óptimo de las operaciones RDMA tanto en el núcleo como en los espacios de usuario
Figura 3: Funciones destacadas del sistema de procesamiento y los componentes lógicos programables del MPSoC Zynq UltraScale+. (Fuente de la imagen: iWave)
La IP AMD ERNIC descarga de forma efectiva la pila RoCE v2 en la FPGA y el controlador ERNIC gestiona la comunicación entre varios módulos para facilitar la transferencia de datos. Genera entradas en la cola de trabajo y envía notificaciones (timbres) al ERNIC IP. Al mismo tiempo, el subsistema 100G Ethernet del Zynq UltraScale+ MPSoC gestiona las capas MAC y física, mientras que el generador de patrones de datos se encarga de producir datos sin procesar y patrones de datos de video.
Protocolo de tiempo de precisión (PTP)
La marca de tiempo PTP (estándar IEEE 1588) desempeña un papel crucial en la sincronización de la hora entre los sistemas de una red Ethernet. Esta sincronización es vital para mejorar el rendimiento de las aplicaciones en tiempo real, ya que permite intercambios de datos sincronizados y de baja latencia a nivel de nanosegundos.
Principales aspectos de la instalación
Las características notables de esta configuración incluyen:
- Implementación de 100G Ethernet sobre RoCE v2 utilizando AMD ERNIC IP
- Tipo de transporte y conexión fiable
- Funciones RDMA SEND, RDMA READ y RDMA WRITE para la gestión de paquetes
- Compatibilidad con los tipos de mensaje RDMA Send with Immediate y RDMA Write with Immediate
- Pruebas de rendimiento para RDMA utilizando aplicaciones XRPING y PERFTEST
- Generador de patrones de datos personalizados para patrones de datos RAW y de vídeo
- Inserción de marcas de tiempo PTP junto a los datos
Las estadísticas detalladas de rendimiento de las transferencias de datos de video desde el kit de desarrollo Zynq UltraScale+ MPSoC al PC servidor revelan un rendimiento impresionante, con capacidad para administrar video 8K a más de 100 fps y video 4K a más de 400 fps.
Aplicaciones potenciales
La integración de RDMA sobre Ethernet convergente y ERNIC IP abre nuevas vías en diversos sectores, mejorando significativamente la conectividad, el rendimiento y la eficiencia en una serie de aplicaciones, entre las que se incluyen:
- Centros de datos y computación en la nube: Facilitar la comunicación eficiente entre servidores y acelerar el procesamiento de datos en arquitecturas en la nube
- Captura y transferencia de video/imágenes: Beneficioso para aplicaciones multimedia, radiodifusión y entornos de realidad virtual (RV)
- Soluciones de almacenamiento: Permiten transferencias de datos más rápidas entre los dispositivos de almacenamiento y los servidores, mejorando así el rendimiento del sistema de almacenamiento
- Computación de alto rendimiento (HPC): Mejora de la velocidad de transferencia de datos y reducción de la latencia en los clústeres de HPC para agilizar las tareas de cálculo y las simulaciones
- Dispositivos IoT Edge: Permiten la recopilación y transmisión de datos en tiempo real desde sensores y dispositivos
A medida que aumenta la demanda de soluciones de transferencia de datos más rápidas y eficientes, RDMA sobre Ethernet convergente y ERNIC IP están preparadas para desempeñar un papel fundamental en el futuro de la informática de alto rendimiento.
Conclusión:
La amplia cartera de plataformas FPGA y SoC FPGA de iWave, combinada con su profunda experiencia técnica, permite a los clientes desarrollar productos de vanguardia que aprovechan los últimos avances en inteligencia artificial (IA), aprendizaje automático y edge computing. Al asociarse con iWave, las empresas pueden acelerar el desarrollo de sus productos, reducir riesgos y adelantarse a la competencia en un panorama tecnológico cada vez más complejo.
Para más información o para hablar de requisitos personalizados, comuníquese con nosotros en mktg@iwave-global.com.
Descargo de responsabilidad: Las opiniones, creencias y puntos de vista expresados por los autores o participantes del foro de este sitio web no reflejan necesariamente las opiniones, las creencias y los puntos de vista de DigiKey o de las políticas oficiales de DigiKey.