Implementación rápida y eficaz de IA y aprendizaje automático con MCU Renesas RA8M1

Por Kenton Williston

Colaboración de Editores de DigiKey de América del Norte

El aumento de la inteligencia artificial (IA), el aprendizaje automático (ML) y otras cargas de trabajo de cálculo intensivo en el extremo de la Red para el Internet de las cosas (IoT) está suponiendo una carga de procesamiento adicional para los microcontroladores (MCU). El manejo de estas nuevas cargas de trabajo aumenta el consumo de energía, incluso cuando se pide a los diseñadores que minimicen el consumo y aceleren el tiempo de comercialización.

Los diseñadores necesitan una opción informática que conserve la eficiencia de una MCU, al tiempo que añade funciones de alto rendimiento adaptadas específicamente a casos de uso de bajo consumo. Esta opción también debe preservar los modelos de implementación simples asociados con las MCU tradicionales, al tiempo que agrega características suficientes para admitir las aplicaciones sofisticadas habilitadas por AI y ML, como el control de voz y el mantenimiento predictivo.

Este artículo analiza los factores que impulsan la demanda de IA y ML y explica por qué se necesitan nuevas arquitecturas de procesador para ofrecer estas capacidades de forma eficiente. A continuación,presenta la familia de unidades de microcontrolador RA8M1 de Renesas y muestra cómo puede utilizarse para satisfacer estos requisitos.

Los requisitos de la IA y el ML de vanguardia

La demanda de IA y ML está aumentando en aplicaciones edge IoT que van desde la automatización de edificios y dispositivos industriales hasta electrodomésticos. Incluso los sistemas embebidos relativamente pequeños y de bajo consumo se encargan ahora de cargas de trabajo como la localización de palabras clave, el control de comandos de voz y el procesamiento de audio e imágenes. Aplicaciones como centros de sensores, navegación y control de drones, realidad aumentada (RA), realidad virtual (RV) y equipos de comunicaciones.

Para minimizar el consumo de energía, la sobrecarga y la latencia al tiempo que se garantiza la privacidad, a menudo se prefiere procesar los datos en el extremo en lugar de enviarlos a la nube. Esto supone un reto para los diseñadores, ya que los dispositivos periféricos suelen tener recursos limitados, sobre todo cuando funcionan con batería/pila.

MCU mejoradas para la computación periférica

Las cargas de trabajo de IA y ML suelen implicar la realización de la misma operación matemática repetidamente en un gran conjunto de datos. Estas cargas de trabajo son susceptibles de aceleración mediante el procesamiento de instrucción única y datos múltiples (SIMD). SIMD realiza varias operaciones matemáticas en paralelo, lo que proporciona una tasa de producción considerablemente mayor y una mayor eficiencia energética que el procesamiento convencional.

Dado que las MCU tradicionales carecen de funcionalidad SIMD, necesitan ayuda para ejecutar cargas de trabajo de IA y ML. Una solución es utilizar un procesador de señal digital (DSP) u otros aceleradores SIMD junto a la unidad de microcontrolador. Sin embargo, este enfoque multiprocesador complica el diseño del sistema.

Otra opción es cambiar a una unidad de microprocesador (MPU) de mayor rendimiento equipada con capacidades SIMD. Esto puede proporcionar el rendimiento necesario en una configuración de un solo procesador, pero las MPU tienen contrapartidas en cuanto a consumo de energía y conjunto de funciones. Por ejemplo, no todas las MPU están diseñadas para ofrecer la computación determinista y de baja latencia que requieren las aplicaciones orientadas a las MCU.

Habilitación de IA y ML en MCU

Reconociendo la necesidad de un conjunto optimizado de MCU para soportar cargas de trabajo de IA y ML, Renesas presentó la serie RA8M1 de MCU (Figura 1). La serie se basa en una arquitectura Arm® Cortex®-M85 con Helium y TrustZone, y pueden funcionar a 480 megahercios (MHz) con un consumo típico de 225 microamperios por megahercio (µA/MHz).

Diagrama de la unidad de microcontrolador RA8M1 de Renesas (haga clic para ampliar)Figura 1: La MCU RA8M1 de Renesas está basada/o en ARM Cortex-M85 e incluye la tecnología Helium para acelerar el procesamiento de IA y ML. (Fuente de la imagen: Renesas)

Diseñada para ofrecer un rendimiento eficiente y un bajo consumo de energía, la unidad de microcontrolador RA8M1 cuenta con características como determinismo, tiempo de interrupción corto y soporte de gestión de energía de última generación. El procesador alcanza una eficiencia de rendimiento de 6.39 CoreMark por megahercio (CoreMark/MHz).

Helium es una extensión vectorial SIMD M-Profile (MVE) que acelera significativamente el procesamiento de señales y ML. Añade 150 instrucciones escalares y vectoriales y permite procesar registros de 128 bits (Figura 2). Está optimizado para microcontroladores de bajo consumo y recursos limitados. Por ejemplo, Helium reutiliza los registros de la Unidad de punto flotante (FPU) en lugar de introducir nuevos registros SIMD. Esto ayuda a reducir el consumo de energía del procesador y la complejidad del diseño.

El diagrama de Helium reutiliza el banco de registros de la FPU para el procesamiento vectorialFigura 2: Helium reutiliza el banco de registros de la unidad de punto flotante (FPU) para el procesamiento vectorial. (Fuente de la imagen: Arm)

Como se muestra en la Figura 3, el Cortex-M85 del RA8M1 incluye la tecnología TrustZone de Arm. TrustZone proporciona aislamiento de hardware para firmware crítico, activos e información privada. El Cortex-M85 también añade nuevas funciones de seguridad y protección, como la extensión de autenticación de punteros e identificación de objetivos de bifurcación (PACBTI). Estas características de seguridad son especialmente valiosas en un contexto de IA en el que un dispositivo puede interactuar con datos personales.

Imagen de TrustZone de Arm Cortex-M85Figura 3: TrustZone de Cortex-M85 proporciona aislamiento de hardware para firmware crítico, activos e información privada. (Fuente de la imagen: Arm)

Características de hardware que debe tener una unidad de microcontrolador apta para IA

Una unidad de microcontrolador debe combinar un rendimiento eficiente con un sólido conjunto de características para admitir aplicaciones de IA. El RA8M1 está bien equipado para el control de motores, controladores lógicos programables (PLC), medidores y otras aplicaciones industriales y de IoT.

Por ejemplo, los algoritmos de IA requieren mucha memoria. La memoria del sistema RA8M1 incluye hasta 2 megabytes (Mbytes) de Flash y 1 Mbyte de SRAM. La SRAM incluye 128 kilobytes (Kbytes) de memoria estrechamente acoplada (TCM), que permite un acceso rápido a la memoria para cálculos de alto rendimiento.

Para garantizar un funcionamiento fiable, 384 Kbytes de la SRAM de usuario y los 128 Kbytes completos de la TCM están configurados como memoria de código de corrección de errores (ECC). Las cachés de datos e instrucciones de 32 Kbytes también están protegidas por ECC.

El RA8M1 incorpora múltiples características de seguridad además de las incluidas en el núcleo Arm. Entre ellos figuran el motor criptográfico de Propiedad Intelectual Segura Reprogramable (RSIP) para el procesamiento seguro de datos, el almacenamiento inmutable para la protección de datos críticos y los mecanismos de Protección contra manipulaciones.

En cuanto a interfaces de comunicación, la MCU está equipada con Ethernet para conectividad de red, Controller Area Network Flexible Data Rate (CAN FD) para aplicaciones industriales y de automoción, y USB High-Speed/Full-Speed para conectividad general. También incorpora una interfaz de cámara y una interfaz periférica serial (SPI) octal con descifrado sobre la marcha para la memoria externa.

Las interfaces analógicas incluyen convertidores de analógico a digital (ADC) y convertidores de digital a analógico (DAC) de 12 bits, comparadores analógicos de alta velocidad y tres circuitos de muestreo y retención. Para la comunicación serie, el RA8M1 admite varios protocolos, incluida una Interfaz periférica serial (SCI) con SPI, un transmisor receptor asíncrono universal (UART) y modos de circuito integrado (I²C). La unidad de microcontrolador también ofrece el circuito interintegrado mejorado (I3C) para mejorar las tasas de transferencia de datos y la eficiencia.

Los desarrolladores que necesiten acceso completo a estas funciones de entrada/salida (E/S) pueden utilizar un encapsulado de matriz de malla de bola (BGA) como el R7FA8M1AHECBD#UC0 de 224 pines. Aquellos que busquen un proceso de diseño y ensamblaje de placas de circuito impreso (PC) más ágil pueden considerar el uso de una opción de encapsulado plano cuádruple de bajo perfil (LQFP) como el R7FA8M1AHECFB#AA0 de 144 pines.

Entornos de desarrollo para aplicaciones de IA

Los diseñadores interesados en experimentar con la serie RA8M1 pueden empezar con la placa de evaluación EK-RA8M1 R7FA8M (Figura 4). Esta placa incluye una interfaz Ethernet RMII RJ45, una interfaz USB de alta velocidad para host y dispositivos, y una cabecera CAN FD de tres patillas. En cuanto a la memoria, dispone de 64 Mbytes de Interfaz periférica serial (SPI) octal.

Imagen de la placa de evaluación EK-RA8M1 de Renesas (haga clic para ampliar)Figura 4: La placa de evaluación EK-RA8M1 cuenta con un sólido soporte de E/S para ejercitar la unidad de microcontrolador RA8M1. (Fuente de la imagen: Renesas)

El RA8M1 es compatible con el paquete de software flexible de Renesas (FSP), un marco integral diseñado para proporcionar una base de software fácil de usar, escalable y de alta calidad para diseños de sistemas embebidos.

El paquete ofrece herramientas de desarrollo, incluido el entorno completo de desarrollo integrado (IDE) e² studio, basado en el popular IDE Eclipse. También contiene dos destacados sistemas operativos en tiempo real libres de derechos de autor: Azure RTOS y FreeRTOS.

El paquete incluye controladores ligeros y listos para la producción que admiten casos de uso comunes en sistemas embebidos. Combinados con la placa de evaluación, estos controladores ofrecen a los desarrolladores una vía rápida para experimentar con las E/S del RA8M1.

Conclusión:

El RA8M1 ofrece a los desarrolladores una nueva opción para implementar cargas de trabajo de IA y ML en aplicaciones IoT edge que ahorra energía, mejora el rendimiento, reduce la complejidad y acorta el tiempo de comercialización más rápida.

DigiKey logo

Descargo de responsabilidad: Las opiniones, creencias y puntos de vista expresados por los autores o participantes del foro de este sitio web no reflejan necesariamente las opiniones, las creencias y los puntos de vista de DigiKey o de las políticas oficiales de DigiKey.

Información sobre el autor

Image of Kenton Williston

Kenton Williston

Kenton Williston se licenció en Ingeniería eléctrica en 2000 y comenzó su carrera como analista de referencias de procesadores. Desde entonces ha trabajado como redactor en el grupo EE Times y ha ayudado a lanzar y dirigir múltiples publicaciones y conferencias al servicio de la industria electrónica.

Información sobre la editorial

Editores de DigiKey de América del Norte