EUR | USD

El aprendizaje automático ha llegado: úselo con sabiduría

El aprendizaje automático (AA), un subconjunto de inteligencia artificial (IA), ya se usa de manera efectiva en aplicaciones, como diagnóstico médico, procesamiento de imágenes, clasificación, predicción, pruebas de regresión y mucho más. Cuando se considera el uso del AA, por lo general, existen dos áreas de riesgo: la seguridad de su uso y el riesgo de la validez de sus hallazgos.

Figura 1: El Internet industrial de las cosas (IIoT) cuenta con numerosas interconexiones que pueden administrarse de manera más eficiente con el aprendizaje automático incorporado en el sistema. (Fuente de la imagen: SlideShare.net)

Los ataques de seguridad con IA no son nuevos, pero son cada vez más sofisticados. La superficie expuesta a ataques, la cantidad de puntos en el que un usuario no autorizado puede ingresar o extraer datos de forma encubierta, puede aprovecharse. Existen tres áreas de vulnerabilidades de riesgo: los datos de entrada, el diseño de algoritmos y las decisiones de salida.

El aprendizaje automático se logra de la mejor manera mediante el acceso a grandes cantidades de datos a partir de los cuales el aprendizaje ocurre en un nivel difícil de conseguir para los humanos. Los ataques incluyen modelos entrenados envenenados por la creación de “puertas traseras” y la inserción de una carga útil o activador malicioso. En este segmento de IA, los algoritmos son impredecibles y complejos, no están sujetos a estándares y normativas, y se basan en datos propios, lo que hace que las alteraciones sean aún más difíciles de detectar.

Existe otra área de riesgo, además de la seguridad. Dado que los seres humanos crean los modelos de aprendizaje, están sujetos a sesgos que pueden integrarse en el modelo. El sesgo de datos es peligroso y debe administrarse con cuidado. Administrar sesgos es un aspecto muy importante para administrar los riesgos del aprendizaje automático.

El riesgo también puede conllevar a datos insuficientes y a la existencia de datos buenos o apropiados. Un gran problema puede ser la falta de datos variables con suficientes puntos de datos para buscar las mejores entradas y obtener resultados óptimos. Los datos que conforman los modelos del aprendizaje automático deben variar según los tipos de datos, los plazos y otras formas de variabilidad.

Por último, existen interpretaciones del resultado. Puede haber interpretaciones erróneas del resultado.Los modelos proporcionan estimaciones y orientaciones, pero es importante tener en cuenta cómo se construyó un modelo, qué supuestos se adoptaron y lo que el resultado muestra para que las interpretaciones tengan valor.

Ya existen muchos casos de lo que puede salir mal, como los siguientes:

  • Algoritmos a los que se culpó por la caída del 6% de la libra esterlina por dos minutos durante el referéndum del Brexit en 2016.
  • Los algoritmos que utilizaron los sistemas de justicia penal en los Estados Unidos que predicen las tasas de reincidencia están sesgados racialmente.
  • Numerosos resultados de estudios del cerebro son cuestionables después de hipótesis estadísticas erróneas y se encuentran errores en imágenes por resonancia magnética funcional (fMRI).
  • Cuando el precio del Bitcoin se disparó rápidamente en 2017, los hackers minaron mediante instancias de Google Cloud de forma gratuita. El sistema de detección de anomalías de Google Cloud estaba en uso para las instancias de Google Cloud, por lo tanto, se advirtió a los clientes del peligro.

Los sistemas de aprendizaje automático resuelven problemas difíciles. El hecho de que pueda sufrir un efecto negativo a nivel de seguridad y precisión se verá afectado por los avances en la tecnología que se utilizan y en el crecimiento de las aplicaciones exitosas que la usan.

Avances recientes en el aprendizaje automático

STMicroelectronics recientemente anunció la primera aplicación de aprendizaje automático en su STM32G4 por el socio Cartesiam, miembro del Programa de socios ST de aprendizaje automático. ST lanzó STM32Cube.AI para que los desarrolladores puedan entrenar con rapidez una red neuronal mediante la recopilación de datos antes de procesarla en un marco de entrenamiento de redes neuronales en una PC a fin de reconocer actividades específicas, como caminar, correr o nadar. El resultado se convierte en un código que permite que las MCU STM32 reconozcan las actividades.

Figura 2: En la imagen se encuentra la placa de evaluación STMicroelectronics SensorTile. (Fuente de la imagen: STMicroelectronics)

NanoEdge AI de Cartesiam ejecuta la fase de aprendizaje en el microcontrolador. Los ingenieros recurren a esta solución cuando no pueden crear modelos previamente entrenados con cuidado para situaciones específicas, pero aún desean usar el aprendizaje automático para crear soluciones inteligentes. La fase de entrenamiento se lleva a cabo en la MCU para analizar el comportamiento normal de un dispositivo dentro de su entorno previsto, luego se ejecutan las inferencias en la misma MCU con el fin de detectar e informar anomalías de comportamiento.

Con NanoEdge AI, los desarrolladores integran las capacidades locales de entrenamiento y análisis de IA en el código C con facilidad, que se optimiza para las MCU STM32. En demostraciones, Cartesiam demostró cómo sus bibliotecas de aprendizaje automático podían usar el módulo SensorTile de STM, la placa de evaluación SensorTile (Figura 2), para aprender el comportamiento de un motor BLDC a través del análisis de vibraciones, luego detectar e informar una anomalía gracias a la MCU STM32L4 integrada.

También se encuentra un núcleo de aprendizaje automático en los sensores avanzados de STMicroelectronics, como el LSM6DSOX iNEMO. El núcleo, combinado con una máquina de estado finito (FSM) y funciones digitales avanzadas, proporciona la capacidad de transición de un estado de potencia ultrabaja a capacidades de IA de alto rendimiento y alta precisión para IoT, juegos, dispositivos portátiles y dispositivos de batería. electrónica de consumo. Al ser compatible con los requisitos típicos del SO, ofrece sensores reales, virtuales y por lotes con 9 kbytes de RAM disponibles para la agrupación por lotes de datos dinámicos.

A pesar de que la inteligencia artificial y el aprendizaje automático en todas sus formas siguen sorprendiendo, será la combinación de nuevas aplicaciones, la potencia de salida y la capacidad de mantener la seguridad lo que seguirá impulsando su uso.

Información sobre el autor

Image of Carolyn Mathas

Carolyn Mathas se ha consagrado como escritora al realizar publicaciones en EDN, EE Times Designlines, Light Reading, Lightwave y Electronic Products durante más de 20 años. También ofrece el servicio de redacción de contenido y marketing a medida para diferentes empresas.

More posts by Carolyn Mathas