La plataforma ADI proporciona componentes y herramientas para desarrollar gafas de realidad aumentada con sonido de oído abierto
Colaboración de Editores de DigiKey de América del Norte
2024-09-11
La integración de audio espacial con gafas de realidad aumentada (RA) puede crear experiencias sensoriales humanas inmersivas e interactivas para salvar mejor la brecha física y digital. Sin embargo, los diseñadores tienen que asegurarse de que las gafas de realidad aumentada con audio sean ligeras y ofrezcan una autonomía prolongada para un uso práctico.
El mercado de las gafas inteligentes de realidad aumentada parece estar a punto de experimentar un crecimiento sustancial, ya que se prevé que los envíos de unidades pasen de poco más de 676,000 en 2023 a 13 millones de unidades en 2030, lo que representa una tasa compuesta de crecimiento anual del 53%. Las mejoras en la calidad de las pantallas, la duración de la batería y el rendimiento general harán que las gafas de realidad aumenten en empresas, industrias y consumidores.
Las gafas de realidad aumentada con micrófonos y altavoces integrados proporcionan acceso rápido a asistentes de voz y reproducción de música. Pueden ser un factor crítico para aprovechar los gemelos digitales en la fábrica o para proporcionar a los ciclistas indicaciones de navegación y rendimiento.
El audio espacial de alta fidelidad puede tener un impacto significativo en la experiencia de RA del usuario al mejorar la textura, el contexto y el significado de las interacciones visuales. Pero obtener un audio de alto rendimiento de las gafas de realidad aumentada es especialmente difícil debido al pequeño factor de forma que se requiere para obtener la aceptación y satisfacción del usuario. Además, estos dispositivos tienen que ser ligeros y ofrecer una mayor duración de la batería, lo que puede resultar especialmente difícil cuando se incorporan a la aplicación funciones como audio de alta calidad, grabación de video o pantallas visuales.
Junto con los avances en la potencia de procesamiento y la resolución de las pantallas, el audio y la gestión de la energía desempeñarán un papel crucial en la creación de aplicaciones de éxito que maximizarán la demanda de estos dispositivos. Entre los retos que hay que superar están:
- Los altavoces más pequeños tienden a tener altas frecuencias de resonancia que pueden dañar los altavoces si se manejan con demasiada fuerza, y hacen que sea más difícil manejar bajos profundos.
- Una calidad de llamada sin ruido que capte la voz del usuario al tiempo que bloquea el ruido ambiental es esencial, pero complicada debido a las distancias entre los micrófonos y la boca del usuario.
- Integrar más características requiere mejores soluciones de gestión de la batería para garantizar una carga más rápida y una mayor autonomía. El equilibrio entre peso, funcionalidad y tiempo de ejecución es clave para su adopción generalizada en el mercado.
- Muchos casos de uso requieren que no se impida a los usuarios oír lo que ocurre en su entorno, como los vehículos que se acercan o las interacciones con los compañeros de trabajo.
Audio de oído abierto
Los diseñadores que se esfuerzan por combinar información visual y auditiva de forma natural y realista deberían considerar la tecnología de audio de oído abierto. Al eliminar la necesidad de auriculares o cascos, el audio de oído abierto ofrece a los usuarios la posibilidad de escuchar tanto los sonidos de la realidad aumentada como los del mundo real, lo que permite disfrutar de una experiencia envolvente y fluida sin comprometer la interacción con otros usuarios y con el entorno.
Con micrófonos integrados y altavoces de oído abierto, las gafas de realidad aumentada son muy adecuadas para aplicaciones de realidad aumentada, realidad virtual (RV) y realidad mixta. Los usuarios pueden disfrutar de una experiencia de escucha más cómoda sin comprometer la calidad ni la fidelidad del sonido. Estos dispositivos permiten a los usuarios oír lo que ocurre en su entorno, de modo que pueden mantener la conciencia de la situación para garantizar la seguridad y colaborar con sus compañeros de trabajo o interactuar con otras personas, al tiempo que minimizan el riesgo -o la molestia- de que otras personas escuchen el contenido de audio.
Los ingenieros pueden aprovechar el audio de oído abierto para crear aplicaciones electrónicas que combinen información visual y auditiva de forma natural. Las gafas de realidad aumentada con esta tecnología añaden otra capa de realismo al ofrecer audio espacial que proporciona a los usuarios un sonido que parece provenir de una dirección y distancia específicas.
El audio espacial será un componente clave del desarrollo del audio de oído abierto. Crea un entorno sonoro realista y envolvente que se adapta al contenido visual y a la perspectiva del usuario. El dispositivo Vision Pro VR de Apple, por ejemplo, incluye audio de oído abierto, integración de audio espacial y mapeado 3D del oído para mejorar la experiencia inmersiva y eliminar la necesidad de componentes externos.
Al simular la forma en que las ondas sonoras interactúan con los oídos, la cabeza y el cuerpo del usuario -y con las superficies y objetos de su entorno físico-, el audio espacial también puede utilizar metadatos como la posición, la orientación, la distancia, la velocidad y la dirección para ajustar dinámicamente los parámetros del sonido. Entre ellos se incluyen el volumen, el paso, el timbre y la reverberación, basados en el movimiento y la interacción del usuario.
El diseño de aplicaciones de audio de oído abierto para gafas de realidad aumentada requiere comprender las ventajas e inconvenientes del dispositivo, los principios y las mejores prácticas del diseño de audio espacial, y las herramientas y marcos de desarrollo. Las pantallas y la grabación de vídeo consumen mucha energía, por lo que la eficiencia es fundamental. El sonido de alta calidad y los diseños atractivos desempeñarán un papel importante en la aceptación de los clientes, y la carga de los dispositivos debe ser cómoda y tan poco frecuente como permita la tecnología.
Plataforma de ADI para aplicaciones de audio de oído abierto para gafas de realidad aumentada
Analog Devices, Inc. (ADI) ofrece una plataforma para gafas de realidad aumentada que incluye componentes integrados de captura de audio, reproducción, gestión de batería y algoritmos. Estos componentes y herramientas de desarrollo ofrecen a los diseñadores una vía rápida para crear y probar aplicaciones de audio para gafas de realidad aumentada de oído abierto.
Los códecs procesadores de audio de ADI utilizan los algoritmos de procesamiento de voz pura de la empresa para mejorar la calidad de las llamadas de voz en entornos acústicos difíciles, y los algoritmos de gestión dinámica de altavoces (DSM™) para crear un sonido más alto y rico a partir de aplicaciones de altavoz con limitaciones de espacio.
- El ADAU1860 (Figura 1) cuenta con un núcleo DSP de audio HiFi 3z y un núcleo FastDSP de baja latencia, junto con ocho canales de entrada de micrófono digital (DMIC), tres entradas analógicas, una salida analógica y dos canales de salida de modulación por densidad de impulsos (PDM). La optimización de la ruta entre la entrada analógica y el núcleo DSP para una baja latencia es ideal para la cancelación de ruido.
Figura 1: El códec ADAU1860 de ADI incorpora dos DSP, ocho entradas digitales de micrófono y tres entradas analógicas, entre otras características. (Fuente de la imagen: Analog Devices, Inc.)
- El ADAU1797 es una opción de códec de bajo consumo y alto rendimiento que también integra un núcleo DSP de audio HiFi 3z y un núcleo FastDSP de baja latencia, junto con tres canales de entrada analógica, 10 canales de entrada DMIC, dos canales de salida PDM y un canal de salida de amplificador de clase D de alta eficiencia. En modo de bajo consumo, los núcleos DSP están optimizados para aplicaciones de pequeño factor de forma, como las gafas AR de audio de oído abierto. En el modo de alto rendimiento, el núcleo HiFi 3z pasa de 50 MHz a 200 MHz, y el FastDSP admite el doble de instrucciones, de 64 a 128. Su mayor capacidad de procesamiento puede utilizarse para descargar ciclos de un procesador host o para permitir el uso de un procesador host de menor coste sin necesidad de un DSP de señal digital (DSP) o una unidad de microcontrolador externos adicionales.
- ADI ofrece placas de evaluación para cada uno de estos códecs. El EVAL-ADAU1797Z (Figura 2) es un diseño de 8 capas, con un plano de tierra y un plano de alimentación en las capas interiores, y puede alimentarse con una única fuente de 3,8 V a 5 V. El EVAL-ADAU1860EBZ tiene un diseño de 4 capas, también con plano de tierra y plano de alimentación en las capas interiores, y puede alimentarse mediante el bus USB o una única fuente de 5 V.
Figura 2: La placa de evaluación EVAL-ADAU1797Z proporciona acceso completo a todas las entradas/salidas analógicas y digitales del ADAU1797. (Fuente de la imagen: Analog Devices, Inc.)
Los amplificadores de audio inteligentes de ADI ofrecen algoritmos integrados de retroalimentación de voltaje y corriente (IV) y gestión de altavoces para maximizar el rendimiento en factores de forma con problemas de espacio.
- El MAX98388 es un amplificador de entrada digital mono de clase D diseñado para aplicaciones AR/VR y gafas inteligentes. Ofrece retroalimentación IV para funciones de amplificador inteligente y puede descargar el procesamiento DSM al códec de audio. Está optimizado para aplicaciones de hasta 5.5 V (monocélula) y ofrece una eficiencia de hasta el 90%.
- El MAX98390, presentado más recientemente, es un amplificador reforzado de clase D con DSM integrado que puede aumentar la sonoridad (SPL) y la respuesta de graves para mejorar la calidad de audio de los microaltavoces al tiempo que maximiza la eficiencia. El convertidor elevador integrado y el escalado FET, junto con el DSM, permiten un funcionamiento más prolongado de la batería. La tensión máxima de salida del convertidor elevador es programable de 6.5 V a 10 V en incrementos de 0.125 V a partir de una tensión de batería tan baja como 2.65 V. El MAX98390CEVSYS# (Figura 3) incluye la GUI DSM Sound Studio de ADI para simplificar el diseño y la implementación DSM para aplicaciones que utilizan el MAX98390CEWX+T.
Figura 3: El sistema de evaluación MAX98390CEVSYS# incluye el software DSM Sound Studio con una potente interfaz gráfica de usuario para extraer, ajustar y evaluar el amplificador MAX98390C. (Fuente de la imagen: Analog Devices, Inc.)
La potencia es un factor crítico en el diseño de las gafas de realidad aumentada. Los altavoces de audio de oído abierto requieren más potencia que la típica administración de auriculares y ADI ofrece varios CI de administración de alimentación eficientes que los diseñadores pueden utilizar para sus aplicaciones:
- Los circuitos integrados de administración de energía (PMIC) de la serie MAX77654 de ADI proporcionan soluciones altamente integradas de carga de batería y fuente de alimentación. Con un regulador de un solo inductor y múltiples salidas (SIMO), proporciona tres carriles de alimentación programables de forma independiente a partir de un único inductor para minimizar el tamaño de la solución. Un cargador Smart Power Selector™ Li+/Li-Poly proporciona una corriente de carga programable de 7.5 mA a 300 mA, y una tensión de carga programable de 3.6 V a 4.6 V, con monitorización de la temperatura de la batería para una carga segura. Incorpora dos reguladores lineales de caída baja (LDO) de 100 mA para proporcionar rechazo a la ondulación en aplicaciones de audio y otras aplicaciones sensibles al ruido.
- Los PMIC MAX77659 incorporan un regulador elevador SIMO de doble entrada que proporciona un carril de carga y tres carriles de alimentación programables de forma independiente a partir de un único inductor y un LDO para el rechazo de la ondulación.
- MAX77972 de ADI es un chip combinado tres en uno que incluye detección USB-C, un cargador Buck de 3 A y un indicador de combustible. Es compatible con USB On-The-Go (OTG) reverse elevador e incluye un Smart power selector™ (SPS). El indicador de combustible utiliza el algoritmo ModelGauge™ m5 que compensa automáticamente el envejecimiento de la célula, la temperatura y la velocidad de descarga, y proporciona un estado de carga (SOC) preciso en una amplia gama de condiciones de funcionamiento. Los pines de detección del canal de configuración USB Type-C (CC) permiten la detección automática de la fuente de alimentación USB Type-C y la configuración del límite de corriente de entrada.
- El MAX17301 es un CI de indicador de combustible autónomo. Proporciona protección, detección opcional de autodescarga interna de la batería y autenticación Algoritmo de control seguro-256 opcional para baterías de ion de litio de 1 celda. Una interfaz I2C de 1 o 2 hilos de Maxim proporciona acceso a los registros de datos y control.
- El MAX17332 de ADI es una solución de gestión de baterías de un solo chip que incluye un cargador lineal, un indicador de combustible, protección de la batería y detección de autodescarga. Puede equilibrar la capacidad de baterías mixtas y proporcionar una carga rápida, con capacidad para cargar independientemente baterías en paralelo y evitar la carga cruzada.
Conclusión:
El audio ha sido una de las principales limitaciones a la hora de aprovechar el potencial de las aplicaciones de RA, que normalmente se han centrado en la visión. El audio de oído abierto ofrece la oportunidad de aprovechar ese potencial con unas gafas de realidad aumentada más ligeras, modernas y cómodas, capaces de soportar numerosos casos de uso. ADI ha ensamblado una plataforma de componentes, herramientas y software para crear soluciones completas.
Descargo de responsabilidad: Las opiniones, creencias y puntos de vista expresados por los autores o participantes del foro de este sitio web no reflejan necesariamente las opiniones, las creencias y los puntos de vista de DigiKey o de las políticas oficiales de DigiKey.


