Necesidades críticas de eficiencia energética en centros de datos
El auge de la IA está convirtiendo la computación en centros de datos en un recurso de alto valor y que consume mucha energía. Los equipos de producto deben ofrecer eficiencia, densidad y fiabilidad mientras gestionan la demanda explosiva y tienen en cuenta las limitaciones de infraestructura, regulación y políticas. Lograr este equilibrio requiere innovaciones en una conversión rápida y eficiente de energía y en supervisión escalonada y sincronizada por hardware para proteger tanto los rieles críticos de baja tensión como los rieles auxiliares a nivel de sistema.
Los centros de datos modernos, especialmente los centrados en la IA, están cada vez más diseñados en torno a la densidad de energía y la capacidad energética total en lugar de solo en el número de servidores. Donde antes los servidores eran la unidad principal de planificación, los centros de datos modernos ahora están organizados en torno a megavatios de energía y refrigeración, dimensionados para filas o pods enteros de racks en lugar de máquinas individuales.
Los racks optimizados para IA suelen consumir 30 kW o más, varias veces más de los 5-15 kW típicos de los racks tradicionales de servidores, lo que pone el consumo máximo de un solo rack al nivel de un pequeño barrio residencial. Operar en este entorno requiere aplicaciones capaces de gestionar la energía proporcionada de forma estricta mientras mantienen los sistemas estables durante picos repentinos. Los componentes de Texas Instruments demuestran cómo los diseños modernos pueden satisfacer estos nuevos requisitos de potencia y fiabilidad.
Anticipación de restricciones
Este cambio significa que los diseñadores ya no pueden asumir que las características escalarán automáticamente. Cada interacción, cálculo o experiencia intensiva en datos tiene ahora un impacto tangible en los sistemas subyacentes. Las funciones que desencadenan cargas de trabajo grandes e repentinas pueden introducir latencia, causar limitación o requerir compensaciones de escalado en otras partes del sistema.
Los diseños más efectivos anticipan las restricciones en lugar de ignorarlas, ofreciendo valor mientras responden bajo presión y hacen que cada detalle de cálculo cuente. Los diseñadores deben sopesar los compromisos entre velocidad, funcionalidad y eficiencia, equilibrando la experiencia del usuario con las limitaciones físicas del cómputo y la energía.
Incorporar eficiencia, precisión y resiliencia en el hardware es clave para diseñar aplicaciones de centros de datos que aporten valor sin sobrecargar los sistemas. Las aplicaciones deben mantenerse receptivas bajo presión y hacer que cada vatio de cálculo cuente. Esto empieza con componentes que gestionan la energía, monitorizan el voltaje y protegen el rendimiento bajo picos repentinos.
Lo siguiente ilustra cómo los componentes de TI pueden reforzar esas aplicaciones.
La capa de conversión
La tecnología de energía de nitruro de galio (GaN) es cada vez más fundamental para optimizar la eficiencia de los centros de datos. Los servidores de IA impulsados por unidades de procesamiento gráfico (GPU) de NVIDIA consumen grandes cantidades de energía que deben reducirse rápida y con precisión. La integración de un controlador de puerta de alta velocidad con un transistor de efecto campo (FET) GaN permite frecuencias de conmutación más altas y reducir las pérdidas de conmutación en comparación con las soluciones convencionales de silicio. Esto mejora la eficiencia de conversión de potencia tanto en placa como en rack, resultando en una menor pérdida de energía por calor, menor demanda de refrigeración y circuitos de entrega de potencia más compactos. Los centros de datos se benefician de una mayor densidad de cálculo y un mejor rendimiento energético global.
El TI LMG3100R017VBER (Figura 1) es un FET GaN de 100 V con un controlador de compuerta de alta frecuencia integrado en un paquete compacto. Combina el FET GaN y el driver, incluyendo un desfasador interno de nivel lateral alto y circuito de arranque, permitiendo que dos dispositivos formen un puente medio sin necesidad de un desfasador de nivel externo.
Figura 1: El LMG3100R017VBER es un FET GaN de 100 V y 1.7 mΩ con controlador de puerta integrado. (Fuente de la imagen: Texas Instruments)
Supervisión del sistema
Los dispositivos GaN conmutan extremadamente rápido y funcionan a altos voltajes. Las fluctuaciones rápidas y grandes comunes en los servidores de centros de datos de alta densidad pueden causar caídas o picos de voltaje, lo que conduce a un funcionamiento errático, aumento del estrés sobre GPU y otros componentes, y posibles inactividades. Sin una monitorización adecuada, una etapa de potencia de FET GaN podría intentar cambiar cuando el voltaje esté fuera del rango seguro.
Mientras que los rieles críticos de alta tensión requieren supervisión de acción rápida, los rieles auxiliares requieren una monitorización y secuenciación más amplias de la lógica del sistema de alimentación, E/S y circuitos de refrigeración para mantener la estabilidad general del sistema.
La línea de circuitos integrados supervisores TPS3760 de TI (Figura 2) monitoriza un único riel de mayor tensión con respuesta sincronizada por hardware y una sobrecarga mínima. Mientras que el fabricante ofrece modelos para aplicaciones automotrices, los diseñadores que se dirigen a aplicaciones de centros de datos pueden seleccionar versiones comerciales estándar como el TPS3760A015DYYR. Estos dispositivos utilizan comparadores de tensión interna de precisión para comprobar continuamente la tensión del riel frente a un umbral definido, estableciendo una señal de reinicio si el voltaje se sale del rango.
Figura 2: Los dispositivos TPS3760 son supervisores de sobretensión/subtensión de 65 V con entrada de detección, corriente de reposo ultra baja y retardo programable. (Fuente de la imagen: Texas Instruments)
La familia TPS389006 de TI proporciona una supervisión rápida y precisa de los raíles de bajo voltaje que alimentan GPU, CPU y memoria. Los dispositivos TPS389006007RTER (Figura 3), por ejemplo, monitorizan estos rieles en tiempo real y activan señales de reinicio inmediatamente cuando el voltaje se desvía de las tolerancias estrictas. Al estar situados cerca del punto de carga, protegen dispositivos sensibles y de alta corriente contra fallos transitorios y aseguran un funcionamiento estable durante cambios rápidos de carga.
Figura 3: Los componentes TPS389600 como el TPS389006007RTER proporcionan una supervisión de voltaje multicanal de alta precisión para sistemas que operan en rieles de alimentación de baja tensión y tienen tolerancias de margen estrechas. (Fuente de la imagen: Texas Instruments)
Los dos tipos de circuitos integrados supervisores complementan los FET GaN combinando secuenciación a nivel de sistema con protección rápida en puntos de carga en un esquema de supervisión escalonado: los dispositivos TPS3760 supervisan rieles de mayor voltaje con reinicio temporizado por hardware, mientras que los dispositivos TPS389006 proporcionan monitorización de baja latencia de rieles críticos de baja tensión, asegurando un funcionamiento seguro y fiable bajo condiciones de carga dinámica.
Conclusión
Las etapas de potencia GaN de alta velocidad, como las LMG3100R017VBER de TI, proporcionan una conversión de potencia compacta y de baja pérdida con conmutación segura en el lado alto. Los circuitos integrados supervisores, como TPS389006 y TPS3760, permiten monitorización por niveles y sincronizada por hardware, desde rieles críticos de baja tensión hasta rieles de sistema de mayor tensión, asegurando una secuencia adecuada y una respuesta rápida ante fallos. Al combinar una conversión rápida y eficiente de energía con supervisión en capas, los diseñadores pueden aumentar la densidad del sistema, reducir el desperdicio de calor y energía, y mantener un rendimiento estable incluso bajo cargas de trabajo fluctuantes.
Have questions or comments? Continue the conversation on TechForum, Digi-Key's online community and technical resource.
Visit TechForum
