Meta lanzó RCCLX, una actualización de código abierto para el software de comunicación de GPU de AMD, el 24 de febrero de 2026, ofreciendo hasta un 50% más de rendimiento para cargas de IA y modelos de lenguaje grandes. La mejora integra la capa de transporte personalizada de Meta con la biblioteca RCCL de AMD, introduciendo colectivos residentes en GPU y otras características avanzadas que aceleran significativamente las operaciones de IA basadas en PyTorch.
El avance llega en un momento crítico para AMD mientras compite con NVIDIA por el dominio del mercado de aceleradores de IA. RCCLX aborda cuellos de botella de rendimiento de larga data en la pila de comunicaciones de AMD que han limitado su adopción para el entrenamiento de IA a gran escala, según Ingeniería de Meta.
El software introduce tres innovaciones clave que impulsan las mejoras de rendimiento. Los colectivos residentes en GPU permiten a los procesadores gráficos gestionar operaciones de comunicación directamente sin intervención del host, reduciendo drásticamente la latencia. Los algoritmos de Acceso Directo a Datos apuntan específicamente a operaciones AllReduce, logrando un 10-50% de aceleración para las fases de decodificación y un 10-30% de mejoras para las fases de prefill en la inferencia de modelos de lenguaje, reportó Meta.
Quizás lo más notable es que los nuevos colectivos de baja precisión utilizan cuantización FP8 para comprimir las transferencias de datos hasta 4:1 mientras mantienen la precisión computacional en FP32. Esta característica por sí sola proporciona una aceleración significativa para grandes transferencias de mensajes en las GPUs de la serie MI300 y MI350 de AMD, según los benchmarks publicados por Meta.
Impacto en el mercado y adopción
El lanzamiento fortalece la posición de AMD en el competitivo panorama de hardware de IA al eliminar una desventaja de software clave. RCCLX se integra sin problemas con PyTorch a través del proyecto Torchcomms, lo que facilita la adopción para desarrolladores que ya usan el marco de IA de Meta.
Disponible bajo una licencia BSD de 3 cláusulas en GitHub, el software requiere las versiones ROCm 6.4 o 7.0 de AMD y está optimizado para los últimos aceleradores Instinct MI300X, MI325X y MI350X de la compañía. Los desarrolladores pueden activar las mejoras compilando Torchcomms desde el código fuente con variables de entorno específicas, indica la documentación de Meta.
El momento parece estratégico, ya que la demanda de infraestructura de IA continúa aumentando a nivel global. Al hacer que estas optimizaciones sean de código abierto, Meta permite que la comunidad de IA en general logre un mejor rendimiento en el hardware de AMD, lo que podría acelerar la adopción más allá de sus propios centros de datos.
Meta indicó planes para continuar desarrollando RCCLX para lograr la paridad de funciones con NCCLX, su equivalente de NVIDIA. La empresa describe Torchcomms como «experimental», señalando una evolución continua a medida que crecen las necesidades del ecosistema de IA. El proyecto sigue abierto a las contribuciones de la comunidad, posicionándolo para un desarrollo colaborativo a medida que más organizaciones despliegan GPUs AMD para cargas de IA.
Sources
- Ingeniería de Meta

