El CEO de Nvidia, Jensen Huang, dio a conocer un importante cambio estratégico en GTC 2026 el lunes, guiando al gigante de microchips desde entrenamiento IA hacia inferencia, el despliegue en tiempo real de inteligencia artificial, a la vez que duplicó su previsión de mercado a $1 billón hasta 2027. La compañía presentó su Vera Rubin AI Platform, que combina nuevas CPU y GPU diseñadas específicamente para ejecutar aplicaciones de IA a escala, a medida que la demanda pasa de construir modelos de IA a desplegarlos globalmente.
El elemento central de la nueva plataforma es la Nvidia Vera CPU, con 88 núcleos personalizados «Olympus» que ofrecen un rendimiento 50% más rápido y el doble de eficiencia energética en comparación con procesadores tradicionales, según Constellation Research. El chip, cuyo lanzamiento está previsto para la segunda mitad de 2026, representa el primer procesador de Nvidia diseñado específicamente para cargas de inferencia en lugar de entrenamiento de modelos de IA.
Grandes proveedores cloud como AWS, Microsoft Azure y Google Cloud ya se han comprometido a adoptar la plataforma Vera CPU, junto con los fabricantes de equipos Dell y HPE, lo que señala un amplio apoyo de la industria a la nueva dirección de Nvidia. La compañía también anunció una alianza estratégica con Groq para incorporar su tecnología Language Processing Unit, especializando aún más la arquitectura hardware para aplicaciones de IA en tiempo real.
Las dinámicas del mercado se desplazan hacia inferencia

El momento del giro de Nvidia refleja cambios fundamentales en el mercado de IA. Según el Educational Technology and Change Journal, 2026 marcará el año en que la inversión total en aceleradores de inferencia superará la de aceleradores de entrenamiento, a medida que las empresas pasan de construir modelos a desplegarlos a escala.
El mercado mundial de inferencia IA, valorado en $97.24 mil millones en 2024, proyecta alcanzar $253.75 mil millones para 2030, según análisis de la industria citados por el Educational Technology and Change Journal. Este crecimiento explosivo está impulsado por sistemas de «IA agéntica» que perciben, razonan y actúan de forma autónoma de manera continua, creando una demanda constante de potencia de cómputo en tiempo real.
Huang describió a la compañía como la «primera empresa del mundo verticalmente integrada, pero horizontalmente abierta», señalando la intención de Nvidia de controlar toda la infraestructura de IA mientras mantiene alianzas, según Constellation Research. La estrategia incluye el Vera Rubin DSX AI Factory Reference Design, que ofrece planos modulares para que los clientes construyan infraestructura de IA a gran escala y de alta eficiencia energética.
El movimiento también posiciona a Nvidia frente a la competencia emergente de empresas como Meta, que están desarrollando chips de inferencia personalizados. Entre las aplicaciones clave que impulsan la demanda se incluyen los vehículos autónomos, el diagnóstico médico, los copilotos en tiempo real y los sistemas de recomendación impulsados por IA que operan a escala global, abarcando industrias desde la salud hasta las telecomunicaciones.
Sources
- constellationr.com
- etcjournal.com

