Tamaño y Participación del Mercado de GPU Desagregada

Mercado de GPU Desagregada (2026 - 2031)
Imagen © Mordor Intelligence. El uso requiere atribución según CC BY 4.0.

Análisis del Mercado de GPU Desagregada por Mordor Intelligence

Se proyecta que el tamaño del mercado de GPU desagregada será de 3,97 mil millones USD en 2025, 5,34 mil millones USD en 2026, y alcanzará los 22,63 mil millones USD en 2031, creciendo a una CAGR del 33,48% de 2026 a 2031. El mercado de GPU desagregada se está expandiendo a medida que las pilas de cómputo de IA se alejan de los diseños de servidores fijos y avanzan hacia arquitecturas conectadas por tejido de red que permiten a los operadores separar los recursos de GPU de los servidores anfitriones y asignarlos donde la demanda es mayor. Los grandes programas de capital de AMD y NVIDIA, junto con las implementaciones confirmadas por las principales plataformas en la nube, muestran que el mercado de GPU desagregada está ahora vinculado al rediseño amplio de centros de datos en lugar de ciclos aislados de actualización de hardware. El comportamiento competitivo también está cambiando porque los operadores están poniendo mayor énfasis en la utilización, la orquestación y la eficiencia a escala de bastidor que en simplemente agregar más aceleradores. El mercado de GPU desagregada también se beneficia del auge de las cargas de trabajo de IA agéntica, que ejercen mayor presión sobre el rendimiento de tokens, el movimiento de caché KV y la coordinación de baja latencia entre las etapas de prellenado y decodificación. Al mismo tiempo, los controles de exportación, las brechas de interoperabilidad y la densidad de potencia de los bastidores de IA modernos están manteniendo el crecimiento desigual, favoreciendo a los operadores con infraestructura diseñada específicamente y una sólida profundidad de ingeniería.

Conclusiones Clave del Informe

  • Por componente, el hardware lideró con una participación de ingresos del 81,32% en 2025, mientras que se proyecta que el software se expandirá a una CAGR del 34,08% hasta 2031 en el mercado de GPU desagregada.
  • Por tipo de acelerador, la desagregación basada en NVLink/NVSwitch mantuvo una participación del 44,21% en 2025, mientras que se proyecta que la desagregación basada en CXL se expandirá a una CAGR del 34,46% hasta 2031.
  • Por modo de implementación, la implementación basada en la nube representó el 61,77% del mercado de unidades de procesamiento gráfico (GPU) desagregadas en 2025 y se proyecta que crecerá a una CAGR del 33,87% hasta 2031.
  • Por aplicación, la IA y la computación de alto rendimiento capturaron el 72,49% del mercado en 2025, mientras que se proyecta que el gemelo digital y la simulación se expandirán a una CAGR del 34,42% hasta 2031.
  • Por usuario final, los proveedores de nube a hiperescala mantuvieron una participación del 47,63% en 2025, mientras que se proyecta que los proveedores de servicios en la nube registren la CAGR más alta del 34,63% hasta 2031.
  • Por geografía, América del Norte mantuvo el 52,71% de la participación del mercado de GPU desagregada en 2025, mientras que se proyecta que Asia-Pacífico se expandirá a una CAGR del 34,39% hasta 2031.

Nota: Las cifras del tamaño del mercado y los pronósticos de este informe se generan utilizando el marco de estimación patentado de Mordor Intelligence, actualizado con los datos y conocimientos más recientes disponibles a partir de enero de 2026.

Análisis de Segmentos

Por Componente: El Hardware Lidera el Gasto Inicial Mientras el Software Gana Peso Recurrente

El hardware representó el 81,32% del mercado de GPU desagregada en 2025, reflejando los altos costos iniciales de los tejidos de interconexión, bandejas de conmutadores, módulos de memoria y sistemas de cómputo a escala de bastidor. Cada bastidor Vera Rubin NVL72 combinó 72 GPU Blackwell, 36 CPU Vera, chips de conmutador NVLink, DPU BlueField-4 y redes Ethernet Spectrum-X en una única unidad de capital basada en tejido, manteniendo el gasto inicial en el mercado de GPU desagregada concentrado en grandes ciclos de adquisición a hiperescala. Ese modelo de adquisición importa porque los compradores no están adquiriendo tarjetas o servidores aislados; están comprometiéndose con plataformas estrechamente integradas que agrupan capacidades de cómputo, redes y gestión dentro de un único evento de implementación. El mercado de GPU desagregada, por lo tanto, muestra una combinación de ingresos con predominio de hardware en su fase actual, especialmente a medida que los hiperescaladores construyen nueva capacidad de IA en bastidores completos en lugar de mediante adiciones graduales nodo por nodo. Los servicios siguieron siendo la capa de componentes más pequeña, aunque la integración, las operaciones gestionadas y la entrega de GPU como servicio todavía tenían un atractivo potencial de margen para los integradores de sistemas y los operadores de nube especializados.

Se proyecta que el software registre la CAGR más rápida del 34,08% de 2026 a 2031 en el mercado de GPU desagregada, a medida que las capas de orquestación, las herramientas de aislamiento y los marcos de inferencia determinan cada vez más el valor que los operadores extraen de cada GPU. NVIDIA Dynamo separó las asignaciones de prellenado y decodificación para elevar la utilización a escala de fábrica, y ese diseño estableció un punto de referencia que las alternativas de código abierto como llm-d ahora necesitan igualar para las implementaciones empresariales. Esto cambia el patrón de ingresos de la industria de GPU desagregada, porque las actualizaciones de software pueden continuar incluso cuando los ciclos de actualización de hardware se ralentizan o cuando el tejido instalado permanece en su lugar. Los operadores que instalaron hardware desagregado en 2024 y 2025 probablemente agregarán nuevas capas de orquestación antes de reemplazar los activos de interconexión física, creando un camino para ingresos recurrentes de software que están menos vinculados al momento de reemplazo de bastidores. Con el tiempo, esa dinámica debería dar al software un papel más importante en el mercado de GPU desagregada incluso si el hardware continúa anclando el gasto absoluto.

Mercado de GPU Desagregada: Participación de Mercado por Componente
Imagen © Mordor Intelligence. El uso requiere atribución según CC BY 4.0.

Por Tipo de Acelerador: NVLink Establece la Línea Base Actual Mientras CXL Amplía la Arquitectura

La desagregación basada en NVLink/NVSwitch mantuvo el 44,21% de la participación del mercado de GPU desagregada en 2025, reflejando la sólida posición de NVIDIA en los tejidos de entrenamiento de IA y la preferencia instalada por la comunicación de GPU estrechamente acoplada. La sexta generación de NVLink entregó 1,8 TB/s por GPU en 2024, y los sistemas NVLink Switch más nuevos habilitaron la comunicación de todos con todos en 72 GPU con 130 TB/s de ancho de banda agregado, dando al mercado de GPU desagregada una opción de alto rendimiento para clústeres de escalado vertical que necesitan comunicación local densa. La desagregación basada en PCIe mantuvo un papel duradero como tejido de referencia en muchos sistemas de múltiples GPU, ofreciendo amplia compatibilidad sin el mismo nivel de dependencia propietaria. Los enfoques basados en InfiniBand y Ethernet continuaron siendo importantes en entornos de escalado horizontal, y Ethernet en particular ganó relevancia donde los operadores querían extender grandes clústeres de IA aprovechando las inversiones en redes existentes. Esa división significa que el mercado de GPU desagregada no se está moviendo hacia un tejido universal, sino hacia un modelo en capas en el que el rendimiento, la apertura y la infraestructura instalada influyen cada uno en la arquitectura final.

Se proyecta que la desagregación basada en CXL se expanda a una CAGR del 34,46% hasta 2031, respaldada por la agrupación de memoria CXL 3.0 y la especificación CXL 4.0, que duplicó el ancho de banda a 128 GT/s mediante capas físicas PCIe 7.0 e introdujo puertos agrupados para un rendimiento total mucho mayor. La investigación en Tsinghua Science and Technology mostró que la desagregación de memoria CXL y la desagregación de cómputo de GPU sirven a diferentes capas de la pila, lo que sugiere que las implementaciones futuras en el mercado de GPU desagregada las combinarán en lugar de forzar una elección entre ellas. Samsung Electronics está desarrollando su plataforma de memoria CXL Pangea con Marvell y Liquid AI para expandir la memoria de GPU, donde los límites de HBM pueden restringir los tamaños de lote de inferencia y la profundidad del contexto de trabajo. En la práctica, NVLink es adecuado para la comunicación estrechamente acoplada de GPU a GPU dentro del bastidor, mientras que CXL extiende la capacidad de memoria y el intercambio de memoria entre nodos y dominios de sistema más amplios. Esa relación complementaria debería ayudar al mercado de GPU desagregada a madurar hacia arquitecturas más componibles sin reducir el papel de los tejidos de GPU de alto ancho de banda ya establecidos en los clústeres de producción.

Por Modo de Implementación: La Entrega en la Nube Establece Estándares Mientras la Implementación Local Mantiene Demanda Estratégica

La implementación basada en la nube mantuvo una participación del 61,77% del tamaño del mercado de GPU desagregada en 2025, y el mismo segmento proyecta publicar la CAGR más rápida del 33,87% hasta 2031. AWS introdujo la inferencia desagregada en SageMaker HyperPod y Amazon EKS a través de llm-d y la Biblioteca de Transferencia de Inferencia de NVIDIA, utilizando el Adaptador de Tejido Elástico para mover datos de caché KV entre nodos desagregados y entregando hasta un 70% más de tokens por segundo en instancias basadas en Blackwell que las implementaciones estándar. Google Cloud añadió otra señal cuando dijo que Virgo puede conectar hasta 80.000 GPU Vera Rubin NVL72 en un único centro de datos y extenderse más allá de 960.000 GPU en múltiples sitios, reforzando el papel de los hiperescaladores en el establecimiento del modelo operativo para el mercado de unidades de procesamiento gráfico (GPU) desagregadas. La ventaja de la entrega en la nube no es solo la escala, sino también la capacidad de ocultar la refrigeración, la configuración del tejido y la complejidad de la orquestación detrás de los servicios gestionados. Por eso el mercado de GPU desagregada continúa inclinándose hacia las plataformas en la nube, especialmente para los compradores que necesitan acceso a capacidad avanzada de IA pero no quieren construir y operar infraestructura especializada por su cuenta.

La implementación local todavía importa en el mercado de GPU desagregada para las empresas y organizaciones del sector público que no pueden mover cargas de trabajo sensibles a entornos de nube pública compartida. La información muestra que los compradores empresariales son más sensibles al precio que los hiperescaladores y generalmente adoptan arquitecturas desagregadas después de que los operadores de nube las han validado a escala, lo que empuja la demanda local hacia un camino más lento pero aún importante. Las organizaciones gubernamentales y de defensa forman un grupo local separado, porque los programas de IA soberana y las normas de seguridad nacional a menudo requieren entornos de cómputo con aislamiento total o vinculados a una jurisdicción. Los requisitos de localización de datos en la Unión Europea y partes de Asia-Pacífico también respaldan un piso para la infraestructura dedicada, incluso cuando la nube sigue siendo el modo más grande y de mayor crecimiento. Como resultado, es probable que el mercado de GPU desagregada mantenga una estructura dual, con plataformas en la nube marcando el ritmo de la innovación mientras las implementaciones locales siguen siendo importantes cuando el cumplimiento normativo, el control o la sensibilidad de la carga de trabajo limitan el acceso compartido.

Por Aplicación: La IA y la HPC Impulsan la Demanda Actual Mientras la Simulación Construye Nuevo Volumen

La IA y la computación de alto rendimiento representaron el 72,49% del mercado de GPU desagregada en 2025, convirtiéndola en el principal impulsor de las implementaciones actuales. Los modelos de lenguaje más grandes y los sistemas de razonamiento requieren capacidad de memoria y rendimiento de interconexión que superan los límites de los nodos aislados, por lo que el mercado de GPU desagregada se ha desarrollado en torno a la agrupación y la coordinación de tejidos como requisitos básicos para el entrenamiento e inferencia de frontera. NVIDIA declaró que Vera Rubin NVL72 puede entregar 10 veces el rendimiento de agentes en comparación con la generación anterior Grace Blackwell, lo que ayuda a explicar por qué los hiperescaladores están implementando estas plataformas tanto para clústeres de entrenamiento como para entornos de inferencia con alto razonamiento. La investigación científica también sigue siendo parte de este segmento, porque la genómica, el modelado climático y la física de partículas necesitan cómputo listo para ráfagas que pueda aprovisionarse a escala sin dejar recursos de GPU costosos inactivos entre trabajos. Esta combinación mantiene al mercado de GPU desagregada estrechamente vinculado a cargas de trabajo donde la utilización, el intercambio de memoria y la eficiencia de interconexión afectan directamente la producción científica o el rendimiento del modelo.

Se proyecta que el gemelo digital y la simulación avancen a una CAGR del 34,42% de 2026 a 2031, reflejando el uso más amplio de modelos de física acelerados por GPU en operaciones industriales, validación de diseño y entrenamiento de sistemas autónomos. El mercado de GPU desagregada se beneficia aquí porque muchas cargas de trabajo de simulación necesitan períodos cortos de muy alta densidad de cómputo, lo que hace que los recursos agrupados sean más económicos que las asignaciones de servidores estáticos. NVIDIA dijo que su plataforma DSX puede reducir el tiempo de implementación de fábricas de IA de meses a días y acelerar el tiempo hasta los primeros ingresos, y ese modelo comercial está comenzando a influir en cómo los usuarios industriales piensan sobre la infraestructura de simulación escalable. El análisis de datos, la renderización y la visualización siguen siendo casos de uso establecidos con un crecimiento más estable, mientras que la renderización se beneficia de la aceleración de GPU en tiempo real en interfaces industriales inmersivas que demandan baja latencia de fotogramas. En conjunto, estos patrones amplían el mercado de GPU desagregada más allá del entrenamiento de IA de frontera y aumentan la demanda de compradores que valoran la capacidad flexible para cargas de trabajo digitales operacionales.

Mercado de GPU Desagregada: Participación de Mercado por Aplicación
Imagen © Mordor Intelligence. El uso requiere atribución según CC BY 4.0.

Por Usuario Final: Los Hiperescaladores Mantienen la Mayor Base Mientras las Nubes Especializadas Crecen Más Rápido

Los proveedores de nube a hiperescala mantuvieron una participación del 47,63% en 2025, dándoles la mayor posición en el mercado de GPU desagregada y una fuerte influencia sobre los estándares de arquitectura, el momento de implementación y las elecciones de software. AWS, Google Cloud, Microsoft Azure y Oracle Cloud Infrastructure fueron identificados como implementadores de sistemas NVIDIA Vera Rubin NVL72 en la segunda mitad de 2026, lo que refuerza hasta qué punto el mercado de GPU desagregada todavía depende de los hiperescaladores para la adopción temprana de volumen. Su papel de pioneros va más allá del poder adquisitivo, porque también dan forma a cómo se empaquetan la orquestación, la agrupación de recursos y los servicios de IA gestionados para los clientes intermedios. Las empresas se están convirtiendo en un grupo de adoptantes más grande, aunque generalmente abordan las implementaciones con controles presupuestarios más estrictos, mayor sensibilidad al riesgo de integración y una preferencia por configuraciones de nube dedicada o locales donde la exposición de datos puede limitarse. Los compradores gubernamentales y de defensa también siguen siendo relevantes, ya que los largos ciclos de adquisición aún pueden generar grandes valores de contrato cuando los programas de cómputo soberano avanzan.

Se proyecta que los proveedores de servicios en la nube registren la CAGR más rápida del 34,63% de 2026 a 2031 en el mercado de GPU desagregada, a medida que los operadores de nivel medio construyen plataformas de GPU como servicio en torno a la especialización y la flexibilidad de precios. NVIDIA identificó a CoreWeave, Lambda, Nebius y Nscale entre los primeros adoptantes de Vera Rubin y Spectrum-X Ethernet Photonics, demostrando cómo las nubes especializadas están expandiendo la capacidad para atender la demanda de entrenamiento e inferencia más allá de las plataformas hiperescaladas más grandes. Su posición es prometedora pero también expuesta, porque la caída de los costos por token en los hiperescaladores puede comprimir los márgenes de alquiler y obligar a los proveedores más pequeños a diferenciarse a través de servicios gestionados y soporte en la capa de aplicaciones. Los proveedores de telecomunicaciones también están emergiendo como usuarios enfocados en el borde de los sistemas de GPU desagregada, mientras que las instituciones de investigación y académicas desempeñan un papel de ingresos menor pero ayudan a reducir las barreras de software a través del trabajo de orquestación de código abierto como llm-d y las herramientas nativas de Kubernetes relacionadas. Esa combinación de hiperescaladores dominantes, nubes especializadas de rápido movimiento y compradores públicos y privados específicos da al mercado de GPU desagregada una base de demanda más amplia sin reducir su dependencia de unos pocos operadores muy grandes.

Análisis Geográfico

América del Norte mantuvo una participación del 52,71% en 2025, dándole la mayor participación regional en el mercado de GPU desagregada y reflejando la profundidad de las construcciones a hiperescala en los Estados Unidos. AWS, Google Cloud, Microsoft Azure y Oracle Cloud Infrastructure fueron nombrados como implementadores de sistemas NVIDIA Vera Rubin NVL72 en la segunda mitad de 2026, y esa concentración de compradores líderes continúa anclando el mercado de GPU desagregada en la región. América del Norte también se beneficia de un denso ecosistema de hardware, una importante actividad de investigación en IA y una madura capa de nube de GPU, incluidos proveedores como CoreWeave, Lambda y Nscale. La colaboración de NVIDIA en septiembre de 2025 con Intel para desarrollar CPU personalizadas para centros de datos de IA basadas en NVLink y x86 profundizó las cadenas de suministro regionales y permitió una integración más sólida entre las CPU de orquestación y los tejidos de GPU.[3]Intel Corporation, "Intel y NVIDIA Desarrollarán Conjuntamente Infraestructura de IA y Productos de Computación Personal," Sala de Prensa de Intel, newsroom.intel.com Canadá añade apoyo a través de la proximidad a la demanda hiperescalada de los Estados Unidos y la economía favorable de la energía, mientras que América del Sur permanece en una etapa más temprana y está más vinculada a las zonas de disponibilidad de hiperescaladores en Brasil y Colombia que a la implementación local amplia.

Europa mantuvo una participación significativa pero menor del mercado de GPU desagregada, con Alemania, el Reino Unido y Francia como los principales centros de implementación según la información de los usuarios. La Directiva de Eficiencia Energética de la Unión Europea requiere informes de efectividad del uso de energía para centros de datos con una carga de TI superior a 500 kW, lo que respalda diseños más eficientes y desagregados y requiere que los operadores demuestren un rendimiento de instalaciones medible. La base automotriz y de fabricación de precisión de Alemania respalda la demanda de cargas de trabajo de gemelo digital y simulación de física, donde el cómputo en ráfagas es más fácil de justificar a través de infraestructura agrupada que a través de asignaciones de servidores fijos. El Reino Unido contribuye a través de un segmento activo de nube de GPU, mientras que Francia e Italia están extendiendo programas de cómputo de IA soberana que incorporan capacidad de GPU desagregada.

Se proyecta que Asia-Pacífico se expanda a una CAGR del 34,39% entre 2026 y 2031, dando a la región la tasa de crecimiento más rápida en el mercado de GPU desagregada durante el período de pronóstico. La región está siendo impulsada por el gasto hiperescalado de IA de China, la cadena de suministro de memoria verticalmente integrada de Corea del Sur, las necesidades de fabricación y automatización de Japón, y los programas de infraestructura de IA pública en India y Singapur. China está construyendo arquitecturas desagregadas domésticas en torno a enfoques de interconexión propietarios, creando una estructura regional dividida en la que las pilas chinas difieren de las utilizadas en otras partes del mercado de GPU desagregada. Corea del Sur se beneficia de la posición de SK Hynix en la producción de HBM3e, lo que ayuda a los operadores domésticos a asegurar un acceso más temprano a los subsistemas de memoria y respalda una implementación de capital de centros de datos más rápida. India también se está moviendo rápidamente a medida que las iniciativas de IA respaldadas por el gobierno y las zonas de nube a hiperescala se expanden, mientras que Oriente Medio y África se encuentran en una etapa más temprana de desarrollo pero están ganando apoyo de los programas de inversión en IA soberana en los Emiratos Árabes Unidos y Arabia Saudita.

CAGR (%) del Mercado de GPU Desagregada, Tasa de Crecimiento por Región
Imagen © Mordor Intelligence. El uso requiere atribución según CC BY 4.0.

Panorama Competitivo

El mercado de GPU desagregada sigue estando muy concentrado en la capa de interconexión de hardware, mientras que el software y los servicios están mucho más fragmentados entre los proveedores de orquestación, los proveedores de nube de GPU y los especialistas en integración. NVIDIA continúa marcando el ritmo en el mercado de GPU desagregada porque su ecosistema NVLink, las plataformas a escala de bastidor y el alcance de producción le otorgan una fuerte ventaja donde los compradores necesitan tejidos de escalado vertical probados y pilas de hardware coordinadas. Su lanzamiento en mayo de 2025 de NVLink Fusion fue un movimiento estratégico notable porque permitió que el silicio personalizado de MediaTek, Marvell, Qualcomm, Fujitsu y otros se conectara de forma nativa con las GPU de NVIDIA y amplió el ecosistema direccionable para la infraestructura de IA semicustomizada. Ese movimiento no redujo la dependencia de NVIDIA en la tecnología propietaria, pero hizo que el tejido de NVIDIA fuera más central para el diseño de sistemas en un conjunto más amplio de socios. En términos prácticos, el mercado de GPU desagregada todavía le da a NVIDIA la posición más sólida donde el rendimiento del hardware y la madurez del ecosistema son más importantes.

AMD está construyendo su posición en el mercado de unidades de procesamiento gráfico (GPU) desagregadas a través de una ruta diferente que combina la plataforma Helios a escala de bastidor con la pila de software abierto ROCm y una base de proveedores más amplia. Su decisión de mayo de 2026 de comprometer más de 10 mil millones USD en el ecosistema de Taiwán fue otro movimiento estratégico importante, porque señaló un esfuerzo de varios años para reducir la brecha de producción de hardware y fortalecer la ejecución a escala de bastidor a través de socios de fabricación regionales.[4]Advanced Micro Devices, Inc., "AMD Anuncia Más de 10 Mil Millones USD en Inversiones en el Ecosistema de Taiwán para Acelerar la Infraestructura de IA," Relaciones con Inversores de AMD, ir.amd.com El papel de Intel es más asimétrico, ya que no lidera la capa de tejido de GPU pero encuentra valor en la posición de CPU de orquestación dentro de los sistemas heterogéneos. Ese enfoque fue evidente en Computex 2026, donde Intel Xeon 6 habilitó la orquestación en una pila de inferencia desagregada de tres proveedores con SambaNova y NVIDIA en un único ejemplo de implementación comercial. Estos movimientos muestran que el mercado de GPU desagregada es competitivo a nivel de plataforma aunque el tejido de hardware central siga estando concentrado.

El área más abierta en el mercado de GPU desagregada es la orquestación de múltiples proveedores, porque todavía no existe una plataforma comercial ampliamente adoptada que programe de manera consistente las cargas de trabajo en NVLink, CXL, InfiniBand y Ethernet. Los actores emergentes como Exostellar, trabajando con Vultr, están apuntando a esa brecha con orquestación a nivel de carga de trabajo en flotas de GPU heterogéneas y geográficamente distribuidas, mientras que los proveedores de servidores como Dell Technologies, Hewlett Packard Enterprise, Supermicro y Lenovo compiten a través de la integración de sistemas, la refrigeración líquida y los servicios de infraestructura gestionada. La actividad de estandarización también importa porque cualquier camino hacia tejidos desagregados más abiertos afectaría cómo las empresas y los gobiernos evalúan el bloqueo de proveedores y la adquisición a largo plazo. Por ahora, el mercado de GPU desagregada respalda una estructura competitiva en capas donde un pequeño número de líderes de hardware influye en la arquitectura central, mientras que un campo mucho más amplio compite por controlar la implementación, la orquestación y la entrega de servicios.

Líderes de la Industria de GPU Desagregada

  1. NVIDIA Corporation

  2. Advanced Micro Devices, Inc.

  3. Intel Corporation

  4. Qualcomm Incorporated

  5. Apple Inc.

  6. *Nota aclaratoria: los principales jugadores no se ordenaron de un modo en especial
Mercado de GPU Desagregada
Imagen © Mordor Intelligence. El uso requiere atribución según CC BY 4.0.

Desarrollos Recientes de la Industria

  • Junio de 2026: Amazon Web Services anunció la disponibilidad general de las instancias EC2 G7 impulsadas por GPU NVIDIA RTX PRO 4500 Blackwell Server Edition, entregando hasta 4,6 veces el rendimiento de inferencia de IA de la generación G6 anterior. Las instancias cuentan con hasta 700 Gbps de ancho de banda de red del Adaptador de Tejido Elástico, admitiendo cargas de trabajo de inferencia de IA desagregada, traducción de idiomas y análisis de imágenes a gran escala.
  • Mayo de 2026: NVIDIA anunció que la plataforma Vera Rubin entró en plena producción en 350 fábricas en 30 países, con AWS, Google Cloud, Microsoft Azure y Oracle Cloud Infrastructure como implementadores confirmados en la segunda mitad de 2026. La plataforma introdujo Spectrum-X Ethernet Photonics, los primeros conmutadores Ethernet con óptica co-empaquetada de la industria en producción, entregando 5 veces la eficiencia energética sobre los transceptores tradicionales y habilitando implementaciones de fábricas de IA de un millón de GPU.
  • Mayo de 2026: AMD anunció 10 mil millones USD en inversiones en el ecosistema de Taiwán para escalar la plataforma Helios a escala de bastidor con GPU MI450X y CPU EPYC Venice de 6.ª generación con empaquetado de puente elevado fanout 2.5D por primera vez en la industria. Los socios ODM Sanmina, Wiwynn, Wistron e Inventec están escalando la producción para implementaciones de múltiples gigavatios previstas en la segunda mitad de 2026.
  • Mayo de 2026: Vector Core Compute, respaldada por Vista Equity Partners y Cambium Capital, lanzó comercialmente el primer sistema de inferencia desagregada en Computex 2026, implementando Intel Xeon 6 para la orquestación, SambaNova SN40 RDU para la decodificación y GPU NVIDIA Blackwell para el prellenado desde un centro de datos en Los Ángeles. Together.ai fue anunciado como el primer cliente comercial.

Índice del informe de la industria de gpu desagregada

1. INTRODUCCIÓN

  • 1.1 Supuestos del Estudio y Definición del Mercado
  • 1.2 Alcance del Estudio

2. METODOLOGÍA DE INVESTIGACIÓN

3. RESUMEN EJECUTIVO

4. PANORAMA DEL MERCADO

  • 4.1 Market Overview
  • 4.2 Market Drivers
    • 4.2.1 Creciente Demanda de Agrupación de GPU en Clústeres de Entrenamiento de IA
    • 4.2.2 Cambio Hacia Arquitecturas de Cómputo y Memoria Separados
    • 4.2.3 Expansión de la Infraestructura de IA a Hiperescala y Nativa de la Nube
    • 4.2.4 Ganancias de Eficiencia Energética y Térmica Mediante la Desagregación de Recursos
    • 4.2.5 Mayor Utilización de Flota Mediante la Asignación de GPU a Múltiples Inquilinos
    • 4.2.6 Ciclos de Actualización Más Cortos en Arquitecturas de Centros de Datos Modulares
  • 4.3 Market Restraints
    • 4.3.1 Alta Complejidad de Integración de Interconexión y Tejido de Red
    • 4.3.2 Fragmentación de la Orquestación de Software en Pilas de GPU
    • 4.3.3 Intensidad de Capital para la Modernización de Centros de Datos Heredados
    • 4.3.4 Compromisos de Latencia en Memoria Remota y Acceso Desagregado
  • 4.4 Industry Value Chain Analysis
  • 4.5 Regulatory Landscape
  • 4.6 Technological Outlook
  • 4.7 Porter's Five Forces Analysis
    • 4.7.1 Poder de Negociación de los Proveedores
    • 4.7.2 Poder de Negociación de los Compradores
    • 4.7.3 Amenaza de Nuevos Entrantes
    • 4.7.4 Amenaza de Sustitutos
    • 4.7.5 Intensidad de la Rivalidad Competitiva
  • 4.8 Impact of Macroeconomic Factors on the Market

5. TAMAÑO DEL MERCADO Y PRONÓSTICOS DE CRECIMIENTO (VALOR)

  • 5.1 Por Componente
    • 5.1.1 Hardware
    • 5.1.2 Software
    • 5.1.3 Servicios
  • 5.2 Por Tipo de Acelerador
    • 5.2.1 Desagregación Basada en PCIe
    • 5.2.2 Desagregación Basada en NVLink/NVSwitch
    • 5.2.3 Desagregación Basada en Tejido Ethernet
    • 5.2.4 Desagregación Basada en Tejido InfiniBand
    • 5.2.5 Desagregación Basada en CXL
  • 5.3 Por Modo de Implementación
    • 5.3.1 Local
    • 5.3.2 Basado en la Nube
  • 5.4 Por Aplicación
    • 5.4.1 IA y Computación de Alto Rendimiento
    • 5.4.2 Análisis de Datos
    • 5.4.3 Gemelo Digital y Simulación
    • 5.4.4 Renderización y Visualización
    • 5.4.5 Investigación Científica
  • 5.5 Por Usuario Final
    • 5.5.1 Proveedores de Nube a Hiperescala
    • 5.5.2 Proveedores de Servicios en la Nube
    • 5.5.3 Empresas
    • 5.5.4 Organizaciones Gubernamentales y de Defensa
    • 5.5.5 Instituciones de Investigación y Académicas
    • 5.5.6 Proveedores de Telecomunicaciones
  • 5.6 Por Geografía
    • 5.6.1 América del Norte
    • 5.6.1.1 Estados Unidos
    • 5.6.1.2 Canadá
    • 5.6.1.3 México
    • 5.6.2 Europa
    • 5.6.2.1 Alemania
    • 5.6.2.2 Reino Unido
    • 5.6.2.3 Francia
    • 5.6.2.4 Italia
    • 5.6.2.5 Resto de Europa
    • 5.6.3 Asia-Pacífico
    • 5.6.3.1 China
    • 5.6.3.2 Japón
    • 5.6.3.3 Corea del Sur
    • 5.6.3.4 India
    • 5.6.3.5 Sudeste Asiático
    • 5.6.3.6 Resto de Asia-Pacífico
    • 5.6.4 América del Sur
    • 5.6.5 Oriente Medio y África

6. PANORAMA COMPETITIVO

  • 6.1 Market Concentration
  • 6.2 Strategic Moves
  • 6.3 Market Positioning Analysis
  • 6.4 Perfiles de Empresas (incluye Descripción General a Nivel Global, Descripción General a Nivel de Mercado, Segmentos Principales, Información Financiera según disponibilidad, Información Estratégica, Rango/Participación de Mercado, Productos y Servicios, Desarrollos Recientes)
  • 6.5 NVIDIA Corporation
  • 6.6 Advanced Micro Devices, Inc.
  • 6.7 Intel Corporation
  • 6.8 Qualcomm Incorporated
  • 6.9 Apple Inc.
  • 6.10 Samsung Electronics Co., Ltd.
  • 6.11 MediaTek Inc.
  • 6.12 Arm Holdings plc
  • 6.13 Imagination Technologies Limited
  • 6.14 Hewlett Packard Enterprise Company
  • 6.15 Dell Technologies Inc.
  • 6.16 Super Micro Computer, Inc.
  • 6.17 Lenovo Group Limited
  • 6.18 ASUSTeK Computer Inc.
  • 6.19 Gigabyte Technology Co., Ltd.
  • 6.20 Micro-Star International Co., Ltd.
  • 6.21 Alibaba Group Holding Limited
  • 6.22 Tencent Holdings Limited
  • 6.23 Amazon.com, Inc.
  • 6.24 Microsoft Corporation

7. OPORTUNIDADES DE MERCADO Y PERSPECTIVAS FUTURAS

  • 7.1 Evaluación de Espacios en Blanco y Necesidades No Satisfechas

Alcance del Informe Global del Mercado de GPU Desagregada

El Mercado de GPU Desagregada comprende hardware, software y servicios que permiten que las unidades de procesamiento gráfico (GPU) se desacoplen de las arquitecturas de servidores tradicionales y se asignen dinámicamente a través de múltiples recursos de cómputo mediante interconexiones de alta velocidad y tejidos de red. Las arquitecturas de GPU desagregada permiten a las organizaciones agrupar, compartir, virtualizar y orquestar recursos de GPU independientemente de los límites físicos del servidor, mejorando la utilización de recursos, la escalabilidad, la flexibilidad operativa y la eficiencia de la infraestructura en entornos de centros de datos, nube y computación de alto rendimiento.

El Informe del Mercado de GPU Desagregada está Segmentado por Componente (Hardware, Software y Servicios), Tipo de Acelerador (Desagregación Basada en PCIe, Desagregación Basada en NVLink/NVSwitch, Desagregación Basada en Tejido Ethernet, Desagregación Basada en Tejido InfiniBand y Desagregación Basada en CXL), Modo de Implementación (Local y Nube), Aplicación (IA y Computación de Alto Rendimiento, Análisis de Datos, Gemelo Digital y Simulación, Renderización y Visualización, e Investigación Científica), Usuario Final (Proveedores de Nube a Hiperescala, Proveedores de Servicios en la Nube, Empresas, Organizaciones Gubernamentales y de Defensa, Instituciones de Investigación y Académicas, Proveedores de Telecomunicaciones) y Geografía (América del Norte, Europa, Asia-Pacífico, América del Sur y Oriente Medio y África). Los Pronósticos del Mercado se Proporcionan en Términos de Valor (USD).

Por Componente
Hardware
Software
Servicios
Por Tipo de Acelerador
Desagregación Basada en PCIe
Desagregación Basada en NVLink/NVSwitch
Desagregación Basada en Tejido Ethernet
Desagregación Basada en Tejido InfiniBand
Desagregación Basada en CXL
Por Modo de Implementación
Local
Basado en la Nube
Por Aplicación
IA y Computación de Alto Rendimiento
Análisis de Datos
Gemelo Digital y Simulación
Renderización y Visualización
Investigación Científica
Por Usuario Final
Proveedores de Nube a Hiperescala
Proveedores de Servicios en la Nube
Empresas
Organizaciones Gubernamentales y de Defensa
Instituciones de Investigación y Académicas
Proveedores de Telecomunicaciones
Por Geografía
América del Norte Estados Unidos
Canadá
México
Europa Alemania
Reino Unido
Francia
Italia
Resto de Europa
Asia-Pacífico China
Japón
Corea del Sur
India
Sudeste Asiático
Resto de Asia-Pacífico
América del Sur
Oriente Medio y África
Por Componente Hardware
Software
Servicios
Por Tipo de Acelerador Desagregación Basada en PCIe
Desagregación Basada en NVLink/NVSwitch
Desagregación Basada en Tejido Ethernet
Desagregación Basada en Tejido InfiniBand
Desagregación Basada en CXL
Por Modo de Implementación Local
Basado en la Nube
Por Aplicación IA y Computación de Alto Rendimiento
Análisis de Datos
Gemelo Digital y Simulación
Renderización y Visualización
Investigación Científica
Por Usuario Final Proveedores de Nube a Hiperescala
Proveedores de Servicios en la Nube
Empresas
Organizaciones Gubernamentales y de Defensa
Instituciones de Investigación y Académicas
Proveedores de Telecomunicaciones
Por Geografía América del Norte Estados Unidos
Canadá
México
Europa Alemania
Reino Unido
Francia
Italia
Resto de Europa
Asia-Pacífico China
Japón
Corea del Sur
India
Sudeste Asiático
Resto de Asia-Pacífico
América del Sur
Oriente Medio y África

Preguntas Clave Respondidas en el Informe

¿Cuál es el tamaño actual del mercado de GPU desagregada?

El mercado de GPU desagregada fue valorado en 3,97 mil millones USD en 2025, se sitúa en 5,34 mil millones USD en 2026 y se prevé que alcance los 22,63 mil millones USD en 2031 a una CAGR del 33,48%.

¿Por qué está aumentando la adopción de GPU desagregada en la infraestructura de IA?

La adopción está aumentando porque la agrupación de GPU mejora la utilización, la IA agéntica incrementa las necesidades de rendimiento de tokens, y las restricciones de memoria y ancho de banda están empujando a los operadores hacia arquitecturas de cómputo y memoria agrupadas.

¿Qué componente contribuye más a los ingresos hoy en día?

El hardware lideró con el 81,32% de los ingresos en 2025, ya que las implementaciones tempranas requirieron un gran gasto en bastidores, tejidos, conmutadores, módulos de memoria y sistemas de cómputo estrechamente integrados.

¿Qué enfoque de acelerador está creciendo más rápido?

Se proyecta que la desagregación basada en CXL crezca a una CAGR del 34,46% hasta 2031, respaldada por la agrupación de memoria compartida y un diseño de sistema componible más flexible.

¿Qué región se está expandiendo más rápido?

Se proyecta que Asia-Pacífico crezca a una CAGR del 34,39% hasta 2031, respaldada por el gasto hiperescalado de IA en China, la fortaleza del suministro de HBM en Corea del Sur y los programas de infraestructura de IA pública en India y Singapur.

¿Cuál es la principal barrera que frena una implementación más amplia?

Las mayores restricciones son la complejidad de la interconexión, la orquestación fragmentada en las pilas de GPU y el costo de adaptar las instalaciones a las necesidades de energía y refrigeración de los bastidores de IA densos.

Última actualización de la página el: