Tamanho e Participação do Mercado de GPU para Data Center de IA

Resumo do Mercado de GPU para Data Center de IA
Imagem © Mordor Intelligence. O reuso requer atribuição conforme CC BY 4.0.

Análise do Mercado de GPU para Data Center de IA por Mordor Intelligence

O tamanho do mercado de GPU para data center de IA deve crescer de USD 36,56 bilhões em 2025 para USD 45,04 bilhões em 2026 e está previsto para atingir USD 90,46 bilhões até 2031 a um CAGR de 14,97% no período de 2026-2031. Os hyperscalers sozinhos planejam investir mais de USD 650 bilhões em infraestrutura de IA durante 2026, com a Alphabet orientando USD 175-185 bilhões em despesas de capital, quase o dobro de seus gastos de 2025, para aliviar as restrições de capacidade. As iniciativas soberanas estão expandindo a base endereçável, pois o Canadá reservou CAD 2 bilhões (USD 1,48 bilhão) para computação doméstica, enquanto o Reino Unido reservou GBP 500 milhões (USD 630 milhões) para conceder até 1 milhão de horas de GPU por startup. Enquanto isso, os controles de exportação redirecionaram o fornecimento para regiões mais favoráveis, adicionando urgência aos acordos de pré-compra de hyperscalers e aprofundando a visibilidade de demanda dos fornecedores. Por fim, a memória de alta largura de banda e as reformas de resfriamento líquido estão se tornando fatores limitantes que aceleram os ciclos de atualização e elevam o valor total do sistema, apesar da inflação dos componentes.

Principais Conclusões do Relatório

  • Por modo de implantação, os data centers em nuvem lideraram com 66,38% da participação do mercado de GPU para data center de IA em 2025, enquanto os data centers de borda devem se expandir a um CAGR de 15,57% até 2031.
  • Por tipo de GPU, os aceleradores de inferência representaram 54,23% do tamanho do mercado de GPU para data center de IA em 2025 e estão previstos para crescer a um CAGR de 15,37% no período de 2026-2031.
  • Por interconexão, as GPUs com malha de alta largura de banda detinham 62,94% de participação em 2025 e devem registrar o crescimento mais rápido, com CAGR de 15,67% entre 2026 e 2031.
  • Por usuário final, os hyperscalers e provedores de serviços em nuvem comandaram 76,64% da receita de 2025, enquanto as instituições governamentais e de pesquisa representaram o segmento de crescimento mais rápido, com um CAGR de 15,24% até 2031.
  • Por geografia, a América do Norte capturou 37,50% da receita em 2025, mas a Ásia-Pacífico deve registrar o maior crescimento regional com um CAGR de 15,97% até 2031.

Nota: O tamanho do mercado e os números de previsão neste relatório são gerados usando a estrutura de estimativa proprietária da Mordor Intelligence, atualizada com os dados e percepções mais recentes disponíveis em janeiro de 2026.

Análise de Segmentos

Por Modo de Implantação: Nuvem Domina, Borda Acelera

As instalações em nuvem representaram 66,38% da receita em 2025, ancoradas por campi de vários gigawatts que integram pods de rack resfriados a líquido com mais de 100.000 GPUs cada. As empresas dependem dessa capacidade centralizada para amortizar a computação entre milhares de inquilinos, mas as crescentes taxas de dados de saída e os mandatos de privacidade estão empurrando algumas cargas de trabalho de volta para as instalações locais ou para centros soberanos. Os data centers de borda, embora ainda sejam um nicho, devem se expandir a um CAGR de 15,57% até 2031, à medida que veículos autônomos, células robóticas e inspeção industrial em tempo real exigem latência de ida e volta inferior a 10 milissegundos. 

Os fornecedores estão cada vez mais rearquitetando o software para facilitar a migração perfeita de modelos em diferentes ambientes. Por exemplo, a camada de Unidade de Processamento de Dados (DPU) BlueField-4 da NVIDIA desempenha um papel fundamental ao fazer o tunelamento de caches de valores-chave do núcleo para a borda. Essa abordagem reduz significativamente as alocações redundantes de memória de GPU, otimizando assim a utilização de recursos. Coletivamente, esses avanços estão impulsionando o mercado de GPU para data center de IA ao longo de uma trajetória de escalonamento de duas vias. Por um lado, os hubs de hiperescala estão testemunhando um crescimento substancial, enquanto, por outro, os microsites federados também estão se expandindo, embora partindo de níveis fundamentais vastamente diferentes. Esses desenvolvimentos destacam as diversas estratégias sendo adotadas para atender às demandas em evolução das cargas de trabalho de IA.

Mercado de GPU para Data Center de IA: Participação de Mercado por Modo de Implantação
Imagem © Mordor Intelligence. O reuso requer atribuição conforme CC BY 4.0.

Nota: Participações de segmentos de todos os segmentos individuais disponíveis mediante compra do relatório

Por Tipo de GPU: Inferência Ganha Participação à Medida que o Pós-Treinamento Escala

Os aceleradores de inferência representaram 54,23% da receita de 2025 e crescerão mais rapidamente do que as GPUs de treinamento, com um CAGR de 15,37%, graças a modelos de monetização estáveis baseados em tokens. O ajuste fino, a geração aumentada por recuperação e a personalização em tempo real impulsionam ciclos de inferência contínuos que agora representam aproximadamente dois terços dos gastos com computação em 2026. As GPUs de treinamento permanecem indispensáveis para a criação de modelos de fronteira, mas sua participação diminui à medida que aumentos marginais de parâmetros geram ganhos de desempenho decrescentes. 

Os fornecedores de hardware estão respondendo com pipelines de precisão mista; o Rubin da NVIDIA inclui um Motor Transformer de terceira geração, e a MI325X da AMD dobra a capacidade de HBM para encaixar interpretadores de trilhões de parâmetros em uma única placa — ambas as inovações que inclinam ainda mais a economia em direção à inferência. Como resultado, os hyperscalers estão cada vez mais bifurcando suas frotas, reservando as GPUs mais recentes ricas em interconexão para treinamento em grandes lotes, enquanto preenchem os clusters de inferência com cartões de alta densidade de memória otimizados para custo por token.

Por Interconexão: Malhas de Alta Largura de Banda Habilitam Coerência em Escala de Rack

As GPUs equipadas com malhas de alta largura de banda proprietárias ou baseadas em padrões representaram 62,94% da receita em 2025 e devem sustentar a maior taxa de crescimento, com uma taxa de crescimento anual composta (CAGR) de 15,67%. A tecnologia NVLink de sexta geração entrega 3,6 TB/s por GPU e, quando implantada em racks Vera Rubin NVL72, estabelece um espaço de memória unificado de 260 TB/s. Essa configuração elimina efetivamente a sobrecarga do particionamento de modelos, melhorando assim a eficiência e o desempenho.

Por outro lado, as arquiteturas baseadas em Ethernet, como o Spectrum-X, provaram que as malhas abertas também podem alcançar escalabilidade. Por exemplo, a topologia de referência da Supermicro conecta 32.768 GPUs por meio de uma rede de 512 switches de folha, 512 switches de espinha e 256 switches de superspinha.[3]Super Micro Computer, "Comparação de Sistemas de GPU NVIDIA Resfriados a Ar versus Resfriados a Líquido," supermicro.com Embora os cartões somente PCIe sejam geralmente mais econômicos inicialmente, o custo total de propriedade (TCO) frequentemente favorece as unidades habilitadas para malha quando fatores como mão de obra de desenvolvimento de software e tempo de treinamento são considerados. Como resultado, os compradores estão priorizando cada vez mais a largura de banda de interconexão em detrimento do poder computacional bruto, reconhecendo-a como o fator-chave na redução do custo por modelo.

Mercado de GPU para Data Center de IA: Participação de Mercado por Interconexão
Imagem © Mordor Intelligence. O reuso requer atribuição conforme CC BY 4.0.

Por Usuário Final: Hyperscalers Lideram, Governo Acelera

Os hyperscalers e provedores de serviços em nuvem controlaram 76,64% dos gastos de 2025, aproveitando a escala do balanço patrimonial para pré-pagar pelo fornecimento e negociar acesso antecipado a cada geração de silício. Essa liderança dificilmente desmoronará em breve, mas os programas soberanos e acadêmicos registrarão a expansão mais rápida, com um CAGR de 15,24%, à medida que os governos correm para localizar cargas de trabalho sensíveis. O Programa de Infraestrutura de Computação Soberana de IA do Canadá e o supercomputador Isambard-AI do Reino Unido exemplificam estruturas de financiamento de longo horizonte que subsidiam frotas de vários petaflops. 

As empresas ocupam um terreno intermediário híbrido, aproveitando instâncias de nuvem pública para treinamento em rajadas, enquanto mantêm fluxos de trabalho de dados críticos nas instalações locais por meio de racks modulares como o NVIDIA DGX Spark ou lâminas MI325X baseadas em AMD. Essa abordagem permite que as empresas equilibrem escalabilidade e controle, garantindo uma utilização eficiente de recursos enquanto protegem dados sensíveis. Juntas, essas dinâmicas de usuário final contribuem para o desenvolvimento de um ecossistema em camadas que suporta o mercado de GPU para data center de IA, estendendo seu crescimento e relevância além do ciclo central de hyperscalers.

Análise Geográfica

A América do Norte reteve 37,50% da receita de 2025, impulsionada pela proximidade das sedes dos principais provedores de nuvem e pela abundante capacidade de energia no Texas, no Centro-Oeste e no Noroeste do Pacífico. A política dos EUA continua a favorecer a alocação doméstica: as revisões de controle de exportação de janeiro de 2026 impuseram uma tarifa de 25% sobre certas GPUs de alto desempenho enviadas ao exterior, preservando efetivamente o fornecimento local. Mega-arrendamentos como o acordo de 300 megawatts da Applied Digital no Delta Forge 1 ressaltam a pista de longo prazo para a construção nos EUA. A Europa segue com crescimento concentrado, mas estratégico; o contrato de 30.000 GPUs Rubin da Microsoft em Narvik, Noruega, revela apetite por campi alimentados por energia renovável em clima frio que mitigam os crescentes impostos de carbono. O Reino Unido está canalizando GBP 500 milhões (USD 630 milhões) para sua Unidade de IA Soberana, prometendo concessões de um milhão de horas de GPU por startup e participações acionárias diretas em empresas de orquestração de infraestrutura.

A Ásia-Pacífico deve registrar a expansão regional mais rápida com um CAGR de 15,97% até 2031. O site soberano GMI Cloud de USD 12 bilhões do Japão em Kagoshima visa 1 gigawatt de capacidade, posicionando o país como um polo de fabricação doméstica para robótica, veículos autônomos e cargas de trabalho de IA para indústria pesada.[4]GMI Cloud, "GMI Cloud Anuncia Infraestrutura de IA Soberana de 1GW no Japão Acelerada pelo NVIDIA Vera Rubin NVL72™," gmicloud.ai A China, enfrentando regras de exportação dos EUA mais rígidas e obstáculos alfandegários nas importações de chips NVIDIA H200, está se voltando para aceleradores domésticos da Huawei, Cambricon e Biren, embora as lacunas de rendimento e maturidade de software sugiram atrasos de desempenho no curto prazo. Em outros lugares, a Índia acelera as aprovações para campi de vários megawatts, enquanto Samsung e SK Hynix na Coreia do Sul ampliam as linhas de HBM4 para capturar valor a montante na cadeia de fornecimento de GPU.

A América do Sul, o Oriente Médio e a África detêm participações menores, mas servem como destinos de seguidor rápido para energia renovável de baixo custo. As mudanças de política em maio de 2025 abriram a Arábia Saudita e os Emirados Árabes Unidos para importações avançadas de GPU sob uma estrutura de Usuário Final Validado, aproveitando seus vastos ativos de gás natural e energia solar para oferecer acordos de compra de energia competitivos. Embora essas regiões não desafiem a escala da América do Norte ou da Ásia-Pacífico em dólares absolutos, elas oferecem potencial incremental e diversificação de risco geográfico para fornecedores que atuam no mercado de GPU para data center de IA.

CAGR (%) do Mercado de GPU para Data Center de IA, Taxa de Crescimento por Região
Imagem © Mordor Intelligence. O reuso requer atribuição conforme CC BY 4.0.

Cenário Competitivo

A NVIDIA permanece o fornecedor dominante no mercado de GPU para data center de IA, detendo aproximadamente 80% de participação em unidades e produzindo quase 1.000 racks GB200 NVL72 semanalmente, cada um com preço próximo a USD 3 milhões. No entanto, essa dominância está sendo desafiada à medida que os hyperscalers integram cada vez mais ASICs em suas operações, particularmente para cargas de trabalho com uso intensivo de inferência. Empresas como Microsoft, Google e Amazon estão aproveitando suas tecnologias proprietárias, como o Maia 200 da Microsoft, o TPU Ironwood do Google e o Trainium de terceira geração da Amazon, para oferecer desempenho que rivaliza ou supera as GPUs a um custo unitário menor quando as cargas de trabalho são definidas de forma restrita. Enquanto isso, a AMD está ganhando força ao se concentrar na corrida de capacidade de memória, oferecendo placas MI325X com 288 GB de HBM3e e planejando lançar peças da série MI400 com integração de HBM4. Essa estratégia permitiu que a AMD garantisse posições tanto em clusters de treinamento quanto de inferência de alta capacidade. Além disso, startups como Cerebras, Graphcore e SambaNova estão conquistando nichos especializados com arquiteturas em escala de wafer ou otimizadas para esparsidade, embora careçam do robusto ecossistema de software CUDA que dá à NVIDIA uma vantagem competitiva.

A integração de hardware emergiu como um diferenciador crítico no mercado. A Supermicro, por exemplo, envia mais de 100.000 GPUs por trimestre e entregou mais de 2.000 racks resfriados a líquido desde meados de 2024. A aquisição de USD 1 bilhão da PurgeRite pela Vertiv fortaleceu ainda mais suas capacidades em gerenciamento de fluidos de ponta a ponta para sistemas térmicos, um recurso que atrai operadores que gerenciam implantações de alta densidade, como racks de 150 quilowatts. A NVIDIA também adotou uma abordagem abrangente com seu lançamento do Rubin, introduzindo uma solução de pilha completa que inclui seis chips co-projetados — GPU, CPU, switch NVLink, NIC, DPU e switch Ethernet — todos gerenciados por seu software Mission Control. Essa estratégia incentiva os clientes a adotar sistemas prontos para uso em vez de optar por atualizações incrementais de GPU, reforçando assim a posição da NVIDIA no mercado.

Como resultado, as barreiras de entrada no setor de GPU para data center de IA agora se estendem além do desempenho do silício para incluir engenharia de rack, integração de instalações e serviços de ciclo de vida. Esses fatores contribuem coletivamente para um cenário de mercado altamente concentrado. A dinâmica competitiva é moldada pela interação entre players estabelecidos como NVIDIA e AMD, hyperscalers desenvolvendo soluções internas e startups emergentes visando aplicações de nicho. Esse ecossistema em camadas ressalta a complexidade do mercado, onde a inovação em hardware, software e integração de sistemas desempenha um papel fundamental na determinação da liderança de mercado e na sustentação do crescimento no período de previsão.

Líderes do Setor de GPU para Data Center de IA

  1. NVIDIA Corporation

  2. Advanced Micro Devices, Inc.

  3. Intel Corporation

  4. Google LLC

  5. Huawei Technologies Co., Ltd.

  6. *Isenção de responsabilidade: Principais participantes classificados em nenhuma ordem específica
Concentração do Mercado de GPU para Data Center de IA
Imagem © Mordor Intelligence. O reuso requer atribuição conforme CC BY 4.0.

Desenvolvimentos Recentes do Setor

  • Abril de 2026: A Applied Digital assinou um arrendamento de 15 anos e 300 megawatts com um hyperscaler norte-americano com grau de investimento em seu campus Delta Forge 1, elevando a receita total de arrendamento contratada para acima de USD 23 bilhões.
  • Abril de 2026: A NVIDIA apresentou a referência DGX SuperPOD para sistemas baseados em Rubin, com o rack Vera Rubin NVL72 com 1.008 GPUs Rubin e orquestração automatizada Mission Control.
  • Abril de 2026: O Canadá abriu o Programa de Infraestrutura de Computação Soberana de IA, oferecendo até CAD 1 bilhão (USD 740 milhões) para construir supercomputadores nacionais de IA sob regras rígidas de residência de dados.
  • Março de 2026: A Global AI implantou 7.000 GPUs NVIDIA GB300 em sua instalação em Endicott, Nova York, e delineou um roteiro para atingir 1 gigawatt de capacidade até 2029.

Sumário do Relatório do Setor de GPU para Data Center de IA

1. INTRODUÇÃO

  • 1.1 Premissas do Estudo e Definição do Mercado
  • 1.2 Escopo do Estudo

2. METODOLOGIA DE PESQUISA

3. RESUMO EXECUTIVO

4. CENÁRIO DE MERCADO

  • 4.1 Visão Geral do Mercado
  • 4.2 Impulsionadores do Mercado
    • 4.2.1 Crescimento Explosivo no Tamanho dos Modelos de IA Generativa
    • 4.2.2 Adoção Rápida de Serviços em Nuvem Acelerados por GPU
    • 4.2.3 Clusters de GPU em Escala de Data Center Ultrapassando o Limite de 100 Mil GPUs
    • 4.2.4 Padronização dos Benchmarks MLPerf em Aquisições
    • 4.2.5 Ascensão das Iniciativas de IA Soberana em Economias Menores
    • 4.2.6 Reformas de Resfriamento Líquido Impulsionando Vendas de Atualização
  • 4.3 Restrições do Mercado
    • 4.3.1 Desequilíbrio Persistente entre Oferta e Demanda de Embalagem Avançada
    • 4.3.2 Escalada do Custo Total de Propriedade para Racks Resfriados a Ar
    • 4.3.3 Restrições de Controle de Exportação em GPUs de Alto Desempenho
    • 4.3.4 Preferência Crescente por Aceleradores de IA Personalizados em Detrimento de GPUs
  • 4.4 Impacto dos Fatores Macroeconômicos no Mercado
  • 4.5 Análise da Cadeia de Valor do Setor
  • 4.6 Cenário Regulatório
  • 4.7 Perspectiva Tecnológica
  • 4.8 Análise das Cinco Forças de Porter
    • 4.8.1 Poder de Barganha dos Fornecedores
    • 4.8.2 Poder de Barganha dos Compradores
    • 4.8.3 Ameaça de Novos Entrantes
    • 4.8.4 Ameaça de Substitutos
    • 4.8.5 Intensidade da Rivalidade Competitiva

5. PREVISÕES DE TAMANHO E CRESCIMENTO DO MERCADO (VALOR)

  • 5.1 Por Modo de Implantação
    • 5.1.1 Data Centers em Nuvem
    • 5.1.2 Data Centers Corporativos e Privados
    • 5.1.3 Data Centers de Borda
  • 5.2 Por Tipo de GPU
    • 5.2.1 GPUs de Treinamento
    • 5.2.2 GPUs de Inferência
  • 5.3 Por Interconexão
    • 5.3.1 GPUs Baseadas em PCIe
    • 5.3.2 GPUs com Interconexão de Alta Largura de Banda
  • 5.4 Por Usuário Final
    • 5.4.1 Hyperscalers e Provedores de Serviços em Nuvem
    • 5.4.2 Empresas
    • 5.4.3 Instituições Governamentais e de Pesquisa
  • 5.5 Por Geografia
    • 5.5.1 América do Norte
    • 5.5.1.1 Estados Unidos
    • 5.5.1.2 Canadá
    • 5.5.1.3 México
    • 5.5.2 Europa
    • 5.5.2.1 Reino Unido
    • 5.5.2.2 Alemanha
    • 5.5.2.3 França
    • 5.5.2.4 Itália
    • 5.5.2.5 Restante da Europa
    • 5.5.3 Ásia-Pacífico
    • 5.5.3.1 China
    • 5.5.3.2 Japão
    • 5.5.3.3 Índia
    • 5.5.3.4 Coreia do Sul
    • 5.5.3.5 Restante da Ásia-Pacífico
    • 5.5.4 América do Sul
    • 5.5.5 Oriente Médio e África

6. CENÁRIO COMPETITIVO

  • 6.1 Concentração do Mercado
  • 6.2 Movimentos Estratégicos
  • 6.3 Análise de Participação de Mercado
  • 6.4 Perfis de Empresas (inclui Visão Geral em Nível Global, Visão Geral em Nível de Mercado, Segmentos Principais, Dados Financeiros quando disponíveis, Informações Estratégicas, Classificação/Participação de Mercado, Produtos e Serviços, Desenvolvimentos Recentes)
    • 6.4.1 NVIDIA Corporation
    • 6.4.2 Advanced Micro Devices, Inc.
    • 6.4.3 Intel Corporation
    • 6.4.4 Google LLC
    • 6.4.5 Amazon Web Services, Inc.
    • 6.4.6 Microsoft Corporation
    • 6.4.7 Alibaba Group Holding Limited
    • 6.4.8 Baidu, Inc.
    • 6.4.9 Huawei Technologies Co., Ltd.
    • 6.4.10 Graphcore Ltd.
    • 6.4.11 SambaNova Systems, Inc.
    • 6.4.12 Cerebras Systems Inc.
    • 6.4.13 Tenstorrent Inc.
    • 6.4.14 Qualcomm Technologies, Inc.
    • 6.4.15 IBM Corporation
    • 6.4.16 Giga Computing Technology Co., Ltd.
    • 6.4.17 Super Micro Computer, Inc.
    • 6.4.18 ASUStek Computer Inc.
    • 6.4.19 Dell Technologies Inc.

7. OPORTUNIDADES DE MERCADO E PERSPECTIVAS FUTURAS

  • 7.1 Avaliação de Espaços em Branco e Necessidades Não Atendidas

Escopo do Relatório Global do Mercado de GPU para Data Center de IA

O Mercado de GPU para Data Center de IA abrange o ecossistema global de unidades de processamento gráfico (GPUs) implantadas em data centers para suportar cargas de trabalho de inteligência artificial (IA), incluindo treinamento de modelos, inferência e computação de alto desempenho. Este mercado inclui hardware, tecnologias de interconexão associadas e infraestruturas de implantação otimizadas para processamento de IA em larga escala.

O Relatório do Mercado de GPU para Data Center de IA é Segmentado por Modo de Implantação (Data Centers em Nuvem, Data Centers Corporativos e Privados e Data Centers de Borda), Tipo de GPU (GPUs de Treinamento e GPUs de Inferência), Interconexão (GPUs Baseadas em PCIe e GPUs com Interconexão de Alta Largura de Banda), Usuário Final (Hyperscalers e Provedores de Serviços em Nuvem, Empresas e Instituições Governamentais e de Pesquisa) e Geografia (América do Norte, Europa, Ásia-Pacífico, América do Sul e Oriente Médio e África). As Previsões de Mercado são Fornecidas em Termos de Valor (USD).

Por Modo de Implantação
Data Centers em Nuvem
Data Centers Corporativos e Privados
Data Centers de Borda
Por Tipo de GPU
GPUs de Treinamento
GPUs de Inferência
Por Interconexão
GPUs Baseadas em PCIe
GPUs com Interconexão de Alta Largura de Banda
Por Usuário Final
Hyperscalers e Provedores de Serviços em Nuvem
Empresas
Instituições Governamentais e de Pesquisa
Por Geografia
América do NorteEstados Unidos
Canadá
México
EuropaReino Unido
Alemanha
França
Itália
Restante da Europa
Ásia-PacíficoChina
Japão
Índia
Coreia do Sul
Restante da Ásia-Pacífico
América do Sul
Oriente Médio e África
Por Modo de ImplantaçãoData Centers em Nuvem
Data Centers Corporativos e Privados
Data Centers de Borda
Por Tipo de GPUGPUs de Treinamento
GPUs de Inferência
Por InterconexãoGPUs Baseadas em PCIe
GPUs com Interconexão de Alta Largura de Banda
Por Usuário FinalHyperscalers e Provedores de Serviços em Nuvem
Empresas
Instituições Governamentais e de Pesquisa
Por GeografiaAmérica do NorteEstados Unidos
Canadá
México
EuropaReino Unido
Alemanha
França
Itália
Restante da Europa
Ásia-PacíficoChina
Japão
Índia
Coreia do Sul
Restante da Ásia-Pacífico
América do Sul
Oriente Médio e África

Principais Perguntas Respondidas no Relatório

Qual é o valor projetado do mercado de GPU para data center de IA em 2031?

O tamanho do mercado de GPU para data center de IA está previsto para atingir USD 90,46 bilhões até 2031, crescendo a um CAGR de 14,97% no período de 2026-2031.

Qual modo de implantação contribui com a maior receita atualmente?

Os data centers em nuvem representam 66,38% da receita de 2025, superando em muito as instalações corporativas, privadas e de borda.

Por que as GPUs de inferência estão ganhando participação em relação às GPUs de treinamento?

A geração contínua de tokens a partir do ajuste fino e da inferência de contexto longo agora impulsiona a maior parte dos gastos com computação, tornando as GPUs de alta densidade de memória e otimizadas para inferência mais econômicas do que os cartões de treinamento de força bruta.

Como os controles de exportação estão influenciando o fornecimento regional?

As regras dos EUA impõem tarifas, limites de volume e revisões caso a caso sobre exportações de GPUs de alto desempenho, direcionando o fornecimento para compradores domésticos e levando a China a acelerar seu próprio ecossistema de aceleradores.

Qual é o papel das reformas de resfriamento líquido no mercado?

À medida que as densidades de energia dos racks ultrapassam 150 quilowatts, o resfriamento líquido evita o estrangulamento térmico, aumenta o rendimento em percentuais de dois dígitos e abre um lucrativo ciclo de atualização para fornecedores em escala de rack.

Qual região deve crescer mais rapidamente até 2031?

A Ásia-Pacífico deve registrar o maior CAGR regional de 15,97%, liderada por investimentos soberanos no Japão, Índia e Coreia do Sul.

Página atualizada pela última vez em: