
Em um cenário dominado pela influência monolítica da Nvidia, a indústria de semicondutores operou durante muito tempo sob a premissa de que as GPUs de uso geral são o único caminho viável para a dominância em inteligência artificial (IA). No entanto, uma mudança sísmica ocorreu esta semana, quando a Etched, uma startup especializada em chips de IA, anunciou oficialmente uma avaliação impressionante de US$ 5 bilhões. Com US$ 1 bilhão em vendas contratadas confirmadas para seu futuro hardware, a empresa está se posicionando como a primeira ameaça estrutural real ao domínio consolidado da Nvidia no mercado de infraestrutura de IA.
Na Creati.ai, acompanhamos a evolução do hardware especializado há anos. O surgimento da Etched representa mais do que apenas outra rodada de financiamento; marca uma transição da era dos chips que "fazem tudo para todos" para a era da otimização de "domínio específico". Ao focar exclusivamente em Transformers — a arquitetura que impulsiona modelos como o GPT-4 e além — a Etched aposta que o futuro da inferência pertence àqueles que eliminam o excesso da programabilidade tradicional das GPUs.
O núcleo da vantagem competitiva da Etched reside em sua arquitetura de chip proprietária, conhecida como "Soho". Ao contrário das arquiteturas Blackwell ou Hopper da Nvidia, que mantêm componentes programáveis para lidar com gráficos, computação científica e cargas de trabalho legadas, o Soho é conectado internamente (hardwired) exclusivamente para operações de redes neurais baseadas em Transformer.
Ao eliminar instruções para tarefas que não são de IA, a Etched alcançou um salto significativo em eficiência. Essa abordagem focada permite uma redução na latência e um aumento massivo no rendimento, visando especificamente os data centers onde operam os grandes modelos de linguagem (LLMs). A tabela a seguir destaca as diferenças estratégicas fundamentais entre as abordagens tradicionais de GPU e o silício especializado da Etched:
| Recurso | GPUs Nvidia | Chips Soho da Etched |
|---|---|---|
| Carga de trabalho alvo | Uso geral (Gráficos, Jogos, IA) | Apenas modelos Transformer |
| Programabilidade | Altamente programável (CUDA) | Arquitetura de função fixa |
| Eficiência de inferência | Alta (por força bruta) | Extrema (por otimização de hardware) |
| Foco no mercado | Mercado de massa em todas as indústrias | Infraestrutura de IA em hiperescala |
Com US$ 1 bilhão em vendas contratadas, a Etched está provando que o mercado de chips de IA está caminhando rapidamente para a eficiência especializada. À medida que as empresas gastam bilhões em custos de computação em nuvem, a demanda por hardware que reduz o "custo por token" tornou-se o principal motor de investimento do setor. Embora a Nvidia continue a inovar em um ritmo incrível, o enorme consumo de energia e os gastos de capital exigidos pelas GPUs de uso geral apresentam um desafio crescente para os operadores de data centers.
A capacidade da Etched de garantir financiamento maciço de pesos-pesados como a Jane Street ressalta uma mudança no sentimento dos investidores. A comunidade de capital de risco não está mais procurando "matadores da Nvidia" que tentam emular seu modelo de negócios. Em vez disso, estão apoiando empresas que alteram fundamentalmente a física do desempenho, priorizando o rendimento bruto e a eficiência energética em detrimento da versatilidade geral.
A indústria de semicondutores está testemunhando uma bifurcação. De um lado, temos empresas estabelecidas como Nvidia, AMD e Intel, que mantêm um vasto ecossistema de software, ferramentas de desenvolvedor e enormes canais de fabricação. Por outro lado, temos uma nova onda de startups como Etched, Groq e outras que apostam que a era "apenas para Transformers" tornará o processamento baseado em gráficos tradicional obsoleto.
A avaliação de US$ 5 bilhões da Etched serve como um indicador para o setor de semicondutores. Valida a hipótese de que o mundo da IA definido por software agora é complexo o suficiente para exigir especialização em nível de hardware.
À medida que a indústria de IA cresce, nós da Creati.ai esperamos ver uma infraestrutura de hardware em camadas. Os futuros data centers provavelmente utilizarão uma abordagem híbrida: chips da Nvidia para desenvolvimento experimental, de ponta e P&D geral, e silício especializado como o Soho da Etched para a inferência de produção de alto volume, repetitiva e sensível a custos que impulsiona a web moderna.
A batalha pela supremacia no espaço de chips de IA está efetivamente entrando em seu segundo capítulo. Embora o primeiro capítulo tenha sido definido pela transição de CPUs para GPUs, o estágio atual é definido pela transição de chips de uso geral para aceleradores de inteligência feitos sob medida. Com o apoio de investidores de elite e uma visão tecnológica clara, a Etched sinalizou que não é mais apenas uma novata — ela é um player formidável mudando as regras do jogo do silício.