O impulso da NVIDIA com DAQIRI destaca um problema maior para agentes de IA: a autonomia depende de infraestrutura de dados em tempo real

A NVIDIA está fazendo um novo argumento de infraestrutura para a era dos agentes de IA: a autonomia entra em colapso se os sistemas não conseguirem ingerir, processar e agir sobre dados novos com rapidez suficiente. O recente blog para desenvolvedores da empresa, que apresenta o NVIDIA DAQIRI, um pipeline de aquisição de dados para instrumentos e sensores de alta velocidade, surge ao lado de uma mensagem mais ampla da indústria vinda da TMForum de que os agentes de IA precisam de uma malha de dados em tempo real para operar em escala.

Tomados em conjunto, os materiais apontam para a mesma mudança. O gargalo da IA avançada já não é apenas a qualidade do modelo ou o acesso a GPUs. É o caminho entre sinais brutos e decisões ao vivo: como os dados se movem de sensores, dispositivos, sistemas corporativos e fluxos de eventos para softwares que podem filtrar, inferir e acionar ações sem esperar por um fluxo de trabalho tradicional de coletar e depois armazenar. Para quem constrói agentes de IA, isso é uma questão prática, não um slogan arquitetural.

Por que a história é realmente sobre agentes de IA, e não apenas sobre hardware científico

O enquadramento da TMForum é amplo e voltado para empresas: agentes de IA precisam de uma malha de dados em tempo real para permitir autonomia em escala. O texto completo desse artigo não estava disponível no material de origem, então os argumentos e exemplos precisos não podem ser verificados aqui. Mas o tema corresponde a um padrão crescente no mercado. Os agentes estão sendo posicionados como softwares capazes de observar contexto, raciocinar sobre o estado e tomar ações em sistemas diferentes. Isso exige uma visão estável e de baixa latência das entradas em mudança.

A contribuição da NVIDIA é mais restrita, mas mais concreta. Em seu blog para desenvolvedores, a empresa descreve o NVIDIA DAQIRI como uma biblioteca de aquisição de dados de alto rendimento e centrada em software dentro da NVIDIA Holoscan Platform. A proposta é voltada a ambientes de alta largura de banda, como instrumentos científicos, scanners industriais e rádios definidos por software, nos quais os dados chegam rápido demais para pipelines legados que primeiro coletam, depois armazenam e depois analisam.

Isso importa além dos laboratórios. O mesmo problema de design aparece em agentes de IA corporativos conectados a software de operações, robótica, ferramentas de observabilidade, sistemas de atendimento ao cliente e equipamentos de manufatura. Um agente não pode ser significativamente autônomo se agir com base em registros desatualizados, fluxos de eventos incompletos ou loops de feedback atrasados.

O que o NVIDIA DAQIRI foi projetado para fazer

De acordo com a NVIDIA, o NVIDIA DAQIRI desloca a aquisição de dados de caminhos de hardware de função fixa para uma camada de software mais adaptável. A empresa afirma que o software pode transmitir saídas de detectores e sensores de alta largura de banda diretamente para a memória da GPU para processamento em fluxo, reduzindo tanto a latência quanto a sobrecarga da CPU.

A afirmação técnica mais notável é o caminho de transporte. A NVIDIA diz que o NVIDIA DAQIRI usa o Data Plane Development Kit, ou DPDK, para contornar o kernel do Linux e rotear pacotes de uma NIC NVIDIA ConnectX diretamente para buffers DMA da GPU com acesso zero-copy. Na descrição da empresa, isso permite que os fluxos recebidos cheguem à GPU prontos para operações imediatas, como filtragem, inferência, compressão, seleção de eventos e controle adaptativo.

A NVIDIA também posiciona o NVIDIA DAQIRI como parte de uma pilha mais ampla, e não como uma ferramenta pontual independente. O blog destaca a integração com a NVIDIA Holoscan Platform para fluxos de trabalho multimodais em tempo real, com o TensorRT para inferência de baixa latência e com o NVIDIA nvCOMP para compressão em streaming. Os desenvolvedores podem construir esses pipelines com configuração orientada por YAML, além de interfaces em C++ e Python, segundo a NVIDIA.

Esse enquadramento em nível de stack é importante. A lição para equipes de IA não é simplesmente “use esta biblioteca”. É que a inteligência em tempo real depende tanto da infraestrutura de encanamento quanto dos modelos. Se os agentes devem monitorar o estado, chamar ferramentas e atualizar planos continuamente, então o software ao redor do modelo precisa oferecer ingestão, transformação e ação em alta frequência.

O CERN oferece um exemplo concreto de por que a filtragem em tempo real importa

O caso de uso mais forte no material de origem vem do CERN. A NVIDIA afirma que o projeto A-GHOST está usando o NVIDIA DAQIRI para conectar placas de hardware baseadas em FPGA a fazendas de processamento com GPU, para que pesquisadores possam analisar fluxos de dados que, de outra forma, seriam descartados por caminhos padrão de seleção de eventos.

O contexto é a atualização do High-Luminosity Large Hadron Collider. Segundo o blog da NVIDIA, o HL-LHC aumentará a luminosidade em um fator de 10 em comparação com o projeto original. A NVIDIA diz que o sistema de seleção atualizado do detector ATLAS aumentará a largura de banda dos eventos selecionados após a primeira etapa para 1 MHz, de 100 kHz, e após a segunda etapa para armazenamento para 10 kHz, de 1 kHz. Mesmo com esse aumento, mais de 99% das colisões ainda serão rejeitadas no sistema online, segundo a empresa.

Esse é o problema operacional em forma extrema: dados ao vivo demais, pouco tempo demais para decidir o que importa. A NVIDIA diz que o A-GHOST está explorando se modelos de IA como Convolutional Auto-Encoders, redes neurais convolucionais temporais e modelos baseados em transformer podem inspecionar o fluxo que, de outra forma, seria descartado.

Para quem constrói agentes de IA, o exemplo do CERN se traduz em uma lição mais familiar. A maioria dos sistemas autônomos não falha porque não consegue chamar um modelo. Eles falham porque não conseguem classificar, priorizar, comprimir ou encaminhar uma enxurrada de sinais recebidos com rapidez suficiente para tomar decisões no tempo certo. Em outras palavras, a autonomia depende de atenção seletiva implementada na infraestrutura.

A base de evidências é forte em arquitetura, mas mais fraca em prova de mercado

A mistura de fontes aqui importa. A TMForum fornece o enquadramento de mercado, mas o texto do artigo não estava disponível nas notas de apuração, então seus argumentos não podem ser citados nem avaliados de forma independente em detalhe. O blog para desenvolvedores da NVIDIA é a principal fonte técnica e contém as informações factuais mais claras sobre o design, as integrações e os casos de uso pretendidos do NVIDIA DAQIRI.

Mas ainda assim é uma fonte controlada pelo fornecedor. Isso significa que as afirmações mais fortes nesta história são relatadas pelo próprio fornecedor. A NVIDIA diz que o NVIDIA DAQIRI pode lidar com dados Ethernet, incluindo UDP e RoCE v2, em taxas de linha de centenas de gigabits por segundo e acima, com hardware adequado e ajuste de CPU/NUMA. Também afirma que a arquitetura reduz a latência a, efetivamente, o tempo de trânsito do PCIe para acesso direto de ring-buffer da NIC aos tensores da GPU. Essas declarações são plausíveis no contexto de bypass do kernel e caminhos GPU-direct, mas o material de origem não inclui benchmarks independentes, metodologia de teste de terceiros ou evidências amplas de implantação em produção.

Da mesma forma, o material do CERN descreve um esforço de P&D, não uma implantação comercial madura e comprovada em escala. O projeto A-GHOST envolve CERN Openlab, a University of Chicago e cientistas da UCL, segundo a NVIDIA, e os modelos descritos devem ser testados com hardware protótipo. Isso é uma validação relevante de interesse, mas não é o mesmo que uma referência de produção consolidada para compradores corporativos.

Portanto, o aprendizado é sólido quanto à direção e à arquitetura, mas ainda não quanto a resultados universais de desempenho ou à amplitude da adoção.

Por que isso importa para builders e compradores corporativos

Para equipes que constroem agentes de IA, a implicação prática é que frameworks de orquestração por si só não bastam. Seja qual for a pilha — microsserviços orientados a eventos, feeds de observabilidade em tempo real, loops de controle industrial ou logs de interação com clientes — a camada que costuma faltar é um caminho durável e de baixa latência dos dados vivos para a inferência e a ação.

Isso cria vários requisitos de design.

Primeiro, a frescura do estado se torna um requisito de produto. Se um agente usa contexto desatualizado, o uso de ferramentas fica frágil e a automação pode se transformar em propagação de erros. O movimento de dados em tempo real, portanto, está ligado diretamente à confiabilidade do agente.

Segundo, a economia da inferência muda quando a filtragem acontece mais cedo. Se os sistemas conseguem descartar eventos de baixo valor ou comprimir cargas úteis antes da execução do modelo, os recursos de GPU são gastos em decisões que importam. A ênfase da NVIDIA em filtragem e compressão em fluxo fala diretamente a esse problema de custo.

Terceiro, a arquitetura de implantação se torna mais distribuída. O blog da NVIDIA aponta para sistemas de edge que vão do NVIDIA DGX Spark ao NVIDIA IGX Platform e a servidores em escala de rack. A implicação mais ampla para o mercado é que nem todo fluxo de trabalho de agente rodará centralmente em uma camada de aplicação na nuvem. Alguns precisarão executar perto de instrumentos, máquinas ou fontes locais de eventos.

Quarto, a interoperabilidade importará tanto quanto a taxa bruta de transferência. A NVIDIA diz que o NVIDIA DAQIRI pode transmitir para plataformas personalizadas específicas de instrumentos, além da pilha de software da NVIDIA. Para IA corporativa, esse mesmo princípio se aplica a ERP, CRM, sistemas de TI e tecnologia operacional. Uma malha de dados em tempo real só ajuda se o agente puder acessar e confiar nos sistemas ao redor.

O que observar a seguir

O próximo sinal a monitorar é se a NVIDIA estende essa mensagem para além da computação científica e a leva a casos de uso mais convencionais de agentes de IA corporativos e industriais. Se o NVIDIA DAQIRI ou componentes adjacentes da NVIDIA Holoscan Platform começarem a aparecer em automação de manufatura, robótica, operações de telecom ou monitoramento de segurança, isso fortaleceria o argumento de que se trata de uma aposta mais ampla em infraestrutura para agentes.

Um segundo sinal é a validação de terceiros. Benchmarks independentes sobre latência, throughput, economia de CPU e complexidade operacional importariam mais do que números relatados pelo próprio fornecedor. Os compradores também vão querer ver estudos de caso de implantação mais claros, e não apenas colaborações de P&D.

Terceiro, vale observar se fornecedores de infraestrutura e empresas de plataformas de agentes começam a convergir em uma linguagem comum em torno de estado, fluxos de eventos e ciclos de ação. Se o enquadramento de “malha de dados em tempo real” da TMForum ganhar tração, ele poderá se tornar uma abreviação útil para um requisito de mercado que abrange IA corporativa e sistemas do mundo físico.

Por fim, observe o próprio design dos modelos. O exemplo do CERN da NVIDIA menciona Convolutional Auto-Encoders e modelos baseados em transformer operando em fluxos ao vivo. Se mais sistemas de agentes adotarem modelos leves e sempre ativos para triagem antes de escalarem para modelos de raciocínio maiores, a infraestrutura em tempo real se tornará ainda mais central.

Perspectiva da Creati.ai

A parte mais importante desta história não é o NVIDIA DAQIRI como um produto isolado. É o lembrete de que os agentes de IA são tão autônomos quanto seu caminho de dados. O mercado passou os últimos dois anos falando sobre modelos, copilots e camadas de orquestração. O problema mais difícil é conectar esses sistemas ao estado ao vivo com baixa latência e confiabilidade suficientes para que a ação possa ser confiável.

Para startups e equipes corporativas, isso sugere uma mudança na origem da vantagem competitiva. Prompts melhores e frameworks de agentes podem ajudar marginalmente, mas a diferenciação duradoura provavelmente virá de controlar o pipeline de eventos, a camada de políticas e as interfaces em tempo real entre modelos e sistemas operacionais. A NVIDIA está defendendo isso pela ótica da infraestrutura. O restante do mercado terá de provar isso em produção.