El impulso de NVIDIA con DAQIRI pone de relieve un problema mayor para los agentes de IA: la autonomía depende de una infraestructura de datos en tiempo real

NVIDIA está planteando un nuevo argumento de infraestructura para la era de los agentes de IA: la autonomía se desmorona si los sistemas no pueden ingerir, procesar y actuar sobre datos تازه lo bastante rápido. La reciente entrada en el blog para desarrolladores de la compañía, en la que presenta NVIDIA DAQIRI, una canalización de adquisición de datos para instrumentos y sensores de alta velocidad, llega junto con un mensaje más amplio del sector por parte de TMForum: los agentes de IA necesitan un tejido de datos en tiempo real para operar a escala.

En conjunto, las fuentes apuntan al mismo cambio. El cuello de botella para la IA avanzada ya no es solo la calidad del modelo o el acceso a GPU. Es el trayecto entre las señales brutas y las decisiones en vivo: cómo los datos se mueven desde sensores, dispositivos, sistemas empresariales y flujos de eventos hacia un software que puede filtrar, inferir y activar acciones sin esperar a un flujo de trabajo tradicional de recopilar y luego almacenar. Para quienes construyen agentes de IA, eso es una cuestión práctica, no un eslogan arquitectónico.

Por qué la historia trata realmente sobre agentes de IA, no solo sobre hardware científico

El enfoque de TMForum es amplio y orientado a la empresa: los agentes de IA necesitan un tejido de datos en tiempo real para habilitar autonomía a escala. El texto completo de ese artículo no estaba disponible en el material de origen, por lo que aquí no pueden verificarse los argumentos y ejemplos exactos. Pero el tema coincide con un patrón creciente en el mercado. Los agentes se están posicionando como software capaz de observar el contexto, razonar sobre el estado y actuar entre sistemas. Eso requiere una visión estable y de baja latencia de las entradas cambiantes.

La contribución de NVIDIA es más acotada, pero también más concreta. En su blog para desarrolladores, la compañía describe NVIDIA DAQIRI como una biblioteca de adquisición de datos de alto rendimiento y centrada en software dentro de la plataforma NVIDIA Holoscan Platform. La propuesta está dirigida a entornos de gran ancho de banda, como instrumentos científicos, escáneres industriales y radios definidas por software, donde los datos llegan demasiado rápido para canalizaciones heredadas que primero recopilan, luego almacenan y después analizan.

Eso importa más allá de los laboratorios. El mismo problema de diseño aparece en agentes de IA empresariales conectados a software de operaciones, robótica, herramientas de observabilidad, sistemas de atención al cliente y equipos de fabricación. Un agente no puede ser realmente autónomo si actúa sobre registros obsoletos, flujos de eventos incompletos o bucles de retroalimentación retrasados.

Qué está diseñado para hacer NVIDIA DAQIRI

Según NVIDIA, NVIDIA DAQIRI desplaza la adquisición de datos de rutas de hardware de función fija hacia una capa de software más adaptable. La compañía afirma que el software puede transmitir salidas de detectores y sensores de alto ancho de banda directamente a la memoria de la GPU para su procesamiento en flujo, reduciendo tanto la latencia como la carga sobre la CPU.

La afirmación técnica más destacada es la ruta de transporte. NVIDIA dice que NVIDIA DAQIRI utiliza el Data Plane Development Kit, o DPDK, para eludir el kernel de Linux y enrutar paquetes desde una NIC NVIDIA ConnectX directamente a los búferes DMA de la GPU con acceso sin copia. En la descripción de la compañía, eso permite que los flujos entrantes lleguen a la GPU listos para operaciones inmediatas como filtrado, inferencia, compresión, selección de eventos y control adaptativo.

NVIDIA también sitúa NVIDIA DAQIRI como parte de una pila más amplia, y no como una herramienta puntual independiente. El blog destaca la integración con NVIDIA Holoscan Platform para flujos de trabajo multimodales en tiempo real, TensorRT para inferencia de baja latencia y NVIDIA nvCOMP para compresión en streaming. Según NVIDIA, los desarrolladores pueden construir estas canalizaciones con configuración impulsada por YAML, además de interfaces en C++ y Python.

Ese enfoque a nivel de pila es importante. La lección para los equipos de IA no es simplemente “usa esta biblioteca”. Es que la inteligencia en tiempo real depende tanto de la fontanería como de los modelos. Si se espera que los agentes supervisen el estado, llamen a herramientas y actualicen planes de forma continua, entonces el software que rodea al modelo debe admitir ingesta, transformación y acción de alta frecuencia.

CERN ofrece un ejemplo concreto de por qué importa el filtrado en tiempo real

El caso de uso más sólido del material de origen proviene de CERN. NVIDIA dice que el proyecto A-GHOST está utilizando NVIDIA DAQIRI para conectar placas de hardware basadas en FPGA con granjas de procesamiento con GPU, de modo que los investigadores puedan analizar flujos de datos que, de otro modo, se descartarían mediante rutas estándar de selección de eventos.

El contexto es la actualización del High-Luminosity Large Hadron Collider. Según el blog de NVIDIA, el HL-LHC elevará la luminosidad en un factor de 10 en comparación con el diseño original. NVIDIA afirma que el sistema de selección actualizado del detector ATLAS aumentará el ancho de banda de eventos seleccionados después de la primera etapa a 1 MHz desde 100 kHz, y después de la segunda etapa hasta almacenamiento a 10 kHz desde 1 kHz. Incluso con ese aumento, más del 99% de las colisiones seguirá siendo rechazado en el sistema en línea, según la compañía.

Ese es el problema operativo en forma extrema: demasiados datos en vivo, demasiado poco tiempo para decidir qué importa. NVIDIA dice que A-GHOST está explorando si modelos de IA como Convolutional Auto-Encoders, redes neuronales convolucionales temporales y modelos basados en transformadores pueden inspeccionar el flujo que de otro modo se descartaría.

Para quienes construyen agentes de IA, el ejemplo de CERN se traduce en una lección más familiar. La mayoría de los sistemas autónomos no fallan porque les falte una llamada a un modelo. Fallan porque no pueden clasificar, priorizar, comprimir o enrutar lo bastante rápido una avalancha de señales entrantes como para tomar decisiones oportunas. En otras palabras, la autonomía depende de una atención selectiva implementada en la infraestructura.

La base de evidencia es sólida en arquitectura, más débil en prueba de mercado

La mezcla de fuentes aquí importa. TMForum aporta el marco de mercado, pero el texto del artículo no estaba disponible en las notas de la cobertura, por lo que sus argumentos no pueden citarse ni evaluarse de forma independiente en detalle. El blog para desarrolladores de NVIDIA es la fuente técnica principal y contiene la información factual más clara sobre el diseño, las integraciones y los casos de uso previstos de NVIDIA DAQIRI.

Pero sigue siendo una fuente controlada por el proveedor. Eso significa que las afirmaciones más sólidas de esta historia son reportadas por el propio proveedor. NVIDIA dice que NVIDIA DAQIRI puede manejar datos Ethernet, incluidos UDP y RoCE v2, a velocidades de línea de cientos de gigabits por segundo y más, con el hardware adecuado y la puesta a punto de CPU/NUMA. También afirma que la arquitectura reduce la latencia hasta, de hecho, el tiempo de tránsito PCIe para el acceso directo desde el búfer circular de la NIC a los tensores de la GPU. Esas afirmaciones son plausibles en el contexto de rutas de kernel bypass y GPU-direct, pero el material de origen no incluye benchmarks independientes, metodología de pruebas de terceros ni evidencia amplia de despliegue en producción.

Del mismo modo, el material de CERN describe un esfuerzo de I+D, no un despliegue comercial plenamente probado y a gran escala. El proyecto A-GHOST involucra a CERN Openlab, la University of Chicago y científicos de UCL, según NVIDIA, y los modelos descritos están previstos para probarse con hardware prototipo. Eso supone una validación significativa de interés, pero no es lo mismo que una referencia madura de producción para compradores empresariales.

Así que la conclusión es sólida en cuanto a dirección y arquitectura, pero todavía no en cuanto a resultados universales de rendimiento o amplitud de adopción.

Por qué esto importa para creadores y compradores empresariales

Para los equipos que construyen agentes de IA, la implicación práctica es que los marcos de orquestación por sí solos no son suficientes. Tanto si la pila usa microservicios impulsados por eventos, flujos de observabilidad en tiempo real, bucles de control industrial o registros de interacción con clientes, la capa que falta suele ser una ruta duradera y de baja latencia desde los datos en vivo hasta la inferencia y la acción.

Eso crea varios requisitos de diseño.

En primer lugar, la frescura del estado se convierte en un requisito del producto. Si un agente usa contexto obsoleto, el uso de herramientas se vuelve frágil y la automatización puede transformarse en propagación de errores. El movimiento de datos en tiempo real está, por tanto, ligado directamente a la fiabilidad del agente.

En segundo lugar, la economía de la inferencia cambia cuando el filtrado ocurre antes. Si los sistemas pueden descartar eventos de poco valor o comprimir cargas útiles antes de la ejecución del modelo, los recursos de GPU se gastan en decisiones que importan. El énfasis de NVIDIA en el filtrado y la compresión en flujo habla directamente de ese problema de costes.

En tercer lugar, la arquitectura de despliegue se vuelve más distribuida. El blog de NVIDIA apunta a sistemas en el borde que van desde NVIDIA DGX Spark hasta NVIDIA IGX Platform y servidores a escala de rack. La implicación de mercado más amplia es que no todos los flujos de trabajo de agentes se ejecutarán de forma centralizada en una capa de aplicación en la nube. Algunos deberán ejecutarse cerca de instrumentos, máquinas o fuentes locales de eventos.

En cuarto lugar, la interoperabilidad importará tanto como el rendimiento bruto. NVIDIA dice que NVIDIA DAQIRI puede transmitir hacia plataformas personalizadas específicas de instrumentos, además de la pila de software de NVIDIA. Para la IA empresarial, ese mismo principio se aplica a ERP, CRM, sistemas de TI y tecnología operativa. Un tejido de datos en tiempo real solo ayuda si el agente puede acceder a los sistemas circundantes y confiar en ellos.

Qué vigilar a continuación

La próxima señal a monitorizar es si NVIDIA extiende este mensaje más allá de la computación científica hacia casos de uso de agentes de IA empresariales e industriales más convencionales. Si NVIDIA DAQIRI o componentes adyacentes de NVIDIA Holoscan Platform empiezan a aparecer en automatización de fabricación, robótica, operaciones de telecomunicaciones o monitorización de seguridad, eso reforzaría la idea de que se trata de una apuesta más amplia por la infraestructura de agentes.

Una segunda señal es la validación de terceros. Los benchmarks independientes sobre latencia, rendimiento, ahorro de CPU y complejidad operativa importarán más que las cifras reportadas por el proveedor. Los compradores también querrán ver estudios de caso de despliegue más claros, no solo colaboraciones de I+D.

Tercero, habrá que observar si los proveedores de infraestructura y las empresas de plataformas de agentes empiezan a converger en un lenguaje común sobre estado, flujos de eventos y bucles de acción. Si el marco de TMForum de un “tejido de datos en tiempo real” gana tracción, podría convertirse en una forma útil de resumir un requisito de mercado que abarca tanto la IA empresarial como los sistemas del mundo físico.

Por último, hay que vigilar el diseño de los propios modelos. El ejemplo de CERN de NVIDIA menciona Convolutional Auto-Encoders y modelos basados en transformadores operando sobre flujos en vivo. Si más sistemas de agentes adoptan modelos ligeros y siempre activos para la clasificación antes de escalar a modelos de razonamiento más grandes, la infraestructura en tiempo real se volverá aún más central.

Perspectiva de Creati.ai

La parte más importante de esta historia no es NVIDIA DAQIRI como producto aislado. Es el recordatorio de que los agentes de IA solo son tan autónomos como su trayectoria de datos. El mercado ha pasado los últimos dos años hablando de modelos, copilots y capas de orquestación. El problema más difícil es conectar esos sistemas con el estado en vivo con una latencia lo bastante baja y una fiabilidad lo bastante alta como para confiar en la acción.

Para startups y equipos empresariales, eso sugiere un cambio en dónde estará la ventaja competitiva. Los mejores prompts y marcos de agentes pueden ayudar marginalmente, pero es más probable que la diferenciación duradera provenga de controlar la canalización de eventos, la capa de políticas y las interfaces en tiempo real entre los modelos y los sistemas operativos. NVIDIA está defendiendo esa tesis desde el lado de la infraestructura. El resto del mercado tendrá que demostrarlo en producción.