Толчок NVIDIA в DAQIRI подчеркивает более серьезную проблему для ИИ-агентов: автономность зависит от инфраструктуры данных в реальном времени

NVIDIA выдвигает новый инфраструктурный аргумент для эпохи ИИ-агентов: автономность рушится, если системы не могут достаточно быстро принимать, обрабатывать и использовать свежие данные. Недавний блог компании для разработчиков, представляющий NVIDIA DAQIRI — конвейер сбора данных для высокоскоростных приборов и датчиков, — выходит на фоне более широкого отраслевого послания от TMForum о том, что ИИ-агентам нужна ткань данных в реальном времени, чтобы работать в масштабе.

Вместе эти источники указывают на один и тот же сдвиг. Узким местом для продвинутого ИИ больше не являются только качество модели или доступ к GPU. Это путь между сырыми сигналами и живыми решениями: как данные перемещаются от датчиков, устройств, корпоративных систем и потоков событий в ПО, которое может фильтровать, делать выводы и запускать действия, не дожидаясь традиционного процесса «собрать — затем сохранить». Для создателей ИИ-агентов это практическая проблема, а не архитектурный лозунг.

Почему история на самом деле об ИИ-агентах, а не только о научном оборудовании

Формулировка TMForum широка и ориентирована на корпоративный рынок: ИИ-агентам нужна ткань данных в реальном времени, чтобы обеспечить автономность в масштабе. Полный текст этой статьи не был доступен в исходных материалах, поэтому точные аргументы и примеры здесь подтвердить нельзя. Но тема совпадает с растущей рыночной тенденцией. Агенты позиционируются как ПО, которое может наблюдать контекст, рассуждать о состоянии и предпринимать действия в разных системах. Для этого нужен устойчивый, малозадержанный обзор меняющихся входных данных.

Вклад NVIDIA уже уже более узкий, но и более конкретный. В своем блоге для разработчиков компания описывает NVIDIA DAQIRI как ориентированную на ПО библиотеку сбора данных с высокой пропускной способностью внутри платформы NVIDIA Holoscan Platform. Этот подход нацелен на среды с высокой пропускной способностью, такие как научные приборы, промышленные сканеры и программно-определяемые радиосистемы, где данные приходят слишком быстро для устаревших конвейеров, которые сначала собирают, затем сохраняют, а потом анализируют.

Это важно не только для лабораторий. Та же проблема проектирования возникает в корпоративных ИИ-агентах, подключенных к ПО для операций, робототехнике, инструментам наблюдаемости, системам поддержки клиентов и производственному оборудованию. Агент не может быть по-настоящему автономным, если он действует на основе устаревших записей, неполных потоков событий или задержанных циклов обратной связи.

Что NVIDIA DAQIRI призван сделать

Согласно NVIDIA, NVIDIA DAQIRI переносит сбор данных из аппаратно закрепленных путей в более адаптируемый программный слой. Компания утверждает, что ПО может передавать высокоскоростные выходные данные детекторов и датчиков напрямую в память GPU для обработки в потоке, снижая как задержку, так и нагрузку на CPU.

Примечательное техническое утверждение касается пути передачи. NVIDIA говорит, что NVIDIA DAQIRI использует Data Plane Development Kit, или DPDK, чтобы обходить ядро Linux и направлять пакеты с сетевой карты NVIDIA ConnectX напрямую в буферы GPU DMA с доступом без копирования. По описанию компании, это позволяет входящим потокам достигать GPU, уже готовыми к немедленным операциям, таким как фильтрация, инференс, сжатие, отбор событий и адаптивное управление.

NVIDIA также позиционирует NVIDIA DAQIRI как часть более широкого стека, а не как самостоятельный точечный инструмент. В блоге подчеркивается интеграция с NVIDIA Holoscan Platform для многомодальных рабочих процессов в реальном времени, TensorRT для инференса с низкой задержкой и NVIDIA nvCOMP для потокового сжатия. Разработчики могут строить такие конвейеры с помощью конфигурации на YAML плюс интерфейсов C++ и Python, утверждает NVIDIA.

Такое позиционирование на уровне стека важно. Вывод для команд ИИ не просто «используйте эту библиотеку». Он в том, что интеллект в реальном времени зависит не меньше от инфраструктуры передачи данных, чем от моделей. Если от агентов ожидают мониторинга состояния, вызова инструментов и постоянного обновления планов, то ПО вокруг модели должно поддерживать высокочастотный прием данных, преобразование и действие.

CERN дает конкретный пример того, почему фильтрация в реальном времени важна

Самый сильный пример в исходных материалах — от CERN. NVIDIA утверждает, что проект A-GHOST использует NVIDIA DAQIRI для соединения аппаратных плат на базе FPGA с фермами GPU-обработки, чтобы исследователи могли анализировать потоки данных, которые иначе были бы отброшены стандартными путями выбора событий.

Контекстом служит обновление High-Luminosity Large Hadron Collider. Согласно блогу NVIDIA, HL-LHC увеличит светимость в 10 раз по сравнению с исходным проектом. NVIDIA говорит, что обновленная система отбора событий детектора ATLAS увеличит пропускную способность отобранных событий после первой стадии до 1 МГц с 100 кГц, а после второй стадии до хранения — до 10 кГц с 1 кГц. Даже при таком росте, по данным компании, более 99% столкновений все равно будут отклоняться в онлайн-системе.

Это и есть операционная проблема в предельной форме: слишком много живых данных, слишком мало времени, чтобы решить, что важно. NVIDIA утверждает, что A-GHOST изучает, могут ли модели ИИ, такие как Convolutional Auto-Encoders, временные сверточные нейронные сети и модели на основе трансформеров, анализировать поток, который иначе был бы отброшен.

Для создателей ИИ-агентов пример CERN переводится в более привычный урок. Большинство автономных систем дают сбой не потому, что им не хватает вызова модели. Они дают сбой потому, что не могут достаточно быстро сортировать, ранжировать, сжимать или направлять лавину входящих сигналов, чтобы принимать своевременные решения. Иными словами, автономность зависит от избирательного внимания, реализованного в инфраструктуре.

База доказательств сильна в архитектуре, но слабее в подтверждении рынка

Смесь источников здесь имеет значение. TMForum дает рыночную рамку, но текст статьи был недоступен в заметках к материалу, поэтому его аргументы нельзя цитировать или подробно оценить независимо. Блог NVIDIA для разработчиков — основной технический источник, и в нем содержится наиболее четкая фактическая информация о дизайне, интеграциях и предполагаемых сценариях использования NVIDIA DAQIRI.

Но это все же источник под контролем вендора. Это означает, что самые сильные утверждения в этой истории сообщаются самой компанией. NVIDIA утверждает, что NVIDIA DAQIRI может работать с Ethernet-данными, включая UDP и RoCE v2, на скоростях линий в сотни гигабит в секунду и выше при наличии подходящего оборудования и настройки CPU/NUMA. Она также говорит, что архитектура снижает задержку практически до времени прохождения по PCIe для прямого доступа от кольцевых буферов NIC к тензорам GPU. Эти заявления выглядят правдоподобно в контексте обхода ядра и путей GPU-direct, но исходные материалы не содержат независимых бенчмарков, методологии стороннего тестирования или широких доказательств промышленного внедрения.

Аналогично, материал CERN описывает исследовательскую и опытно-конструкторскую работу, а не полностью подтвержденное коммерческое внедрение в масштабе. По данным NVIDIA, в проект A-GHOST вовлечены CERN Openlab, University of Chicago и ученые UCL, а описанные модели планируется тестировать на прототипном оборудовании. Это значимая валидация интереса, но это не то же самое, что зрелый производственный референс для корпоративных покупателей.

Итак, вывод надежен в части направления и архитектуры, но пока не в части универсальных результатов по производительности или широты внедрения.

Почему это важно для разработчиков и корпоративных покупателей

Для команд, создающих ИИ-агентов, практический вывод состоит в том, что одних только фреймворков оркестрации недостаточно. Будь то архитектура на основе event-driven микросервисов, потоки наблюдаемости в реальном времени, промышленные контуры управления или журналы взаимодействия с клиентами, часто отсутствующим слоем оказывается устойчивый и малозадержанный путь от живых данных к инференсу и действию.

Это создает несколько требований к проектированию.

Во-первых, свежесть состояния становится требованием к продукту. Если агент использует устаревший контекст, работа с инструментами становится хрупкой, а автоматизация может превращаться в распространение ошибок. Следовательно, движение данных в реальном времени напрямую связано с надежностью агента.

Во-вторых, экономика инференса меняется, когда фильтрация происходит раньше. Если системы могут отбрасывать малозначимые события или сжимать полезную нагрузку до выполнения модели, ресурсы GPU тратятся на решения, которые действительно важны. Акцент NVIDIA на фильтрации в потоке и сжатии прямо говорит об этой проблеме затрат.

В-третьих, архитектура развертывания становится более распределенной. В блоге NVIDIA указываются edge-системы — от NVIDIA DGX Spark до NVIDIA IGX Platform и rack-scale серверов. Более широкий рыночный вывод состоит в том, что не каждый рабочий процесс агента будет выполняться централизованно в облачном слое приложений. Некоторым придется работать рядом с приборами, машинами или локальными источниками событий.

В-четвертых, совместимость будет важна не меньше, чем сырой throughput. NVIDIA утверждает, что NVIDIA DAQIRI может передавать данные в пользовательские платформы, специфичные для конкретных инструментов, помимо стека ПО NVIDIA. Для корпоративного ИИ тот же принцип распространяется на ERP, CRM, ИТ-системы и операционные технологии. Ткань данных в реальном времени помогает только если агент может получать доступ к окружающим системам и доверять им.

На что смотреть дальше

Следующий сигнал, за которым стоит следить, — расширит ли NVIDIA это сообщение за пределы научных вычислений в более массовые корпоративные и промышленные сценарии ИИ-агентов. Если NVIDIA DAQIRI или смежные компоненты NVIDIA Holoscan Platform начнут появляться в автоматизации производства, робототехнике, телеком-операциях или мониторинге безопасности, это усилит аргумент, что речь идет о более широком инфраструктурном решении для агентов.

Второй сигнал — сторонняя валидация. Независимые бенчмарки по задержке, пропускной способности, экономии CPU и операционной сложности будут важнее, чем цифры, сообщаемые вендором. Покупатели также захотят видеть более понятные кейсы внедрения, а не только НИОКР-сотрудничество.

Третий — будут ли поставщики инфраструктуры и компании, работающие с платформами для агентов, сходиться к общему языку вокруг состояния, потоков событий и циклов действий. Если концепция TMForum о «ткани данных в реальном времени» получит распространение, она может стать полезным кратким обозначением рыночного требования, охватывающего корпоративный ИИ и системы физического мира.

Наконец, стоит следить за самим дизайном моделей. В примере CERN от NVIDIA упоминаются Convolutional Auto-Encoders и модели на основе трансформеров, работающие с живыми потоками. Если большее число агентных систем примет легкие, постоянно работающие модели для первичной сортировки перед передачей задач более крупным моделям рассуждения, инфраструктура в реальном времени станет еще более центральной.

Позиция Creati.ai

Самая важная часть этой истории — не NVIDIA DAQIRI как отдельный продукт. Это напоминание о том, что ИИ-агенты автономны ровно настолько, насколько автономен их путь данных. Последние два года рынок говорил о моделях, copilot-ах и слоях оркестрации. Более сложная проблема — связать эти системы с живым состоянием при достаточно низкой задержке и достаточно высокой надежности, чтобы действиям можно было доверять.

Для стартапов и корпоративных команд это означает сдвиг в том, откуда будет приходить конкурентное преимущество. Лучшие промпты и фреймворки для агентов могут помочь на краю, но устойчивую дифференциацию, скорее всего, обеспечит владение конвейером событий, слоем политик и интерфейсами в реальном времени между моделями и операционными системами. NVIDIA делает этот аргумент с инфраструктурной стороны. Остальному рынку еще предстоит доказать это в производстве.