
В быстро развивающемся ландшафте искусственного интеллекта (ИИ) отрасль упирается в предсказуемую, но пугающую стену: энергопотребление. По мере того как модели растут в объеме и сложности, вычислительные затраты — особенно энергия, необходимая для логического вывода (inference) — стали серьезным препятствием для масштабируемости предприятий. Сегодня Creati.ai исследует революционное развитие в этом секторе. Навин Рао, бывший глава отдела ИИ в Databricks и опытный пионер в области полупроводниковых технологий, официально представил свой последний проект — Unconventional AI.
Компания стремится решить одну из самых критических задач десятилетия: сократить ошеломляющие энергетические потребности ИИ-инфраструктуры в 1000 раз. Отходя от традиционных кремниевых чипов общего назначения, Unconventional AI делает ставку на то, что разработка специализированного оборудования является ключом к устойчивым и высокопроизводительным вычислениям.
Последние несколько лет бум ИИ был синонимом доминирования стандартных архитектур GPU. Хотя эти чипы позволили совершить текущую революцию в области генеративного ИИ (Generative AI), они изначально не были разработаны для специфических, повторяющихся паттернов логического вывода на основе трансформеров. В результате компании тратят миллионы на электроэнергию только для того, чтобы поддерживать работу этих мощных процессоров в масштабе.
Навин Рао не новичок в технологиях глубокого оборудования (deep-tech hardware). До работы в Databricks он основал Nervana Systems, которую Intel приобрела за сотни миллионов долларов. Опираясь на этот глубокий опыт, он утверждает, что путь к 1000-кратной эффективности не ограничивается простой оптимизацией программных алгоритмов; он требует фундаментального переосмысления того, как данные перемещаются через физический кремний.
| Фактор сложности | Описание | Влияние на предприятие |
|---|---|---|
| Высокое энергопотребление | Традиционные GPU потребляют избыточную мощность для простых задач логического вывода | Растущие операционные расходы |
| Перемещение данных | Энергетические затраты на перемещение данных между памятью и процессорами огромны | Задержки и ограничение производительности |
| Неэффективность универсальности | GPU разработаны для гибкости, а не для специфических нужд логического вывода LLM | Потерянные циклы на неиспользуемых логических вентилях |
Подход, выбранный стартапом, основан на философии: «логический вывод — это другая игра». В то время как обучение требует колоссальной пропускной способности, логический вывод характеризуется повторяющимися, предсказуемыми математическими операциями. Стратегия Unconventional AI сосредоточена на создании оборудования, которое исключает избыточные этапы вычислений.
Оптимизируя систему под специфические арифметические операции, лежащие в основе больших языковых моделей (LLM), компания стремится обойти накладные расходы, которые преследуют традиционное серверное оборудование. Это не просто постепенное улучшение; это попытка переписать физику обработки ИИ.
Если Unconventional AI достигнет своей амбициозной цели — снижения энергопотребления в 1000 раз, — последствия для отрасли будут глубокими. Для компаний, которые в настоящее время ограничены «налогом на логический вывод», это означает движение к демократизации передового ИИ.
В настоящее время многие организации опасаются развертывания сложных агентов или автономных систем из-за стоимости их непрерывной работы. Массовое снижение энергетических требований может эффективно снизить барьер входа, позволяя использовать ИИ-приложения в реальном времени, на устройствах или на периферии, которые ранее считались экономически нецелесообразными.
Приход Навина Рао в сферу аппаратного обеспечения подчеркивает новую тенденцию на стыке ИИ и заботы о климате. Поскольку дата-центры становятся крупнейшими в мире потребителями электроэнергии, аппаратные стартапы, фокусирующиеся на «зеленой» архитектуре, становятся следующим приоритетным объектом инвестиций.
Creati.ai считает, что отрасль переходит от эпохи «роста грубой силой» к эпохе «архитектурной оптимизации». Хотя путь к массовому производству проприетарного кремния полон трудностей, связанных с цепочками поставок и техническими аспектами, ценностное предложение, представленное Unconventional AI, очевидно. Согласовывая возможности оборудования со специфическими, уникальными потребностями современного ИИ, фирма позиционирует себя как краеугольный камень следующего поколения ИИ-инфраструктуры.
По мере развития этой технологии мы ожидаем более тщательного изучения того, как эти чипы показывают себя в реальных бенчмарках по сравнению с текущими отраслевыми стандартами. На данный момент вектор задан: в гонке за экологичность ИИ самые значительные прорывы могут произойти за пределами стандартной экосистемы GPU.