Исследование связывает продвинутые функции AI с резко более высоким потреблением энергии на фоне роста вычислительных затрат моделей

Новая волна публикаций снова выводит энергопотребление в центр развертывания AI. По данным The Korea Times, исследование показало, что продвинутые системы AI могут использовать в 136,5 раза больше электроэнергии, чем стандартные чатботы, — разрыв, который подчеркивает, как быстро может расти спрос на электроэнергию, когда поставщики переходят от простой генерации текста к более продвинутому reasoning и мультимодальным функциям.

Отдельный материал Crypto Briefing указывает на ту же более широкую тенденцию с другой стороны. В нем говорится, что более новая внутренняя модель Meta, именуемая Watermelon, использует примерно в десять раз больше compute, чем более ранняя модель под названием Avocado. В совокупности эти два сообщения предполагают, что следующую волну в индустрии AI формируют не только качество моделей и внедрение продуктов, но и то, сколько инфраструктуры поставщики и клиенты готовы финансировать и эксплуатировать.

Доступные в этой истории доказательства ограничены. Ни один из источников не приводит полный исходный текст исследования или техническую методологию в доступных здесь материалах, а отчет, связанный с Meta, по-видимому, опирается на вторичное освещение, а не на первичное техническое раскрытие. И все же эти утверждения важны, потому что они совпадают с уже заметной тенденцией в enterprise AI, где каждый шаг вверх по уровню возможностей часто сопровождается непропорционально большим ростом спроса на оборудование, энергопотребления и операционных расходов.

Что, по-видимому, показывают отчеты

The Korea Times описывает исследование, предупреждающее, что «продвинутый AI» потребляет в 136,5 раза больше электроэнергии, чем стандартные чатботы. Без полного текста работы остаются неясными ключевые определения: в отчете не указано, какие модели тестировались, что именно считалось «продвинутым», измерялось ли обучение или inference, и как были стандартизированы рабочие нагрузки.

Эти детали важны. Легковесный чатбот, отвечающий на короткие запросы на основе компактной языковой модели, имеет совершенно иной аппаратный профиль, чем система, использующая reasoning с большим контекстом, вызовы инструментов, поиск, анализ изображений или многошаговое агентное поведение. На практике многие продукты, продвигаемые как AI-ассистенты, теперь объединяют несколько дорогостоящих операций за одним ответом. Из-за этого сравнения по энергопотреблению крайне чувствительны к дизайну продукта.

Материал Crypto Briefing добавляет еще один сигнал со стороны compute. Там говорится, что модель Meta Watermelon использует в десять раз больше compute, чем Avocado, и подается это как свидетельство более сильного внутреннего курса на проприетарный AI. И здесь видимая в доказательствах база тоже тонкая. В предоставленных материалах нет сопутствующей исследовательской статьи, пакета бенчмарков или заметки об инфраструктуре. Но направление движения знакомо: более крупные или более продвинутые модельные программы обычно требуют больше чипов, больше энергии и больше капитала.

Для продуктовых команд, использующих модели OpenAI, Anthropic, Google или Meta через API либо облачные сервисы, эти различия на бэкенде часто скрыты. Вместо этого проявляются цены, задержка, лимиты по мощности и уровни доступности. Для команд, которые обучают модели или дообучают их напрямую, компромиссы становятся куда более ощутимыми.

Почему разрыв в электроэнергии важен сейчас

Сроки здесь имеют значение. Рынок AI выходит за рамки базовых чатботов и движется к AI agents, workflow с длинным контекстом, инструментам код-ассистента, мультимодальному поиску и enterprise copilots, встроенным в ежедневные операции. Такие продукты могут повысить полезность, но они также добавляют больше вычислений к каждому взаимодействию пользователя.

Это поднимает базовый бизнес-вопрос: когда лучший ответ перестает оправдывать дополнительные затраты? Если высококлассной модели или agent-архитектуре требуется существенно больше электроэнергии, чем стандартному чатботу, экономика меняется и для поставщиков, и для покупателей. Растут счета за облако. Повышается важность загрузки оборудования. Могут смещаться решения о региональном развертывании в сторону мест с более дешевой или надежной энергией.

Особенно это актуально для enterprise AI-покупателей, которым нужна предсказуемая unit economics. Пилот может выглядеть привлекательно при низкой нагрузке, но широкое внедрение в customer support, поиск, внутренние знания, разработку ПО и автоматизацию может показать, насколько дорогими становятся тяжелые inference workload’ы. В таком контексте «продвинутый AI» — это не только ярлык возможностей. Это еще и бюджетная категория.

Эти сообщения также появляются на фоне более широкой обеспокоенности расширением AI data center. Коммунальные службы, регуляторы и hyperscalers оказались втянуты в споры о том, успеют ли генерация и передача энергии за спросом со стороны инфраструктуры, насыщенной GPU. Даже без полной методологии, лежащей за цифрой в 136,5 раза, базовое предупреждение вписывается в этот более широкий рыночный разговор.

Доказательства, оговорки и кто именно делает какие заявления

Главное фактическое ограничение этой истории в том, что доказательства косвенные. Материал The Korea Times ссылается на исследование, но в доступных здесь материалах нет самой статьи, ее авторов или точного дизайна эксперимента. Поэтому цифру в 136,5 раза следует рассматривать как сообщенный результат, а не как окончательно установленный отраслевой базис.

Такая же осторожность относится и к утверждению, связанному с Meta. Crypto Briefing пишет, что Watermelon использует в десять раз больше compute, чем Avocado, но доступные здесь источники не включают техническую заметку Meta, model card или публичную инженерную документацию. Это означает, что сравнение по compute следует читать как сообщенное СМИ, а не как напрямую верифицированное раскрытие от Meta.

Есть и проблема измерения, которая часто осложняет истории об энергопотреблении AI. Compute — это не то же самое, что электроэнергия, а электроэнергия — не то же самое, что выбросы углерода. Модель может использовать больше compute, но работать на более эффективном оборудовании, в лучше оптимизированном data center или в регионе с иными источниками энергии. Аналогично, чатбот может выглядеть дешевым в одном бенчмарке и дорогим в продакшене, если он опирается на повторные вызовы, retrieval-слои или системы guardrail.

Тем не менее неопределенность действует в обе стороны. Слабая база источников означает, что читателям не стоит переоценивать точные множители, но она не отменяет лежащий в основе паттерн. Во всей генеративной AI прирост возможностей часто сопровождается высокими затратами ресурсов, особенно когда поставщики переходят к более крупным моделям или более тяжелым reasoning-путям.

Что это значит для разработчиков и enterprise-команд

Для разработчиков ближайший вывод — архитектурная дисциплина. Командам не нужна самая дорогая модель для каждого запроса. Маршрутизация простых задач на меньшие модели, резервирование premium inference для сложных случаев, сокращение окон контекста и ограничение использования инструментов могут существенно снизить затраты и потребление энергии. Во многих случаях лучшая оркестрация эффективнее, чем автоматическое назначение всего на frontier-модель.

Для enterprise AI-команд эта история — напоминание оценивать продукты по форме workload’а, а не только по качеству демо. Стандартный чатбот, обрабатывающий высокочастотный FAQ-трафик, может быть дешевле и надежнее, чем более насыщенный ассистент, который вызывает несколько моделей и внешние инструменты на каждом ходе. Это не делает продвинутые системы плохой инвестицией. Это означает, что покупателям нужна видимость шаблонов inference, задержки и ценообразования при реальном использовании.

Последствия затрагивают и внедрения coding assistant, а также офисной автоматизации. Эти системы могут давать измеримый рост продуктивности, но они часто предполагают устойчивый, повторяющийся inference, а не редкие запросы. Если использование вырастает с нескольких сотен сотрудников до десятков тысяч, интенсивность инфраструктуры становится вопросом закупок, а не второстепенной деталью бек-офиса.

Это также важно для open-source и self-hosted стратегий. Некоторые компании выбирают open models, чтобы снизить зависимость от цен API, но крупные развертывания все равно требуют значительной GPU-мощности и планирования энергопотребления. Реальный вопрос не в том, cloud или self-hosted в абстракции. Вопрос в том, какая комбинация размера модели, задержки, конфиденциальности и загрузки подходит конкретному рабочему процессу.

Конкуренция смещается от качества модели к инфраструктурной эффективности

Эти сообщения указывают на конкурентный сдвиг, который легко не заметить в материалах, сосредоточенных на функциях. Поставщики AI теперь конкурируют не только по бенчмаркам или широте продукта. Они конкурируют по тому, насколько эффективно могут предоставлять продвинутые возможности в масштабе.

Это важно для Meta, чья AI-стратегия охватывает и релизы open-weight, и крупные внутренние инвестиции в модели. Если сравнение compute между Watermelon и Avocado в целом верно, это означает, что Meta готова нести существенно более высокие инфраструктурные расходы ради более сильной проприетарной производительности. То же давление ощущают конкуренты по всему enterprise AI: прогресс моделей ограничивается не только исследованиями, но и доступной электроэнергией, чипами и капиталом.

Для клиентов это может привести к более стратифицированному рынку. Базовые сервисы чатботов могут продолжать дешеветь по мере улучшения моделей и serving stack’ов. Одновременно премиальные AI agents и продвинутые мультимодальные системы могут оставаться дорогими, потому что потребляют гораздо больше compute на одно полезное действие. Этот разрыв может повлиять на ценовые уровни, упаковку продуктов и ожидания покупателей в течение следующего года.

На что смотреть дальше

Во-первых, следите за публикацией исходного исследования, на которое ссылается The Korea Times. Достоверность утверждения о 136,5-кратном различии сильно зависит от того, как исследователи определили advanced AI, какой базовый уровень они использовали и измеряли ли они обучение, inference или оба процесса.

Во-вторых, следите за прямыми раскрытиями от Meta относительно Watermelon и Avocado. Техническая статья, model card или комментарий руководства помогли бы отделить рыночную интерпретацию от документированных инженерных фактов.

В-третьих, отслеживайте, начнут ли крупные поставщики более явно делать акцент на метриках эффективности. Покупатели enterprise AI все чаще будут спрашивать не только о том, какая модель работает лучше, но и о том, какая модель обеспечивает приемлемое качество на ватт, на токен или на выполненную задачу.

Наконец, обращайте внимание на дизайн продукта. Победителями в AI agents и workplace automation могут оказаться не системы с максимальной сырой мощностью. Ими могут стать те, которые выборочно используют продвинутый reasoning, удерживая затраты и спрос на электроэнергию в пределах, которые предприятия действительно способны поддерживать.

Мнение Creati.ai

Самая важная мысль этой истории — не точный множитель ни в одном из отчетов. А то, что экономика AI все сильнее сливается с инфраструктурной экономикой. По мере того как продукты развиваются от стандартного чатбота к более насыщенным ассистентам и AI agents, интенсивность compute быстро растет, а электроэнергия становится практическим ограничением для продуктовой стратегии.

Для основателей и продуктовых команд это создает четкий мандат: проектировать с прицелом на эффективность возможностей, а не только на их максимум. В enterprise AI устойчивое преимущество может приходить не только от самых больших frontier-систем, но и от умной маршрутизации, небольших специализированных моделей и оркестрации, учитывающей рабочие процессы. Рынок по-прежнему вознаграждает амбиции в области моделей, но со временем, вероятно, еще больше будет вознаграждать дисциплинированное развертывание.