AI News

Новый бенчмарк от Tencent Hunyuan и Университета Цинхуа утверждает, что современные AI search-агенты сдерживаются не столько качеством извлечения данных или использованием инструментов. По данным, которые привели исследователи, более серьезная точка отказа в том, что модели часто не останавливаются, чтобы задать уточняющий вопрос, когда запрос пользователя расплывчатый, недоопределенный или неверный.

Это важно, потому что индустрия быстро движется к упаковке больших моделей в роли исследовательских ассистентов, браузерных агентов и ответных систем. Если бенчмарк подтвердится, он указывает на практическую проблему проектирования для команд, создающих AI search-продукты: больше поисков и более длинные цепочки рассуждений не обязательно улучшают результат, если система так и не подтверждает, что именно имел в виду пользователь. В некоторых случаях, как утверждают исследователи, повторный поиск работает хуже, чем просто догадка.

Что DiscoBench пытается измерить

Новый бенчмарк под названием DiscoBench предназначен для проверки того, может ли модель обнаруживать неоднозначность в ходе многошагового поиска информации, задавать пользователю полезный уточняющий вопрос, а затем возвращаться на правильный исследовательский путь. Как описывает The Decoder, датасет включает 211 задач с 463 неоднозначными точками в одиннадцати доменах, включая спорт, кино, музыку, науку, политику и видеоигры.

Исследователи рассматривают это как пробел в существующей оценке агентов. Такие бенчмарки, как GAIA и BrowseComp, обычно предполагают, что запрос пользователя уже полон и точен. DiscoBench же фокусируется на распространенном производственном сценарии: пользователь просит о чем-то, что может относиться к нескольким сущностям, разным временным периодам, неясным критериям ранжирования или даже ложной фактической предпосылке. В такой ситуации модель может выстроить аккуратный поиск и все равно с самого первого решения пойти не туда.

Согласно описанной методологии, каждая задача разбивается на контрольные точки, где агент может продолжать поиск, запросить уточнение или ответить. В бенчмарке используется Tavily для поиска и симулятор пользователя на базе Gemini 3 Flash, который возвращает заранее заданные подсказки, если агент задает полезный уточняющий вопрос. Датасет в основном на китайском языке, что, по словам исследователей, отражает типичные паттерны китайскоязычного веба.

Этот языковой и инструментальный контекст важен для интерпретации. DiscoBench не является универсальной мерой для всех поисковых задач во всех веб-экосистемах, а использование LLM-симулятора означает, что цикл взаимодействия структурирован, а не полностью открыт. Тем не менее бенчмарк примечателен тем, что он изолирует поведение продукта, с которым многие пользовательские AI-системы испытывают трудности: понимание момента, когда не следует продолжать.

Результаты показывают дефицит уточнения, а не дефицит поиска

Главный результат — скромная абсолютная производительность. The Decoder сообщает, что среди одиннадцати недавно выпущенных моделей лучший итоговый результат без явной подсказки о неоднозначности составил 43,1 процента у Doubao Seed 2.0 Pro. За ней следовала Gemini 3.1 Pro Preview с 40,8 процента, а Claude Opus 4.7 — с 39,8 процента.

Эти цифры достаточно низкие, чтобы сделать общий вывод трудноигнорируемым. Даже сильные передовые модели, по-видимому, испытывают трудности, когда неоднозначность добавляется в цепочку поисковых действий. Авторы бенчмарка утверждают, что основная проблема не в том, что модели не умеют искать, а в том, что они слишком многое предполагают и слишком мало спрашивают.

Анализ поведения, на который ссылается The Decoder, особенно показателен. Системы, которые сначала искали, а затем задавали уточняющий вопрос, якобы достигли 93,4 процента успеха. Модели, которые сразу угадывали, показали 56,5 процента. Модели, которые многократно искали, но так и не задавали вопроса, обозначенные как “SearchHeavyGuess”, упали до 51,9 процента. По интерпретации исследователей, такой паттерн говорит о том, что некоторые модели, по сути, чувствуют неопределенность, но не превращают ее во взаимодействие с пользователем.

Это помогает объяснить, почему дополнительное использование инструментов не автоматически приводит к лучшим результатам. Модель может сделать много поисков, просмотреть много страниц и все равно остаться привязанной к неправильной интерпретации исходного запроса. На практике разработчики не могут рассматривать глубину поиска как замену поведению по уточнению.

Почему этот бенчмарк важен для продуктов, которые уже выходят на рынок

Сроки важны, потому что AI search выходит за рамки демонстраций и переходит в коммерческие рабочие процессы. Команды выпускают исследовательские копилоты, ассистентов поддержки клиентов и продукты для автоматизации браузера, которые все больше зависят от многошагового извлечения. Для таких систем DiscoBench указывает на режим отказа, который легко пропустить в обычной оценке: модель выглядит активной и компетентной, пока преследует неверную цель.

Это имеет прямые последствия для корпоративных внедрений AI. Во внутренних системах знаний неоднозначность постоянно возникает в названиях проектов, версиях документов, именах клиентов, ссылках на политики и диапазонах дат. Во внешних поисковых продуктах проблема проявляется в сравнениях, рейтингах и неоднозначности брендов или сущностей. Если система считает каждый запрос завершенным, она может выдавать уверенную, но нерелевантную работу и при этом выглядеть очень отзывчивой.

Для разработчиков AI-агентов этот бенчмарк предлагает сдвиг в дизайне. Уточнение не следует рассматривать как запасной вариант на случай очевидной путаницы. Оно, возможно, должно стать базовой возможностью с явными порогами, отслеживанием состояния и UX, который делает задавание уточняющих вопросов естественным, а не мешающим. Данные, на которые ссылается The Decoder, также предполагают, что подсказки на уровне промпта могут помочь обнаруживать неоднозначность, но этого недостаточно, чтобы самостоятельно исправить выполнение задачи целиком.

Это различие важно для планирования дорожной карты. Более удачные системные промпты могут увеличить частоту вопросов, но полезный развернутый агент также должен задать правильный вопрос в правильный момент, а затем встроить ответ в дальнейший рабочий процесс. Обнаружение, формулировка и продолжение работы, по-видимому, являются разными возможностями.

Доказательства, оговорки и степень доверия к выводам

Самые сильные заявления здесь исходят из исследования бенчмарка, описанного The Decoder, а не из рецензируемой публикации, включенной в исходный набор. Это не опровергает выводы, но означает, что читателям следует воспринимать рейтинги производительности и поведенческие выводы как сообщенные исследователями, пока основная статья, данные и детали оценки не будут более широко изучены.

Из доступных данных видны несколько ограничений. Во-первых, DiscoBench в основном написан на китайском языке, поэтому результаты могут не переноситься напрямую на англоязычное поисковое поведение или корпоративные рабочие процессы с документами. Во-вторых, бенчмарк опирается на Tavily и симулированного пользователя, созданного с помощью Gemini 3 Flash. Такая схема разумна для контролируемого тестирования, но это не то же самое, что измерение полноценных продакшн-систем с реальными пользователями, разными стеком поиска или собственной оркестрацией.

В-третьих, список моделей и версий приведен так, как его сообщает The Decoder, включая Claude Opus 4.7, GPT 5.4, Gemini 3.1 Pro Preview, DeepSeek V4 Pro, GLM 5.1, Qwen3.6 Max, Kimi K2.6, MiniMax M2.7, MiMo v2.5 Pro, Hunyuan 3.0 Preview и Doubao Seed 2.0 Pro. Некоторые из этих обозначений могут отражать внутреннюю или региональную маркировку авторов бенчмарка, а исходный материал не дает полного разбора в формате model card по выбору конфигураций.

Тем не менее некоторые паттерны выглядят устойчивыми даже с учетом этих оговорок. Авторы сообщают, что без доступа к поиску производительность резко падает, что поддерживает идею о том, что задачи требуют живого извлечения, а не запомненных знаний. Они также сообщают, что когда неоднозначность убирают из запросов, точность растет примерно на 26,8–40,2 пункта в зависимости от модели. Если это воспроизводится, это сильный сигнал, что узким местом является именно обработка неоднозначности.

Статья также помещает DiscoBench в более широкий контекст критики надежности AI search. The Decoder ссылается на LiveBrowseComp как на доказательство того, что модели могут чрезмерно полагаться на предварительные знания, и на Halluhard — как на исследование проблем галлюцинаций при проверке источников. Это смежные исследования, а не прямые валидации DiscoBench, но они усиливают представление о том, что навык браузинга все еще хрупок.

Сигналы конкуренции для Anthropic, Perplexity и разработчиков search-агентов

Эти результаты появляются на фоне того, как вендоры продвигают разные подходы к AI-поддерживаемому исследованию. По сводке The Decoder, Anthropic заявляла, что Claude Opus 4.8 настроена чаще отмечать неопределенность. Если это подтвердится независимым тестированием, это будет очень близко к слабости, которую DiscoBench пытается выявить.

Perplexity, в свою очередь, исследует Search as Code — подход, который позволяет моделям выражать поисковые рабочие процессы как Python-программы, а не полагаться только на заранее созданные шаблоны API поиска. Это может помочь с планированием и проверкой, но DiscoBench подсказывает, что остается нерешенным отдельный вопрос: может ли система распознать, что недостающая информация находится не в интернете, а в голове пользователя?

Для команд, оценивающих AI-агентов, это создает более тонкий чек-лист закупки. Сравнивать оценки в бенчмарках, ориентированных на поиск, уже недостаточно. Покупателям, возможно, придется тестировать, может ли продукт остановиться, определить тип неоднозначности, задать краткий уточняющий вопрос и затем возобновить задачу без сброса контекста. В регулируемых или критически важных областях эта способность может быть важнее сырой скорости извлечения.

На что смотреть дальше

Следующий сигнал, за которым стоит следить, — опубликуют ли Tencent Hunyuan и Университет Цинхуа более полную документацию, код или публичные примеры для DiscoBench. Независимое воспроизведение будет особенно важно для англоязычных задач и в исследованиях с реальными пользователями.

Также стоит смотреть, начнут ли поставщики моделей публиковать метрики уточнения наряду с бенчмарками извлечения и рассуждения. Полезный стандарт мог бы включать обнаружение неоднозначности, качество вопроса, долю успешного восстановления после уточнения и режимы отказа по доменам.

На стороне продукта обращайте внимание на изменения в интерфейсах AI-агентов. Если вендоры начнут делать уточнение заметной, намеренной частью пользовательского опыта, а не случайным прерыванием, это будет означать, что рынок серьезно относится к этому классу отказов.

Наконец, следите за тем, покажут ли системы вроде Claude Opus 4.8, Gemini 3.1 Pro или GPT 5.4 заметный прогресс в задачах с сильной неоднозначностью при независимом тестировании. Конкурентное преимущество в AI search все больше может зависеть от сдержанности и диалога, а не только от большего числа инструментов.

Мнение Creati.ai

DiscoBench — полезное напоминание о том, что многие сбои AI-продуктов начинаются до извлечения, а не после него. Команды часто оптимизируют более качественные поисковые коннекторы, большие контекстные окна и более сложные цепочки агентов. Но если модель принимает неоднозначное задание и действует по нему, весь стек может выдавать отполированную нерелевантность.

Для разработчиков практический вывод прост: рассматривайте уточнение как базовую инфраструктуру. Побеждать в AI search, вероятно, будут системы, которые знают, когда остановиться, задать один точный вопрос и только потом продолжить. Это менее эффектно, чем автономный браузинг, но для корпоративного AI и доверия пользователей это, вероятно, более важная способность.

Рекомендуемые
AdsCreator.com
AdsCreator.com
Мгновенно создавайте отполированные рекламные креативы в фирменном стиле из любого URL сайта для Meta, Google и Stories.
AirMusic
AirMusic
AirMusic.ai генерирует качественные музыкальные треки с помощью ИИ по текстовым подсказкам с настройкой стиля и настроения и экспортом стемов.
Seedance 2.0 Video AI
Seedance 2.0 Video AI
Создавайте кинематографичные видео 1080p из промптов, изображений и референсных клипов с синхронизированным аудио.
KiloClaw
KiloClaw
Хостинг OpenClaw-агента: развертывание в один клик, более 500 моделей, защищённая инфраструктура и автоматизированное управление агентами для команд и разработчиков.
Atoms
Atoms
Платформа на базе ИИ, которая с помощью многоагентной автоматизации за минуты создает полнофункциональные приложения и сайты без программирования.
VoxDeck
VoxDeck
Создатель презентаций с ИИ, ведущий визуальную революцию
Refly.ai
Refly.ai
Refly.AI даёт нетехническим создателям возможность автоматизировать рабочие процессы с помощью естественного языка и визуального полотна.
Skywork.ai
Skywork.ai
Skywork AI - это инновационный инструмент для повышения производительности с использованием ИИ.
Pippit
Pippit
Поднимите создание контента с помощью мощных инструментов искусственного интеллекта Pippit!
Diagrimo
Diagrimo
Diagrimo мгновенно преобразует текст в настраиваемые диаграммы и визуализации, созданные искусственным интеллектом.
BGRemover
BGRemover
Легко удаляйте фоны изображений онлайн с помощью SharkFoto BGRemover.
SuperMaker AI Video Generator
SuperMaker AI Video Generator
Создавайте потрясающие видео, музыку и изображения без усилий с SuperMaker.
Elser AI
Elser AI
Универсальная веб‑студия, превращающая текст и изображения в аниме‑арт, персонажей, голоса и короткометражные фильмы.
Qoder
Qoder
Qoder — это помощник по кодированию с искусственным интеллектом, автоматизирующий планирование, кодирование и тестирование программных проектов.
FineVoice
FineVoice
Преобразуйте текст в эмоции — Клонируйте, создавайте и настраивайте выразительные AI-голоса за считанные секунды.
Flowith
Flowith
это агентное рабочее пространство на основе холста, которое предлагает бесплатно 🍌Nano Banana Pro и другие эффективные м
FixArt AI
FixArt AI
FixArt AI предлагает бесплатные, безограниченные AI-инструменты для генерации изображений и видео без регистрации.
whatslove.ai
whatslove.ai
ИИ-коуч по знакомствам, который подбирает советы, темы для начала разговора и идеи для свиданий с учетом вашей личности.
Funy AI
Funy AI
Оживите свои фантазии! Создавайте ИИ-видео с поцелуями и бикини из изображений или текста. Попробуйте смену одежды. Бесп
Media.io Free AI Image Generator
Media.io Free AI Image Generator
Создавайте AI-визуалы с помощью Media.io на основе текстовых запросов или референсных изображений для соцсетей, маркетинга, e-commerce и других задач.
kinovi - Seedance 2.0 - Real Man AI Video
kinovi - Seedance 2.0 - Real Man AI Video
Бесплатный AI-генератор видео с реалистичными людьми на выходе, без водяных знаков и с полными правами для коммерческого использования.
Flaq AI Media API
Flaq AI Media API
Flaq AI — это единая AI-медийная API-платформа для генерации изображений, видео и LLM-ориентированных рабочих процессов со стабильными моделями
Paper Banana
Paper Banana
Инструмент на базе ИИ для мгновенного преобразования академического текста в готовые к публикации методологические схемы и точные статистические графики.
MusicGPT
MusicGPT
AI-музыкальная платформа для создания песен, звуковых эффектов, вокала и аудиоредактирования с помощью простых запросов.
Gemini Omni - Video Generator
Gemini Omni - Video Generator
Платформа для создания видео на базе ИИ с conversational-редактированием, мультимодальными референсами и согласованной генерацией коротких роликов.
Scavio AI
Scavio AI
API поиска в реальном времени для нескольких платформ, которая помогает ИИ-агентам получать структурированные данные из веба, e-commerce, видео и соцсетей.
Imagvio AI
Imagvio AI
Платформа для создания изображений и видео на базе ИИ с точным редактированием, генерацией и творческими рабочими процессами, ориентированными на согласованность.
SharkFoto
SharkFoto
SharkFoto — это универсальная платформа с поддержкой ИИ для эффективного создания и редактирования видео, изображений и музыки.
Coffee Chats AI
Coffee Chats AI
Автоматизация кофе-чатов с AI-сопоставлением для сообществ, команд, наставничества и общения выпускников.
happy horse AI
happy horse AI
Open-source AI-генератор видео, создающий синхронизированные видео и аудио из текста или изображений.
Questie AI - Game Companion
Questie AI - Game Companion
AI-компаньон для игр в реальном времени, который смотрит на ваш экран, общается голосом и подсказывает во время игры.
APIMaster
APIMaster
Настоящие LLM, верифицированные по отпечатку. Один API, до 70% дешевле официальных цен.
StitchPilot.ai
StitchPilot.ai
Работающий в браузере AI-инструмент для вышивки, позволяющий конвертировать изображения, просматривать стежковые файлы и проверять форматы для машин.
paperclaw
paperclaw
ИИ-пространство для работы, которое за минуты создаёт готовые к публикации научные иллюстрации, схемы, постеры и редактируемые SVG.
Mubert AI
Mubert AI
Mubert — это AI-платформа для музыки, которая за секунды создаёт, расширяет, ремикширует и озвучивает треки без роялти.
SkyGen Plus
SkyGen Plus
Многомодельная AI-платформа для создания изображений, видео и музыки в одном удобном рабочем процессе.
Iara Chat
Iara Chat
Iara Chat: Ассистент по производительности и коммуникации на основе ИИ.
OnlyDoc Summarizer
OnlyDoc Summarizer
Бесплатный PDF-суммаризатор OnlyDoc читает PDF и выделяет ключевые моменты в чистом, структурированном резюме
Couple AI - AI Couple Photo Maker
Couple AI - AI Couple Photo Maker
Создавайте реалистичные AI-портреты пары из селфи с тематическими стилями, быстрой генерацией и приватными HD-загрузками.
CreateMemorial
CreateMemorial
CreateMemorial помогает семьям создавать долговечные онлайн-страницы памяти и видео-слайдшоу для похорон, чтобы почтить память близких.
HappyHorseAIStudio
HappyHorseAIStudio
Браузерный генератор видео на базе ИИ для текста, изображений, референсов и видеомонтажа.
AI Pet Video Generator
AI Pet Video Generator
Создавайте вирусные, легко распространяемые видео о питомцах из фотографий с помощью шаблонов на базе ИИ и мгновенного экспорта в HD для социальных платформ.
WriteHybrid AI Humanizer
WriteHybrid AI Humanizer
WriteHybrid — это AI-гуманизатор и детектор, который естественно переписывает текст и помогает пользователям обходить обнаружение ИИ.
AdMakeAI
AdMakeAI
AI-генератор рекламы, который за секунды создает высокоэффективные статичные и UGC-объявления для брендов.
Ampere.SH
Ampere.SH
Бесплатный управляемый хостинг OpenClaw. Разверните AI‑агентов за 60 секунд с кредитами Claude на $500.
AnimeShorts
AnimeShorts
Создавайте потрясающие аниме-ролики без усилий с помощью передовых технологий ИИ.
AIsa
AIsa
AIsa предоставляет AI-агентам единый шлюз к моделям, навыкам, API и платежам с OpenAI-совместимым доступом.
AI Gift finder by wishwave
AI Gift finder by wishwave
AI-помощник в поиске подарков, который создает общими списками желаний из реальных товаров из сотен популярных магазинов.
Claude API
Claude API
Claude API for Everyone
InstantChapters
InstantChapters
Создавайте захватывающие главы книг мгновенно с Instant Chapters.
AI Clothes Changer by SharkFoto
AI Clothes Changer by SharkFoto
AI Clothes Changer от SharkFoto позволяет мгновенно виртуально примерять наряды с реалистичной посадкой, текстурой и освещением.
Gptimg2 AI
Gptimg2 AI
Универсальная AI-студия для создания изображений и видео из текста, изображений или референсов.
VidMage
VidMage
Легко меняйте лица на фотографиях и видео с помощью технологий ИИ.
NerdyTips
NerdyTips
Платформа прогнозов на футбол на базе ИИ, предоставляющая основанные на данных советы по матчам в лигах по всему миру.
insmelo AI Music Generator
insmelo AI Music Generator
Генератор музыки на базе ИИ, который превращает подсказки, тексты или загруженные файлы в отточенные, не требующие выплат авторских отчислений песни примерно за минуту.
WhatsApp AI Sales
WhatsApp AI Sales
WABot — это AI-«копилот» продаж для WhatsApp, который предоставляет скрипты в реальном времени, переводы и определение намерений.
AI Video API: Seedance 2.0 Here
AI Video API: Seedance 2.0 Here
Унифицированный AI API для видео, предлагающий топовые модели генерации через один ключ по более низкой цене.
Kirkify
Kirkify
Kirkify AI мгновенно создает вирусные мемы с заменой лиц и фирменной неон-«глитч» эстетикой для создателей мемов.
GPT Image 2 Online
GPT Image 2 Online
AI-генератор и редактор изображений с фотореалистичными результатами, точной отрисовкой текста и сильным следованием промптам.
Lyria3 AI
Lyria3 AI
Генератор музыки на базе ИИ, который мгновенно создает высококачественные полностью продюсированные песни по текстовым подсказкам, стихам и стилям.
Text to Music
Text to Music
Преобразуйте текст или слова в полноценные песни студийного качества с вокалом, сгенерированным ИИ, инструментами и многодорожечным экспортом.
AIToHuman
AIToHuman
Бесплатный инструмент очеловечивания AI-текста, который мгновенно переписывает сгенерированный ИИ контент в естественный, похожий на человеческий стиль.
BeatMV
BeatMV
Веб-ориентированная платформа ИИ, которая превращает песни в кинематографические музыкальные видеоклипы и создаёт музыку с помощью ИИ.
EaseMate AI
EaseMate AI
Универсальный AI-ассистент для чата, письма, помощи в учёбе, создания изображений и генерации видео в одной браузерной платформе.
HookTide
HookTide
Платформа роста в LinkedIn на базе ИИ, которая изучает ваш голос, чтобы создавать контент, взаимодействовать и анализировать эффективность.
Anijam AI
Anijam AI
Anijam — это нативная для ИИ анимационная платформа, которая превращает идеи в отточенные истории с помощью агентного создания видео.
WhatsApp Warmup Tool
WhatsApp Warmup Tool
Инструмент прогрева WhatsApp на базе ИИ автоматизирует массовую рассылку и предотвращает блокировку аккаунтов.
Create WhatsApp Link
Create WhatsApp Link
Бесплатный генератор ссылок и QR для WhatsApp с аналитикой, брендированными ссылками, маршрутизацией и функциями многопользовательского чата.
Tome AI PPT
Tome AI PPT
Генератор презентаций на базе ИИ, который создает, улучшает и экспортирует профессиональные слайды за считанные минуты.
wan 2.7-image
wan 2.7-image
Управляемый генератор изображений на базе ИИ для точных лиц, палитр, текста и визуальной непрерывности.
Image3D - AI 2D to 3D Model Generator (GLB, OBJ, STL, PLY)
Image3D - AI 2D to 3D Model Generator (GLB, OBJ, STL, PLY)
Браузерный ИИ, который превращает любое 2D-изображение или текстовый запрос в 3D-модель за 30 секунд. Экспорт GLB, OBJ, STL, PLY — бесплатно
Gobii
Gobii
Gobii позволяет командам создавать автономных цифровых работников 24/7 для автоматизации веб-исследований и рутинных задач.
UNI-1 AI
UNI-1 AI
UNI-1 — это унифицированная модель генерации изображений, сочетающая визуальное рассуждение с высококачественным синтезом изображений.
GLM Image
GLM Image
GLM Image сочетает гибридные авторегрессионные и диффузионные модели для генерации высококачественных AI-изображений с выдающейся отрисовкой текста.
GenPPT.AI
GenPPT.AI
Генератор PPT на базе ИИ, который за считанные минуты создаёт, улучшает и экспортирует профессиональные презентации PowerPoint с заметками докладчика и диаграммами.
Seedance 20 Video
Seedance 20 Video
Seedance 2 — это мультимодальный генератор видео с ИИ, обеспечивающий согласованных персонажей, многокадровое повествование и нативный звук в 2K.
Hitem3D
Hitem3D
Hitem3D преобразует одно изображение в высокоразрешённые, готовые к производству 3D-модели с помощью ИИ.
Wan 2.7
Wan 2.7
Профессиональная модель AI для видео с точным управлением движением и согласованностью между видами.
AI FIRST
AI FIRST
Разговорный ИИ‑ассистент, автоматизирующий исследовательские задачи, работу в браузере, веб‑скрейпинг и управление файлами с помощью естественного языка.
Manga Translator AI
Manga Translator AI
AI Manga Translator мгновенно переводит изображения манги на несколько языков онлайн.
TextToHuman
TextToHuman
Бесплатный AI-очеловечиватель, который мгновенно переписывает AI-текст в естественный, похожий на человеческий стиль. Регистрация не требуется.
Video Sora 2
Video Sora 2
Sora 2 AI превращает текст или изображения в короткие социальные и eCommerce-видео с физически корректным движением за считанные минуты.
Palix AI
Palix AI
Универсальная AI‑платформа для создателей, позволяющая генерировать изображения, видео и музыку с использованием единой системы кредитов.
Remy - Newsletter Summarizer
Remy - Newsletter Summarizer
Remy автоматизирует управление новостными рассылками, резюмируя письма в удобные для восприятия сводки.
Veemo - AI Video Generator
Veemo - AI Video Generator
Veemo AI — это универсальная платформа, которая быстро создаёт видеоролики и изображения высокого качества на основе текста или изображений.
Image 2 AI
Image 2 AI
Инструмент для генерации и редактирования изображений на базе OpenAI для фотореалистичных визуалов, точного рендеринга текста и UI-макетов.

DiscoBench показывает, что AI search-агенты срываются на неоднозначных запросах, потому что не просят пользователей уточнить

Новый бенчмарк от Tencent Hunyuan и Университета Цинхуа показывает, что AI search-агенты проваливаются из-за неоднозначности, а не из-за самого поиска, что ограничивает надежность в реальном мире.