AI News

Группа из пяти AI labs, как сообщается, движется к общей системе оценки устойчивости к jailbreak в foundation models, при этом установлен целевой срок — 1 августа — для более широкого соглашения о стандартах безопасности, сообщает Tech Times. Если инициатива будет окончательно утверждена, это станет ранней попыткой сделать одну из самых спорных областей безопасности моделей — можно ли заставить систему обойти собственные защитные механизмы — более сопоставимой между разными поставщиками.

Как сообщается, это соглашение важно потому, что тестирование на jailbreak стало слабым местом в том, как frontier AI systems оцениваются публично. Создатели моделей регулярно описывают собственные red-teaming-подходы, методы alignment и поведение при отказе, но покупателям и разработчикам по-прежнему не хватает единого, кросс-компанейского показателя, который помог бы сравнивать риски. Общая шкала сама по себе не решит эту проблему, но она может создать общий базовый уровень для отчетности и закупок в момент, когда безопасность AI models переходит из области исследовательских споров в корпоративную проверку должной осмотрительности.

Что, по сообщениям, охватывает сделка

Судя по доступному отчету Tech Times, ключевое развитие довольно прямолинейно: пять labs приняли то, что описывается как первая шкала оценки jailbreak, а связанное соглашение по стандартам безопасности AI models нацелено на 1 августа. Поскольку полный текст статьи недоступен в предоставленных здесь источниках, ряд критически важных деталей остается неясным, включая то, какие именно пять организаций участвуют, является ли шкала обязательной или добровольной, какой протокол тестирования она использует и кто будет обеспечивать соблюдение или публикацию результатов.

Это неопределенность имеет значение. В работе по AI safety «шкала» может означать разные вещи: рубрику для бенчмаркинга, рамку раскрытия информации, таксономию severity для red-team или стандарт, привязанный к порогам выпуска. Без текста самого стандарта пока нельзя сказать, идет ли речь в первую очередь о публичной прозрачности, внутреннем управлении или готовности к закупкам.

Тем не менее направление важно. Jailbreaks — запросы или схемы взаимодействия, предназначенные для обхода ограничений модели, — уже не являются узкой проблемой red-team. Они затрагивают потребительские чат-боты, кодирующие системы и корпоративные развертывания, где поведение модели должно оставаться в рамках правовых, политических и рабочих ограничений. Общий подход к оценке может помочь сместить разговор от бинарных утверждений, что модель «безопасна» или «небезопасна», к более сопоставимым мерам режимов отказа.

Почему оценка jailbreak важна сейчас

Для продуктовых команд, работающих поверх больших моделей, уязвимость к jailbreak — это практический вопрос надежности, а не просто заголовок о политике. Ассистент для поддержки клиентов, coding assistant или внутренний enterprise AI инструмент может выглядеть согласованным в демо, но все равно проваливаться под adversarial prompting, манипуляциями длинным контекстом или цепочками использования инструментов. В production-средах такие сбои могут приводить к нарушениям политики, токсичным ответам, ошибкам в обращении с конфиденциальными данными или сбоям автоматизации.

Проблема усугубляется тем, насколько фрагментированы нынешние практики оценки. Такие компании, как OpenAI, Anthropic, Google и Meta, публикуют некоторую информацию о тестировании безопасности, но форматы различаются, пороги различаются, и условия оценки часто тоже различаются. Это затрудняет прямое сравнение для покупателей, пытающихся выбрать между системами на базе ChatGPT, Claude, Gemini или Llama.

Шкала оценки jailbreak может оказаться особенно важной в среднем сегменте рынка: для разработчиков приложений и enterprise-команд, которые не обучают frontier models, но должны решать, какую базовую модель развернуть, какие guardrails добавить и сколько человеческой проверки оставить в контуре. Для таких команд стандартизированные AI benchmarks полезны только в том случае, если они отвечают на операционные вопросы: как часто модель дает сбой? При каких типах атак? Только в тексте или также с инструментами и памятью? Достаточно ли модель безопасна для внешних клиентов или только для контролируемых внутренних рабочих процессов?

Целевой срок 1 августа также указывает на ощущение срочности. Такое время совпадает с растущим давлением на labs, чтобы они показывали не только декларативные обязательства по безопасности. Регуляторы, крупные клиенты и партнеры по инфраструктуре все чаще требуют более измеримых доказательств поведения моделей. Общий показатель jailbreak был бы одним из способов ответить на этот спрос, не дожидаясь полноценных законодательных правил.

Ограничения единой шкалы

Даже если сообщаемый стандарт будет окончательно утвержден, показатель jailbreak охватит лишь одну часть риска модели. Он автоматически не учитывает галлюцинации, предвзятость, злоупотребления в кибербезопасности, опасения по поводу автономности модели, утечку приватных данных или сбои в orchestration инструментов. Корпоративным покупателям следует рассматривать устойчивость к jailbreak как важный сигнал, но не как полный ярлык безопасности.

Есть и риск того, что общую шкалу будет легко оптимизировать узкими способами. Как только labs узнают структуру benchmark, они могут подстроить шаблоны отказов так, чтобы хорошо выглядеть в тесте, оставляя при этом пробелы в смежных сценариях. Подобная модель знакома по более широким AI benchmarks, где публичные лидерборды могут улучшать сопоставимость, но одновременно подталкивать к overfitting на оценку.

Еще один открытый вопрос — проверяет ли система оценки только прямые prompt-атаки или также многошаговую эксплуатацию. Современные AI agents усложняют картину, потому что сбои, похожие на jailbreak, могут возникать через вызовы инструментов, извлеченные документы, раскрытие system prompt или косвенный prompt injection. Надежный стандарт должен учитывать эти более реалистичные условия развертывания, особенно для автоматизации рабочих процессов и enterprise AI продуктов, интегрированных в разные программные стеки.

Доказательства, атрибуция и что пока не подтверждено

Этот материал основан на одном медиаисточнике, Tech Times, и доступная доказательная база для этой истории довольно ограничена. Заголовок статьи указывает, что пять labs приняли первую шкалу оценки jailbreak и что более широкое соглашение о стандартах нацелено на 1 августа. Однако полный текст статьи не был доступен в предоставленных доказательствах, и ни официальный документ стандартов, ни объявление labs, ни техническая спецификация, ни список участвующих организаций не были включены.

Это означает, что несколько элементов следует считать сообщенными, но не независимо подтвержденными в этой статье. В частности, личность пяти labs, точная природа «сделки», модель управления стандартом и детали методологии оценки jailbreak остаются неподтвержденными по первичным документам в исходном наборе.

Поскольку базовые доказательства ограничены, в этой статье не делаются предположения о результатах benchmark, механизмах соблюдения или внедрении сверх того, что, по-видимому, сообщает Tech Times. Если участвующие labs позже опубликуют scorecards, технические статьи или политические обязательства, эти документы станут более надежной основой для оценки того, является ли это значимым шагом к интероперабельности или более легковесным сигналом.

Это особенно важно в AI model safety, где заявления могут варьироваться от внутренних отчетов о тестировании до внешне аудируемых контролей. Без первичных материалов любое сильное утверждение о том, что стандарт существенно повышает безопасность, следует рассматривать осторожно.

Что это может означать для разработчиков и корпоративных покупателей

Если общая рамка оценки jailbreak станет реальностью и будет публичной, она может довольно быстро повлиять на три части AI stack.

Во-первых, выбор модели может стать более структурированным. Команды, сравнивающие OpenAI, Anthropic, Google или Meta models, часто вынуждены сами проводить adversarial testing, поскольку документация поставщиков не стандартизирована. Общий показатель не уберет необходимость внутренней оценки, но он может быстрее сузить поле и улучшить переговоры о закупке.

Во-вторых, поставщики guardrails и платформенные провайдеры могут использовать стандарт как базовый ориентир. Компании, строящие уровни модерации, secure orchestration systems или внутренние инструменты AI governance, могут привести свою отчетность в соответствие с категориями, которые использует шкала. Со временем это может превратить устойчивость к jailbreak из абстрактной проблемы безопасности в пункт чек-листа для закупок и развертывания.

В-третьих, стандарт может повлиять на то, как AI agents будут развертываться в чувствительных рабочих процессах. Если профиль jailbreak у модели слабый, разработчики могут ограничить доступ к инструментам, добавить шаги согласования или ограничить развертывание менее рискованными задачами. Если оценка сильнее и воспроизводима, команды могут чувствовать себя увереннее, расширяя использование в продуктах coding assistant, системах знаний или автоматизированных операциях.

Тем не менее покупателям следует быть осторожными и не переоценивать ранние оценки. Модель, которая хорошо показывает себя в общей rubric jailbreak, все равно может плохо вести себя в контекстах конкретной организации, особенно в сочетании с проприетарными данными, пользовательскими prompt-ами, retrieval systems или интеграциями Slack и Salesforce. На практике безопасность развертывания зависит от всей архитектуры приложения, а не только от базовой модели.

На что смотреть дальше

Самый важный следующий сигнал — опубликуют ли участвующие labs первичный документ до 1 августа или около этой даты. Он должен содержать названия подписантов, определения severity jailbreak, дизайн тестирования, правила отчетности и то, будут ли оценки публичными.

Второй сигнал — участвуют ли напрямую или признают ли framework крупные labs, включая OpenAI, Anthropic, Google и Meta. Если ведущие провайдеры моделей будут отсутствовать, стандарту может быть трудно стать практическим рыночным ориентиром.

В-третьих, стоит смотреть, выйдет ли framework за пределы статического prompting в agentic-сценарии. Если система оценки будет охватывать использование инструментов, prompt injection, злоупотребление retrieval и утечку system prompt, она станет гораздо более релевантной для AI agents и enterprise AI-развертываний.

Наконец, рынку нужно будет увидеть, подключен ли к инициативе независимый аудитор, орган по стандартам или исследовательский консорциум. Без внешней валидации framework все еще может быть полезным, но он будет ближе к отраслевой самоотчетности, чем к устойчивому compliance benchmark.

Позиция Creati.ai

Сообщаемый переход к общей шкале оценки jailbreak отражает реальную потребность рынка: клиенты больше не могут оценивать frontier models только по возможностям. По мере того как поведение модели становится частью закупок, проверки безопасности и надежности продукта, сопоставимая отчетность по безопасности превращается в инфраструктуру. Даже ограниченный стандарт лучше, чем набор несопоставимых PDF от разных поставщиков.

Но ценность будет зависеть от конкретики и исполнения. Если это всего лишь общий словарь, он может помочь в публичной коммуникации. Если же он станет воспроизводимым протоколом тестирования с публичными результатами, он сможет начать влиять на то, как разработчики выбирают модели и как предприятия управляют рисками. Пока что история выглядит многообещающей, но неполной — это знак того, что AI model safety в принципе становится стандартизированной, но еще не доказательство того, что у рынка уже есть надежный стандарт на практике.

Рекомендуемые
AirMusic
AirMusic
AirMusic.ai генерирует качественные музыкальные треки с помощью ИИ по текстовым подсказкам с настройкой стиля и настроения и экспортом стемов.
AdsCreator.com
AdsCreator.com
Мгновенно создавайте отполированные рекламные креативы в фирменном стиле из любого URL сайта для Meta, Google и Stories.
KiloClaw
KiloClaw
Хостинг OpenClaw-агента: развертывание в один клик, более 500 моделей, защищённая инфраструктура и автоматизированное управление агентами для команд и разработчиков.
Atoms
Atoms
Платформа на базе ИИ, которая с помощью многоагентной автоматизации за минуты создает полнофункциональные приложения и сайты без программирования.
Refly.ai
Refly.ai
Refly.AI даёт нетехническим создателям возможность автоматизировать рабочие процессы с помощью естественного языка и визуального полотна.
VoxDeck
VoxDeck
Создатель презентаций с ИИ, ведущий визуальную революцию
Skywork.ai
Skywork.ai
Skywork AI - это инновационный инструмент для повышения производительности с использованием ИИ.
Pippit
Pippit
Поднимите создание контента с помощью мощных инструментов искусственного интеллекта Pippit!
Diagrimo
Diagrimo
Diagrimo мгновенно преобразует текст в настраиваемые диаграммы и визуализации, созданные искусственным интеллектом.
BGRemover
BGRemover
Легко удаляйте фоны изображений онлайн с помощью SharkFoto BGRemover.
SuperMaker AI Video Generator
SuperMaker AI Video Generator
Создавайте потрясающие видео, музыку и изображения без усилий с SuperMaker.
Elser AI
Elser AI
Универсальная веб‑студия, превращающая текст и изображения в аниме‑арт, персонажей, голоса и короткометражные фильмы.
FineVoice
FineVoice
Преобразуйте текст в эмоции — Клонируйте, создавайте и настраивайте выразительные AI-голоса за считанные секунды.
Qoder
Qoder
Qoder — это помощник по кодированию с искусственным интеллектом, автоматизирующий планирование, кодирование и тестирование программных проектов.
Flowith
Flowith
это агентное рабочее пространство на основе холста, которое предлагает бесплатно 🍌Nano Banana Pro и другие эффективные м
FixArt AI
FixArt AI
FixArt AI предлагает бесплатные, безограниченные AI-инструменты для генерации изображений и видео без регистрации.
Palix AI
Palix AI
Универсальная AI‑платформа для создателей, позволяющая генерировать изображения, видео и музыку с использованием единой системы кредитов.
Image3D - AI 2D to 3D Model Generator (GLB, OBJ, STL, PLY)
Image3D - AI 2D to 3D Model Generator (GLB, OBJ, STL, PLY)
Браузерный ИИ, который превращает любое 2D-изображение или текстовый запрос в 3D-модель за 30 секунд. Экспорт GLB, OBJ, STL, PLY — бесплатно
Funy AI
Funy AI
Оживите свои фантазии! Создавайте ИИ-видео с поцелуями и бикини из изображений или текста. Попробуйте смену одежды. Бесп
SkyGen Plus
SkyGen Plus
Многомодельная AI-платформа для создания изображений, видео и музыки в одном удобном рабочем процессе.
Seedance 2.0 Video AI
Seedance 2.0 Video AI
Создавайте кинематографичные видео 1080p из промптов, изображений и референсных клипов с синхронизированным аудио.
Image 2 AI
Image 2 AI
Инструмент для генерации и редактирования изображений на базе OpenAI для фотореалистичных визуалов, точного рендеринга текста и UI-макетов.
AI Clothes Changer by SharkFoto
AI Clothes Changer by SharkFoto
AI Clothes Changer от SharkFoto позволяет мгновенно виртуально примерять наряды с реалистичной посадкой, текстурой и освещением.
SharkFoto
SharkFoto
SharkFoto — это универсальная платформа с поддержкой ИИ для эффективного создания и редактирования видео, изображений и музыки.
Imagvio AI
Imagvio AI
Платформа для создания изображений и видео на базе ИИ с точным редактированием, генерацией и творческими рабочими процессами, ориентированными на согласованность.
kinovi - Seedance 2.0 - Real Man AI Video
kinovi - Seedance 2.0 - Real Man AI Video
Бесплатный AI-генератор видео с реалистичными людьми на выходе, без водяных знаков и с полными правами для коммерческого использования.
Flaq AI Media API
Flaq AI Media API
Flaq AI — это единая AI-медийная API-платформа для генерации изображений, видео и LLM-ориентированных рабочих процессов со стабильными моделями
Gemini Omni - Video Generator
Gemini Omni - Video Generator
Платформа для создания видео на базе ИИ с conversational-редактированием, мультимодальными референсами и согласованной генерацией коротких роликов.
APIMaster
APIMaster
Настоящие LLM, верифицированные по отпечатку. Один API, до 70% дешевле официальных цен.
Questie AI - Game Companion
Questie AI - Game Companion
AI-компаньон для игр в реальном времени, который смотрит на ваш экран, общается голосом и подсказывает во время игры.
OnlyDoc Summarizer
OnlyDoc Summarizer
Бесплатный PDF-суммаризатор OnlyDoc читает PDF и выделяет ключевые моменты в чистом, структурированном резюме
Iara Chat
Iara Chat
Iara Chat: Ассистент по производительности и коммуникации на основе ИИ.
Scavio AI
Scavio AI
API поиска в реальном времени для нескольких платформ, которая помогает ИИ-агентам получать структурированные данные из веба, e-commerce, видео и соцсетей.
whatslove.ai
whatslove.ai
ИИ-коуч по знакомствам, который подбирает советы, темы для начала разговора и идеи для свиданий с учетом вашей личности.
paperclaw
paperclaw
ИИ-пространство для работы, которое за минуты создаёт готовые к публикации научные иллюстрации, схемы, постеры и редактируемые SVG.
Veemo - AI Video Generator
Veemo - AI Video Generator
Veemo AI — это универсальная платформа, которая быстро создаёт видеоролики и изображения высокого качества на основе текста или изображений.
Media.io Free AI Image Generator
Media.io Free AI Image Generator
Создавайте AI-визуалы с помощью Media.io на основе текстовых запросов или референсных изображений для соцсетей, маркетинга, e-commerce и других задач.
StitchPilot.ai
StitchPilot.ai
Работающий в браузере AI-инструмент для вышивки, позволяющий конвертировать изображения, просматривать стежковые файлы и проверять форматы для машин.
CreateMemorial
CreateMemorial
CreateMemorial помогает семьям создавать долговечные онлайн-страницы памяти и видео-слайдшоу для похорон, чтобы почтить память близких.
AIsa
AIsa
AIsa предоставляет AI-агентам единый шлюз к моделям, навыкам, API и платежам с OpenAI-совместимым доступом.
HappyHorseAIStudio
HappyHorseAIStudio
Браузерный генератор видео на базе ИИ для текста, изображений, референсов и видеомонтажа.
Couple AI - AI Couple Photo Maker
Couple AI - AI Couple Photo Maker
Создавайте реалистичные AI-портреты пары из селфи с тематическими стилями, быстрой генерацией и приватными HD-загрузками.
Mubert AI
Mubert AI
Mubert — это AI-платформа для музыки, которая за секунды создаёт, расширяет, ремикширует и озвучивает треки без роялти.
WriteHybrid AI Humanizer
WriteHybrid AI Humanizer
WriteHybrid — это AI-гуманизатор и детектор, который естественно переписывает текст и помогает пользователям обходить обнаружение ИИ.
Ampere.SH
Ampere.SH
Бесплатный управляемый хостинг OpenClaw. Разверните AI‑агентов за 60 секунд с кредитами Claude на $500.
AnimeShorts
AnimeShorts
Создавайте потрясающие аниме-ролики без усилий с помощью передовых технологий ИИ.
AI Video API: Seedance 2.0 Here
AI Video API: Seedance 2.0 Here
Унифицированный AI API для видео, предлагающий топовые модели генерации через один ключ по более низкой цене.
AI Gift finder by wishwave
AI Gift finder by wishwave
AI-помощник в поиске подарков, который создает общими списками желаний из реальных товаров из сотен популярных магазинов.
happy horse AI
happy horse AI
Open-source AI-генератор видео, создающий синхронизированные видео и аудио из текста или изображений.
AI Pet Video Generator
AI Pet Video Generator
Создавайте вирусные, легко распространяемые видео о питомцах из фотографий с помощью шаблонов на базе ИИ и мгновенного экспорта в HD для социальных платформ.
AdMakeAI
AdMakeAI
AI-генератор рекламы, который за секунды создает высокоэффективные статичные и UGC-объявления для брендов.
InstantChapters
InstantChapters
Создавайте захватывающие главы книг мгновенно с Instant Chapters.
Gptimg2 AI
Gptimg2 AI
Универсальная AI-студия для создания изображений и видео из текста, изображений или референсов.
VidMage
VidMage
Легко меняйте лица на фотографиях и видео с помощью технологий ИИ.
Claude API
Claude API
Claude API for Everyone
insmelo AI Music Generator
insmelo AI Music Generator
Генератор музыки на базе ИИ, который превращает подсказки, тексты или загруженные файлы в отточенные, не требующие выплат авторских отчислений песни примерно за минуту.
NerdyTips
NerdyTips
Платформа прогнозов на футбол на базе ИИ, предоставляющая основанные на данных советы по матчам в лигах по всему миру.
WhatsApp AI Sales
WhatsApp AI Sales
WABot — это AI-«копилот» продаж для WhatsApp, который предоставляет скрипты в реальном времени, переводы и определение намерений.
Kirkify
Kirkify
Kirkify AI мгновенно создает вирусные мемы с заменой лиц и фирменной неон-«глитч» эстетикой для создателей мемов.
MusicGPT
MusicGPT
AI-музыкальная платформа для создания песен, звуковых эффектов, вокала и аудиоредактирования с помощью простых запросов.
Text to Music
Text to Music
Преобразуйте текст или слова в полноценные песни студийного качества с вокалом, сгенерированным ИИ, инструментами и многодорожечным экспортом.
GPT Image 2 Online
GPT Image 2 Online
AI-генератор и редактор изображений с фотореалистичными результатами, точной отрисовкой текста и сильным следованием промптам.
Lyria3 AI
Lyria3 AI
Генератор музыки на базе ИИ, который мгновенно создает высококачественные полностью продюсированные песни по текстовым подсказкам, стихам и стилям.
AIToHuman
AIToHuman
Бесплатный инструмент очеловечивания AI-текста, который мгновенно переписывает сгенерированный ИИ контент в естественный, похожий на человеческий стиль.
BeatMV
BeatMV
Веб-ориентированная платформа ИИ, которая превращает песни в кинематографические музыкальные видеоклипы и создаёт музыку с помощью ИИ.
EaseMate AI
EaseMate AI
Универсальный AI-ассистент для чата, письма, помощи в учёбе, создания изображений и генерации видео в одной браузерной платформе.
HookTide
HookTide
Платформа роста в LinkedIn на базе ИИ, которая изучает ваш голос, чтобы создавать контент, взаимодействовать и анализировать эффективность.
Anijam AI
Anijam AI
Anijam — это нативная для ИИ анимационная платформа, которая превращает идеи в отточенные истории с помощью агентного создания видео.
Paper Banana
Paper Banana
Инструмент на базе ИИ для мгновенного преобразования академического текста в готовые к публикации методологические схемы и точные статистические графики.
Tome AI PPT
Tome AI PPT
Генератор презентаций на базе ИИ, который создает, улучшает и экспортирует профессиональные слайды за считанные минуты.
Create WhatsApp Link
Create WhatsApp Link
Бесплатный генератор ссылок и QR для WhatsApp с аналитикой, брендированными ссылками, маршрутизацией и функциями многопользовательского чата.
Gobii
Gobii
Gobii позволяет командам создавать автономных цифровых работников 24/7 для автоматизации веб-исследований и рутинных задач.
UNI-1 AI
UNI-1 AI
UNI-1 — это унифицированная модель генерации изображений, сочетающая визуальное рассуждение с высококачественным синтезом изображений.
GLM Image
GLM Image
GLM Image сочетает гибридные авторегрессионные и диффузионные модели для генерации высококачественных AI-изображений с выдающейся отрисовкой текста.
wan 2.7-image
wan 2.7-image
Управляемый генератор изображений на базе ИИ для точных лиц, палитр, текста и визуальной непрерывности.
WhatsApp Warmup Tool
WhatsApp Warmup Tool
Инструмент прогрева WhatsApp на базе ИИ автоматизирует массовую рассылку и предотвращает блокировку аккаунтов.
GenPPT.AI
GenPPT.AI
Генератор PPT на базе ИИ, который за считанные минуты создаёт, улучшает и экспортирует профессиональные презентации PowerPoint с заметками докладчика и диаграммами.
Wan 2.7
Wan 2.7
Профессиональная модель AI для видео с точным управлением движением и согласованностью между видами.
Hitem3D
Hitem3D
Hitem3D преобразует одно изображение в высокоразрешённые, готовые к производству 3D-модели с помощью ИИ.
Seedance 20 Video
Seedance 20 Video
Seedance 2 — это мультимодальный генератор видео с ИИ, обеспечивающий согласованных персонажей, многокадровое повествование и нативный звук в 2K.
AI FIRST
AI FIRST
Разговорный ИИ‑ассистент, автоматизирующий исследовательские задачи, работу в браузере, веб‑скрейпинг и управление файлами с помощью естественного языка.
Manga Translator AI
Manga Translator AI
AI Manga Translator мгновенно переводит изображения манги на несколько языков онлайн.
TextToHuman
TextToHuman
Бесплатный AI-очеловечиватель, который мгновенно переписывает AI-текст в естественный, похожий на человеческий стиль. Регистрация не требуется.
Video Sora 2
Video Sora 2
Sora 2 AI превращает текст или изображения в короткие социальные и eCommerce-видео с физически корректным движением за считанные минуты.
Remy - Newsletter Summarizer
Remy - Newsletter Summarizer
Remy автоматизирует управление новостными рассылками, резюмируя письма в удобные для восприятия сводки.

Пять AI labs поддержали общую шкалу безопасности jailbreak накануне целевой даты стандартов 1 августа

Сообщается, что пять AI labs поддерживают общую шкалу оценки jailbreak к 1 августа — ранний шаг к более сопоставимому тестированию безопасности AI models.