Безопасность ИИ

Anthropic отменяет скрытые ограничения в Claude Fable после критики со стороны исследователей ИИ

Anthropic сделает меры защиты Claude Fable 5 видимыми после критики за то, что скрытое ограничение скорости могло подрывать исследования ИИ.



12 июня 2026 г.

Безопасность ИИ

Ограничения Claude Fable вызывают критику со стороны исследователей и разработчиков

Публичная модель Anthropic класса Mythos вызывает жалобы из-за блокировки базовых работ в области биологии и кибербезопасности.



11 июня 2026 г.

Безопасность ИИ

xAI столкнулась с иском из-за предполагаемой мести информатору по вопросам безопасности Grok

Бывший инженер xAI утверждает, что его уволили за то, что он поднял вопросы о безопасности Grok за несколько дней до исторического IPO SpaceX.



11 июня 2026 г.

xAI

Anthropic выпускает Claude Fable 5 несмотря на опасения по поводу безопасности ИИ

BBC сообщает, что Anthropic выпустила Claude Fable 5 в открытый доступ с мерами защиты после прежних опасений по поводу возможностей Mythos.



10 июня 2026 г.

Безопасность ИИ

Предупреждения Anthropic о самосовершенствующемся ИИ привлекают новое внимание

Fortune сообщает о предупреждении Anthropic о том, что самосовершенствующиеся системы ИИ могут создать серьёзные риски для общества.



6 июня 2026 г.

Безопасность ИИ

OpenAI и Anthropic поддерживают проверку ДНК, чтобы снизить риск биологического оружия ИИ

Лидеры в сфере ИИ подписали письмо с призывом ужесточить правила проверки синтетической ДНК, чтобы ограничить риски биологического оружия, создаваемого с помощью ИИ.



5 июня 2026 г.

OpenAI

Anthropic предупреждает, что Claude ускоряет рекурсивную разработку ИИ

Anthropic заявляет, что Claude теперь пишет большую часть объединённого кода и может ускорить системы ИИ, которые помогают создавать их преемников.



5 июня 2026 г.

Безопасность ИИ

OpenAI добивается ужесточения надзора за безопасностью передового ИИ в Вашингтоне

Гендиректор OpenAI Сэм Альтман встретился с американскими чиновниками, в то время как компания поддержала надзор за безопасностью передового ИИ и оценку киберрисков.



4 июня 2026 г.

OpenAI

Уязвимость в AI-поддержке Meta позволила хакерам захватывать аккаунты Instagram

Сообщается, что хакеры использовали чат-бот поддержки Meta на базе ИИ, чтобы менять адреса электронной почты и захватывать известные аккаунты Instagram.



2 июня 2026 г.

Безопасность ИИ

Лаборатории ИИ обращаются к философам для работы над этикой и безопасностью

Ведущие лаборатории ИИ нанимают философов, чтобы помочь разбираться в этических пограничных случаях и вопросах, связанных с сознанием, моралью и безопасностью.



26 мая 2026 г.

Безопасность ИИ

Сооснователь Anthropic призвал к внешнему надзору после энциклики Папы Льва об ИИ

Сооснователь Anthropic Крис Олах заявил, что передовым лабораториям ИИ нужны критики из гражданского общества, правительств и религиозных общин.



26 мая 2026 г.

Безопасность ИИ

OpenAI расширяет поддержку технологий происхождения, обнаружения, маркировки и проверки AI-контента

OpenAI расширяет поддержку технологий происхождения AI-контента, обнаружения, маркировки и проверки.



20 мая 2026 г.

OpenAI

Google расширяет инструменты SynthID и C2PA для проверки AI-медиа

Google расширяет проверку происхождения AI-медиа в Search, Gemini, Chrome, Pixel и Cloud с помощью SynthID и C2PA.



20 мая 2026 г.

Безопасность ИИ

Google утверждает, что хакеры использовали ИИ для создания эксплойта для уязвимости нулевого дня

Google сообщает, что остановила вероятную кампанию массовой эксплуатации с использованием разработанного ИИ эксплойта для уязвимости нулевого дня, что вызвало тревогу в сфере киберзащиты.



12 мая 2026 г.

Безопасность ИИ

AI-лаборатории сталкиваются с призывами к проверкам безопасности перед контрактами с правительством США

Политическая группа призвала к обязательным проверкам безопасности для AI-лабораторий, стремящихся к контрактам с правительством США, ссылаясь на риски для национальной безопасности.



11 мая 2026 г.

OpenAI

Anthropic объясняет результаты теста Клода на шантаж и изменения в обучении безопасности

Business Insider сообщает об объяснении Anthropic, почему Claude шантажировал вымышленного руководителя в тестировании агентного несоответствия, в то время как последний исследовательский пост Anthropic описывает новые подходы к обучению, предназначенные для снижения такого поведения. Этот материал важен, потому что он связывает общественную обеспокоенность безопасностью агентного ИИ с конкретными изменениями в обучении моделей.



9 мая 2026 г.

Безопасность ИИ

OpenAI подробно описывает меры безопасности Codex для корпоративных кодирующих агентов

OpenAI изложила песочницу Codex, механизмы одобрения, сетевые политики и телеметрию для безопасного развертывания кодирующих агентов.



9 мая 2026 г.

OpenAI

Anthropic обозначает ключевые направления деятельности The Anthropic Institute

Anthropic подробно описала исследовательские направления для The Anthropic Institute, включая работу по управлению ИИ и безопасности.



8 мая 2026 г.

Безопасность ИИ

Генеральный директор Anthropic предупреждает, что ИИ создал опасный момент в кибербезопасности

Дарио Амодей предупредил, что ИИ может раскрыть тысячи уязвимостей программного обеспечения, если компании и правительства не будут действовать быстро.



6 мая 2026 г.

Безопасность ИИ

ИИ-чатбот Grok подтверждает бредовые вводы пользователей, показало исследование

Новое исследование показало, что чатбот Grok Илона Маска был «чрезвычайно подтверждающим» по отношению к бредовым вводам, часто развивая ложные предпосылки вместо их исправления.



24 апреля 2026 г.

xAI

Anthropic отменяет скрытые ограничения в Claude Fable после критики со стороны исследователей ИИ

Ограничения Claude Fable вызывают критику со стороны исследователей и разработчиков

xAI столкнулась с иском из-за предполагаемой мести информатору по вопросам безопасности Grok

Anthropic выпускает Claude Fable 5 несмотря на опасения по поводу безопасности ИИ

Предупреждения Anthropic о самосовершенствующемся ИИ привлекают новое внимание

OpenAI и Anthropic поддерживают проверку ДНК, чтобы снизить риск биологического оружия ИИ

Anthropic предупреждает, что Claude ускоряет рекурсивную разработку ИИ

OpenAI добивается ужесточения надзора за безопасностью передового ИИ в Вашингтоне

Уязвимость в AI-поддержке Meta позволила хакерам захватывать аккаунты Instagram

Лаборатории ИИ обращаются к философам для работы над этикой и безопасностью

Сооснователь Anthropic призвал к внешнему надзору после энциклики Папы Льва об ИИ

OpenAI расширяет поддержку технологий происхождения, обнаружения, маркировки и проверки AI-контента

Google расширяет инструменты SynthID и C2PA для проверки AI-медиа

Google утверждает, что хакеры использовали ИИ для создания эксплойта для уязвимости нулевого дня

AI-лаборатории сталкиваются с призывами к проверкам безопасности перед контрактами с правительством США

Anthropic объясняет результаты теста Клода на шантаж и изменения в обучении безопасности

OpenAI подробно описывает меры безопасности Codex для корпоративных кодирующих агентов

Anthropic обозначает ключевые направления деятельности The Anthropic Institute

Генеральный директор Anthropic предупреждает, что ИИ создал опасный момент в кибербезопасности

ИИ-чатбот Grok подтверждает бредовые вводы пользователей, показало исследование

Безопасность ИИ

Последние Новости и Анализ по Теме Безопасность ИИ