Исследователи безопасности обманом заставили LLM выдавать рецепты кокаина с помощью внедрения промптов
Исследователи использовали внедрение промптов в ролевую модель, чтобы обойти защитные ограничения LLM и извлечь вредоносный контент, включая инструкции по синтезу наркотиков.
