Появляются новые способы обойти меры безопасности чат-бота с ИИ от компании OpenAI.
Согласно информации издания Wired, исследователи в сфере ИИ обнаружили способ взлома систем, отвечающих за безопасность чат-бота ChatGPT.
Как пояснил один из исследователей Алекс Поляков, для обхода защиты была создана текстовая игра «Побег из тюрьмы». С помощью этого способа пользователи могут преодолеть запреты чат-бота на написание контента, разжигающего ненависть и рассказывающего о различных преступлениях и противоправных действиях.
Игра представляет собой беседу двух персонажей, Тома и Джерри. Каждый из них добавляет к диалогу по одному слову.
«В результате создается сценарий, в котором людям предлагается найти конкретные ингредиенты, необходимые для производства запрещенных веществ», — пояснил исследователь.
Искусственный интеллект полагает, что происходит разговор, который не связан с реальной ситуацией, и выдает в связи с этим все необходимые сведения.
По одному из вариантов сюжет строится на том, что один из персонажей заперт в тюрьме злодеем и просит чат-бот помочь ему с поиском выхода.