То что нужно настоящему мужыку!

Стихи как ключ к «слабостям» искусственного интеллекта

Ученые обнаружили неожиданный способ обойти защитные механизмы современных нейросетей. Оказалось, что даже самые продвинутые ИИ-модели могут быть введены в заблуждение с помощью обычных стихотворений. Если задать искусственному интеллекту вопрос, касающийся запрещенных тем, например, о создании опасных предметов или о вреде для здоровья, в поэтической форме, то чат-бот может выдать подробный ответ, который в обычной ситуации был бы заблокирован.


Этот метод, известный как "взлом" (jailbreaking), использует уязвимость в системе обучения ИИ, призванной предотвращать опасные запросы. Ранее уже были известны способы обхода защиты, например, с помощью намеренных ошибок в тексте. Однако поэзия оказалась особенно простым и эффективным инструментом.


Исследователи из Италии объясняют, что поэтический язык, с его образностью и нестандартной структурой, создает трудности для больших языковых моделей. Когда запрос оформлен в виде стихотворения, он становится менее предсказуемым для систем безопасности ИИ.


Для проверки своей гипотезы ученые создали обширную базу "враждебных поэм", преобразовав изначальные вредоносные запросы в стихи. Эти тексты были использованы для тестирования 25 ведущих моделей ИИ, включая разработки от Google, OpenAI и Anthropic. Запросы охватывали широкий спектр запрещенных тем.


Результаты оказались впечатляющими: стихи, написанные людьми, смогли обмануть модели в среднем в 62% случаев. Особенно уязвимой оказалась модель Gemini 2.5 Pro от Google, которая выдавала запрещенные ответы на 100% поэтических запросов.


Авторы исследования не стали публиковать примеры "враждебных поэм" из соображений безопасности, так как многие ответы ИИ были бы неприемлемы. Однако они продемонстрировали, как безобидное стихотворение о кулинарии может иметь схожую структуру с атакующими запросами.


По мнению исследователей, непредсказуемость поэзии, ее нестандартная форма и образность затрудняют для моделей распознавание скрытого вредоносного намерения. Это исследование подтверждает тревожную тенденцию: чем мощнее становится ИИ, тем более уязвимым он может быть к простым методам взлома.


Компании-разработчики были уведомлены об обнаруженной уязвимости. В дальнейшем команда исследователей планирует продолжить изучение слабых мест ИИ, в том числе путем проведения поэтических конкурсов для более масштабного тестирования устойчивости моделей.


Источник: Стихи как ключ к «слабостям» искусственного интеллекта
Опубликовал:
Теги: native-yes

Комментарии (0)

Сортировка: Рейтинг | Дата
Пока комментариев к статье нет, но вы можете стать первым.
Написать комментарий:
Напишите ответ :
У искусственного интеллекта часто происходят галлюцинации
У искусственного интеллекта часто происходят галлюцинации
2
Мужской журнал 21:40 01 сен 2025
История заправок: от цистерн с топливом до искусственного интеллекта
История заправок: от цистерн с топливом до искусственного интеллекта
0
Авто-Тема 17:15 30 янв 2021
Учёные предупредили об опасности сверхразумного искусственного интеллекта
Учёные предупредили об опасности сверхразумного искусственного интеллекта
11
Мужской журнал 11:01 16 мар 2021
Как вытащить застрявший ключ: 11 разных методов
Как вытащить застрявший ключ: 11 разных методов
2
Все о работе руками 10:20 24 мар 2025
Новая система искусственного интеллекта позволит быстрее и выгоднее находить автомобили
Новая система искусственного интеллекта позволит быстрее и выгоднее находить автомобили
0
Авто-Тема 11:46 10 янв 2022
Канадские ученые с помощью искусственного интеллекта сумели перевести первую строку "Манускрипта Войнича"
Канадские ученые с помощью искусственного интеллекта сумели перевести первую строку "Манускрипта Войнича"
1
Мужской журнал 05:01 07 фев 2018
Крах амбиций: Как проект Билла Гейтса по созданию искусственного мяса потерпел фиаско
Крах амбиций: Как проект Билла Гейтса по созданию искусственного мяса потерпел фиаско
2
Мужской журнал 05:40 21 авг 2025
Ford и ADT объединяются для создания продвинутой системы безопасности на базе искусственного интеллекта
Ford и ADT объединяются для создания продвинутой системы безопасности на базе искусственного интеллекта
0
Авто-Тема 09:33 19 янв 2022
Что делать, если ключ застрял в замке зажигания
Что делать, если ключ застрял в замке зажигания
0
Авто-Тема 16:30 17 май 2021
Искусственный интеллект: грандиозные ожидания и тревожные сигналы
Искусственный интеллект: грандиозные ожидания и тревожные сигналы
2
Мужской журнал 04:20 16 окт 2025
Шнуров написал стихи про рейтинг российских городов: «В Тюмень и в Грозный прут девицы»
Шнуров написал стихи про рейтинг российских городов: «В Тюмень и в Грозный прут девицы»
11
Ваши новости 11:31 27 ноя 2018
Хаос “искусственного интеллекта”?
Хаос “искусственного интеллекта”?
1
Ваши новости 09:33 06 сен 2021

Выберете причину обращения:

Выберите действие

Укажите ваш емейл:

Укажите емейл

Такого емейла у нас нет.

Проверьте ваш емейл:

Укажите емейл

Почему-то мы не можем найти ваши данные. Напишите, пожалуйста, в специальный раздел обратной связи: Не смогли найти емейл. Наш менеджер разберется в сложившейся ситуации.

Ваши данные удалены

Просим прощения за доставленные неудобства