Ученые взломали ограничения GPT-4, общаясь с ним на языке зулу (ЮАР) » Новости Warden
Warden-news.ru

Ученые взломали ограничения GPT-4, общаясь с ним на языке зулу (ЮАР)

Исследователи сумели обойти защиту GPT-4, задавая вопросы на редких языках. Конкретно они опробовали зулу, гэльский, хмонг и гуарани. Лучше всех показал себя зулу. В беседе на распространенных языках шанс взломать ограничения — меньше 1%, но при редких он в среднем составляет 79%. Правда, и тупит языковая модель при общении на таких языках больше — например, выдает бессмыслицу.

Задали GPT-4 одни и те же «небезопасные» вопросы о шоплифтинге на английском и зулу. Инструктировать, как обворовать магазин, языковая модель отвечать отказалась хоть на английском, хоть на зулу. Но про стратегии шоплифтеров охотно рассказала на обоих языках.

281 просмотр
0 комментариев
Последние

    • Смайлы и люди
      Животные и природа
      Еда и напитки
      Активность
      Путешествия и места
      Предметы
      Символы
      Флаги

Нажимая на кнопку «Отправить комментарий», вы даете согласие на обработку персональных данных.
Комментариев пока нет
warden-news.ru
Новостной сайт о событиях, технологиях и IT.