Поддержать команду Зеркала
Беларусы на войне
  1. По «договоренности» с Трампом. Лукашенко помиловал 31 гражданина Украины
  2. Почти все мы охотно едим этот продукт каждый день, но он разрушает печень не хуже алкоголя. Рассказываем
  3. Есть лайфхак, как добиться исключения из базы «тунеядцев» и избежать жировок по полным тарифам. Но надо заплатить — о каких суммах речь
  4. За сколько сейчас можно пройти границу с Польшей на автобусе? Вот что пишут в чатах
  5. Героиня популярного американского сериала попадает в беларусское СИЗО. Показали его экс-политзаключенной — вот ее впечатления
  6. Не смейте ныть! Почему жалоба на жировку пугает власть больше, чем НАТО, — мнение
  7. Трамп дал Зеленскому неделю на подписание мирного соглашения с Россией — Financial Times
  8. «Сейчас один из наитяжелейших моментов нашей истории». Зеленский обратился к украинцам по поводу мирного плана
  9. «Двадцатый год вы же все помните?» Лукашенко в ответ на просьбу повысить статус и зарплаты ученым посоветовал равняться на силовиков
  10. Как Максим Зенькович оказался в заболоченном месте? В МВД рассказали новые подробности о поисках подростка
  11. Чиновники озадачились тем, какую туалетную бумагу использует население. Хотят ввести новшество для этого товара
  12. Предложенный мирный план ведет не к миру, а к риску новой агрессии России — ISW


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.