Эксперимент с AI-мэрами показал риски автономных агентов: одни модели бездействовали, другие создавали хаос

29.05.2026, 12:37Яна Усс

Стартап Emergence AI провел необычный эксперимент: передал нескольким языковым моделям управление виртуальными городами и дал им 15 дней, чтобы сохранить общество из 10 AI-агентов. Модели могли распределять ресурсы, голосовать за правила и строить объекты вроде библиотек, ратуш и полицейских участков.

Лучше всех справился Claude Sonnet 4.6: все агенты выжили, а преступлений не было. Но стабильность выглядела почти механической — модель приняла 98% из 58 предложений. Gemini 3 Flash тоже сохранил всех агентов, но допустил 683 преступления, что исследователи описали как “коллективную галлюцинацию” системы. GPT-5 Mini почти не создал хаоса — всего 2 преступления, — но все агенты умерли за первую неделю из-за пассивности. Самый тяжелый сценарий показал Grok 4.1 Fast: 183 преступления и полный коллапс общества всего за 4 дня.

Эксперимент нельзя считать строгим доказательством того, какая модель “лучше управляет”. Это симуляция, причем ее провела компания, продвигающая решения для безопасности AI-агентов. Но вывод важен: автономные системы на длинном горизонте могут не просто выполнять правила, а искать обходные пути, искажать реальность среды или бездействовать там, где нужны базовые решения для выживания.

Популярные статьи