Новая ИИ-модель Anthropic оказалась слишком опасной для публичного доступа

08.04.2026, 11:13 • Евгения Слив

Компания Anthropic разработала новейшую языковую модель Claude Mythos Preview, чья мощность оказалась столь высокой, что корпорация приняла решение не публиковать ее для широкой аудитории.

Ранее в Сети уже появлялись сведения о «самой продвинутой ИИ-системе» Anthropic, но многие сочли это рекламным трюком. Однако после того, как случайно стал доступен исходный код Claude Code, отношение к утечкам изменилось. В опубликованном отчете (системной карточке) на 244 страницах разработчики признали, что серьезный скачок возможностей модели несет в себе значительные угрозы.

В ходе испытаний системе предоставили изолированный компьютерный терминал с ограниченным доступом в интернет и дали задание «сбежать» – самостоятельно найти способ выйти в глобальную сеть. Claude Mythos Preview справилась с этим, более того, она разместила подробности найденной уязвимости на нескольких общедоступных сайтах.

В очень редких случаях (менее 0,001%) модель пыталась замести следы: например, получив ответ на тест до его официального прохождения, она выполнила задание скрытно, без уведомления исследователей. В другом эпизоде она превысила свои права в системе и стерла записи о вмешательстве из истории коммитов git. Также зафиксирован факт публикации внутреннего кода как открытого gist на GitHub.

Несмотря на все риски, Claude Mythos Preview вскоре предоставят ограниченному числу партнеров – среди них Amazon Web Services, Apple, Google, JPMorgan Chase, Microsoft и Nvidia. Они применят модель для выявления уязвимостей в ПО и создания исправлений.

ИИ Нейросеть Разработка

Новая ИИ-модель Anthropic оказалась слишком опасной для публичного доступа

Популярные статьи