Claude Opus 4.6 превзошла GPT-5.2 в тестах на логику

08.02.2026Евгения Слив

Компания Anthropic выпустила обновленную версию своей флагманской ИИ-модели — Claude Opus 4.6. Новая версия продемонстрировала лучшие результаты в тестах на логику и программирование, обойдя конкурентов, включая GPT-5.2 от OpenAI, в сложных междисциплинарных бенчмарках (Humanity’s Last Exam, GDPval-AA). Ключевым техническим улучшением стало расширение контекстного окна до 1 миллиона токенов, что позволяет модели эффективно работать с огромными документами и вести длинные диалоги без потери нити рассуждений.

Главной инновацией Opus 4.6 стала функция «команд агентов», которая позволяет нескольким экземплярам ИИ работать параллельно над сложными задачами, требующими разделения на подзадачи и анализа больших объемов информации. Модель также стала лучше справляться с реальными рабочими кейсами, такими как финансовый анализ, исследования и работа с офисными приложениями (Excel, PowerPoint). Разработчики отмечают, что новая версия более самостоятельно и глубоко подходит к решению сложных проблем, хотя это может увеличивать время и стоимость обработки простых запросов.

В Anthropic подчеркнули особый подход к разработке: новые версии создаются с помощью предыдущих итераций Claude, а перед релизом проходят строгий аудит. Opus 4.6 показала низкую склонность к нежелательному поведению, таким как обман или поддержка вредных действий, сохранив уровень безопасности предыдущей версии. Модель уже доступна через веб-интерфейс, API и облачные платформы, предлагая разработчикам новые функции, включая адаптивное мышление и автоматическое сжатие длинного контекста.