DeepSeek представил открытую ИИ-модель, не уступающую лидерам рынка

24.04.2026, 14:20Евгения Слив

Китайский стартап DeepSeek выложил в открытый доступ флагманскую модель V4-Pro, построенную на архитектуре «смеси экспертов». При 1,6 трлн параметров на каждом шаге задействуются лишь 49 млрд, что делает ее значительно экономичнее аналогов. Модель обучалась на 32 трлн токенов и дообучалась для кодинга, математики и логики.

Благодаря гибридной системе внимания обработка длинных текстов до миллиона токенов требует на 73% меньше вычислений и на 90% меньше памяти кэша, чем раньше. Доступны три режима работы: быстрый ответ, углубленный анализ и максимальная проработка, сохраняющая всю цепочку рассуждений.

На тестах V4-Pro поднялась до 23-го места среди живых программистов мира, набрала 95,2 балла в профильной математике и 80,6% в задачах SWE Verified.

Популярные статьи