Нейросеть Kling AI научилась сама монтировать видео по текстовому описанию

05.02.2026Евгения Слив

Китайский технологический гигант Kuaishou совершил качественный скачок в генерации видео, представив модель Kling AI 3.0. Ее ключевой инновацией стала способность самостоятельно создавать видео со сложным монтажом: анализируя текстовый промпт, система определяет структуру сцены и автоматически выстраивает ракурсы камеры, генерируя ролики с диалогами, параллельным повествованием или закадровым голосом длительностью до 15 секунд. Это превращает инструмент из простого генератора движущихся картинок в ассистента для создания готового видеоконтента с кинематографическими приемами.

Технически модель демонстрирует значительный прогресс в согласованности элементов и работе с мультимодальным вводом. Она может использовать несколько изображений или коротких видео в качестве референсов, точно фиксируя и сохраняя характеристики персонажей и объектов на протяжении всего ролика. Также улучшена синхронизация аудио с мимикой, добавлена поддержка нескольких языков и возможность «захвата» голоса и внешности персонажа для их последующей генерации.

Анонс усиливает давление на OpenAI и ее флагманскую модель Sora, которая, несмотря на ранний ажиотаж, столкнулась со спадом интереса и конкуренцией. В то время как Sora борется с ограничениями из-за нарушений авторских прав и снижением числа загрузок, Kling 3.0 предлагает более комплексный и контролируемый подход к созданию видео, напрямую апеллируя к нуждам создателей контента.