快手可灵 3.0 系列 AI 模型发布并开启内测：可生成 15 秒视频，升级智能分镜能力

2026-01-31 13:53IT之家(问舟)10评

IT之家 1 月 31 日消息，快手今日宣布推出新一代视频生成模型可灵 3.0 系列，目前处于超前内测阶段。该系列包含图片 3.0、视频 3.0 和视频 3.0 Omni，在原有模型基础上进行了技术升级。

其中，图片 3.0 模型主要升级包括四项功能：

据介绍，此次升级采用视觉思维链（vCoT）技术辅助生成前的场景解构推理，并通过 Deep-Stack 视觉信息流机制增强细粒度感知能力。模型训练过程中引入强化学习框架，结合真实感与电影质感双重评估标准优化输出效果。

另外，新的视频模型采用统一的多模态训练框架，支持文本、图像、视频片段等多种输入形式，单次视频生成时长最高可达 15 秒，并支持 3-15 秒灵活时长设置。功能改进主要包括：

视频 3.0 Omni 版本额外支持创建视频主体特征库，可提取 3-8 秒视频中的角色形象与音色进行还原应用。技术文档显示，此次升级涉及多模态指令解析架构优化、音频采样区间调整及特征解耦重组方案。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

快手可灵 O1 主体库上线：只要有多角度参考图就能让 AI“记住”主角

快手可灵 2.6“音画同出”模型上线，单次生成可同时产出画面、语音、环境音

全球首个统一多模态视频模型，快手可灵视频 O1 模型全量上线

大家都在买广告

热门评论