Goku是香港大学和字节跳动联合发布的最新视频生成模型,专为图像和视频的联合生成设计。基于先进的rectifed flow Transformer框架,支持文生视频、图生视频及文生图等多种模式。
-
-
高质量的视频生成能力、极低的广告视频制作成本(比传统方法低100倍)。
-
大规模高质量的数据集和高效的训练设施:研究人员构建了包含约3600万视频和1.6亿图像的数据集,采用多模态大语言模型生成语境一致的框架。Goku采用了先进的并行策略和容错机制,确保训练过程的高效性和稳定性。
-
-
Goku+是基于Goku模型推出的扩展版本,专注于广告视频创作,能快速生成高质量的广告视频,支持20秒以上的视频生成,具备稳定的手部动作和丰富的面部及身体表情。Goku+可将产品图片转化为吸引人的视频,支持虚拟数字人与产品互动,增强广告吸引力。