[AI模型]字节联合港大发布新视频模型Goku

作者:麦波 AI 导航站发布时间:2025-02-22 200 次浏览

在这里输入230x80px的广告

Goku是香港大学和字节跳动联合发布的最新视频生成模型，专为图像和视频的联合生成设计。基于先进的rectifed flow Transformer框架，支持文生视频、图生视频及文生图等多种模式。

核心优势
- 高质量的视频生成能力、极低的广告视频制作成本(比传统方法低100倍)。
- 大规模高质量的数据集和高效的训练设施：研究人员构建了包含约3600万视频和1.6亿图像的数据集，采用多模态大语言模型生成语境一致的框架。Goku采用了先进的并行策略和容错机制，确保训练过程的高效性和稳定性。
扩展版本
- Goku+是基于Goku模型推出的扩展版本，专注于广告视频创作，能快速生成高质量的广告视频，支持20秒以上的视频生成，具备稳定的手部动作和丰富的面部及身体表情。Goku+可将产品图片转化为吸引人的视频，支持虚拟数字人与产品互动，增强广告吸引力。

-->

相关文章推荐