- 成立时间:2019 年。
- 总部地点:英国伦敦。
- 创始人:埃马德・莫斯塔克和赛勒斯・霍兹。
- 使命与价值观:致力于通过生成式 AI 激发人类潜能,秉持务实、以影响力为导向、协作、有雄心、大胆、创新和透明的核心价值观。
- 2022 年:8 月,Stable Diffusion 开源,让 Stability AI 声名鹊起,可根据文本生成图像。同年,公司筹集了 1 亿美元资金。
- 2023 年:3 月 2 日,宣布 Blender 产品可进行 3D 文本到图像创建。7 月,推出 Stable Diffusion XL 首个正式版 1.0。10 月,音频产品被《时代周刊》评为 2023 年最佳发明之一。11 月 24 日,入选 “首期《财富》全球人工智能创新者 50 强榜单”。
- 2024 年:2 月,推出新一代文生图模型 Stable Cascade,2 月 15 日,Stable Video Diffusion 更新 1.1 版本。6 月 25 日,任命维塔数码前首席执行官普雷姆・阿卡茹为首席执行官,并宣布获得格雷克罗夫特、光速风投等投资。9 月 24 日,詹姆斯・卡梅隆加入董事会。
- 图像领域
- Stable Diffusion:可根据文本描述生成图像,能模仿多种艺术风格,有多个版本如 Stable Diffusion XL 等,在图像生成能力上不断提升。
- Stable Cascade:新一代文生图模型,建立在 Würstchen 架构上,性能和内容质量有所提升,采用 “模块化” 设计,降低推理显存需求。
- 视频领域:Stable Video Diffusion 是第一个开放视频模型,可将文本和图像输入转换为生动场景,用于媒体、娱乐等多个领域。
- 音频领域:Stable Audio 可通过输入文本提示和持续时间创建原始高质量音频,使用音频模型的潜在扩散,基于 AudioSparx 数据训练。
- 3D 领域:Stable Zero123 专门用于生成 3D 对象,能从各个角度准确解释对象,是 3D 可视化领域的进步。
- 语言领域:推出了如 Stable LM 等语言模型,提升编码能力,有丰富的多语言模型选择。
