DeepSeek-R1 是幻方量化旗下大模型公司 DeepSeek 研发的系列推理模型1。以下是关于它的一些介绍:
- 发展历程:2024 年 11 月 20 日,DeepSeek-R1-Lite 预览版正式上线网页端。2025 年 1 月 20 日,DeepSeek 正式发布 DeepSeek-R1 模型,并同步开源模型权重。1 月 24 日,在 Arena 上,DeepSeek-R1 基准测试升至全类别大模型第三,在风格控制类模型分类中与 OpenAI o1 并列第一。1 月 31 日,英伟达、微软与亚马逊三家美国头部企业接入该模型。2 月,DeepSeek-R1 模型上线国家超算互联网平台。
- 技术特点:使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。模型采用 MoE(混合专家)架构,有 37b 激活参数、671b 总参数,支持 128k 上下文长度。
- 主要功能:在数学、代码以及各种复杂逻辑推理任务上应用出色,取得了媲美 OpenAI o1 的推理效果,并能展现完整思考过程。在后训练阶段大规模使用强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。DeepSeek 开源了 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型,并通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上对标 OpenAI o1 - mini。
- 应用情况:2 月 1 日,和华为云联合首发并上线基于华为云昇腾云服务的推理服务。2 月 2 日,腾讯云宣布 DeepSeek - R1 大模型一键部署至腾讯云 HAI 上。2 月 4 日,中科曙光国家先进计算产业创新中心有限公司宣布海光信息技术团队成功完成 DeepSeek - R1 等模型与海光 DCU 的国产化适配并正式上线。此外,万兴科技、智联招聘、吉利汽车等多家企业也纷纷接入或使用 DeepSeek - R1 模型,将其应用于不同领域,以提升产品性能和服务质量。同时,中国人民大学、北京师范大学、北京交通大学等多所高校也接入了该模型,将其用于教学课程平台,为师生提供教学辅助。
通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型(1.5B/7B/8B/14B/32B/70B)开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。DeepSeek - R1 不同版本运行的最低硬件要求如下:
- DeepSeek - R1 - 1.5B
- DeepSeek - R1 - 7B
- DeepSeek - R1 - 8B
- DeepSeek - R1 - 14B
- DeepSeek - R1 - 32B
- DeepSeek - R1 - 70B
- DeepSeek - R1 - 671B
例如下载1.5B版本:
