DeepSeek 已在开发者渠道 Hugging Face 上发布他们 R1 推理 AI 模型的更新版别,这一音讯开始是在周三早上经过其微信大众号宣告的。
依据 DeepSeek 的公告,这一更新版别的 R1 采用了十分宽松的 MIT 许可证,可用于商业用途,但此次更新仅为“小幅晋级”。Hugging Face 上的模型库中没有详细描述,仅包括配置文件和权重(即模型运转的中心参数)。
更新后的 R1 具有 6850 亿个参数,体量巨大。因为模型规划极大,一般顾客等级的硬件很可能没办法直接运转。
本年早一点的时分,DeepSeek 因发布了 R1 模型而“一夜成名”,这款模型在性能上一度足以与 OpenAI 的产品相抗衡。