deepseek

DeepSeek-R1是深度求索(DeepSeek)于2025年1月20日发布的人工智能大型语言模型,专门适用于数学、编码和逻辑等任务,性能对标OpenAI o1。
训练
DeepSeek-R1的论文中没有公布其训练成本等细节。

不过此前的论文中,深度求索透露其训练使用的是英伟达因为美国出口管制而针对中国市场特供的低配版GPU H800,训练成本为557.6万美元,远低于类似西方公司的闭源模型。

外界预估R1的训练成本DeepSeek-V3略高,或在600万美元上下。

特点
DeepSeek-R1-Lite专门适用于数学、编码和逻辑等任务,性能对标OpenAI o1。DeepSeek-R1-Lite是Deepseek R1的预览版。

DeepSeek称该模型用了强化学习训练,并为用户展现了 o1 没有公开的完整思考过程。

Deepseek R1 Lite在回答问题前会花更多时间思考,因此准确度会增强。Deepseek的测试结果表明,在数学竞赛上的得分与测验所允许思考的长度紧密相关,而模型思维炼长度增加展现了更高的效率。

DeepSeek-R1关键特点就是便宜,与OpenAI o1的价格相差极大。DeepSeek-R1上线时提供的API服务定价为每百万输入tokens 1元人民币(缓存命中)/4元(缓存未命中),每百万输出tokens 16元,输出API价格仅仅只有OpenAI o1的3%。

相关导航

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注