中证网
返回首页

DeepSeek发文,披露关键信息

郑萃颖 中证金牛座

3月1日,DeepSeek在知乎官方账号发布文章《DeepSeek-V3/R1推理系统概览》,披露DeepSeek-V3/R1推理系统采用大规模跨节点专家并行(EP)技术,来实现更大的吞吐和更低的延迟。为提升整个系统效率和GPU(图形处理器)利用率,DeepSeek尽可能地为每个GPU分配均衡的计算负载、通信负载。

36a990de-d093-43a1-b3f0-c1388b6f5b4d.png

图片来源:知乎

值得注意的是,DeepSeek在该文章中还披露了其成本和利润等关键信息。

文章提到,DeepSeek-V3和DeepSeek-R1的所有服务均使用H800 GPU,由于白天服务负荷高,晚上服务负荷低,DeepSeek在白天负荷高的时候用所有节点部署推理服务,晚上负荷低的时候减少推理节点。

图片来源:知乎

在2月27日至2月28日的24小时里,DeepSeek-V3和DeepSeek-R1推理服务占用节点总和,峰值占用278个节点,平均占用226.75个节点(每个节点为8个H800 GPU)。假定GPU租赁成本为2美元/小时,总成本为87072美元/天。

若所有tokens的输入和输出全部按照DeepSeek-R1的定价计算,理论上DeepSeek一天的总收入为562027美元,成本利润率高达545%。不过,由于DeepSeek-V3定价低于DeepSeek-R1,且网页端和应用程序免费,仅部分服务产生收入,再加上非高峰时段设有夜间折扣,其实际收入不及理论数值。

图片来源:知乎

据了解,“DeepSeek开源周”自2月24日启动,在此期间,DeepSeek陆续开源了众多最新技术进展,包括FlashMLA、DeepEP、DeepGEMM和3FS四个开源项目以及DualPipe、EPLB等代码库。这些开源成果在业内引发了热烈讨论。

中证网声明:凡本网注明“来源:中国证券报·中证网”的所有作品,版权均属于中国证券报、中证网。中国证券报·中证网与作品作者联合声明,任何组织未经中国证券报、中证网以及作者书面授权不得转载、摘编或利用其它方式使用上述作品。
中证金牛座
更多精彩内容,请打开APP阅读
立即打开