中证网
返回首页

DeepSeek-V4预览版上线,​寒武纪宣布已适配

杨洁 中证金牛座

4月24日,DeepSeek全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。据介绍,DeepSeek-V4按照大小分为Pro和Flash两个版本,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。DeepSeek-V4还开创了一种全新的注意力机制,实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。DeepSeek宣布,从现在开始,1M(一百万)上下文将是DeepSeek所有官方服务的标配。

当天,国产AI芯片厂商寒武纪发文称,已基于vLLM推理框架完成对DeepSeek公司最新开源的两个版本模型285B DeepSeek-V4-flash和1.6T DeepSeek-V4-pro的Day 0适配,适配代码已开源到GitHub社区。寒武纪表示,这一成果得益于公司长期积累的自研NeuWare软件生态与芯片设计技术,也是寒武纪对芯片与算法联合创新持续投入的延续。

根据DeepSeek介绍,目前,DeepSeek API已同步上线V4-Pro与V4-Flash,并支持OpenAI ChatCompletions接口与Anthropic接口。不过,就目前API访问的价格而言,V4-Pro输出价格是V4-Flash的12倍。DeepSeek坦言,受限于高端算力,目前Pro版本的API访问服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。

这也说明了DeepSeek和国产芯片算力正携手合作优化模型表现并降低运行成本。市场方面,国产AI芯片股上涨。

中证网声明:凡本网注明“来源:中国证券报·中证网”的所有作品,版权均属于中国证券报、中证网。中国证券报·中证网与作品作者联合声明,任何组织未经中国证券报、中证网以及作者书面授权不得转载、摘编或利用其它方式使用上述作品。
中证金牛座
更多精彩内容,请打开APP阅读
立即打开