DeepSeek-V4预览版上线,寒武纪宣布已适配
杨洁
中证金牛座
4月24日,DeepSeek全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。据介绍,DeepSeek-V4按照大小分为Pro和Flash两个版本,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。DeepSeek-V4还开创了一种全新的注意力机制,实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。DeepSeek宣布,从现在开始,1M(一百万)上下文将是DeepSeek所有官方服务的标配。
当天,国产AI芯片厂商寒武纪发文称,已基于vLLM推理框架完成对DeepSeek公司最新开源的两个版本模型285B DeepSeek-V4-flash和1.6T DeepSeek-V4-pro的Day 0适配,适配代码已开源到GitHub社区。寒武纪表示,这一成果得益于公司长期积累的自研NeuWare软件生态与芯片设计技术,也是寒武纪对芯片与算法联合创新持续投入的延续。
根据DeepSeek介绍,目前,DeepSeek API已同步上线V4-Pro与V4-Flash,并支持OpenAI ChatCompletions接口与Anthropic接口。不过,就目前API访问的价格而言,V4-Pro输出价格是V4-Flash的12倍。DeepSeek坦言,受限于高端算力,目前Pro版本的API访问服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。
这也说明了DeepSeek和国产芯片算力正携手合作优化模型表现并降低运行成本。市场方面,国产AI芯片股上涨。