DeepSeek新消息,继续开源
2月21日中午,DeepSeek官方账号发布消息称,下周将开源5个代码库。
“我们是一个探索通用人工智能的小团队。从下周开始,我们将开源5个代码库,完全透明地分享我们虽小但诚挚的进展。这些在我们在线服务中不起眼的基础组件已经过记录、部署,并在实际应用中经受了考验。作为开源社区的一部分,我们相信分享的每一行代码都将汇聚成集体的动力,加速我们前进的征程。每日解锁即将到来。这里没有象牙塔,只有纯粹的创业精神和社区驱动的创新。”DeepSeek团队表示。
大模型正在以惊人的速度迭代。
2月18日,特斯拉首席执行官埃隆·马斯克在社交媒体的直播中发布了xAI开发的最新版大模型Grok-3,并表示将在数月后对Grok-3进行全面开源。xAI公司于2023年7月成立,半年后发布Grok和Grok-1.5模型,又在去年8月发布了Grok-2。据xAI介绍,Grok-3的性能超越了此前发布的所有大模型。
同样在2月18日,阶跃星辰宣布与吉利汽车集团联合开源了两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。
DeepSeek AI开源行动引领大模型开源新趋势,深刻影响行业发展。今年1月,DeepSeek发布推理模型DeepSeek-R1,以极低的训练成本和使用成本,超越OpenAI对标模型,搅动AI大模型竞争。
数据分析平台QuestMobil的最新数据显示,从上线以来至2月9日,DeepSeek App的累计下载量超1.1亿次,周活跃用户规模最高近9700万。
2月初,谷歌公司发布Gemini2.0系列模型,该系列模型强化了编码与推理能力,全面开放使用并降低成本。近日,OpenAI宣布,公司将在未来几个月内推出新一代人工智能模型GPT-5和GPT-4.5。此外,OpenAI还开源了一个全新评估大模型代码能力的测试基准——SWE-Lancer。人工智能初创企业Anthropic计划在未来几周内发布新的混合型大模型Claude 4,用户可以自行控制使用时的推理成本。
大模型开源趋势正逐渐成为行业发展的重要驱动力。开源使得更多人能够参与到模型的优化和创新中。通过共享代码,全球的开发者可以共同为人工智能的发展添砖加瓦,加速技术迭代。
机构分析认为,国产大模型开启了全球大模型开发和应用的新阶段,开源模型的高性价比和低训练成本极大地降低了大模型的投资、开发、运营成本,降低了融合应用的技术门槛,为千行百业智能化广泛落地提供了更多可能,包括端侧AI、聊天机器人、自动驾驶等在内“AI+X”有望带动传统行业和终端产品的升级浪潮。