智谱发布GLM-4.6模型,代码能力提升,适配寒武纪国产芯片
杨洁
中证金牛座
9月30日,智谱宣布GLM系列最新版本GLM-4.6上线,其代码能力较上一版本GLM-4.5提升27%。智谱表示,该模型在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面实现全面提升。目前GLM-4.6已上线智谱MaaS平台bigmodel.cn,即将在Hugging Face、ModelScope开源,遵循MIT协议。此外,在平均token消耗方面,该模型比GLM-4.5节省30%以上。
智谱介绍,GLM-4.6已在寒武纪国产芯片上实现FP8+Int4混合量化部署,在保持精度不变的前提下,大幅降低推理成本,为国产芯片在大模型本地化运行上开创了可行路径。此外,基于vLLM推理框架部署,摩尔线程新一代GPU可基于原生FP8精度稳定运行GLM-4.6。GLM-4.6和寒武纪、摩尔线程国产芯片的组合,即将通过智谱MaaS平台正式面向大众和企业提供服务。未来,国产原创GLM大模型与国产芯片将联合推动在模型训练和推理环节的性能与效率优化。