金山云宣布其星流训推平台已全面接入智谱 GLM 系列推理模型,成为首批接入该系列推理模型的平台之一。这一举措标志着金山云在 AI 领域的进一步拓展,为用户提供更加高效、智能和更具性价比的模型服务。
智谱 GLM 系列推理模型是国产 AI 大模型独角兽智谱于日前正式开源的,涵盖基座、推理、沉思模型,均遵循 MIT 许可协议。其中,GLM-Z1-32B-0414是具有深度思考能力的推理模型,相较其32B 基座模型提升了数理能力和解决复杂任务的能力。在 AIME24/25、LiveCodeBench、GPQA 等基准测试中,GLM-Z1-32B-0414在数理推理能力、指令遵循能力和综合工具调用能力等方面表现突出。此外,智谱还训练了一个9B 的小尺寸模型,虽然参数量更少,但在数学推理及通用任务上依然表现优异。
金山云星流训推平台聚焦高效部署与分布式推理协同,提供从模型部署到调用的服务能力。通过智能任务调度与跨节点并行计算,该平台能够实现模型的高效推理。用户无需复杂配置,即可在公有云环境构建稳定、高性价比的模型服务。接入 GLM 系列推理模型后,金山云星流训推平台的部署流程更加简化,用户可以通过控制台创建资源池、进入模型在线服务导航页、新建模型在线服务,并自主配置服务副本数等基本信息、资源和网络配置,完成模型部署。部署完成后,用户可以选择内网、公网调用或在线调试等方式调用模型服务,也可以通过 WebUI 调用模型。
此前,金山云星流训推平台已完成 DeepSeek 等多款大模型部署。通过接入更多优质大模型,金山云将为各领域客户提供更加高效、智能和更具性价比的模型服务。这一举措不仅提升了金山云在 AI 领域的服务能力,也为开发者和企业用户提供了更多选择,推动了 AI 技术的广泛应用和发展。