360智脑开放平台

让企业用 AI,像用水电一样简单

更多链接
模型广场控制台API Keys用量查询文档
360智脑开放平台. 保留所有权利|隐私政策|服务条款
360智脑开放平台
360智脑开放平台
  • 模型广场
  • API 文档
  • Playground
G

z-ai/glm-5

在线对话
智谱

发布时间

2026/2/12

模型系列

GLM

输入模态

输出模态

上下文窗口

128,000

最大输出长度

2,048

输入价格

¥4 / 1M tokens

输出价格

¥18 / 1M tokens

GLM-5 是面向 Coding 与 Agent 场景的新一代大模型,在复杂系统工程与长程任务中达到开源 SOTA,真实编程体验逼近 Claude Opus 级别;基于 744B 新基座、异步强化学习与稀疏注意力,实现从“写代码”到“写工程”的全面升级。

z-ai/glm-5的供应商

智脑 API 根据调度策略向最合适的供应商发起请求,并自动回退至可用性最高的供应商。

h
huaweicloud
国内

首字延迟

5.12s

吞吐量

19.24tps

可用性

100.00%

供应商模型名

huaweicloud/z-ai/glm-5

支持的参数

temperaturetop_ptop_k

近期可用性

6月3日 11 PM100.00%
6月1日 7 PM: 100.00%6月1日 7 PM: 100.00%6月1日 8 PM: 100.00%6月1日 8 PM: 100.00%6月1日 9 PM: 99.63%6月1日 9 PM: 99.44%6月1日 10 PM: 91.43%6月1日 10 PM: 86.93%6月1日 11 PM: 84.14%6月1日 11 PM: 98.22%6月2日 8 AM: 100.00%6月2日 9 AM: 100.00%6月2日 9 AM: 99.82%6月2日 10 AM: 100.00%6月2日 10 AM: 99.05%6月2日 11 AM: 95.42%6月2日 11 AM: 93.44%6月2日 12 PM: 99.61%6月2日 12 PM: 100.00%6月2日 1 PM: 100.00%6月2日 1 PM: 99.35%6月2日 2 PM: 100.00%6月2日 2 PM: 99.79%6月2日 3 PM: 100.00%6月2日 3 PM: 99.47%6月2日 4 PM: 99.25%6月2日 4 PM: 99.66%6月2日 5 PM: 100.00%6月2日 5 PM: 100.00%6月2日 6 PM: 100.00%6月2日 6 PM: 97.27%6月2日 7 PM: 100.00%暂无数据6月2日 8 PM: 99.65%6月2日 8 PM: 100.00%6月2日 9 PM: 99.28%6月2日 9 PM: 100.00%6月2日 10 PM: 99.54%6月2日 10 PM: 99.14%6月2日 11 PM: 100.00%6月2日 11 PM: 100.00%6月3日 8 AM: 100.00%6月3日 9 AM: 99.69%6月3日 9 AM: 100.00%6月3日 10 AM: 100.00%6月3日 10 AM: 99.86%6月3日 11 AM: 42.86%6月3日 11 AM: 75.00%6月3日 12 PM: 99.82%6月3日 12 PM: 100.00%6月3日 1 PM: 100.00%6月3日 1 PM: 100.00%6月3日 2 PM: 99.70%6月3日 2 PM: 100.00%6月3日 3 PM: 100.00%6月3日 3 PM: 99.49%6月3日 4 PM: 99.86%6月3日 4 PM: 99.55%6月3日 5 PM: 99.82%6月3日 5 PM: 100.00%6月3日 6 PM: 99.25%6月3日 6 PM: 99.50%6月3日 7 PM: 99.42%6月3日 7 PM: 98.95%6月3日 8 PM: 99.59%6月3日 8 PM: 99.26%6月3日 9 PM: 99.31%6月3日 9 PM: 99.83%6月3日 10 PM: 100.00%6月3日 10 PM: 99.52%6月3日 11 PM: 100.00%6月3日 11 PM: 100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

128,000

最大输出

2,048

输入价格

¥4 / 1M tokens

输出价格

¥18 / 1M tokens

z-ai/glm-5的性能

在智脑 API 上对比不同供应商的表现

吞吐量

30.03 tok/s

首字延迟

2.58 s

z-ai/glm-5的可用性

z-ai/glm-5的各供应商可用性

z-ai/glm-5示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "z-ai/glm-5",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);