智脑API服务平台
智脑API服务平台
  • 模型广场
  • API 文档
智脑API服务平台

让企业用 AI,像用水电一样简单

更多链接
模型广场控制台API Keys用量查询文档
© 2026 智脑API服务平台. 保留所有权利。|ICP备案号|隐私政策|服务条款

z-ai/glm-5

在线对话

发布时间

-

模型系列

输入模态

输出模态

上下文窗口

204,800

最大输出长度

131,072

输入价格

¥0 / 1M tokens

输出价格

¥0 / 1M tokens

GLM-5 是面向 Coding 与 Agent 场景的新一代大模型,在复杂系统工程与长程任务中达到开源 SOTA,真实编程体验逼近 Claude Opus 级别;基于 744B 新基座、异步强化学习与稀疏注意力,实现从“写代码”到“写工程”的全面升级。

z-ai/glm-5的供应商

智脑 API 根据调度策略向最合适的供应商发起请求,并自动回退至可用性最高的供应商。

七
七牛云
国内

首字延迟

1.29s

吞吐量

18.57tps

可用性

99.00%

供应商模型名

qiniu/glm-5

支持的参数

tools
temperature
top_p
top_k
structured_outputs

近期可用性

3月4日 11 PM100.00%
3月3日 10 PM: 96.88%3月3日 10 PM: 99.42%3月3日 10 PM: 99.79%3月3日 10 PM: 100.00%3月3日 11 PM: 98.26%3月3日 11 PM: 93.24%3月3日 11 PM: 97.47%3月3日 11 PM: 94.59%3月4日 8 AM: 79.70%3月4日 8 AM: 100.00%3月4日 8 AM: 98.08%3月4日 8 AM: 78.21%3月4日 9 AM: 75.68%3月4日 9 AM: 98.78%3月4日 9 AM: 80.35%3月4日 9 AM: 97.78%3月4日 10 AM: 100.00%3月4日 10 AM: 83.49%3月4日 10 AM: 100.00%3月4日 10 AM: 88.31%3月4日 11 AM: 100.00%3月4日 11 AM: 86.71%3月4日 11 AM: 100.00%3月4日 11 AM: 89.04%3月4日 12 PM: 92.31%3月4日 12 PM: 100.00%3月4日 12 PM: 90.30%3月4日 12 PM: 100.00%3月4日 1 PM: 100.00%3月4日 1 PM: 95.76%3月4日 1 PM: 96.67%3月4日 1 PM: 100.00%3月4日 2 PM: 96.72%3月4日 2 PM: 100.00%3月4日 2 PM: 98.22%3月4日 2 PM: 100.00%3月4日 3 PM: 97.50%3月4日 3 PM: 100.00%3月4日 3 PM: 97.40%3月4日 3 PM: 98.67%3月4日 4 PM: 97.95%3月4日 4 PM: 88.10%3月4日 4 PM: 99.26%3月4日 4 PM: 98.33%3月4日 5 PM: 100.00%3月4日 5 PM: 96.69%3月4日 5 PM: 100.00%3月4日 5 PM: 97.98%3月4日 6 PM: 98.36%3月4日 6 PM: 100.00%3月4日 6 PM: 98.19%3月4日 6 PM: 98.86%3月4日 7 PM: 97.06%3月4日 7 PM: 100.00%3月4日 7 PM: 97.52%3月4日 7 PM: 97.44%3月4日 8 PM: 97.19%3月4日 8 PM: 100.00%3月4日 8 PM: 100.00%3月4日 8 PM: 98.14%3月4日 9 PM: 97.51%3月4日 9 PM: 100.00%3月4日 9 PM: 100.00%3月4日 9 PM: 98.51%3月4日 10 PM: 98.82%3月4日 10 PM: 100.00%3月4日 10 PM: 99.41%3月4日 10 PM: 100.00%3月4日 11 PM: 98.54%3月4日 11 PM: 100.00%3月4日 11 PM: 99.43%3月4日 11 PM: 100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

不支持 ZDR

可用于蒸馏

否

上下文长度

128,000

最大输出

2,048

输入价格

¥0 / 1M tokens

输出价格

¥0 / 1M tokens

智
智谱
国内

首字延迟

2.66s

吞吐量

16.17tps

可用性

100.00%

供应商模型名

bigmodel/glm-5

支持的参数

frequency_penalty
include_reasoning
logit_bias
logprobs
max_tokens
min_p
presence_penalty
reasoning
repetition_penalty
response_format
seed
stop
structured_outputs
temperature
tool_choice
tools
top_k
top_logprobs
top_p

近期可用性

3月4日 11 PM99.77%
3月3日 6 PM: 100.00%3月3日 7 PM: 99.88%3月3日 7 PM: 100.00%3月3日 7 PM: 99.71%3月3日 7 PM: 93.48%3月3日 8 PM: 100.00%3月3日 8 PM: 99.57%3月3日 8 PM: 100.00%3月3日 8 PM: 100.00%3月3日 9 PM: 100.00%3月3日 9 PM: 98.67%3月3日 9 PM: 100.00%3月3日 9 PM: 99.74%3月3日 10 PM: 98.15%3月3日 10 PM: 100.00%3月3日 10 PM: 98.62%3月3日 11 PM: 99.04%3月3日 11 PM: 98.78%3月4日 8 AM: 99.55%3月4日 8 AM: 99.57%3月4日 9 AM: 99.62%3月4日 9 AM: 100.00%3月4日 9 AM: 98.87%3月4日 9 AM: 100.00%3月4日 10 AM: 99.27%3月4日 10 AM: 100.00%3月4日 10 AM: 99.55%3月4日 10 AM: 100.00%3月4日 11 AM: 98.67%3月4日 11 AM: 100.00%3月4日 11 AM: 99.53%3月4日 11 AM: 100.00%3月4日 12 PM: 98.84%3月4日 12 PM: 98.41%3月4日 12 PM: 86.36%3月4日 12 PM: 99.42%3月4日 1 PM: 99.61%3月4日 1 PM: 99.61%3月4日 1 PM: 63.93%3月4日 2 PM: 99.55%3月4日 2 PM: 70.83%3月4日 2 PM: 98.77%3月4日 2 PM: 100.00%3月4日 3 PM: 98.70%3月4日 3 PM: 83.95%3月4日 3 PM: 48.78%3月4日 3 PM: 99.17%3月4日 4 PM: 98.48%3月4日 4 PM: 18.58%3月4日 4 PM: 98.80%3月4日 4 PM: 14.61%3月4日 5 PM: 46.15%3月4日 5 PM: 99.43%3月4日 5 PM: 25.84%3月4日 5 PM: 98.65%3月4日 6 PM: 100.00%3月4日 6 PM: 99.17%3月4日 6 PM: 98.79%3月4日 6 PM: 100.00%3月4日 7 PM: 73.91%3月4日 7 PM: 98.86%3月4日 7 PM: 52.63%3月4日 7 PM: 99.38%3月4日 8 PM: 99.37%3月4日 8 PM: 99.49%3月4日 9 PM: 98.97%3月4日 9 PM: 100.00%3月4日 9 PM: 99.12%3月4日 10 PM: 99.04%3月4日 10 PM: 99.65%3月4日 11 PM: 99.10%3月4日 11 PM: 99.77%

推理

-

支持的响应格式

OpenAI Chat Completions
OpenAI Responses
Anthropic Messages
Google VertexAI

请求日志收集

-

可用于蒸馏

-

上下文长度

128,000

最大输出

2,048

输入价格

¥0 / 1M tokens

输出价格

¥0 / 1M tokens

派
派欧云
国内

首字延迟

7.41s

吞吐量

24.15tps

可用性

98.00%

供应商模型名

ppinfra/glm-5

支持的参数

frequency_penalty
include_reasoning
logit_bias
logprobs
max_tokens
min_p
presence_penalty
reasoning
repetition_penalty
response_format
seed
stop
structured_outputs
temperature
tool_choice
tools
top_k
top_logprobs
top_p

近期可用性

3月4日 11 PM98.39%
3月3日 1 PM: 98.57%3月3日 1 PM: 100.00%3月3日 2 PM: 99.28%3月3日 2 PM: 100.00%3月3日 3 PM: 99.24%3月3日 3 PM: 99.64%3月3日 4 PM: 100.00%3月3日 4 PM: 100.00%3月3日 4 PM: 100.00%3月3日 4 PM: 99.21%3月3日 5 PM: 100.00%3月3日 5 PM: 100.00%3月3日 5 PM: 99.45%3月3日 6 PM: 100.00%3月3日 6 PM: 99.51%3月3日 6 PM: 100.00%3月3日 6 PM: 99.86%3月3日 7 PM: 100.00%3月3日 7 PM: 99.88%3月3日 7 PM: 99.62%3月3日 8 PM: 99.40%3月3日 8 PM: 99.34%3月3日 9 PM: 99.09%3月3日 9 PM: 99.60%3月3日 10 PM: 98.28%3月3日 10 PM: 99.55%3月3日 11 PM: 99.47%3月3日 11 PM: 98.14%3月4日 8 AM: 99.07%3月4日 8 AM: 97.96%3月4日 9 AM: 99.30%3月4日 9 AM: 100.00%3月4日 9 AM: 99.08%3月4日 10 AM: 97.37%3月4日 10 AM: 97.71%3月4日 11 AM: 100.00%3月4日 11 AM: 98.21%3月4日 11 AM: 96.29%3月4日 11 AM: 100.00%3月4日 12 PM: 98.94%3月4日 12 PM: 100.00%3月4日 12 PM: 100.00%3月4日 12 PM: 98.59%3月4日 1 PM: 98.58%3月4日 1 PM: 98.52%3月4日 2 PM: 97.89%3月4日 2 PM: 98.62%3月4日 2 PM: 100.00%3月4日 3 PM: 99.32%3月4日 3 PM: 100.00%3月4日 3 PM: 100.00%3月4日 3 PM: 98.96%3月4日 4 PM: 97.44%3月4日 4 PM: 99.55%3月4日 4 PM: 100.00%3月4日 4 PM: 99.10%3月4日 5 PM: 100.00%3月4日 5 PM: 99.48%3月4日 6 PM: 99.33%3月4日 6 PM: 99.54%3月4日 7 PM: 99.28%3月4日 7 PM: 98.94%3月4日 8 PM: 100.00%3月4日 8 PM: 99.48%3月4日 8 PM: 99.61%3月4日 8 PM: 100.00%3月4日 9 PM: 99.63%3月4日 9 PM: 99.17%3月4日 10 PM: 99.67%3月4日 10 PM: 99.68%3月4日 11 PM: 98.84%3月4日 11 PM: 98.39%

推理

-

支持的响应格式

OpenAI Chat Completions
OpenAI Responses
Anthropic Messages
Google VertexAI

请求日志收集

-

可用于蒸馏

-

上下文长度

128,000

最大输出

2,048

输入价格

¥0 / 1M tokens

输出价格

¥0 / 1M tokens

z-ai/glm-5的性能

在智脑 API 上对比不同供应商的表现

吞吐量

14.45 tok/s

首字延迟

2.66 s

z-ai/glm-5的可用性

z-ai/glm-5的各供应商可用性

z-ai/glm-5示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "z-ai/glm-5",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);