360智脑开放平台
360智脑开放平台
  • 模型广场
  • API 文档
360智脑开放平台

让企业用 AI,像用水电一样简单

更多链接
模型广场控制台API Keys用量查询文档
© 2026 智脑API服务平台. 保留所有权利|隐私政策|服务条款
G

z-ai/glm-5.1

在线对话
智谱

发布时间

2026/4/8

模型系列

GLM

输入模态

输出模态

上下文窗口

200,000

最大输出长度

128,000

输入价格

¥6 / 1M tokens

输出价格

¥24 / 1M tokens

GLM-5.1 是智谱最新旗舰模型,代码能力大大增强,长程任务显著提升,能够在单次任务中持续、自主地工作长达 8 小时,完成从规划、执行到迭代优化的完整闭环,交付工程级成果。 在综合能力与 Coding 能力上,GLM-5.1 整体表现对齐 Claude Opus 4.6,并在长程自主执行、复杂工程优化与真实开发场景中展现出更强的持续工作能力,是构建 Autonomous Agent 与长程 Coding Agent 的理想基座。

z-ai/glm-5.1的供应商

智脑 API 根据调度策略向最合适的供应商发起请求,并自动回退至可用性最高的供应商。

h
huaweicloud
国内

首字延迟

8.68s

吞吐量

18.88tps

可用性

100.00%

供应商模型名

huaweicloud/z-ai/glm-5.1

支持的参数

temperaturetop_ptop_k

近期可用性

4月15日 11 PM100.00%
4月14日 9 AM: 100.00%4月14日 10 AM: 97.44%4月14日 10 AM: 100.00%4月14日 11 AM: 100.00%4月14日 11 AM: 100.00%4月14日 12 PM: 93.41%4月14日 12 PM: 89.23%4月14日 12 PM: 87.50%4月14日 12 PM: 94.68%4月14日 1 PM: 90.57%4月14日 1 PM: 92.19%4月14日 2 PM: 82.86%4月14日 2 PM: 92.92%4月14日 3 PM: 99.17%4月14日 3 PM: 100.00%4月14日 4 PM: 100.00%4月14日 4 PM: 100.00%4月14日 5 PM: 84.51%4月14日 5 PM: 98.69%4月14日 6 PM: 100.00%4月14日 6 PM: 100.00%4月14日 7 PM: 100.00%4月14日 7 PM: 99.07%4月14日 8 PM: 90.98%4月14日 8 PM: 100.00%4月14日 9 PM: 100.00%4月14日 9 PM: 100.00%4月14日 10 PM: 97.22%4月14日 10 PM: 100.00%4月14日 11 PM: 100.00%4月14日 11 PM: 96.30%4月15日 8 AM: 100.00%4月15日 8 AM: 100.00%4月15日 9 AM: 100.00%4月15日 9 AM: 100.00%4月15日 10 AM: 89.78%4月15日 10 AM: 66.67%4月15日 10 AM: 81.97%4月15日 10 AM: 100.00%4月15日 11 AM: 100.00%4月15日 11 AM: 87.39%4月15日 11 AM: 89.71%4月15日 12 PM: 67.39%4月15日 12 PM: 100.00%4月15日 1 PM: 67.57%4月15日 1 PM: 100.00%4月15日 2 PM: 100.00%4月15日 2 PM: 72.22%4月15日 3 PM: 75.69%4月15日 3 PM: 100.00%4月15日 3 PM: 89.29%4月15日 4 PM: 98.00%4月15日 4 PM: 100.00%4月15日 4 PM: 100.00%4月15日 5 PM: 100.00%4月15日 5 PM: 82.09%4月15日 6 PM: 100.00%4月15日 6 PM: 100.00%4月15日 6 PM: 100.00%4月15日 7 PM: 98.53%4月15日 7 PM: 95.08%4月15日 8 PM: 100.00%4月15日 8 PM: 97.96%4月15日 9 PM: 97.14%4月15日 9 PM: 100.00%4月15日 10 PM: 100.00%4月15日 10 PM: 81.82%4月15日 10 PM: 100.00%4月15日 10 PM: 100.00%4月15日 11 PM: 100.00%4月15日 11 PM: 100.00%4月15日 11 PM: 100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

200,000

最大输出

128,000

输入价格

¥6 / 1M tokens

输出价格

¥24 / 1M tokens

智
智谱
国内

首字延迟

8.68s

吞吐量

27.59tps

可用性

100.00%

供应商模型名

bigmodel/z-ai/glm-5.1

支持的参数

temperaturetop_ptop_k

近期可用性

4月15日 11 PM100.00%
4月14日 5 PM: 99.49%4月14日 6 PM: 100.00%4月14日 6 PM: 98.61%4月14日 6 PM: 100.00%4月14日 6 PM: 99.79%4月14日 7 PM: 100.00%4月14日 7 PM: 99.10%4月14日 7 PM: 100.00%4月14日 8 PM: 100.00%4月14日 8 PM: 95.74%4月14日 8 PM: 100.00%4月14日 8 PM: 100.00%4月14日 9 PM: 100.00%4月14日 9 PM: 100.00%4月14日 9 PM: 100.00%4月14日 9 PM: 100.00%4月14日 10 PM: 99.74%4月14日 10 PM: 100.00%4月14日 10 PM: 100.00%4月14日 11 PM: 100.00%4月14日 11 PM: 100.00%4月14日 11 PM: 98.55%4月15日 8 AM: 100.00%4月15日 8 AM: 100.00%4月15日 8 AM: 100.00%4月15日 9 AM: 100.00%4月15日 9 AM: 96.97%4月15日 10 AM: 100.00%4月15日 10 AM: 96.07%4月15日 10 AM: 100.00%4月15日 10 AM: 95.15%4月15日 11 AM: 100.00%4月15日 11 AM: 96.93%4月15日 11 AM: 98.06%4月15日 11 AM: 100.00%4月15日 12 PM: 92.68%4月15日 12 PM: 100.00%4月15日 12 PM: 99.16%4月15日 12 PM: 100.00%4月15日 1 PM: 92.93%4月15日 1 PM: 100.00%4月15日 2 PM: 100.00%4月15日 2 PM: 100.00%4月15日 2 PM: 94.03%4月15日 3 PM: 92.03%4月15日 3 PM: 100.00%4月15日 3 PM: 97.32%4月15日 4 PM: 100.00%4月15日 4 PM: 98.76%4月15日 4 PM: 97.84%4月15日 4 PM: 100.00%4月15日 5 PM: 99.04%4月15日 5 PM: 100.00%4月15日 5 PM: 95.89%4月15日 5 PM: 100.00%4月15日 6 PM: 100.00%4月15日 6 PM: 99.80%4月15日 6 PM: 100.00%4月15日 6 PM: 100.00%4月15日 7 PM: 100.00%4月15日 7 PM: 100.00%4月15日 7 PM: 100.00%4月15日 7 PM: 99.76%4月15日 8 PM: 100.00%4月15日 8 PM: 100.00%4月15日 8 PM: 99.51%4月15日 9 PM: 100.00%4月15日 9 PM: 100.00%4月15日 10 PM: 99.46%4月15日 10 PM: 98.86%4月15日 11 PM: 98.84%4月15日 11 PM: 100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

200,000

最大输出

128,000

输入价格

¥6 / 1M tokens

输出价格

¥24 / 1M tokens

z-ai/glm-5.1的性能

在智脑 API 上对比不同供应商的表现

吞吐量

25.51 tok/s

首字延迟

9.13 s

z-ai/glm-5.1的可用性

z-ai/glm-5.1的各供应商可用性

z-ai/glm-5.1示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "z-ai/glm-5.1",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);