SmartBrain API

Enterprise AI as Simple as Utilities

More Links
Model HubConsoleAPI KeysUsage QueryDocs
SmartBrain API. All rights reserved|Privacy Policy|Terms
SmartBrain API
SmartBrain API
  • Model Hub
  • API Docs
  • Playground
G

z-ai/glm-5

Online Chat
智谱

Publish time

2026/2/12

Model Series

GLM

Input type

Output type

Context Window

128,000

Max Output Length

2,048

Input Price

¥4 / 1M tokens

Output Price

¥18 / 1M tokens

GLM-5 是面向 Coding 与 Agent 场景的新一代大模型,在复杂系统工程与长程任务中达到开源 SOTA,真实编程体验逼近 Claude Opus 级别;基于 744B 新基座、异步强化学习与稀疏注意力,实现从“写代码”到“写工程”的全面升级。

Providers for z-ai/glm-5

Zhinao API routes requests to the best-fit provider and automatically fails over to the one with highest availability.

h
huaweicloud
国内

TTFT

5.14s

Throughput

18.90tps

Uptime

97.00%

Provider Model

huaweicloud/z-ai/glm-5

Supported Parameters

temperaturetop_ptop_k

Recent Uptime

5月14日 11 PM96.62%
5月12日 6 PM: 99.67%5月12日 7 PM: 75.00%5月12日 7 PM: 100.00%5月12日 8 PM: 97.01%5月12日 8 PM: 100.00%5月12日 9 PM: 100.00%5月12日 9 PM: 100.00%5月12日 10 PM: 100.00%5月12日 10 PM: 98.05%5月12日 11 PM: 99.60%5月12日 11 PM: 100.00%5月13日 8 AM: 98.56%5月13日 9 AM: 99.03%5月13日 9 AM: 100.00%5月13日 10 AM: 98.78%5月13日 10 AM: 99.86%5月13日 11 AM: 100.00%5月13日 11 AM: 99.52%5月13日 12 PM: 99.18%5月13日 12 PM: 98.56%5月13日 1 PM: 99.61%5月13日 1 PM: 99.64%5月13日 2 PM: 100.00%5月13日 2 PM: 99.70%5月13日 3 PM: 98.00%5月13日 3 PM: 98.84%5月13日 4 PM: 98.52%5月13日 4 PM: 99.56%5月13日 5 PM: 99.69%5月13日 5 PM: 98.72%5月13日 6 PM: 100.00%5月13日 6 PM: 100.00%5月13日 7 PM: 100.00%5月13日 7 PM: 100.00%5月13日 8 PM: 97.80%5月13日 8 PM: 98.44%5月13日 9 PM: 100.00%5月13日 9 PM: 100.00%5月13日 10 PM: 100.00%5月13日 10 PM: 99.44%5月13日 11 PM: 98.93%5月13日 11 PM: 100.00%5月14日 8 AM: 99.49%5月14日 9 AM: 99.67%5月14日 9 AM: 99.76%5月14日 10 AM: 99.64%5月14日 10 AM: 99.59%5月14日 11 AM: 97.96%5月14日 11 AM: 99.83%5月14日 12 PM: 99.79%5月14日 12 PM: 100.00%5月14日 1 PM: 97.42%5月14日 1 PM: 100.00%5月14日 2 PM: 99.23%5月14日 2 PM: 99.18%5月14日 3 PM: 99.70%5月14日 4 PM: 99.60%5月14日 4 PM: 99.28%5月14日 5 PM: 99.35%5月14日 5 PM: 99.24%5月14日 6 PM: 99.13%5月14日 6 PM: 97.28%5月14日 7 PM: 98.08%5月14日 7 PM: 98.20%5月14日 8 PM: 98.02%5月14日 8 PM: 87.75%5月14日 9 PM: 84.69%5月14日 9 PM: 99.25%5月14日 10 PM: 98.86%5月14日 10 PM: 100.00%5月14日 11 PM: 100.00%5月14日 11 PM: 96.62%

Reasoning

Toggleable

Supported Response Formats

OpenAI Chat Completions

Request Log Collection

ZDR Supported

Distillable

Yes

Total Context

128,000

Max Output

2,048

Input Price

¥4 / 1M tokens

Output Price

¥18 / 1M tokens

Performance for z-ai/glm-5

Compare different providers across Zhinao API

Throughput

27.99 tok/s

TTFT

3.13 s

Uptime for z-ai/glm-5

Uptime for z-ai/glm-5 across all providers

Sample code and API for z-ai/glm-5

Get API Key

Zhinao API normalizes requests and responses across providers for you

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "z-ai/glm-5",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);