SmartBrain API

Enterprise AI as Simple as Utilities

More Links
Model HubConsoleAPI KeysUsage QueryDocs
SmartBrain API. All rights reserved|Privacy Policy|Terms
SmartBrain API
SmartBrain API
  • Model Hub
  • API Docs
  • Playground
G

z-ai/glm-4.6v

Online Chat
智谱

Publish time

2025/12/8

Model Series

GLM

Input type

Output type

Context Window

128,000

Max Output Length

2,048

Input Price

¥1 / 1M tokens

Output Price

¥3 / 1M tokens

GLM-4.6V 是 GLM 系列在多模态方向上的一次重要迭代,它将训练时上下文窗口提升到128k tokens,在视觉理解精度上达到同参数规模 SOTA,并首次在模型架构中将 Function Call(工具调用)能力原生融入视觉模型,打通从「视觉感知」到「可执行行动(Action)」的链路,为真实业务场景中的多模态 Agent 提供统一的技术底座。

Providers for z-ai/glm-4.6v

Zhinao API routes requests to the best-fit provider and automatically fails over to the one with highest availability.

智
智谱
国内

TTFT

14.16s

Throughput

3.67tps

Uptime

100.00%

Provider Model

bigmodel/glm-4.6v

Supported Parameters

Recent Uptime

5月14日 11 PM100.00%
5月12日 6 PM: 100.00%5月12日 7 PM: 100.00%5月12日 7 PM: 33.33%5月12日 8 PM: 100.00%5月12日 8 PM: 100.00%5月12日 9 PM: 100.00%5月12日 9 PM: 100.00%5月12日 10 PM: 100.00%5月12日 10 PM: 100.00%5月12日 11 PM: 100.00%5月12日 11 PM: 100.00%5月13日 8 AM: 100.00%5月13日 9 AM: 100.00%5月13日 9 AM: 100.00%5月13日 10 AM: 100.00%5月13日 10 AM: 100.00%5月13日 11 AM: 100.00%5月13日 11 AM: 100.00%5月13日 12 PM: 66.67%5月13日 12 PM: 100.00%5月13日 1 PM: 100.00%5月13日 1 PM: 100.00%5月13日 2 PM: 66.67%5月13日 2 PM: 66.67%5月13日 3 PM: 100.00%5月13日 3 PM: 100.00%5月13日 4 PM: 100.00%5月13日 4 PM: 88.89%5月13日 5 PM: 100.00%5月13日 5 PM: 100.00%5月13日 6 PM: 100.00%5月13日 6 PM: 100.00%5月13日 7 PM: 100.00%5月13日 7 PM: 100.00%5月13日 8 PM: 100.00%5月13日 8 PM: 100.00%5月13日 9 PM: 100.00%5月13日 9 PM: 66.67%5月13日 10 PM: 100.00%5月13日 10 PM: 100.00%5月13日 11 PM: 100.00%5月13日 11 PM: 100.00%5月14日 8 AM: 100.00%5月14日 9 AM: 100.00%5月14日 9 AM: 100.00%5月14日 10 AM: 100.00%5月14日 10 AM: 100.00%5月14日 11 AM: 100.00%5月14日 11 AM: 100.00%5月14日 12 PM: 100.00%5月14日 12 PM: 100.00%5月14日 1 PM: 100.00%5月14日 1 PM: 100.00%5月14日 2 PM: 100.00%5月14日 2 PM: 100.00%5月14日 3 PM: 100.00%5月14日 4 PM: 100.00%5月14日 4 PM: 100.00%5月14日 5 PM: 100.00%5月14日 5 PM: 100.00%5月14日 6 PM: 100.00%5月14日 6 PM: 100.00%5月14日 7 PM: 100.00%5月14日 7 PM: 100.00%5月14日 8 PM: 100.00%5月14日 8 PM: 100.00%5月14日 9 PM: 100.00%5月14日 9 PM: 100.00%5月14日 10 PM: 100.00%5月14日 10 PM: 100.00%5月14日 11 PM: 83.33%5月14日 11 PM: 100.00%

Reasoning

-

Supported Response Formats

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

Request Log Collection

-

Distillable

-

Total Context

128,000

Max Output

2,048

Input Price

¥1 / 1M tokens

Output Price

¥3 / 1M tokens

Performance for z-ai/glm-4.6v

Compare different providers across Zhinao API

Throughput

25.00 tok/s

TTFT

1.01 s

Uptime for z-ai/glm-4.6v

Uptime for z-ai/glm-4.6v across all providers

Sample code and API for z-ai/glm-4.6v

Get API Key

Zhinao API normalizes requests and responses across providers for you

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "z-ai/glm-4.6v",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);