360智脑开放平台
360智脑开放平台
  • 模型广场
  • API 文档
360智脑开放平台

让企业用 AI,像用水电一样简单

更多链接
模型广场控制台API Keys用量查询文档
© 2026 智脑API服务平台. 保留所有权利|隐私政策|服务条款
G

z-ai/glm-4.6v

在线对话
智谱

发布时间

2025/12/8

模型系列

GLM

输入模态

输出模态

上下文窗口

128,000

最大输出长度

2,048

输入价格

¥1 / 1M tokens

输出价格

¥3 / 1M tokens

GLM-4.6V 是 GLM 系列在多模态方向上的一次重要迭代,它将训练时上下文窗口提升到128k tokens,在视觉理解精度上达到同参数规模 SOTA,并首次在模型架构中将 Function Call(工具调用)能力原生融入视觉模型,打通从「视觉感知」到「可执行行动(Action)」的链路,为真实业务场景中的多模态 Agent 提供统一的技术底座。

z-ai/glm-4.6v的供应商

智脑 API 根据调度策略向最合适的供应商发起请求,并自动回退至可用性最高的供应商。

智
智谱
国内

首字延迟

51.14s

吞吐量

暂无数据

可用性

100.00%

供应商模型名

bigmodel/glm-4.6v

支持的参数

近期可用性

4月19日 1 PM100.00%
4月17日 11 AM: 66.67%4月17日 12 PM: 83.33%4月17日 12 PM: 50.00%4月17日 1 PM: 50.00%4月17日 1 PM: 100.00%4月17日 2 PM: 100.00%4月17日 2 PM: 100.00%4月17日 2 PM: 100.00%4月17日 3 PM: 66.67%4月17日 3 PM: 50.00%4月17日 4 PM: 100.00%4月17日 4 PM: 100.00%4月17日 4 PM: 100.00%4月17日 5 PM: 100.00%4月17日 5 PM: 100.00%4月17日 6 PM: 100.00%4月17日 6 PM: 100.00%4月17日 7 PM: 100.00%4月17日 7 PM: 100.00%4月17日 8 PM: 100.00%4月17日 8 PM: 100.00%4月17日 9 PM: 100.00%4月17日 9 PM: 100.00%4月17日 10 PM: 100.00%4月17日 10 PM: 100.00%4月17日 11 PM: 66.67%4月17日 11 PM: 100.00%4月18日 12 AM: 100.00%4月18日 8 AM: 100.00%4月18日 9 AM: 100.00%4月18日 9 AM: 100.00%4月18日 10 AM: 100.00%4月18日 10 AM: 100.00%4月18日 11 AM: 100.00%4月18日 11 AM: 100.00%4月18日 12 PM: 100.00%4月18日 12 PM: 100.00%4月18日 1 PM: 100.00%4月18日 1 PM: 100.00%4月18日 2 PM: 100.00%4月18日 2 PM: 100.00%4月18日 3 PM: 100.00%4月18日 3 PM: 100.00%4月18日 4 PM: 100.00%4月18日 4 PM: 100.00%4月18日 4 PM: 100.00%4月18日 5 PM: 100.00%4月18日 5 PM: 100.00%4月18日 6 PM: 100.00%4月18日 6 PM: 100.00%4月18日 7 PM: 100.00%4月18日 7 PM: 100.00%4月18日 8 PM: 50.00%4月18日 8 PM: 100.00%4月18日 9 PM: 100.00%4月18日 9 PM: 100.00%4月18日 10 PM: 100.00%4月18日 10 PM: 100.00%4月18日 11 PM: 100.00%4月18日 11 PM: 100.00%4月18日 11 PM: 100.00%4月19日 12 AM: 50.00%4月19日 8 AM: 100.00%4月19日 9 AM: 100.00%4月19日 9 AM: 100.00%4月19日 10 AM: 100.00%4月19日 10 AM: 100.00%4月19日 11 AM: 100.00%4月19日 11 AM: 100.00%4月19日 12 PM: 100.00%4月19日 12 PM: 100.00%4月19日 1 PM: 100.00%

推理

-

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

-

可用于蒸馏

-

上下文长度

128,000

最大输出

2,048

输入价格

¥1 / 1M tokens

输出价格

¥3 / 1M tokens

z-ai/glm-4.6v的性能

在智脑 API 上对比不同供应商的表现

吞吐量

6.00 tok/s

首字延迟

0.85 s

z-ai/glm-4.6v的可用性

z-ai/glm-4.6v的各供应商可用性

z-ai/glm-4.6v示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "z-ai/glm-4.6v",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);