360智脑开放平台

让企业用 AI,像用水电一样简单

更多链接
模型广场控制台API Keys用量查询文档
360智脑开放平台. 保留所有权利|隐私政策|服务条款
360智脑开放平台
360智脑开放平台
  • 模型广场
  • API 文档
  • Playground
千

alibaba/qwen-vl-max

在线对话
阿里巴巴

发布时间

2025/2/1

模型系列

千问

输入模态

输出模态

上下文窗口

131,072

最大输出长度

2,048

输入价格

¥3 / 1M tokens

输出价格

¥9 / 1M tokens

相比qwen-vl-plus再次提升视觉推理和指令遵循能力,在更多复杂任务中提供最佳性能。

alibaba/qwen-vl-max的供应商

智脑 API 根据调度策略向最合适的供应商发起请求,并自动回退至可用性最高的供应商。

通
通义千问
国内

首字延迟

0.41s

吞吐量

26.10tps

可用性

100.00%

供应商模型名

qwen-vl-max

支持的参数

近期可用性

5月10日 10 PM100.00%
5月8日 6 PM: 100.00%5月8日 7 PM: 99.93%5月8日 7 PM: 99.93%5月8日 8 PM: 100.00%5月8日 8 PM: 100.00%5月8日 9 PM: 100.00%5月8日 9 PM: 100.00%5月8日 10 PM: 100.00%5月8日 10 PM: 100.00%5月8日 11 PM: 100.00%5月8日 11 PM: 100.00%5月9日 8 AM: 100.00%5月9日 8 AM: 100.00%5月9日 9 AM: 100.00%5月9日 9 AM: 100.00%5月9日 10 AM: 100.00%5月9日 10 AM: 100.00%5月9日 11 AM: 100.00%5月9日 11 AM: 100.00%5月9日 12 PM: 100.00%5月9日 12 PM: 100.00%5月9日 1 PM: 100.00%5月9日 1 PM: 99.97%5月9日 2 PM: 100.00%5月9日 2 PM: 95.62%5月9日 3 PM: 100.00%5月9日 3 PM: 99.92%5月9日 4 PM: 100.00%5月9日 4 PM: 100.00%5月9日 5 PM: 99.95%5月9日 5 PM: 99.96%5月9日 6 PM: 100.00%5月9日 6 PM: 100.00%5月9日 7 PM: 100.00%5月9日 7 PM: 99.93%5月9日 8 PM: 100.00%5月9日 8 PM: 99.30%5月9日 9 PM: 100.00%5月9日 9 PM: 100.00%5月9日 10 PM: 100.00%5月9日 10 PM: 99.94%5月9日 11 PM: 100.00%5月9日 11 PM: 100.00%5月10日 8 AM: 100.00%5月10日 9 AM: 100.00%5月10日 9 AM: 100.00%5月10日 10 AM: 97.80%5月10日 10 AM: 98.21%5月10日 11 AM: 97.45%5月10日 11 AM: 100.00%5月10日 12 PM: 100.00%5月10日 12 PM: 100.00%5月10日 1 PM: 97.18%5月10日 1 PM: 96.00%5月10日 2 PM: 100.00%5月10日 2 PM: 100.00%5月10日 3 PM: 100.00%5月10日 3 PM: 100.00%5月10日 4 PM: 90.00%5月10日 4 PM: 40.97%5月10日 5 PM: 98.53%5月10日 5 PM: 99.21%5月10日 6 PM: 100.00%5月10日 6 PM: 100.00%5月10日 7 PM: 97.83%5月10日 7 PM: 100.00%5月10日 8 PM: 96.77%5月10日 8 PM: 100.00%5月10日 9 PM: 100.00%5月10日 9 PM: 100.00%5月10日 10 PM: 100.00%5月10日 10 PM: 100.00%

推理

-

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

-

可用于蒸馏

-

上下文长度

131,072

最大输出

2,048

输入价格

¥3 / 1M tokens

输出价格

¥9 / 1M tokens

alibaba/qwen-vl-max的性能

在智脑 API 上对比不同供应商的表现

吞吐量

14.11 tok/s

首字延迟

0.03 s

alibaba/qwen-vl-max的可用性

alibaba/qwen-vl-max的各供应商可用性

alibaba/qwen-vl-max示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "alibaba/qwen-vl-max",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);