360zhinao-pro-qwen-plus

在线对话

发布时间

模型系列

输入模态

输出模态

上下文窗口

65,536

最大输出长度

31,000

输入价格

¥4 / 1M tokens

输出价格

¥16 / 1M tokens

【360zhinao-pro-qwen-plus】基于 360zhinao-pro 和 qwen-plus 的聚合虚拟模型，将在两者之间根据效果智能调度，确保能力最优，后台账单按照实际调用模型计费。

360zhinao-pro-qwen-plus的供应商

智脑 API 根据调度策略向最合适的供应商发起请求，并自动回退至可用性最高的供应商。

360智脑

国内

首字延迟

0.44s

吞吐量

26.24tps

可用性

100.00%

供应商模型名

360gpt-pro

支持的参数

近期可用性

7月19日 9 PM100.00%

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

32,192

最大输出

30,000

输入价格

¥2 / 1M tokens

输出价格

¥5 / 1M tokens

通

通义千问

国内

首字延迟

0.12s

吞吐量

6.69tps

可用性

100.00%

供应商模型名

aliyun/qwen-plus-latest

支持的参数

近期可用性

7月19日 9 PM100.00%

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

1,000,000

最大输出

32,768

输入价格

¥0.8 / 1M tokens

输出价格

¥2 / 1M tokens

360zhinao-pro-qwen-plus的性能

在智脑 API 上对比不同供应商的表现

吞吐量

14.42 tok/s

首字延迟

0.34 s

360zhinao-pro-qwen-plus的可用性

360zhinao-pro-qwen-plus的各供应商可用性

360zhinao-pro-qwen-plus示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

查看完整文档

当前模型可能不支持 OpenAI Chat Completions 协议，请注意

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "360zhinao-pro-qwen-plus",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);

360zhinao-pro-qwen-plus

在线对话

发布时间

模型系列

输入模态

输出模态

上下文窗口

65,536

最大输出长度

31,000

输入价格

¥4 / 1M tokens

输出价格

¥16 / 1M tokens

【360zhinao-pro-qwen-plus】基于 360zhinao-pro 和 qwen-plus 的聚合虚拟模型，将在两者之间根据效果智能调度，确保能力最优，后台账单按照实际调用模型计费。

360zhinao-pro-qwen-plus的供应商

智脑 API 根据调度策略向最合适的供应商发起请求，并自动回退至可用性最高的供应商。

360智脑

国内

首字延迟

0.44s

吞吐量

26.24tps

可用性

100.00%

供应商模型名

360gpt-pro

支持的参数

近期可用性

7月19日 9 PM100.00%

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

32,192

最大输出

30,000

输入价格

¥2 / 1M tokens

输出价格

¥5 / 1M tokens

通

通义千问

国内

首字延迟

0.12s

吞吐量

6.69tps

可用性

100.00%

供应商模型名

aliyun/qwen-plus-latest

支持的参数

近期可用性

7月19日 9 PM100.00%

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

1,000,000

最大输出

32,768

输入价格

¥0.8 / 1M tokens

输出价格

¥2 / 1M tokens

360zhinao-pro-qwen-plus的性能

在智脑 API 上对比不同供应商的表现

吞吐量

14.42 tok/s

首字延迟

0.34 s

360zhinao-pro-qwen-plus的可用性

360zhinao-pro-qwen-plus的各供应商可用性

360zhinao-pro-qwen-plus示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

查看完整文档

当前模型可能不支持 OpenAI Chat Completions 协议，请注意

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "360zhinao-pro-qwen-plus",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);