360智脑开放平台

让企业用 AI,像用水电一样简单

更多链接
模型广场控制台API Keys用量查询文档
360智脑开放平台. 保留所有权利|隐私政策|服务条款
360智脑开放平台
360智脑开放平台
  • 模型广场
  • API 文档
  • Playground

qwen3-32b

在线对话

发布时间

-

模型系列

输入模态

输出模态

上下文窗口

128,000

最大输出长度

31,000

输入价格

¥2 / 1M tokens

输出价格

¥20 / 1M tokens

实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力显著超过QwQ、通用能力显著超过Qwen2.5-32B-Instruct,达到同规模业界SOTA水平。

qwen3-32b的供应商

智脑 API 根据调度策略向最合适的供应商发起请求,并自动回退至可用性最高的供应商。

h
huaweicloud
国内

首字延迟

暂无数据

吞吐量

41.84tps

可用性

100.00%

供应商模型名

huaweicloud/qwen/qwen3-32b

支持的参数

temperaturetop_ptop_k

近期可用性

5月29日 9 PM100.00%
暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据5月27日 8 AM: 100.00%5月27日 9 AM: 100.00%5月27日 9 AM: 100.00%5月27日 10 AM: 100.00%5月27日 10 AM: 100.00%5月27日 11 AM: 100.00%5月27日 12 PM: 100.00%5月27日 1 PM: 100.00%5月27日 2 PM: 100.00%5月27日 3 PM: 100.00%5月27日 4 PM: 100.00%5月27日 5 PM: 100.00%5月27日 6 PM: 100.00%5月27日 6 PM: 100.00%5月27日 7 PM: 100.00%5月27日 8 PM: 50.00%暂无数据暂无数据5月28日 9 AM: 100.00%5月28日 10 AM: 100.00%5月28日 11 AM: 100.00%5月28日 12 PM: 100.00%5月28日 2 PM: 100.00%5月28日 3 PM: 100.00%5月28日 4 PM: 100.00%5月28日 5 PM: 100.00%5月28日 6 PM: 100.00%5月28日 6 PM: 100.00%5月28日 8 PM: 100.00%5月29日 10 AM: 100.00%5月29日 10 AM: 100.00%5月29日 12 PM: 100.00%5月29日 2 PM: 100.00%5月29日 3 PM: 100.00%5月29日 4 PM: 100.00%5月29日 5 PM: 100.00%5月29日 6 PM: 100.00%5月29日 6 PM: 100.00%5月29日 9 PM: 100.00%5月29日 9 PM: 100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

128,000

最大输出

8,000

输入价格

¥1.06 / 1M tokens

输出价格

¥10.6 / 1M tokens

七
七牛云
国内

首字延迟

0.01s

吞吐量

26.34tps

可用性

100.00%

供应商模型名

qiniu/qwen3-32b

支持的参数

近期可用性

5月29日 10 PM100.00%
5月27日 5 PM: 100.00%5月27日 6 PM: 100.00%5月27日 6 PM: 100.00%5月27日 7 PM: 100.00%5月27日 7 PM: 100.00%5月27日 8 PM: 100.00%5月27日 8 PM: 100.00%5月27日 9 PM: 100.00%5月27日 9 PM: 100.00%5月27日 10 PM: 100.00%5月27日 10 PM: 100.00%5月27日 11 PM: 100.00%5月27日 11 PM: 100.00%5月28日 8 AM: 100.00%5月28日 9 AM: 100.00%5月28日 9 AM: 100.00%5月28日 10 AM: 100.00%5月28日 10 AM: 100.00%5月28日 11 AM: 100.00%5月28日 11 AM: 100.00%5月28日 12 PM: 100.00%5月28日 12 PM: 100.00%5月28日 1 PM: 100.00%5月28日 1 PM: 100.00%5月28日 2 PM: 100.00%5月28日 2 PM: 100.00%5月28日 3 PM: 100.00%5月28日 3 PM: 100.00%5月28日 4 PM: 100.00%5月28日 4 PM: 100.00%5月28日 5 PM: 100.00%5月28日 5 PM: 100.00%5月28日 6 PM: 100.00%5月28日 6 PM: 100.00%5月28日 7 PM: 100.00%5月28日 7 PM: 100.00%5月28日 8 PM: 100.00%5月28日 8 PM: 100.00%5月28日 9 PM: 100.00%5月28日 9 PM: 100.00%5月28日 10 PM: 100.00%5月28日 10 PM: 100.00%5月28日 11 PM: 100.00%5月28日 11 PM: 100.00%5月29日 8 AM: 100.00%5月29日 9 AM: 100.00%5月29日 9 AM: 100.00%5月29日 10 AM: 100.00%5月29日 10 AM: 100.00%5月29日 11 AM: 100.00%5月29日 11 AM: 100.00%5月29日 12 PM: 100.00%5月29日 12 PM: 100.00%5月29日 1 PM: 100.00%5月29日 1 PM: 100.00%5月29日 2 PM: 100.00%5月29日 2 PM: 100.00%5月29日 3 PM: 100.00%5月29日 3 PM: 100.00%5月29日 4 PM: 100.00%5月29日 4 PM: 100.00%5月29日 5 PM: 100.00%5月29日 5 PM: 100.00%5月29日 6 PM: 100.00%5月29日 6 PM: 100.00%5月29日 7 PM: 100.00%5月29日 7 PM: 100.00%5月29日 8 PM: 100.00%5月29日 8 PM: 100.00%5月29日 9 PM: 100.00%5月29日 9 PM: 100.00%5月29日 10 PM: 100.00%

推理

-

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

-

可用于蒸馏

-

上下文长度

65,536

最大输出

31,000

输入价格

¥2 / 1M tokens

输出价格

¥20 / 1M tokens

通
通义千问
国内

首字延迟

0.04s

吞吐量

23.30tps

可用性

80.00%

供应商模型名

alibaba/qwen3-32b

支持的参数

近期可用性

5月29日 4 PM100.00%
暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据5月27日 10 AM: 100.00%暂无数据暂无数据暂无数据暂无数据5月27日 10 PM: 100.00%5月27日 11 PM: 100.00%5月27日 11 PM: 100.00%5月28日 1 PM: 100.00%暂无数据5月28日 4 PM: 100.00%5月28日 5 PM: 100.00%暂无数据5月28日 8 PM: 33.33%5月28日 9 PM: 100.00%5月28日 10 PM: 100.00%5月28日 11 PM: 100.00%5月28日 11 PM: 100.00%5月29日 2 PM: 100.00%5月29日 4 PM: 100.00%

推理

-

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

-

可用于蒸馏

-

上下文长度

65,536

最大输出

31,000

输入价格

¥2 / 1M tokens

输出价格

¥20 / 1M tokens

qwen3-32b的性能

在智脑 API 上对比不同供应商的表现

吞吐量

25.05 tok/s

首字延迟

0.03 s

qwen3-32b的可用性

qwen3-32b的各供应商可用性

qwen3-32b示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "qwen3-32b",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);