qwen3-235b-a22b

在线对话

发布时间

模型系列

输入模态

输出模态

上下文窗口

65,536

最大输出长度

31,000

输入价格

¥2 / 1M tokens

输出价格

¥8 / 1M tokens

【虚拟模型名】qwen3 开源版模型默认开启思考模式，实现推理模式和非推理模式的有效融合，可在对话中切换模式。推理能力显著超过QwQ、通用能力显著超过Qwen2.5-72B-Instruct，达到同规模业界SOTA水平。

qwen3-235b-a22b的供应商

智脑 API 根据调度策略向最合适的供应商发起请求，并自动回退至可用性最高的供应商。

huaweicloud

国内

首字延迟

0.90s

吞吐量

26.94tps

可用性

100.00%

供应商模型名

huaweicloud/qwen3-235b-a22b

支持的参数

近期可用性

6月3日 11 PM100.00%

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

31,000

输入价格

¥2 / 1M tokens

输出价格

¥8 / 1M tokens

七

七牛云

国内

首字延迟

1.71s

吞吐量

19.09tps

可用性

99.00%

供应商模型名

qiniu/qwen3-235b-a22b

支持的参数

近期可用性

6月3日 11 PM99.38%

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

31,000

输入价格

¥2 / 1M tokens

输出价格

¥8 / 1M tokens

算

算能SophNet

国内

首字延迟

0.10s

吞吐量

12.99tps

可用性

100.00%

供应商模型名

sophnet/qwen3-235b-a22b

支持的参数

近期可用性

6月1日 2 AM暂无数据

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

31,000

输入价格

¥2 / 1M tokens

输出价格

¥8 / 1M tokens

通

通义千问

国内

首字延迟

1.51s

吞吐量

30.19tps

可用性

100.00%

供应商模型名

alibaba/qwen3-235b-a22b

支持的参数

近期可用性

6月3日 11 PM100.00%

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

16,384

输入价格

¥2 / 1M tokens

输出价格

¥20 / 1M tokens

qwen3-235b-a22b的性能

在智脑 API 上对比不同供应商的表现

吞吐量

21.17 tok/s

首字延迟

1.76 s

qwen3-235b-a22b的可用性

qwen3-235b-a22b的各供应商可用性

qwen3-235b-a22b示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "qwen3-235b-a22b",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);

qwen3-235b-a22b

在线对话

发布时间

模型系列

输入模态

输出模态

上下文窗口

65,536

最大输出长度

31,000

输入价格

¥2 / 1M tokens

输出价格

¥8 / 1M tokens

qwen3-235b-a22b的供应商

智脑 API 根据调度策略向最合适的供应商发起请求，并自动回退至可用性最高的供应商。

huaweicloud

国内

首字延迟

0.90s

吞吐量

26.94tps

可用性

100.00%

供应商模型名

huaweicloud/qwen3-235b-a22b

支持的参数

近期可用性

6月3日 11 PM100.00%

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

31,000

输入价格

¥2 / 1M tokens

输出价格

¥8 / 1M tokens

七

七牛云

国内

首字延迟

1.71s

吞吐量

19.09tps

可用性

99.00%

供应商模型名

qiniu/qwen3-235b-a22b

支持的参数

近期可用性

6月3日 11 PM99.38%

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

31,000

输入价格

¥2 / 1M tokens

输出价格

¥8 / 1M tokens

算

算能SophNet

国内

首字延迟

0.10s

吞吐量

12.99tps

可用性

100.00%

供应商模型名

sophnet/qwen3-235b-a22b

支持的参数

近期可用性

6月1日 2 AM暂无数据

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

31,000

输入价格

¥2 / 1M tokens

输出价格

¥8 / 1M tokens

通

通义千问

国内

首字延迟

1.51s

吞吐量

30.19tps

可用性

100.00%

供应商模型名

alibaba/qwen3-235b-a22b

支持的参数

近期可用性

6月3日 11 PM100.00%

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

16,384

输入价格

¥2 / 1M tokens

输出价格

¥20 / 1M tokens

qwen3-235b-a22b的性能

在智脑 API 上对比不同供应商的表现

吞吐量

21.17 tok/s

首字延迟

1.76 s

qwen3-235b-a22b的可用性

qwen3-235b-a22b的各供应商可用性

qwen3-235b-a22b示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "qwen3-235b-a22b",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);