智脑 API 根据调度策略向最合适的供应商发起请求,并自动回退至可用性最高的供应商。
首字延迟
暂无数据
吞吐量
暂无数据
可用性
暂无数据
供应商模型名
360/huaweicloud-deepseek-r1
支持的参数
近期可用性
推理
-
支持的响应格式
请求日志收集
-
可用于蒸馏
-
上下文长度
65,536
最大输出
31,000
输入价格
¥4 / 1M tokens
输出价格
¥16 / 1M tokens
首字延迟
暂无数据
吞吐量
26.97tps
可用性
100.00%
供应商模型名
360/huaweiyun-deepseek-r1
支持的参数
近期可用性
推理
-
支持的响应格式
请求日志收集
-
可用于蒸馏
-
上下文长度
65,536
最大输出
31,000
输入价格
¥4 / 1M tokens
输出价格
¥16 / 1M tokens
首字延迟
2.57s
吞吐量
22.52tps
可用性
100.00%
供应商模型名
huaweicloud/deepseek-r1
支持的参数
近期可用性
推理
-
支持的响应格式
请求日志收集
-
可用于蒸馏
-
上下文长度
65,536
最大输出
31,000
输入价格
¥2 / 1M tokens
输出价格
¥8 / 1M tokens
首字延迟
2.73s
吞吐量
22.09tps
可用性
99.00%
供应商模型名
paratera/deepseek-r1
支持的参数
近期可用性
推理
-
支持的响应格式
请求日志收集
-
可用于蒸馏
-
上下文长度
65,536
最大输出
31,000
输入价格
¥4 / 1M tokens
输出价格
¥16 / 1M tokens
首字延迟
4.21s
吞吐量
26.27tps
可用性
99.00%
供应商模型名
qiniu/deepseek-r1
支持的参数
近期可用性
推理
-
支持的响应格式
请求日志收集
-
可用于蒸馏
-
上下文长度
65,536
最大输出
8,096
输入价格
¥4 / 1M tokens
输出价格
¥16 / 1M tokens
首字延迟
3.70s
吞吐量
27.59tps
可用性
98.00%
供应商模型名
volcengine/deepseek-r1
支持的参数
近期可用性
推理
-
支持的响应格式
请求日志收集
-
可用于蒸馏
-
上下文长度
65,536
最大输出
8,096
输入价格
¥4 / 1M tokens
输出价格
¥16 / 1M tokens
首字延迟
3.81s
吞吐量
26.28tps
可用性
100.00%
供应商模型名
baidu/deepseek-r1-250528
支持的参数
近期可用性
推理
-
支持的响应格式
请求日志收集
-
可用于蒸馏
-
上下文长度
65,536
最大输出
8,096
输入价格
¥2 / 1M tokens
输出价格
¥8 / 1M tokens
首字延迟
3.22s
吞吐量
30.29tps
可用性
100.00%
供应商模型名
sophnet/deepseek-r1
支持的参数
近期可用性
推理
-
支持的响应格式
请求日志收集
-
可用于蒸馏
-
上下文长度
4,096
最大输出
2,048
输入价格
¥4 / 1M tokens
输出价格
¥16 / 1M tokens
首字延迟
暂无数据
吞吐量
暂无数据
可用性
暂无数据
供应商模型名
guizhoumobile/deepseek-r1
支持的参数
近期可用性
推理
-
支持的响应格式
请求日志收集
-
可用于蒸馏
-
上下文长度
65,536
最大输出
8,096
输入价格
¥4 / 1M tokens
输出价格
¥16 / 1M tokens
在智脑 API 上对比不同供应商的表现
29.14 tok/s
3.29 s
deepseek-r1的各供应商可用性
智脑 API 为您统一各供应商的请求与响应格式
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://api.360.cn/v1",
apiKey: process.env.ZHINAO_API_KEY,
});
const response = await client.chat.completions.create({
model: "deepseek-r1",
messages: [
{ role: "user", content: "Hello, how are you?" }
],
temperature: 0.7,
max_tokens: 1000,
});
console.log(response.choices[0].message.content);