发布时间
2026/4/24模型系列
DeepSeek输入模态
输出模态
上下文窗口
1,000,000最大输出长度
384,000输入价格
¥3 / 1M tokens输出价格
¥6 / 1M tokensDeepSeek-V4 拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。 相比前代模型,DeepSeek-V4-Pro 的 Agent 能力显著增强。在 Agentic Coding 评测中,V4-Pro 已达到当前开源模型最佳水平,并在其他 Agent 相关评测中同样表现优异。
智脑 API 根据调度策略向最合适的供应商发起请求,并自动回退至可用性最高的供应商。
首字延迟
0.90s
吞吐量
36.59tps
可用性
99.00%
供应商模型名
deepseek/deepseek/deepseek-v4-pro
支持的参数
近期可用性
推理
可切换推理
支持的响应格式
请求日志收集
支持 ZDR
可用于蒸馏
是
上下文长度
1,000,000
最大输出
384,000
输入价格
¥3 / 1M tokens
输出价格
¥6 / 1M tokens
首字延迟
9.03s
吞吐量
10.74tps
可用性
100.00%
供应商模型名
paratera/deepseek/deepseek-v4-pro
支持的参数
近期可用性
推理
可切换推理
支持的响应格式
请求日志收集
支持 ZDR
可用于蒸馏
是
上下文长度
1,000,000
最大输出
384,000
输入价格
¥6.24 / 1M tokens
输出价格
¥12.48 / 1M tokens
首字延迟
2.69s
吞吐量
29.93tps
可用性
99.00%
供应商模型名
st/deepseek/deepseek-v4-pro
支持的参数
近期可用性
推理
可切换推理
支持的响应格式
请求日志收集
支持 ZDR
可用于蒸馏
是
上下文长度
1,000,000
最大输出
384,000
输入价格
¥9.6 / 1M tokens
输出价格
¥19.2 / 1M tokens
首字延迟
9.61s
吞吐量
21.63tps
可用性
99.00%
供应商模型名
volcengine/deepseek/deepseek-v4-pro
支持的参数
近期可用性
推理
可切换推理
支持的响应格式
请求日志收集
支持 ZDR
可用于蒸馏
是
上下文长度
1,000,000
最大输出
384,000
输入价格
¥12 / 1M tokens
输出价格
¥24 / 1M tokens
首字延迟
1.15s
吞吐量
22.67tps
可用性
100.00%
供应商模型名
tencent/deepseek/deepseek-v4-pro
支持的参数
近期可用性
推理
可切换推理
支持的响应格式
请求日志收集
支持 ZDR
可用于蒸馏
是
上下文长度
1,000,000
最大输出
384,000
输入价格
¥3 / 1M tokens
输出价格
¥6 / 1M tokens
首字延迟
5.24s
吞吐量
30.67tps
可用性
100.00%
供应商模型名
alibaba/deepseek/deepseek-v4-pro
支持的参数
近期可用性
推理
可切换推理
支持的响应格式
请求日志收集
支持 ZDR
可用于蒸馏
是
上下文长度
1,000,000
最大输出
384,000
输入价格
¥10.2 / 1M tokens
输出价格
¥20.4 / 1M tokens
在智脑 API 上对比不同供应商的表现
27.56 tok/s
2.63 s
deepseek/deepseek-v4-pro的各供应商可用性
智脑 API 为您统一各供应商的请求与响应格式
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://api.360.cn/v1",
apiKey: process.env.ZHINAO_API_KEY,
});
const response = await client.chat.completions.create({
model: "deepseek/deepseek-v4-pro",
messages: [
{ role: "user", content: "Hello, how are you?" }
],
temperature: 0.7,
max_tokens: 1000,
});
console.log(response.choices[0].message.content);