deepseek/deepseek-v4-pro

在线对话

DeepSeek

通用长文本函数调用翻译代码数学RAG

发布时间

2026/4/24

模型系列

DeepSeek

输入模态

输出模态

上下文窗口

1,000,000

最大输出长度

384,000

输入价格

¥3 / 1M tokens

输出价格

¥6 / 1M tokens

DeepSeek-V4 拥有百万字超长上下文，在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。相比前代模型，DeepSeek-V4-Pro 的 Agent 能力显著增强。在 Agentic Coding 评测中，V4-Pro 已达到当前开源模型最佳水平，并在其他 Agent 相关评测中同样表现优异。

deepseek/deepseek-v4-pro的供应商

智脑 API 根据调度策略向最合适的供应商发起请求，并自动回退至可用性最高的供应商。

deepseek

国内

首字延迟

0.90s

吞吐量

36.59tps

可用性

99.00%

供应商模型名

deepseek/deepseek/deepseek-v4-pro

支持的参数

temperaturetop_ptop_k

近期可用性

6月4日 11 PM100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

1,000,000

最大输出

384,000

输入价格

¥3 / 1M tokens

输出价格

¥6 / 1M tokens

paratera并行科技

国内

首字延迟

9.03s

吞吐量

10.74tps

可用性

100.00%

供应商模型名

paratera/deepseek/deepseek-v4-pro

支持的参数

temperaturetop_ptop_k

近期可用性

6月4日 11 PM99.88%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

1,000,000

最大输出

384,000

输入价格

¥6.24 / 1M tokens

输出价格

¥12.48 / 1M tokens

国内

首字延迟

2.69s

吞吐量

29.93tps

可用性

99.00%

供应商模型名

st/deepseek/deepseek-v4-pro

支持的参数

temperaturetop_ptop_k

近期可用性

6月4日 11 PM98.60%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

1,000,000

最大输出

384,000

输入价格

¥9.6 / 1M tokens

输出价格

¥19.2 / 1M tokens

火

火山引擎

国内

首字延迟

9.61s

吞吐量

21.63tps

可用性

99.00%

供应商模型名

volcengine/deepseek/deepseek-v4-pro

支持的参数

temperaturetop_ptop_k

近期可用性

6月4日 11 PM99.37%

推理

可切换推理

支持的响应格式

OpenAI Chat CompletionsOpenAI Responses

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

1,000,000

最大输出

384,000

输入价格

¥12 / 1M tokens

输出价格

¥24 / 1M tokens

腾

腾讯混元

国内

首字延迟

1.15s

吞吐量

22.67tps

可用性

100.00%

供应商模型名

tencent/deepseek/deepseek-v4-pro

支持的参数

temperaturetop_ptop_k

近期可用性

6月4日 11 PM100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

1,000,000

最大输出

384,000

输入价格

¥3 / 1M tokens

输出价格

¥6 / 1M tokens

通

通义千问

国内

首字延迟

5.24s

吞吐量

30.67tps

可用性

100.00%

供应商模型名

alibaba/deepseek/deepseek-v4-pro

支持的参数

temperaturetop_ptop_k

近期可用性

6月4日 11 PM99.79%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

1,000,000

最大输出

384,000

输入价格

¥10.2 / 1M tokens

输出价格

¥20.4 / 1M tokens

deepseek/deepseek-v4-pro的性能

在智脑 API 上对比不同供应商的表现

吞吐量

27.56 tok/s

首字延迟

2.63 s

deepseek/deepseek-v4-pro的可用性

deepseek/deepseek-v4-pro的各供应商可用性

deepseek/deepseek-v4-pro示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "deepseek/deepseek-v4-pro",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);

deepseek/deepseek-v4-pro

在线对话

DeepSeek

通用长文本函数调用翻译代码数学RAG

发布时间

2026/4/24

模型系列

DeepSeek

输入模态

输出模态

上下文窗口

1,000,000

最大输出长度

384,000

输入价格

¥3 / 1M tokens

输出价格

¥6 / 1M tokens

deepseek/deepseek-v4-pro的供应商

智脑 API 根据调度策略向最合适的供应商发起请求，并自动回退至可用性最高的供应商。

deepseek

国内

首字延迟

0.90s

吞吐量

36.59tps

可用性

99.00%

供应商模型名

deepseek/deepseek/deepseek-v4-pro

支持的参数

temperaturetop_ptop_k

近期可用性

6月4日 11 PM100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

1,000,000

最大输出

384,000

输入价格

¥3 / 1M tokens

输出价格

¥6 / 1M tokens

paratera并行科技

国内

首字延迟

9.03s

吞吐量

10.74tps

可用性

100.00%

供应商模型名

paratera/deepseek/deepseek-v4-pro

支持的参数

temperaturetop_ptop_k

近期可用性

6月4日 11 PM99.88%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

1,000,000

最大输出

384,000

输入价格

¥6.24 / 1M tokens

输出价格

¥12.48 / 1M tokens

国内

首字延迟

2.69s

吞吐量

29.93tps

可用性

99.00%

供应商模型名

st/deepseek/deepseek-v4-pro

支持的参数

temperaturetop_ptop_k

近期可用性

6月4日 11 PM98.60%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

1,000,000

最大输出

384,000

输入价格

¥9.6 / 1M tokens

输出价格

¥19.2 / 1M tokens

火

火山引擎

国内

首字延迟

9.61s

吞吐量

21.63tps

可用性

99.00%

供应商模型名

volcengine/deepseek/deepseek-v4-pro

支持的参数

temperaturetop_ptop_k

近期可用性

6月4日 11 PM99.37%

推理

可切换推理

支持的响应格式

OpenAI Chat CompletionsOpenAI Responses

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

1,000,000

最大输出

384,000

输入价格

¥12 / 1M tokens

输出价格

¥24 / 1M tokens

腾

腾讯混元

国内

首字延迟

1.15s

吞吐量

22.67tps

可用性

100.00%

供应商模型名

tencent/deepseek/deepseek-v4-pro

支持的参数

temperaturetop_ptop_k

近期可用性

6月4日 11 PM100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

1,000,000

最大输出

384,000

输入价格

¥3 / 1M tokens

输出价格

¥6 / 1M tokens

通

通义千问

国内

首字延迟

5.24s

吞吐量

30.67tps

可用性

100.00%

供应商模型名

alibaba/deepseek/deepseek-v4-pro

支持的参数

temperaturetop_ptop_k

近期可用性

6月4日 11 PM99.79%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

1,000,000

最大输出

384,000

输入价格

¥10.2 / 1M tokens

输出价格

¥20.4 / 1M tokens

deepseek/deepseek-v4-pro的性能

在智脑 API 上对比不同供应商的表现

吞吐量

27.56 tok/s

首字延迟

2.63 s

deepseek/deepseek-v4-pro的可用性

deepseek/deepseek-v4-pro的各供应商可用性

deepseek/deepseek-v4-pro示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "deepseek/deepseek-v4-pro",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);