360智脑开放平台

让企业用 AI,像用水电一样简单

更多链接
模型广场控制台API Keys用量查询文档
360智脑开放平台. 保留所有权利|隐私政策|服务条款
360智脑开放平台
360智脑开放平台
  • 模型广场
  • API 文档
  • Playground
D

deepseek/deepseek-v4-flash

在线对话
DeepSeek
通用长文本函数调用翻译代码数学

发布时间

2026/4/24

模型系列

DeepSeek

输入模态

输出模态

上下文窗口

1,000,000

最大输出长度

384,000

输入价格

¥1 / 1M tokens

输出价格

¥2 / 1M tokens

DeepSeek-V4 拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。 相比 DeepSeek-V4-Pro,DeepSeek-V4-Flash 在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下 V4-Flash 能够提供更加快捷、经济的 API 服务。

deepseek/deepseek-v4-flash的供应商

智脑 API 根据调度策略向最合适的供应商发起请求,并自动回退至可用性最高的供应商。

d
deepseek
国内

首字延迟

0.24s

吞吐量

63.55tps

可用性

100.00%

供应商模型名

deepseek/deepseek/deepseek-v4-flash

支持的参数

temperaturetop_ptop_k

近期可用性

6月12日 8 AM100.00%
6月9日 9 PM: 98.75%6月9日 9 PM: 99.79%6月9日 10 PM: 99.38%6月9日 10 PM: 100.00%6月9日 11 PM: 100.00%6月9日 11 PM: 100.00%6月10日 8 AM: 100.00%6月10日 8 AM: 99.85%6月10日 9 AM: 99.96%6月10日 9 AM: 99.92%6月10日 10 AM: 99.97%6月10日 10 AM: 99.99%6月10日 11 AM: 99.87%6月10日 11 AM: 99.96%6月10日 12 PM: 99.92%6月10日 12 PM: 99.98%6月10日 1 PM: 99.61%6月10日 1 PM: 99.88%6月10日 2 PM: 100.00%6月10日 2 PM: 99.99%6月10日 3 PM: 99.93%6月10日 3 PM: 99.75%6月10日 4 PM: 99.89%6月10日 4 PM: 99.95%6月10日 5 PM: 100.00%6月10日 5 PM: 100.00%6月10日 6 PM: 99.36%6月10日 6 PM: 100.00%6月10日 7 PM: 100.00%6月10日 7 PM: 99.87%6月10日 8 PM: 100.00%6月10日 8 PM: 99.90%6月10日 9 PM: 100.00%6月10日 9 PM: 100.00%6月10日 10 PM: 100.00%6月10日 10 PM: 100.00%6月10日 11 PM: 100.00%6月10日 11 PM: 100.00%6月11日 8 AM: 100.00%6月11日 8 AM: 100.00%6月11日 9 AM: 99.98%6月11日 9 AM: 100.00%6月11日 10 AM: 99.98%6月11日 10 AM: 99.89%6月11日 11 AM: 99.97%6月11日 11 AM: 99.90%6月11日 12 PM: 99.97%6月11日 12 PM: 99.97%6月11日 1 PM: 100.00%6月11日 1 PM: 99.96%6月11日 2 PM: 100.00%6月11日 2 PM: 99.96%6月11日 3 PM: 99.96%6月11日 3 PM: 99.83%6月11日 4 PM: 99.94%6月11日 4 PM: 99.91%6月11日 5 PM: 99.90%6月11日 5 PM: 100.00%6月11日 6 PM: 98.33%6月11日 6 PM: 100.00%6月11日 7 PM: 98.25%6月11日 7 PM: 100.00%6月11日 8 PM: 100.00%6月11日 8 PM: 100.00%6月11日 9 PM: 100.00%6月11日 9 PM: 100.00%6月11日 10 PM: 100.00%6月11日 10 PM: 100.00%6月11日 11 PM: 100.00%6月11日 11 PM: 100.00%6月12日 8 AM: 100.00%6月12日 8 AM: 100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

1,000,000

最大输出

384,000

输入价格

¥1 / 1M tokens

输出价格

¥2 / 1M tokens

h
huaweicloud
国内

首字延迟

暂无数据

吞吐量

15.20tps

可用性

100.00%

供应商模型名

huaweicloud/deepseek/deepseek-v4-flash

支持的参数

temperaturetop_ptop_k

近期可用性

6月9日 8 AM暂无数据
暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

1,000,000

最大输出

384,000

输入价格

¥1 / 1M tokens

输出价格

¥2 / 1M tokens

s
st
国内

首字延迟

1.10s

吞吐量

52.11tps

可用性

100.00%

供应商模型名

st/deepseek/deepseek-v4-flash

支持的参数

temperaturetop_ptop_k

近期可用性

6月12日 8 AM99.95%
6月9日 9 PM: 99.19%6月9日 9 PM: 99.64%6月9日 10 PM: 98.22%6月9日 10 PM: 99.16%6月9日 11 PM: 99.88%6月9日 11 PM: 98.51%6月10日 8 AM: 100.00%6月10日 8 AM: 99.70%6月10日 9 AM: 99.83%6月10日 9 AM: 99.95%6月10日 10 AM: 98.62%6月10日 10 AM: 99.76%6月10日 11 AM: 98.47%6月10日 11 AM: 99.81%6月10日 12 PM: 99.33%6月10日 12 PM: 99.82%6月10日 1 PM: 98.68%6月10日 1 PM: 97.56%6月10日 2 PM: 99.97%6月10日 2 PM: 96.15%6月10日 3 PM: 99.05%6月10日 3 PM: 97.05%6月10日 4 PM: 99.67%6月10日 4 PM: 97.60%6月10日 5 PM: 99.87%6月10日 5 PM: 99.96%6月10日 6 PM: 99.74%6月10日 6 PM: 99.68%6月10日 7 PM: 99.47%6月10日 7 PM: 99.98%6月10日 8 PM: 99.95%6月10日 8 PM: 99.98%6月10日 9 PM: 99.91%6月10日 9 PM: 99.97%6月10日 10 PM: 99.98%6月10日 10 PM: 99.94%6月10日 11 PM: 99.87%6月10日 11 PM: 99.96%6月11日 8 AM: 100.00%6月11日 8 AM: 99.68%6月11日 9 AM: 99.89%6月11日 9 AM: 99.91%6月11日 10 AM: 99.72%6月11日 10 AM: 99.38%6月11日 11 AM: 99.46%6月11日 11 AM: 99.63%6月11日 12 PM: 97.57%6月11日 12 PM: 99.84%6月11日 1 PM: 99.56%6月11日 1 PM: 99.95%6月11日 2 PM: 99.80%6月11日 2 PM: 94.35%6月11日 3 PM: 98.98%6月11日 3 PM: 97.33%6月11日 4 PM: 99.77%6月11日 4 PM: 99.68%6月11日 5 PM: 97.90%6月11日 5 PM: 99.76%6月11日 6 PM: 99.87%6月11日 6 PM: 99.76%6月11日 7 PM: 82.54%6月11日 7 PM: 85.27%6月11日 8 PM: 88.45%6月11日 8 PM: 97.26%6月11日 9 PM: 99.89%6月11日 9 PM: 99.00%6月11日 10 PM: 98.96%6月11日 10 PM: 99.81%6月11日 11 PM: 99.78%6月11日 11 PM: 99.25%6月12日 8 AM: 100.00%6月12日 8 AM: 99.95%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

1,000,000

最大输出

384,000

输入价格

¥0.8 / 1M tokens

输出价格

¥1.6 / 1M tokens

腾
腾讯混元
国内

首字延迟

1.34s

吞吐量

27.45tps

可用性

100.00%

供应商模型名

tencent/deepseek/deepseek-v4-flash

支持的参数

temperaturetop_ptop_k

近期可用性

6月12日 8 AM100.00%
6月9日 7 PM: 100.00%6月9日 8 PM: 99.65%6月9日 8 PM: 100.00%6月9日 9 PM: 100.00%6月9日 9 PM: 100.00%6月9日 10 PM: 100.00%6月9日 10 PM: 100.00%6月9日 11 PM: 100.00%6月9日 11 PM: 100.00%6月10日 8 AM: 90.77%6月10日 9 AM: 100.00%6月10日 9 AM: 99.18%6月10日 10 AM: 100.00%6月10日 10 AM: 100.00%6月10日 11 AM: 100.00%6月10日 11 AM: 100.00%6月10日 12 PM: 99.82%6月10日 12 PM: 99.72%6月10日 1 PM: 88.56%6月10日 1 PM: 100.00%6月10日 2 PM: 100.00%6月10日 2 PM: 100.00%6月10日 3 PM: 100.00%6月10日 3 PM: 85.56%6月10日 4 PM: 86.87%6月10日 4 PM: 89.15%6月10日 5 PM: 46.11%6月10日 5 PM: 15.29%6月10日 6 PM: 69.67%6月10日 6 PM: 72.41%6月10日 7 PM: 84.40%6月10日 7 PM: 76.55%6月10日 8 PM: 70.82%6月10日 8 PM: 86.67%6月10日 9 PM: 91.11%6月10日 9 PM: 88.65%6月10日 10 PM: 91.21%6月10日 10 PM: 94.51%6月10日 11 PM: 100.00%6月10日 11 PM: 100.00%6月11日 8 AM: 100.00%6月11日 9 AM: 100.00%6月11日 9 AM: 99.75%6月11日 10 AM: 100.00%6月11日 10 AM: 99.88%6月11日 11 AM: 100.00%6月11日 11 AM: 100.00%6月11日 12 PM: 100.00%6月11日 12 PM: 100.00%6月11日 1 PM: 100.00%6月11日 1 PM: 100.00%6月11日 2 PM: 100.00%6月11日 2 PM: 100.00%6月11日 3 PM: 98.27%6月11日 3 PM: 99.76%6月11日 4 PM: 99.88%6月11日 4 PM: 100.00%6月11日 5 PM: 99.37%6月11日 5 PM: 99.73%6月11日 6 PM: 99.83%6月11日 6 PM: 99.68%6月11日 7 PM: 99.34%6月11日 7 PM: 100.00%6月11日 8 PM: 100.00%6月11日 8 PM: 100.00%6月11日 9 PM: 100.00%6月11日 9 PM: 99.75%6月11日 10 PM: 98.95%6月11日 10 PM: 100.00%6月11日 11 PM: 100.00%6月11日 11 PM: 100.00%6月12日 8 AM: 100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

1,000,000

最大输出

384,000

输入价格

¥1 / 1M tokens

输出价格

¥2 / 1M tokens

deepseek/deepseek-v4-flash的性能

在智脑 API 上对比不同供应商的表现

吞吐量

49.41 tok/s

首字延迟

1.11 s

deepseek/deepseek-v4-flash的可用性

deepseek/deepseek-v4-flash的各供应商可用性

deepseek/deepseek-v4-flash示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "deepseek/deepseek-v4-flash",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);