SmartBrain API

Enterprise AI as Simple as Utilities

More Links
Model HubConsoleAPI KeysUsage QueryDocs
SmartBrain API. All rights reserved|Privacy Policy|Terms
SmartBrain API
SmartBrain API
  • Model Hub
  • API Docs
  • Playground
D

deepseek/deepseek-v4-flash

Online Chat
DeepSeek
通用长文本函数调用翻译代码数学

Publish time

2026/4/24

Model Series

DeepSeek

Input type

Output type

Context Window

1,000,000

Max Output Length

384,000

Input Price

¥1 / 1M tokens

Output Price

¥2 / 1M tokens

DeepSeek-V4 拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。 相比 DeepSeek-V4-Pro,DeepSeek-V4-Flash 在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下 V4-Flash 能够提供更加快捷、经济的 API 服务。

Providers for deepseek/deepseek-v4-flash

Zhinao API routes requests to the best-fit provider and automatically fails over to the one with highest availability.

d
deepseek
国内

TTFT

0.86s

Throughput

52.30tps

Uptime

100.00%

Provider Model

deepseek/deepseek/deepseek-v4-flash

Supported Parameters

temperaturetop_ptop_k

Recent Uptime

5月14日 11 PM99.51%
5月12日 6 PM: 95.38%5月12日 7 PM: 99.12%5月12日 7 PM: 97.38%5月12日 8 PM: 93.81%5月12日 8 PM: 99.34%5月12日 9 PM: 100.00%5月12日 9 PM: 99.25%5月12日 10 PM: 99.79%5月12日 10 PM: 100.00%5月12日 11 PM: 99.54%5月12日 11 PM: 96.33%5月13日 8 AM: 68.43%5月13日 9 AM: 85.25%5月13日 9 AM: 99.57%5月13日 10 AM: 100.00%5月13日 10 AM: 100.00%5月13日 11 AM: 100.00%5月13日 11 AM: 99.96%5月13日 12 PM: 99.95%5月13日 12 PM: 100.00%5月13日 1 PM: 99.89%5月13日 1 PM: 98.90%5月13日 2 PM: 99.66%5月13日 2 PM: 100.00%5月13日 3 PM: 100.00%5月13日 3 PM: 100.00%5月13日 4 PM: 100.00%5月13日 4 PM: 97.20%5月13日 5 PM: 99.93%5月13日 5 PM: 93.22%5月13日 6 PM: 100.00%5月13日 6 PM: 98.61%5月13日 7 PM: 100.00%5月13日 7 PM: 99.61%5月13日 8 PM: 99.33%5月13日 8 PM: 99.48%5月13日 9 PM: 98.97%5月13日 9 PM: 99.43%5月13日 10 PM: 99.35%5月13日 10 PM: 78.88%5月13日 11 PM: 99.51%5月13日 11 PM: 99.57%5月14日 8 AM: 100.00%5月14日 9 AM: 100.00%5月14日 9 AM: 99.75%5月14日 10 AM: 100.00%5月14日 10 AM: 99.65%5月14日 11 AM: 99.69%5月14日 11 AM: 98.07%5月14日 12 PM: 98.02%5月14日 12 PM: 99.43%5月14日 1 PM: 99.08%5月14日 1 PM: 99.70%5月14日 2 PM: 95.41%5月14日 2 PM: 99.03%5月14日 3 PM: 98.99%5月14日 4 PM: 98.32%5月14日 4 PM: 98.91%5月14日 5 PM: 99.69%5月14日 5 PM: 98.51%5月14日 6 PM: 92.50%5月14日 6 PM: 99.39%5月14日 7 PM: 99.89%5月14日 7 PM: 99.27%5月14日 8 PM: 97.71%5月14日 8 PM: 99.89%5月14日 9 PM: 99.04%5月14日 9 PM: 100.00%5月14日 10 PM: 100.00%5月14日 10 PM: 99.46%5月14日 11 PM: 99.62%5月14日 11 PM: 99.51%

Reasoning

Toggleable

Supported Response Formats

OpenAI Chat Completions

Request Log Collection

ZDR Supported

Distillable

Yes

Total Context

1,000,000

Max Output

384,000

Input Price

¥1 / 1M tokens

Output Price

¥2 / 1M tokens

h
huaweicloud
国内

TTFT

17.87s

Throughput

22.10tps

Uptime

93.00%

Provider Model

huaweicloud/deepseek/deepseek-v4-flash

Supported Parameters

temperaturetop_ptop_k

Recent Uptime

5月12日 12 AMNo data
No dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo data

Reasoning

Toggleable

Supported Response Formats

OpenAI Chat Completions

Request Log Collection

ZDR Supported

Distillable

Yes

Total Context

1,000,000

Max Output

384,000

Input Price

¥1 / 1M tokens

Output Price

¥2 / 1M tokens

s
st
国内

TTFT

1.06s

Throughput

10.62tps

Uptime

100.00%

Provider Model

st/deepseek/deepseek-v4-flash

Supported Parameters

temperaturetop_ptop_k

Recent Uptime

5月14日 11 PM99.89%
No dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo dataNo data5月13日 6 PM: 96.43%5月13日 7 PM: 98.19%5月13日 7 PM: 99.52%5月13日 8 PM: 99.35%5月13日 8 PM: 99.91%5月13日 9 PM: 99.42%5月13日 9 PM: 99.80%5月13日 10 PM: 99.91%5月13日 10 PM: 100.00%5月13日 11 PM: 99.78%5月13日 11 PM: 99.93%5月14日 8 AM: 100.00%5月14日 8 AM: 100.00%5月14日 9 AM: 99.84%5月14日 9 AM: 99.83%5月14日 10 AM: 100.00%5月14日 10 AM: 99.56%5月14日 11 AM: 98.32%5月14日 11 AM: 92.94%5月14日 12 PM: 98.85%5月14日 12 PM: 96.68%5月14日 1 PM: 92.80%5月14日 1 PM: 99.08%5月14日 2 PM: 99.18%5月14日 2 PM: 92.22%5月14日 3 PM: 98.76%5月14日 4 PM: 99.78%5月14日 4 PM: 96.12%5月14日 5 PM: 97.49%5月14日 5 PM: 91.58%5月14日 6 PM: 94.21%5月14日 6 PM: 96.37%5月14日 7 PM: 98.14%5月14日 7 PM: 99.65%5月14日 8 PM: 96.64%5月14日 8 PM: 98.14%5月14日 9 PM: 98.25%5月14日 9 PM: 99.70%5月14日 10 PM: 99.80%5月14日 10 PM: 99.90%5月14日 11 PM: 99.78%5月14日 11 PM: 99.89%

Reasoning

Toggleable

Supported Response Formats

OpenAI Chat Completions

Request Log Collection

ZDR Supported

Distillable

Yes

Total Context

1,000,000

Max Output

384,000

Input Price

¥0.8 / 1M tokens

Output Price

¥1.6 / 1M tokens

Performance for deepseek/deepseek-v4-flash

Compare different providers across Zhinao API

Throughput

30.55 tok/s

TTFT

1.11 s

Uptime for deepseek/deepseek-v4-flash

Uptime for deepseek/deepseek-v4-flash across all providers

Sample code and API for deepseek/deepseek-v4-flash

Get API Key

Zhinao API normalizes requests and responses across providers for you

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "deepseek/deepseek-v4-flash",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);