deepseek-r1

在线对话

发布时间

模型系列

输入模态

输出模态

上下文窗口

128,000

最大输出长度

31,000

输入价格

¥4 / 1M tokens

输出价格

¥16 / 1M tokens

【360在阿里云部署版】DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。

deepseek-r1的供应商

智脑 API 根据调度策略向最合适的供应商发起请求，并自动回退至可用性最高的供应商。

360智脑

国内

首字延迟

暂无数据

吞吐量

暂无数据

可用性

暂无数据

供应商模型名

360/huaweicloud-deepseek-r1

支持的参数

近期可用性

7月16日 9 PM暂无数据

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

31,000

输入价格

¥4 / 1M tokens

输出价格

¥16 / 1M tokens

360智脑

国内

首字延迟

1.41s

吞吐量

26.21tps

可用性

96.00%

供应商模型名

360/huaweiyun-deepseek-r1

支持的参数

近期可用性

7月19日 9 PM96.20%

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

31,000

输入价格

¥4 / 1M tokens

输出价格

¥16 / 1M tokens

huaweicloud

国内

首字延迟

1.86s

吞吐量

25.53tps

可用性

100.00%

供应商模型名

huaweicloud/deepseek-r1

支持的参数

temperaturetop_ptop_k

近期可用性

7月19日 9 PM100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

65,536

最大输出

31,000

输入价格

¥2 / 1M tokens

输出价格

¥8 / 1M tokens

paratera并行科技

国内

首字延迟

5.73s

吞吐量

25.91tps

可用性

100.00%

供应商模型名

paratera/deepseek-r1

支持的参数

近期可用性

7月19日 9 PM100.00%

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

31,000

输入价格

¥4 / 1M tokens

输出价格

¥16 / 1M tokens

七

七牛云

国内

首字延迟

1.79s

吞吐量

62.09tps

可用性

暂无数据

供应商模型名

qiniu/deepseek-r1

支持的参数

temperaturetop_ptop_k

近期可用性

7月16日 9 PM暂无数据

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

65,536

最大输出

8,096

输入价格

¥4 / 1M tokens

输出价格

¥16 / 1M tokens

火

火山引擎

国内

首字延迟

暂无数据

吞吐量

5.50tps

可用性

暂无数据

供应商模型名

volcengine/deepseek-r1

支持的参数

近期可用性

7月19日 5 PM

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

8,096

输入价格

¥4 / 1M tokens

输出价格

¥16 / 1M tokens

百

百度文心

国内

首字延迟

暂无数据

吞吐量

12.80tps

可用性

暂无数据

供应商模型名

baidu/deepseek-r1-250528

支持的参数

近期可用性

7月18日 9 PM

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

8,096

输入价格

¥2 / 1M tokens

输出价格

¥8 / 1M tokens

算

算能SophNet

国内

首字延迟

0.09s

吞吐量

24.35tps

可用性

100.00%

供应商模型名

sophnet/deepseek-r1

支持的参数

近期可用性

7月16日 9 PM暂无数据

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

4,096

最大输出

2,048

输入价格

¥4 / 1M tokens

输出价格

¥16 / 1M tokens

贵

贵州移动

国内

首字延迟

暂无数据

吞吐量

暂无数据

可用性

暂无数据

供应商模型名

guizhoumobile/deepseek-r1

支持的参数

近期可用性

7月16日 9 PM暂无数据

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

8,096

输入价格

¥4 / 1M tokens

输出价格

¥16 / 1M tokens

deepseek-r1的性能

在智脑 API 上对比不同供应商的表现

吞吐量

26.90 tok/s

首字延迟

1.43 s

deepseek-r1的可用性

deepseek-r1的各供应商可用性

deepseek-r1示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

查看完整文档

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "deepseek-r1",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);

deepseek-r1

在线对话

发布时间

模型系列

输入模态

输出模态

上下文窗口

128,000

最大输出长度

31,000

输入价格

¥4 / 1M tokens

输出价格

¥16 / 1M tokens

deepseek-r1的供应商

智脑 API 根据调度策略向最合适的供应商发起请求，并自动回退至可用性最高的供应商。

360智脑

国内

首字延迟

暂无数据

吞吐量

暂无数据

可用性

暂无数据

供应商模型名

360/huaweicloud-deepseek-r1

支持的参数

近期可用性

7月16日 9 PM暂无数据

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

31,000

输入价格

¥4 / 1M tokens

输出价格

¥16 / 1M tokens

360智脑

国内

首字延迟

1.41s

吞吐量

26.21tps

可用性

96.00%

供应商模型名

360/huaweiyun-deepseek-r1

支持的参数

近期可用性

7月19日 9 PM96.20%

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

31,000

输入价格

¥4 / 1M tokens

输出价格

¥16 / 1M tokens

huaweicloud

国内

首字延迟

1.86s

吞吐量

25.53tps

可用性

100.00%

供应商模型名

huaweicloud/deepseek-r1

支持的参数

temperaturetop_ptop_k

近期可用性

7月19日 9 PM100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

65,536

最大输出

31,000

输入价格

¥2 / 1M tokens

输出价格

¥8 / 1M tokens

paratera并行科技

国内

首字延迟

5.73s

吞吐量

25.91tps

可用性

100.00%

供应商模型名

paratera/deepseek-r1

支持的参数

近期可用性

7月19日 9 PM100.00%

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

31,000

输入价格

¥4 / 1M tokens

输出价格

¥16 / 1M tokens

七

七牛云

国内

首字延迟

1.79s

吞吐量

62.09tps

可用性

暂无数据

供应商模型名

qiniu/deepseek-r1

支持的参数

temperaturetop_ptop_k

近期可用性

7月16日 9 PM暂无数据

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

65,536

最大输出

8,096

输入价格

¥4 / 1M tokens

输出价格

¥16 / 1M tokens

火

火山引擎

国内

首字延迟

暂无数据

吞吐量

5.50tps

可用性

暂无数据

供应商模型名

volcengine/deepseek-r1

支持的参数

近期可用性

7月19日 5 PM

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

8,096

输入价格

¥4 / 1M tokens

输出价格

¥16 / 1M tokens

百

百度文心

国内

首字延迟

暂无数据

吞吐量

12.80tps

可用性

暂无数据

供应商模型名

baidu/deepseek-r1-250528

支持的参数

近期可用性

7月18日 9 PM

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

8,096

输入价格

¥2 / 1M tokens

输出价格

¥8 / 1M tokens

算

算能SophNet

国内

首字延迟

0.09s

吞吐量

24.35tps

可用性

100.00%

供应商模型名

sophnet/deepseek-r1

支持的参数

近期可用性

7月16日 9 PM暂无数据

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

4,096

最大输出

2,048

输入价格

¥4 / 1M tokens

输出价格

¥16 / 1M tokens

贵

贵州移动

国内

首字延迟

暂无数据

吞吐量

暂无数据

可用性

暂无数据

供应商模型名

guizhoumobile/deepseek-r1

支持的参数

近期可用性

7月16日 9 PM暂无数据

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

65,536

最大输出

8,096

输入价格

¥4 / 1M tokens

输出价格

¥16 / 1M tokens

deepseek-r1的性能

在智脑 API 上对比不同供应商的表现

吞吐量

26.90 tok/s

首字延迟

1.43 s

deepseek-r1的可用性

deepseek-r1的各供应商可用性

deepseek-r1示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

查看完整文档

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "deepseek-r1",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);