DeepSeek

https://www.deepseek.com/

共 3 个模型

排序

DeepSeek-V4 拥有百万字超长上下文，在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。相比 DeepSeek-V4-Pro，DeepSeek-V4-Flash 在世界知识储备方面稍逊一筹，但展现出了接近的推理能力。而由于模型参数和激活更小，相较之下 V4-Flash 能够提供更加快捷、经济的 API 服务。

通用长文本函数调用翻译代码+1

输入价格:¥1 / 1M tokens

输出价格:¥2 / 1M tokens

上下文:1,000,000

最大输出:384,000

供应商

d s 腾 h

7月19日 9 PM99.95%

输入:

输出:

deepseek/deepseek-v4-pro

DeepSeek

DeepSeek-V4 拥有百万字超长上下文，在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。相比前代模型，DeepSeek-V4-Pro 的 Agent 能力显著增强。在 Agentic Coding 评测中，V4-Pro 已达到当前开源模型最佳水平，并在其他 Agent 相关评测中同样表现优异。

通用长文本函数调用翻译代码+2

输入价格:¥3 / 1M tokens

输出价格:¥6 / 1M tokens

上下文:1,000,000

最大输出:384,000

供应商

通 d s 腾 p

7月19日 9 PM100.00%

输入:

输出:

deepseek/deepseek-r1-distill-qwen-32b

DeepSeek

DeepSeek-R1-Distill 模型是在开源模型的基础上通过微调训练得到的，训练过程中使用了由DeepSeek-R1生成的样本数据。DeepSeek-R1是由深度求索推出的推理大模型。DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。

输入价格:¥1.5 / 1M tokens

输出价格:¥6 / 1M tokens

上下文:65,536

最大输出:8,096

供应商

贵

7月19日 9 PM100.00%