七牛云

国内

12 models

Sort by

deepseek-r1

【360在阿里云部署版】DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。

Input Price:¥4 / 1M tokens

Output Price:¥16 / 1M tokens

Context:128,000

Max Output:31,000

Providers

七

5月24日 11 PM100.00%

Input:

Output:

deepseek-chat-v3

【 deepseek-V3-0324 新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术，大幅提高了在推理类任务上的表现水平，在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

Input Price:¥2 / 1M tokens

Output Price:¥8 / 1M tokens

Context:65,536

Max Output:31,000

Providers

七

5月24日 11 PM100.00%

Input:

Output:

qwen3-235b-a22b

【虚拟模型名】qwen3 开源版模型默认开启思考模式，实现推理模式和非推理模式的有效融合，可在对话中切换模式。推理能力显著超过QwQ、通用能力显著超过Qwen2.5-72B-Instruct，达到同规模业界SOTA水平。

Input Price:¥2 / 1M tokens

Output Price:¥8 / 1M tokens

Context:65,536

Max Output:31,000

Providers

七

5月24日 11 PM99.29%

Input:

Output:

deepseek-v3-360gpt-pro

【 360gpt-pro & deepseek-V3 虚拟模型名新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术，大幅提高了在推理类任务上的表现水平，在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

Input Price:¥2 / 1M tokens

Output Price:¥5 / 1M tokens

Context:32,192

Max Output:30,000

Providers

七

5月24日 11 PM100.00%

Input:

Output:

deepseek-v3.1

【虚拟模型】DeepSeek-V3.1 是深度求索全新推出的混合推理模型，支持思考与非思考2种推理模式，较 DeepSeek-R1-0528 思考效率更高。经 Post-Training 优化，Agent 工具使用与智能体任务表现大幅提升。支持 128k 上下文窗口，输出长度支持最大 64k tokens。

Input Price:¥4 / 1M tokens

Output Price:¥12 / 1M tokens

Context:128,000

Max Output:8,096

Providers

七

5月24日 11 PM100.00%

Input:

Output:

qwen3-32b

实现思考模式和非思考模式的有效融合，可在对话中切换模式。推理能力显著超过QwQ、通用能力显著超过Qwen2.5-32B-Instruct，达到同规模业界SOTA水平。

Input Price:¥2 / 1M tokens

Output Price:¥20 / 1M tokens

Context:128,000

Max Output:31,000

Providers

七

5月24日 11 PM100.00%

Input:

Output:

deepseek-v3.1-terminus

此次更新在保持模型原有能力的基础上，针对用户反馈的问题进行了改进，包括：语言一致性：缓解了中英文混杂、偶发异常字符等情况； Agent 能力：进一步优化了 Code Agent 与 Search Agent 的表现。

Input Price:¥4 / 1M tokens

Output Price:¥12 / 1M tokens

Context:128,000

Max Output:8,096

Providers

七

5月24日 11 PM100.00%

Input:

Output:

deepseek-v3.2-exp

DeepSeek-V3.2-Exp 模型，是一个实验性（Experimental）的版本。作为迈向新一代架构的中间步骤，V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention（一种稀疏注意力机制），针对长文本的训练和推理效率进行了探索性的优化和验证。

Input Price:¥2 / 1M tokens

Output Price:¥3 / 1M tokens

Context:65,536

Max Output:8,096

Providers

七

5月24日 11 PM100.00%

Input:

Output:

deepseek-v3.2

DeepSeek-V3.2 的目标是平衡推理能力与输出长度，适合日常使用，例如问答场景和通用 Agent 任务场景。在公开的推理类 Benchmark 测试中，DeepSeek-V3.2 达到了 GPT-5 的水平，仅略低于 Gemini-3.0-Pro；相比 Kimi-K2-Thinking，V3.2 的输出长度大幅降低，显著减少了计算开销与用户等待时间。

Input Price:¥2 / 1M tokens

Output Price:¥3 / 1M tokens

Context:128,000

Max Output:8,192

Providers

七

5月24日 11 PM100.00%

Input:

Output:

deepseek-v3.2-speciale

在高度复杂任务上，Speciale 模型大幅优于标准版本，但消耗的 Tokens 也显著更多，成本更高。目前，DeepSeek-V3.2-Speciale 仅供研究使用，不支持工具调用，暂未针对日常对话与写作任务进行专项优化。

Input Price:¥2 / 1M tokens

Output Price:¥3 / 1M tokens

Context:128,000

Max Output:8,096

Providers

七

5月22日 2 PM

Input:

Output:

moonshot/kimi-k2.5

kimi-k2.5 是 Kimi 迄今最全能的模型，原生的多模态架构设计，同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务模型上下文长度 256k，支持长思考擅长深度推理支持自动上下文缓存功能，ToolCalls、JSON Mode、Partial Mode、联网搜索功能等能力

Input Price:¥4 / 1M tokens

Output Price:¥21 / 1M tokens

Context:262,144

Max Output:32,768

Providers

七

5月24日 11 PM100.00%

Input:

Output:

智

z-ai/glm-5

智谱

GLM-5 是面向 Coding 与 Agent 场景的新一代大模型，在复杂系统工程与长程任务中达到开源 SOTA，真实编程体验逼近 Claude Opus 级别；基于 744B 新基座、异步强化学习与稀疏注意力，实现从“写代码”到“写工程”的全面升级。

Input Price:¥4 / 1M tokens

Output Price:¥18 / 1M tokens

Context:128,000

Max Output:2,048

Providers

七

5月24日 11 PM100.00%

Input:

Output:

七牛云

国内

12 models

Sort by

deepseek-r1

Input Price:¥4 / 1M tokens

Output Price:¥16 / 1M tokens

Context:128,000

Max Output:31,000

Providers

七

5月24日 11 PM100.00%

Input:

Output:

deepseek-chat-v3

Input Price:¥2 / 1M tokens

Output Price:¥8 / 1M tokens

Context:65,536

Max Output:31,000

Providers

七

5月24日 11 PM100.00%

Input:

Output:

qwen3-235b-a22b

Input Price:¥2 / 1M tokens

Output Price:¥8 / 1M tokens

Context:65,536

Max Output:31,000

Providers

七

5月24日 11 PM99.29%

Input:

Output:

deepseek-v3-360gpt-pro

Input Price:¥2 / 1M tokens

Output Price:¥5 / 1M tokens

Context:32,192

Max Output:30,000

Providers

七

5月24日 11 PM100.00%

Input:

Output:

deepseek-v3.1

Input Price:¥4 / 1M tokens

Output Price:¥12 / 1M tokens

Context:128,000

Max Output:8,096

Providers

七

5月24日 11 PM100.00%

Input:

Output:

qwen3-32b

实现思考模式和非思考模式的有效融合，可在对话中切换模式。推理能力显著超过QwQ、通用能力显著超过Qwen2.5-32B-Instruct，达到同规模业界SOTA水平。

Input Price:¥2 / 1M tokens

Output Price:¥20 / 1M tokens

Context:128,000

Max Output:31,000

Providers

七

5月24日 11 PM100.00%

Input:

Output:

deepseek-v3.1-terminus

Input Price:¥4 / 1M tokens

Output Price:¥12 / 1M tokens

Context:128,000

Max Output:8,096

Providers

七

5月24日 11 PM100.00%

Input:

Output:

deepseek-v3.2-exp

Input Price:¥2 / 1M tokens

Output Price:¥3 / 1M tokens

Context:65,536

Max Output:8,096

Providers

七

5月24日 11 PM100.00%

Input:

Output:

deepseek-v3.2

Input Price:¥2 / 1M tokens

Output Price:¥3 / 1M tokens

Context:128,000

Max Output:8,192

Providers

七

5月24日 11 PM100.00%

Input:

Output:

deepseek-v3.2-speciale

Input Price:¥2 / 1M tokens

Output Price:¥3 / 1M tokens

Context:128,000

Max Output:8,096

Providers

七

5月22日 2 PM

Input:

Output:

moonshot/kimi-k2.5

Input Price:¥4 / 1M tokens

Output Price:¥21 / 1M tokens

Context:262,144

Max Output:32,768

Providers

七

5月24日 11 PM100.00%

Input:

Output:

智

z-ai/glm-5

智谱

Input Price:¥4 / 1M tokens

Output Price:¥18 / 1M tokens

Context:128,000

Max Output:2,048

Providers

七

5月24日 11 PM100.00%

Input:

Output: