智脑API服务平台
智脑API服务平台
  • 模型广场
  • API 文档
智脑API服务平台

让企业用 AI,像用水电一样简单

更多链接
模型广场控制台API Keys用量查询文档
© 2026 智脑API服务平台. 保留所有权利。|ICP备案号|隐私政策|服务条款

moonshot/kimi-k2.5

在线对话

发布时间

-

模型系列

输入模态

输出模态

上下文窗口

262,144

最大输出长度

32,768

输入价格

¥0 / 1M tokens

输出价格

¥0 / 1M tokens

kimi-k2.5 是 Kimi 迄今最全能的模型,原生的多模态架构设计,同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务 模型上下文长度 256k,支持长思考擅长深度推理 支持自动上下文缓存功能,ToolCalls、JSON Mode、Partial Mode、联网搜索功能等能力

moonshot/kimi-k2.5的供应商

智脑 API 根据调度策略向最合适的供应商发起请求,并自动回退至可用性最高的供应商。

七
七牛云
国内

首字延迟

1.07s

吞吐量

40.58tps

可用性

100.00%

供应商模型名

qiniu/kimi-k2.5

支持的参数

近期可用性

3月4日 11 PM100.00%
3月3日 10 AM: 100.00%3月3日 11 AM: 100.00%3月3日 11 AM: 100.00%3月3日 11 AM: 100.00%3月3日 11 AM: 71.43%3月3日 12 PM: 100.00%3月3日 12 PM: 100.00%3月3日 12 PM: 66.67%3月3日 1 PM: 100.00%3月3日 1 PM: 100.00%3月3日 1 PM: 100.00%3月3日 1 PM: 100.00%3月3日 2 PM: 100.00%3月3日 2 PM: 100.00%3月3日 2 PM: 100.00%3月3日 2 PM: 100.00%3月3日 3 PM: 100.00%3月3日 3 PM: 100.00%3月3日 3 PM: 100.00%3月3日 3 PM: 100.00%3月3日 4 PM: 100.00%3月3日 4 PM: 100.00%3月3日 5 PM: 100.00%3月3日 5 PM: 100.00%3月3日 6 PM: 100.00%3月3日 6 PM: 100.00%3月3日 7 PM: 100.00%3月3日 7 PM: 98.19%3月3日 8 PM: 97.65%3月3日 8 PM: 95.67%3月3日 9 PM: 97.10%3月3日 9 PM: 98.86%3月3日 10 PM: 96.48%3月3日 10 PM: 97.66%3月3日 11 PM: 97.57%3月3日 11 PM: 95.87%3月4日 8 AM: 77.42%3月4日 8 AM: 78.74%3月4日 9 AM: 81.99%3月4日 9 AM: 83.71%3月4日 10 AM: 91.03%3月4日 10 AM: 91.63%3月4日 11 AM: 91.32%3月4日 11 AM: 90.79%3月4日 12 PM: 96.24%3月4日 12 PM: 98.06%3月4日 1 PM: 98.80%3月4日 1 PM: 99.05%3月4日 2 PM: 93.96%3月4日 2 PM: 96.07%3月4日 3 PM: 98.14%3月4日 3 PM: 97.34%3月4日 4 PM: 100.00%3月4日 4 PM: 93.80%3月4日 5 PM: 99.63%3月4日 5 PM: 98.86%3月4日 6 PM: 98.90%3月4日 6 PM: 100.00%3月4日 6 PM: 100.00%3月4日 7 PM: 100.00%3月4日 7 PM: 71.43%3月4日 7 PM: 100.00%3月4日 7 PM: 100.00%3月4日 8 PM: 100.00%3月4日 8 PM: 100.00%3月4日 8 PM: 100.00%3月4日 9 PM: 100.00%3月4日 9 PM: 100.00%3月4日 10 PM: 100.00%3月4日 10 PM: 100.00%3月4日 11 PM: 100.00%3月4日 11 PM: 100.00%

推理

-

支持的响应格式

OpenAI Chat Completions
OpenAI Responses
Anthropic Messages
Google VertexAI

请求日志收集

-

可用于蒸馏

-

上下文长度

4,096

最大输出

2,048

输入价格

¥0 / 1M tokens

输出价格

¥0 / 1M tokens

月
月之暗面
国内

首字延迟

暂无数据

吞吐量

37.66tps

可用性

94.00%

供应商模型名

moonshot/moonshot/kimi-k2.5

支持的参数

近期可用性

3月4日 11 PM94.31%
3月2日 10 PM: 98.89%3月2日 10 PM: 93.70%3月2日 11 PM: 95.32%3月2日 11 PM: 97.92%3月3日 8 AM: 91.39%3月3日 8 AM: 92.98%3月3日 9 AM: 87.66%3月3日 9 AM: 91.95%3月3日 10 AM: 91.16%3月3日 10 AM: 9.38%3月3日 10 AM: 8.70%3月3日 10 AM: 85.43%3月3日 11 AM: 93.48%3月3日 11 AM: 81.71%3月3日 12 PM: 83.21%3月3日 12 PM: 84.71%3月3日 1 PM: 88.44%3月3日 1 PM: 89.69%3月3日 2 PM: 78.21%3月3日 2 PM: 80.41%3月3日 3 PM: 77.33%3月3日 3 PM: 81.82%3月3日 4 PM: 79.73%3月3日 4 PM: 88.66%3月3日 5 PM: 86.52%3月3日 5 PM: 90.00%3月3日 6 PM: 91.12%3月3日 6 PM: 92.43%3月3日 6 PM: 50.00%3月3日 7 PM: 94.58%3月3日 7 PM: 77.60%3月3日 8 PM: 80.41%3月3日 8 PM: 73.19%3月3日 9 PM: 66.80%3月3日 9 PM: 61.21%3月3日 10 PM: 73.38%3月3日 10 PM: 67.30%3月3日 11 PM: 66.92%3月3日 11 PM: 79.50%3月4日 8 AM: 94.30%3月4日 8 AM: 94.57%3月4日 9 AM: 93.53%3月4日 9 AM: 95.09%3月4日 10 AM: 96.20%3月4日 10 AM: 92.59%3月4日 11 AM: 92.54%3月4日 11 AM: 92.50%3月4日 12 PM: 94.43%3月4日 12 PM: 94.96%3月4日 1 PM: 94.84%3月4日 1 PM: 89.76%3月4日 2 PM: 84.98%3月4日 2 PM: 86.27%3月4日 3 PM: 92.00%3月4日 3 PM: 90.08%3月4日 4 PM: 87.29%3月4日 4 PM: 84.48%3月4日 5 PM: 86.30%3月4日 5 PM: 87.88%3月4日 6 PM: 83.99%3月4日 6 PM: 76.92%3月4日 6 PM: 81.95%3月4日 7 PM: 87.18%3月4日 7 PM: 89.37%3月4日 8 PM: 86.15%3月4日 8 PM: 75.47%3月4日 9 PM: 91.49%3月4日 9 PM: 90.06%3月4日 10 PM: 89.92%3月4日 10 PM: 89.35%3月4日 11 PM: 95.16%3月4日 11 PM: 94.31%

推理

-

支持的响应格式

OpenAI Chat Completions
OpenAI Responses
Anthropic Messages
Google VertexAI

请求日志收集

-

可用于蒸馏

-

上下文长度

4,096

最大输出

2,048

输入价格

¥0 / 1M tokens

输出价格

¥0 / 1M tokens

moonshot/kimi-k2.5的性能

在智脑 API 上对比不同供应商的表现

吞吐量

39.29 tok/s

首字延迟

0.98 s

moonshot/kimi-k2.5的可用性

moonshot/kimi-k2.5的各供应商可用性

moonshot/kimi-k2.5示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "moonshot/kimi-k2.5",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);