moonshot/kimi-k2.5

在线对话

发布时间

模型系列

输入模态

输出模态

上下文窗口

262,144

最大输出长度

32,768

输入价格

¥0 / 1M tokens

输出价格

¥0 / 1M tokens

kimi-k2.5 是 Kimi 迄今最全能的模型，原生的多模态架构设计，同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务模型上下文长度 256k，支持长思考擅长深度推理支持自动上下文缓存功能，ToolCalls、JSON Mode、Partial Mode、联网搜索功能等能力

moonshot/kimi-k2.5的供应商

智脑 API 根据调度策略向最合适的供应商发起请求，并自动回退至可用性最高的供应商。

七

七牛云

国内

首字延迟

1.07s

吞吐量

40.58tps

可用性

100.00%

供应商模型名

qiniu/kimi-k2.5

支持的参数

近期可用性

3月4日 11 PM100.00%

推理

支持的响应格式

OpenAI Chat Completions

OpenAI Responses

Anthropic Messages

Google VertexAI

请求日志收集

可用于蒸馏

上下文长度

4,096

最大输出

2,048

输入价格

¥0 / 1M tokens

输出价格

¥0 / 1M tokens

月

月之暗面

国内

首字延迟

暂无数据

吞吐量

37.66tps

可用性

94.00%

供应商模型名

moonshot/moonshot/kimi-k2.5

支持的参数

近期可用性

3月4日 11 PM94.31%

推理

支持的响应格式

OpenAI Chat Completions

OpenAI Responses

Anthropic Messages

Google VertexAI

请求日志收集

可用于蒸馏

上下文长度

4,096

最大输出

2,048

输入价格

¥0 / 1M tokens

输出价格

¥0 / 1M tokens

moonshot/kimi-k2.5的性能

在智脑 API 上对比不同供应商的表现

吞吐量

39.29 tok/s

首字延迟

0.98 s

moonshot/kimi-k2.5的可用性

moonshot/kimi-k2.5的各供应商可用性

moonshot/kimi-k2.5示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "moonshot/kimi-k2.5",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);

moonshot/kimi-k2.5

在线对话

发布时间

模型系列

输入模态

输出模态

上下文窗口

262,144

最大输出长度

32,768

输入价格

¥0 / 1M tokens

输出价格

¥0 / 1M tokens

moonshot/kimi-k2.5的供应商

智脑 API 根据调度策略向最合适的供应商发起请求，并自动回退至可用性最高的供应商。

七

七牛云

国内

首字延迟

1.07s

吞吐量

40.58tps

可用性

100.00%

供应商模型名

qiniu/kimi-k2.5

支持的参数

近期可用性

3月4日 11 PM100.00%

推理

支持的响应格式

OpenAI Chat Completions

OpenAI Responses

Anthropic Messages

Google VertexAI

请求日志收集

可用于蒸馏

上下文长度

4,096

最大输出

2,048

输入价格

¥0 / 1M tokens

输出价格

¥0 / 1M tokens

月

月之暗面

国内

首字延迟

暂无数据

吞吐量

37.66tps

可用性

94.00%

供应商模型名

moonshot/moonshot/kimi-k2.5

支持的参数

近期可用性

3月4日 11 PM94.31%

推理

支持的响应格式

OpenAI Chat Completions

OpenAI Responses

Anthropic Messages

Google VertexAI

请求日志收集

可用于蒸馏

上下文长度

4,096

最大输出

2,048

输入价格

¥0 / 1M tokens

输出价格

¥0 / 1M tokens

moonshot/kimi-k2.5的性能

在智脑 API 上对比不同供应商的表现

吞吐量

39.29 tok/s

首字延迟

0.98 s

moonshot/kimi-k2.5的可用性

moonshot/kimi-k2.5的各供应商可用性

moonshot/kimi-k2.5示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "moonshot/kimi-k2.5",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);