moonshotai/kimi-k2.6

在线对话

月之暗面

发布时间

2026/4/20

模型系列

Kimi

输入模态

输出模态

上下文窗口

262,144

最大输出长度

262,144

输入价格

¥6.5 / 1M tokens

输出价格

¥27 / 1M tokens

Kimi K2.6 是 Kimi 最新最智能的模型，Kimi K2.6 的通用 Agent、代码、视觉理解等综合能力得到全面提升，其中在博士级难度的完整版人类最后的考试（Humanity’s Last Exam）、在考察模型真实软件工程能力的 SWE-Bench Pro、评估 Agent 深度检索能力的 DeepSearchQA 等基准测试中均取得行业领先的成绩，同时支持文本、图片与视频输入，思考与非思考模式，对话与 Agent 任务。

moonshotai/kimi-k2.6的供应商

智脑 API 根据调度策略向最合适的供应商发起请求，并自动回退至可用性最高的供应商。

微

微软 Microsoft Azure

国外

首字延迟

12.91s

吞吐量

48.94tps

可用性

31.00%

供应商模型名

microsoft/moonshotai/kimi-k2.6

支持的参数

temperaturetop_ptop_k

近期可用性

5月9日 10 PM30.77%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

262,144

最大输出

262,144

输入价格

¥6.5 / 1M tokens

输出价格

¥27 / 1M tokens

月

月之暗面

国内

首字延迟

4.60s

吞吐量

20.77tps

可用性

100.00%

供应商模型名

moonshot/moonshotai/kimi-k2.6

支持的参数

temperaturetop_ptop_k

近期可用性

5月9日 11 PM100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

262,144

最大输出

262,144

输入价格

¥6.5 / 1M tokens

输出价格

¥27 / 1M tokens

moonshotai/kimi-k2.6的性能

在智脑 API 上对比不同供应商的表现

吞吐量

30.99 tok/s

首字延迟

8.75 s

moonshotai/kimi-k2.6的可用性

moonshotai/kimi-k2.6的各供应商可用性

moonshotai/kimi-k2.6示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "moonshotai/kimi-k2.6",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);

moonshotai/kimi-k2.6

在线对话

月之暗面

发布时间

2026/4/20

模型系列

Kimi

输入模态

输出模态

上下文窗口

262,144

最大输出长度

262,144

输入价格

¥6.5 / 1M tokens

输出价格

¥27 / 1M tokens

moonshotai/kimi-k2.6的供应商

智脑 API 根据调度策略向最合适的供应商发起请求，并自动回退至可用性最高的供应商。

微

微软 Microsoft Azure

国外

首字延迟

12.91s

吞吐量

48.94tps

可用性

31.00%

供应商模型名

microsoft/moonshotai/kimi-k2.6

支持的参数

temperaturetop_ptop_k

近期可用性

5月9日 10 PM30.77%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

262,144

最大输出

262,144

输入价格

¥6.5 / 1M tokens

输出价格

¥27 / 1M tokens

月

月之暗面

国内

首字延迟

4.60s

吞吐量

20.77tps

可用性

100.00%

供应商模型名

moonshot/moonshotai/kimi-k2.6

支持的参数

temperaturetop_ptop_k

近期可用性

5月9日 11 PM100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

262,144

最大输出

262,144

输入价格

¥6.5 / 1M tokens

输出价格

¥27 / 1M tokens

moonshotai/kimi-k2.6的性能

在智脑 API 上对比不同供应商的表现

吞吐量

30.99 tok/s

首字延迟

8.75 s

moonshotai/kimi-k2.6的可用性

moonshotai/kimi-k2.6的各供应商可用性

moonshotai/kimi-k2.6示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "moonshotai/kimi-k2.6",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);