发布时间
2026/4/20模型系列
Kimi输入模态
输出模态
上下文窗口
262,144最大输出长度
262,144输入价格
¥6.5 / 1M tokens输出价格
¥27 / 1M tokensKimi K2.6 是 Kimi 最新最智能的模型,Kimi K2.6 的通用 Agent、代码、视觉理解等综合能力得到全面提升,其中在博士级难度的完整版人类最后的考试(Humanity’s Last Exam)、在考察模型真实软件工程能力的 SWE-Bench Pro、评估 Agent 深度检索能力的 DeepSearchQA 等基准测试中均取得行业领先的成绩,同时支持文本、图片与视频输入,思考与非思考模式,对话与 Agent 任务。
智脑 API 根据调度策略向最合适的供应商发起请求,并自动回退至可用性最高的供应商。
首字延迟
12.91s
吞吐量
48.94tps
可用性
31.00%
供应商模型名
microsoft/moonshotai/kimi-k2.6
支持的参数
近期可用性
推理
可切换推理
支持的响应格式
请求日志收集
支持 ZDR
可用于蒸馏
是
上下文长度
262,144
最大输出
262,144
输入价格
¥6.5 / 1M tokens
输出价格
¥27 / 1M tokens
首字延迟
4.60s
吞吐量
20.77tps
可用性
100.00%
供应商模型名
moonshot/moonshotai/kimi-k2.6
支持的参数
近期可用性
推理
可切换推理
支持的响应格式
请求日志收集
支持 ZDR
可用于蒸馏
是
上下文长度
262,144
最大输出
262,144
输入价格
¥6.5 / 1M tokens
输出价格
¥27 / 1M tokens
在智脑 API 上对比不同供应商的表现
30.99 tok/s
8.75 s
moonshotai/kimi-k2.6的各供应商可用性
智脑 API 为您统一各供应商的请求与响应格式
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://api.360.cn/v1",
apiKey: process.env.ZHINAO_API_KEY,
});
const response = await client.chat.completions.create({
model: "moonshotai/kimi-k2.6",
messages: [
{ role: "user", content: "Hello, how are you?" }
],
temperature: 0.7,
max_tokens: 1000,
});
console.log(response.choices[0].message.content);