智脑API服务平台
智脑API服务平台
  • 模型广场
  • API 文档
智脑API服务平台

让企业用 AI,像用水电一样简单

更多链接
模型广场控制台API Keys用量查询文档
© 2026 智脑API服务平台. 保留所有权利。|ICP备案号|隐私政策|服务条款

kimi-k2

在线对话

发布时间

-

模型系列

输入模态

输出模态

上下文窗口

128,000

最大输出长度

32,000

输入价格

¥0 / 1M tokens

输出价格

¥0 / 1M tokens

Kimi-K2 是一款Moonshot AI推出的具备超强代码和 Agent 能力的 MoE 架构基础模型,总参数 1T,激活参数 32B。在通用知识推理、编程、数学、Agent 等主要类别的基准性能测试中,K2 模型的性能超过其他主流开源模型。

kimi-k2的供应商

智脑 API 根据调度策略向最合适的供应商发起请求,并自动回退至可用性最高的供应商。

字
字节豆包
国内

首字延迟

3.76s

吞吐量

27.05tps

可用性

100.00%

供应商模型名

volcengine/kimi-k2-250711

支持的参数

近期可用性

3月4日 11 PM100.00%
3月2日 9 PM: 100.00%3月2日 9 PM: 100.00%3月2日 10 PM: 100.00%3月2日 10 PM: 100.00%3月2日 11 PM: 100.00%3月2日 11 PM: 100.00%3月3日 8 AM: 100.00%3月3日 8 AM: 100.00%3月3日 9 AM: 100.00%3月3日 9 AM: 100.00%3月3日 10 AM: 100.00%3月3日 10 AM: 100.00%3月3日 11 AM: 100.00%3月3日 11 AM: 100.00%3月3日 11 AM: 100.00%3月3日 11 AM: 100.00%3月3日 12 PM: 100.00%3月3日 12 PM: 100.00%3月3日 1 PM: 100.00%3月3日 1 PM: 100.00%3月3日 2 PM: 100.00%3月3日 2 PM: 100.00%3月3日 3 PM: 100.00%3月3日 3 PM: 100.00%3月3日 4 PM: 100.00%3月3日 4 PM: 100.00%3月3日 5 PM: 100.00%3月3日 5 PM: 100.00%3月3日 6 PM: 100.00%3月3日 6 PM: 100.00%3月3日 7 PM: 100.00%3月3日 7 PM: 100.00%3月3日 8 PM: 100.00%3月3日 8 PM: 100.00%3月3日 9 PM: 100.00%3月3日 9 PM: 100.00%3月3日 10 PM: 100.00%3月3日 10 PM: 100.00%3月3日 11 PM: 100.00%3月3日 11 PM: 100.00%3月4日 8 AM: 100.00%3月4日 8 AM: 100.00%3月4日 9 AM: 100.00%3月4日 9 AM: 100.00%3月4日 10 AM: 100.00%3月4日 10 AM: 100.00%3月4日 11 AM: 100.00%3月4日 11 AM: 100.00%3月4日 12 PM: 100.00%3月4日 12 PM: 100.00%3月4日 1 PM: 100.00%3月4日 1 PM: 100.00%3月4日 2 PM: 100.00%3月4日 2 PM: 100.00%3月4日 3 PM: 100.00%3月4日 3 PM: 100.00%3月4日 4 PM: 100.00%3月4日 4 PM: 100.00%3月4日 5 PM: 100.00%3月4日 5 PM: 100.00%3月4日 6 PM: 100.00%3月4日 6 PM: 100.00%3月4日 7 PM: 100.00%3月4日 7 PM: 100.00%3月4日 8 PM: 100.00%3月4日 8 PM: 100.00%3月4日 9 PM: 100.00%3月4日 9 PM: 100.00%3月4日 10 PM: 100.00%3月4日 10 PM: 100.00%3月4日 11 PM: 100.00%3月4日 11 PM: 100.00%

推理

-

支持的响应格式

OpenAI Chat Completions
OpenAI Responses
Anthropic Messages
Google VertexAI

请求日志收集

-

可用于蒸馏

-

上下文长度

4,096

最大输出

2,048

输入价格

¥0 / 1M tokens

输出价格

¥0 / 1M tokens

月
月之暗面
国内

首字延迟

1.85s

吞吐量

31.67tps

可用性

100.00%

供应商模型名

moonshot/kimi-k2-0711-preview

支持的参数

近期可用性

3月4日 9 PM100.00%
暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据暂无数据3月3日 9 AM: 100.00%3月3日 9 AM: 100.00%3月3日 10 AM: 100.00%3月3日 11 AM: 100.00%3月3日 12 PM: 100.00%3月3日 4 PM: 100.00%3月3日 5 PM: 100.00%3月4日 9 AM: 100.00%3月4日 10 AM: 100.00%3月4日 12 PM: 100.00%3月4日 3 PM: 100.00%3月4日 4 PM: 100.00%3月4日 6 PM: 100.00%3月4日 9 PM: 100.00%3月4日 9 PM: 100.00%

推理

-

支持的响应格式

OpenAI Chat Completions
OpenAI Responses
Anthropic Messages
Google VertexAI

请求日志收集

-

可用于蒸馏

-

上下文长度

4,096

最大输出

2,048

输入价格

¥0 / 1M tokens

输出价格

¥0 / 1M tokens

kimi-k2的性能

在智脑 API 上对比不同供应商的表现

吞吐量

27.10 tok/s

首字延迟

4.15 s

kimi-k2的可用性

kimi-k2的各供应商可用性

kimi-k2示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "kimi-k2",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);