minimax/MiniMax-M2.5

在线对话

MiniMax

发布时间

2026/2/12

模型系列

MiniMax

输入模态

输出模态

上下文窗口

196,608

最大输出长度

196,608

输入价格

¥2.1 / 1M tokens

输出价格

¥8.4 / 1M tokens

强大多语言编程实力，全面升级编程体验

minimax/MiniMax-M2.5的供应商

智脑 API 根据调度策略向最合适的供应商发起请求，并自动回退至可用性最高的供应商。

360智脑

国内

首字延迟

0.67s

吞吐量

70.81tps

可用性

100.00%

供应商模型名

360zhinao-minimax-2.5-260313

支持的参数

frequency_penaltyinclude_reasoninglogit_biaslogprobsmax_tokensmin_pparallel_tool_callspresence_penaltyreasoningreasoning_effortrepetition_penaltyresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_ktop_logprobstop_p

近期可用性

4月19日 1 PM100.00%

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

最大输出

输入价格

¥2 / 1M tokens

输出价格

¥9 / 1M tokens

MiniMax

国内

首字延迟

4.13s

吞吐量

44.82tps

可用性

100.00%

供应商模型名

minimax/minimax/MiniMax-M2.5

支持的参数

近期可用性

4月19日 1 PM100.00%

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

196,608

最大输出

196,608

输入价格

¥2.1 / 1M tokens

输出价格

¥8.4 / 1M tokens

paratera并行科技

国内

首字延迟

暂无数据

吞吐量

35tps

可用性

100.00%

供应商模型名

paratera/minimax/MiniMax-M2.5

支持的参数

近期可用性

4月17日 1 PM100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

196,608

最大输出

196,608

输入价格

¥1.68 / 1M tokens

输出价格

¥6.72 / 1M tokens

minimax/MiniMax-M2.5的性能

在智脑 API 上对比不同供应商的表现

吞吐量

74.70 tok/s

首字延迟

2.21 s

minimax/MiniMax-M2.5的可用性

minimax/MiniMax-M2.5的各供应商可用性

minimax/MiniMax-M2.5示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "minimax/MiniMax-M2.5",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);

minimax/MiniMax-M2.5

在线对话

MiniMax

发布时间

2026/2/12

模型系列

MiniMax

输入模态

输出模态

上下文窗口

196,608

最大输出长度

196,608

输入价格

¥2.1 / 1M tokens

输出价格

¥8.4 / 1M tokens

强大多语言编程实力，全面升级编程体验

minimax/MiniMax-M2.5的供应商

智脑 API 根据调度策略向最合适的供应商发起请求，并自动回退至可用性最高的供应商。

360智脑

国内

首字延迟

0.67s

吞吐量

70.81tps

可用性

100.00%

供应商模型名

360zhinao-minimax-2.5-260313

支持的参数

近期可用性

4月19日 1 PM100.00%

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

最大输出

输入价格

¥2 / 1M tokens

输出价格

¥9 / 1M tokens

MiniMax

国内

首字延迟

4.13s

吞吐量

44.82tps

可用性

100.00%

供应商模型名

minimax/minimax/MiniMax-M2.5

支持的参数

近期可用性

4月19日 1 PM100.00%

推理

支持的响应格式

OpenAI Chat CompletionsOpenAI ResponsesAnthropic MessagesGoogle VertexAI

请求日志收集

可用于蒸馏

上下文长度

196,608

最大输出

196,608

输入价格

¥2.1 / 1M tokens

输出价格

¥8.4 / 1M tokens

paratera并行科技

国内

首字延迟

暂无数据

吞吐量

35tps

可用性

100.00%

供应商模型名

paratera/minimax/MiniMax-M2.5

支持的参数

近期可用性

4月17日 1 PM100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat Completions

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

196,608

最大输出

196,608

输入价格

¥1.68 / 1M tokens

输出价格

¥6.72 / 1M tokens

minimax/MiniMax-M2.5的性能

在智脑 API 上对比不同供应商的表现

吞吐量

74.70 tok/s

首字延迟

2.21 s

minimax/MiniMax-M2.5的可用性

minimax/MiniMax-M2.5的各供应商可用性

minimax/MiniMax-M2.5示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "minimax/MiniMax-M2.5",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);