minimax/MiniMax-M3

在线对话

MiniMax

发布时间

2026/5/31

模型系列

MiniMax

输入模态

输出模态

上下文窗口

512,000

最大输出长度

128,000

输入价格

¥2.1 / 1M tokens

输出价格

¥8.4 / 1M tokens

MiniMax-M3 是 MiniMax 推出的多模态基础模型。它支持文本、图像和视频输入，并输出文本，拥有 1M 的上下文窗口，适用于长时间的智能体工作、编码和工具使用。该模型基于 MiniMax 稀疏注意力机制 (MSA) 构建，MSA 用键值块选择取代了完整的注意力机制，从而在长时间上下文中大幅降低每个词元的计算量——在 1M 个token的情况下，其计算成本约为上一代模型的 1/20，同时显著加快了预填充和解码速度，并在大多数任务中保持了质量。该模型在交错数据上作为原生多模态模型进行训练，并通过交互式用户模拟器框架针对多轮次、类似生产环境的协作进行了调优，因此更适合持续的多步骤任务，而非单轮执行。

minimax/MiniMax-M3的供应商

智脑 API 根据调度策略向最合适的供应商发起请求，并自动回退至可用性最高的供应商。

MiniMax

国内

首字延迟

1.48s

吞吐量

10.13tps

可用性

100.00%

供应商模型名

minimax/minimax/MiniMax-M3

支持的参数

temperaturetop_ptop_k

近期可用性

7月19日 2 PM100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat CompletionsAnthropic MessagesOpenAI Responses

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

512,000

最大输出

128,000

输入价格

¥2.1 / 1M tokens

输出价格

¥8.4 / 1M tokens

minimax/MiniMax-M3的性能

在智脑 API 上对比不同供应商的表现

吞吐量

10.30 tok/s

首字延迟

1.52 s

minimax/MiniMax-M3的可用性

minimax/MiniMax-M3的各供应商可用性

minimax/MiniMax-M3示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

查看完整文档

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "minimax/MiniMax-M3",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);

minimax/MiniMax-M3

在线对话

MiniMax

发布时间

2026/5/31

模型系列

MiniMax

输入模态

输出模态

上下文窗口

512,000

最大输出长度

128,000

输入价格

¥2.1 / 1M tokens

输出价格

¥8.4 / 1M tokens

minimax/MiniMax-M3的供应商

智脑 API 根据调度策略向最合适的供应商发起请求，并自动回退至可用性最高的供应商。

MiniMax

国内

首字延迟

1.48s

吞吐量

10.13tps

可用性

100.00%

供应商模型名

minimax/minimax/MiniMax-M3

支持的参数

temperaturetop_ptop_k

近期可用性

7月19日 2 PM100.00%

推理

可切换推理

支持的响应格式

OpenAI Chat CompletionsAnthropic MessagesOpenAI Responses

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

512,000

最大输出

128,000

输入价格

¥2.1 / 1M tokens

输出价格

¥8.4 / 1M tokens

minimax/MiniMax-M3的性能

在智脑 API 上对比不同供应商的表现

吞吐量

10.30 tok/s

首字延迟

1.52 s

minimax/MiniMax-M3的可用性

minimax/MiniMax-M3的各供应商可用性

minimax/MiniMax-M3示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

查看完整文档

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "minimax/MiniMax-M3",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);