发布时间
2026/5/31模型系列
MiniMax输入模态
输出模态
上下文窗口
512,000最大输出长度
128,000输入价格
¥2.1 / 1M tokens输出价格
¥8.4 / 1M tokensMiniMax-M3 是 MiniMax 推出的多模态基础模型。它支持文本、图像和视频输入,并输出文本,拥有 1M 的上下文窗口,适用于长时间的智能体工作、编码和工具使用。该模型基于 MiniMax 稀疏注意力机制 (MSA) 构建,MSA 用键值块选择取代了完整的注意力机制,从而在长时间上下文中大幅降低每个词元的计算量——在 1M 个token的情况下,其计算成本约为上一代模型的 1/20,同时显著加快了预填充和解码速度,并在大多数任务中保持了质量。 该模型在交错数据上作为原生多模态模型进行训练,并通过交互式用户模拟器框架针对多轮次、类似生产环境的协作进行了调优,因此更适合持续的多步骤任务,而非单轮执行。
智脑 API 根据调度策略向最合适的供应商发起请求,并自动回退至可用性最高的供应商。
首字延迟
2.90s
吞吐量
1.51tps
可用性
99.00%
供应商模型名
minimax/minimax/MiniMax-M3
支持的参数
近期可用性
推理
可切换推理
支持的响应格式
请求日志收集
支持 ZDR
可用于蒸馏
是
上下文长度
512,000
最大输出
128,000
输入价格
¥2.1 / 1M tokens
输出价格
¥8.4 / 1M tokens
在智脑 API 上对比不同供应商的表现
1.62 tok/s
2.90 s
minimax/MiniMax-M3的各供应商可用性
智脑 API 为您统一各供应商的请求与响应格式
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://api.360.cn/v1",
apiKey: process.env.ZHINAO_API_KEY,
});
const response = await client.chat.completions.create({
model: "minimax/MiniMax-M3",
messages: [
{ role: "user", content: "Hello, how are you?" }
],
temperature: 0.7,
max_tokens: 1000,
});
console.log(response.choices[0].message.content);