360智脑开放平台

让企业用 AI,像用水电一样简单

更多链接
模型广场控制台API Keys用量查询文档
360智脑开放平台. 保留所有权利|隐私政策|服务条款
360智脑开放平台
360智脑开放平台
  • 模型广场
  • API 文档
  • Playground
M

minimax/MiniMax-M3

在线对话
MiniMax

发布时间

2026/5/31

模型系列

MiniMax

输入模态

输出模态

上下文窗口

512,000

最大输出长度

128,000

输入价格

¥2.1 / 1M tokens

输出价格

¥8.4 / 1M tokens

MiniMax-M3 是 MiniMax 推出的多模态基础模型。它支持文本、图像和视频输入,并输出文本,拥有 1M 的上下文窗口,适用于长时间的智能体工作、编码和工具使用。该模型基于 MiniMax 稀疏注意力机制 (MSA) 构建,MSA 用键值块选择取代了完整的注意力机制,从而在长时间上下文中大幅降低每个词元的计算量——在 1M 个token的情况下,其计算成本约为上一代模型的 1/20,同时显著加快了预填充和解码速度,并在大多数任务中保持了质量。 该模型在交错数据上作为原生多模态模型进行训练,并通过交互式用户模拟器框架针对多轮次、类似生产环境的协作进行了调优,因此更适合持续的多步骤任务,而非单轮执行。

minimax/MiniMax-M3的供应商

智脑 API 根据调度策略向最合适的供应商发起请求,并自动回退至可用性最高的供应商。

M
MiniMax
国内

首字延迟

2.90s

吞吐量

1.51tps

可用性

99.00%

供应商模型名

minimax/minimax/MiniMax-M3

支持的参数

temperaturetop_ptop_k

近期可用性

6月3日 11 PM99.49%
6月1日 7 PM: 99.13%6月1日 7 PM: 99.07%6月1日 8 PM: 98.52%6月1日 8 PM: 99.26%6月1日 9 PM: 98.26%6月1日 9 PM: 98.01%6月1日 10 PM: 99.48%6月1日 10 PM: 96.28%6月1日 11 PM: 98.72%6月1日 11 PM: 96.72%6月2日 8 AM: 98.83%6月2日 9 AM: 98.22%6月2日 9 AM: 98.75%6月2日 10 AM: 99.09%6月2日 10 AM: 98.87%6月2日 11 AM: 99.22%6月2日 11 AM: 98.21%6月2日 12 PM: 98.97%6月2日 12 PM: 98.80%6月2日 1 PM: 99.36%6月2日 1 PM: 99.67%6月2日 2 PM: 99.69%6月2日 2 PM: 99.34%6月2日 3 PM: 98.92%6月2日 3 PM: 99.31%6月2日 4 PM: 98.80%6月2日 4 PM: 97.95%6月2日 5 PM: 98.46%6月2日 5 PM: 98.69%6月2日 6 PM: 98.25%6月2日 6 PM: 95.86%6月2日 7 PM: 99.08%6月2日 7 PM: 99.68%6月2日 8 PM: 99.05%6月2日 8 PM: 99.15%6月2日 9 PM: 99.79%6月2日 9 PM: 99.09%6月2日 10 PM: 99.78%6月2日 10 PM: 98.94%6月2日 11 PM: 97.67%6月2日 11 PM: 98.50%6月3日 8 AM: 99.31%6月3日 9 AM: 98.61%6月3日 9 AM: 99.50%6月3日 10 AM: 99.26%6月3日 10 AM: 97.89%6月3日 11 AM: 99.56%6月3日 11 AM: 99.23%6月3日 12 PM: 98.91%6月3日 12 PM: 98.27%6月3日 1 PM: 98.49%6月3日 1 PM: 99.44%6月3日 2 PM: 98.86%6月3日 2 PM: 99.22%6月3日 3 PM: 98.27%6月3日 3 PM: 98.56%6月3日 4 PM: 97.50%6月3日 4 PM: 97.70%6月3日 5 PM: 98.79%6月3日 5 PM: 98.29%6月3日 6 PM: 98.12%6月3日 6 PM: 98.33%6月3日 7 PM: 99.46%6月3日 7 PM: 96.79%6月3日 8 PM: 98.71%6月3日 8 PM: 95.88%6月3日 9 PM: 96.43%6月3日 9 PM: 98.90%6月3日 10 PM: 97.10%6月3日 10 PM: 96.77%6月3日 11 PM: 98.20%6月3日 11 PM: 99.49%

推理

可切换推理

支持的响应格式

OpenAI Chat CompletionsOpenAI Responses

请求日志收集

支持 ZDR

可用于蒸馏

是

上下文长度

512,000

最大输出

128,000

输入价格

¥2.1 / 1M tokens

输出价格

¥8.4 / 1M tokens

minimax/MiniMax-M3的性能

在智脑 API 上对比不同供应商的表现

吞吐量

1.62 tok/s

首字延迟

2.90 s

minimax/MiniMax-M3的可用性

minimax/MiniMax-M3的各供应商可用性

minimax/MiniMax-M3示例代码与 API

获取 API Key

智脑 API 为您统一各供应商的请求与响应格式

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "minimax/MiniMax-M3",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);