SmartBrain API

Enterprise AI as Simple as Utilities

More Links
Model HubConsoleAPI KeysUsage QueryDocs
SmartBrain API. All rights reserved|Privacy Policy|Terms
SmartBrain API
SmartBrain API
  • Model Hub
  • API Docs
  • Playground
M

minimax/MiniMax-M3

Online Chat
MiniMax

Publish time

2026/5/31

Model Series

MiniMax

Input type

Output type

Context Window

512,000

Max Output Length

128,000

Input Price

¥2.1 / 1M tokens

Output Price

¥8.4 / 1M tokens

MiniMax-M3 是 MiniMax 推出的多模态基础模型。它支持文本、图像和视频输入,并输出文本,拥有 1M 的上下文窗口,适用于长时间的智能体工作、编码和工具使用。该模型基于 MiniMax 稀疏注意力机制 (MSA) 构建,MSA 用键值块选择取代了完整的注意力机制,从而在长时间上下文中大幅降低每个词元的计算量——在 1M 个token的情况下,其计算成本约为上一代模型的 1/20,同时显著加快了预填充和解码速度,并在大多数任务中保持了质量。 该模型在交错数据上作为原生多模态模型进行训练,并通过交互式用户模拟器框架针对多轮次、类似生产环境的协作进行了调优,因此更适合持续的多步骤任务,而非单轮执行。

Providers for minimax/MiniMax-M3

Zhinao API routes requests to the best-fit provider and automatically fails over to the one with highest availability.

M
MiniMax
国内

TTFT

3.02s

Throughput

1.06tps

Uptime

99.00%

Provider Model

minimax/minimax/MiniMax-M3

Supported Parameters

temperaturetop_ptop_k

Recent Uptime

6月4日 11 PM98.72%
6月2日 7 PM: 99.68%6月2日 8 PM: 99.05%6月2日 8 PM: 99.15%6月2日 9 PM: 99.79%6月2日 9 PM: 99.09%6月2日 10 PM: 99.78%6月2日 10 PM: 98.94%6月2日 11 PM: 97.67%6月2日 11 PM: 98.50%6月3日 8 AM: 99.31%6月3日 9 AM: 98.61%6月3日 9 AM: 99.50%6月3日 10 AM: 99.26%6月3日 10 AM: 97.89%6月3日 11 AM: 99.56%6月3日 11 AM: 99.23%6月3日 12 PM: 98.91%6月3日 12 PM: 98.27%6月3日 1 PM: 98.49%6月3日 1 PM: 99.44%6月3日 2 PM: 98.86%6月3日 2 PM: 99.22%6月3日 3 PM: 98.27%6月3日 3 PM: 98.56%6月3日 4 PM: 97.50%6月3日 4 PM: 97.70%6月3日 5 PM: 98.79%6月3日 5 PM: 98.29%6月3日 6 PM: 98.12%6月3日 6 PM: 98.33%6月3日 7 PM: 99.46%6月3日 7 PM: 96.79%6月3日 8 PM: 98.71%6月3日 8 PM: 95.88%6月3日 9 PM: 96.43%6月3日 9 PM: 98.90%6月3日 10 PM: 97.10%6月3日 10 PM: 96.77%6月3日 11 PM: 98.20%6月3日 11 PM: 99.49%6月4日 8 AM: 100.00%6月4日 8 AM: 99.57%6月4日 9 AM: 97.49%6月4日 9 AM: 97.80%6月4日 10 AM: 99.37%6月4日 10 AM: 97.26%6月4日 11 AM: 97.89%6月4日 11 AM: 97.82%6月4日 12 PM: 97.04%6月4日 12 PM: 97.94%6月4日 1 PM: 87.95%6月4日 1 PM: 94.15%6月4日 2 PM: 96.39%6月4日 2 PM: 98.52%6月4日 3 PM: 98.60%6月4日 3 PM: 98.21%6月4日 4 PM: 99.22%6月4日 4 PM: 99.10%6月4日 5 PM: 98.76%6月4日 5 PM: 98.79%6月4日 6 PM: 99.03%6月4日 6 PM: 97.75%6月4日 7 PM: 97.63%6月4日 7 PM: 99.74%6月4日 8 PM: 98.99%6月4日 8 PM: 99.37%6月4日 9 PM: 91.67%6月4日 9 PM: 99.80%6月4日 10 PM: 98.70%6月4日 10 PM: 96.38%6月4日 11 PM: 98.94%6月4日 11 PM: 98.72%

Reasoning

Toggleable

Supported Response Formats

OpenAI Chat CompletionsOpenAI Responses

Request Log Collection

ZDR Supported

Distillable

Yes

Total Context

512,000

Max Output

128,000

Input Price

¥2.1 / 1M tokens

Output Price

¥8.4 / 1M tokens

Performance for minimax/MiniMax-M3

Compare different providers across Zhinao API

Throughput

1.54 tok/s

TTFT

2.99 s

Uptime for minimax/MiniMax-M3

Uptime for minimax/MiniMax-M3 across all providers

Sample code and API for minimax/MiniMax-M3

Get API Key

Zhinao API normalizes requests and responses across providers for you

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.360.cn/v1",
  apiKey: process.env.ZHINAO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "minimax/MiniMax-M3",
  messages: [
    { role: "user", content: "Hello, how are you?" }
  ],
  temperature: 0.7,
  max_tokens: 1000,
});

console.log(response.choices[0].message.content);