MiniMax-M3 是 MiniMax 推出的多模态基础模型。它支持文本、图像和视频输入,并输出文本,拥有 1M 的上下文窗口,适用于长时间的智能体工作、编码和工具使用。该模型基于 MiniMax 稀疏注意力机制 (MSA) 构建,MSA 用键值块选择取代了完整的注意力机制,从而在长时间上下文中大幅降低每个词元的计算量——在 1M 个token的情况下,其计算成本约为上一代模型的 1/20,同时显著加快了预填充和解码速度,并在大多数任务中保持了质量。 该模型在交错数据上作为原生多模态模型进行训练,并通过交互式用户模拟器框架针对多轮次、类似生产环境的协作进行了调优,因此更适合持续的多步骤任务,而非单轮执行。
供应商
Qwen3.7系列中规模最大、综合能力最强的Max模型,当前开放纯文本模型能力供体验。Qwen3.7是面向智能体时代的新一代旗舰模型,核心优势在于智能体能力的广度与深度:在编程、办公与生产力、长周期自主执行方面均能出色胜任各项任务。
供应商
Doubao-Seed-2.0-pro 是一款旗舰级通用大模型,专为 Agent 时代的复杂推理和长链任务执行场景而设计。它强调多模态理解、长上下文推理、结构化生成和工具增强执行。其在执行复杂指令和多重约束方面的能力非常出色,能够稳定处理诸如多步复杂规划、复杂图文推理、视频内容理解和高难度分析等场景。
供应商
Qwen3.5原生视觉语言系列Plus模型,相较于2月15日快照,本模型在Agentic coding能力上大幅提升;推理速度显著提升;知识、推理与长上下文能力保持较高水准,满足复杂Agent任务的需求,适合应用于编码智能体、生产工作流和高吞吐场景。该版本为2026年4月20日快照。
供应商
Kimi K2.6 是 Kimi 最新最智能的模型,Kimi K2.6 的通用 Agent、代码、视觉理解等综合能力得到全面提升,其中在博士级难度的完整版人类最后的考试(Humanity’s Last Exam)、在考察模型真实软件工程能力的 SWE-Bench Pro、评估 Agent 深度检索能力的 DeepSearchQA 等基准测试中均取得行业领先的成绩,同时支持文本、图片与视频输入,思考与非思考模式,对话与 Agent 任务。
供应商
GLM-5.1 是智谱最新旗舰模型,代码能力大大增强,长程任务显著提升,能够在单次任务中持续、自主地工作长达 8 小时,完成从规划、执行到迭代优化的完整闭环,交付工程级成果。 在综合能力与 Coding 能力上,GLM-5.1 整体表现对齐 Claude Opus 4.6,并在长程自主执行、复杂工程优化与真实开发场景中展现出更强的持续工作能力,是构建 Autonomous Agent 与长程 Coding Agent 的理想基座。
GLM-5V-Turbo 是智谱首个多模态 Agent 基座模型,面向视觉编程与复杂任务场景深度优化,支持图像、视频、文本与文件等多模态输入,强化视觉理解、长程规划与动作执行能力。相比通用多模态模型,它更适合融入 Agent 工作流,完成「环境感知 → 任务规划 → 执行落地」的完整闭环,让多模态能力从“能看懂”走向“能行动”。
供应商
Agentic指令遵循:在包含 50+ skills、60–150 个 feature list 的复杂环境中,M2.7 仍能保持稳定的技能调用与指令遵循能力,有效缓解大规模 skill library 场景下常见的遵从能力下降问题;针对需要 几十个技能协同的复杂任务进行优化,能够在长流程、多步骤的 Agent 场景中稳定完成复杂任务拆解与执行。 领先的 Agent Harness 能力,支持 Agent Teams、多工具检索(Tool Search)、多种 Agent 脚手架功能,便于构建复杂的多 Agent 系统。 强工程与 Coding 能力:在真实工程场景中具备优秀表现,包括 日志分析与 Bug 定位、代码重构、代码安全(生成无漏洞代码)、机器学习、Android 开发 等能力。 复杂 Office 自动化能力:支持复杂 Excel / Word / PPT 办公任务及多轮编辑。
供应商
Agentic指令遵循:在包含 50+ skills、60–150 个 feature list 的复杂环境中,M2.7 仍能保持稳定的技能调用与指令遵循能力,有效缓解大规模 skill library 场景下常见的遵从能力下降问题;针对需要 几十个技能协同的复杂任务进行优化,能够在长流程、多步骤的 Agent 场景中稳定完成复杂任务拆解与执行。 领先的 Agent Harness 能力,支持 Agent Teams、多工具检索(Tool Search)、多种 Agent 脚手架功能,便于构建复杂的多 Agent 系统。 强工程与 Coding 能力:在真实工程场景中具备优秀表现,包括 日志分析与 Bug 定位、代码重构、代码安全(生成无漏洞代码)、机器学习、Android 开发 等能力。 复杂 Office 自动化能力:支持复杂 Excel / Word / PPT 办公任务及多轮编辑。
GLM-5-Turbo 是面向真实 Agent 长链路任务深度优化的模型,重点提升了复杂指令拆解、工具调用、定时持续执行与长任务稳定性。相比通用对话模型,它更适合进入真实业务流程,让龙虾从“能聊”走向“能做”。
供应商
Seed-2.0-Lite 是一款功能全面且极具成本效益的企业级主力模型。它不仅具备强大的多模态与智能体(Agent)能力,还实现了显著降低的延迟,使其成为涵盖文本、视觉及工具应用等各类生产级工作负载的理想默认之选。该模型专为高频视觉理解及智能体驱动型工作流而精心打造,是实现大规模部署并确保极低延迟的绝佳方案。
供应商