Qwen3.7系列中规模最大、综合能力最强的Max模型,当前开放纯文本模型能力供体验。Qwen3.7是面向智能体时代的新一代旗舰模型,核心优势在于智能体能力的广度与深度:在编程、办公与生产力、长周期自主执行方面均能出色胜任各项任务。
Providers
Doubao-Seed-2.0-pro 是一款旗舰级通用大模型,专为 Agent 时代的复杂推理和长链任务执行场景而设计。它强调多模态理解、长上下文推理、结构化生成和工具增强执行。其在执行复杂指令和多重约束方面的能力非常出色,能够稳定处理诸如多步复杂规划、复杂图文推理、视频内容理解和高难度分析等场景。
Providers
DeepSeek-V4 拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。 相比前代模型,DeepSeek-V4-Pro 的 Agent 能力显著增强。在 Agentic Coding 评测中,V4-Pro 已达到当前开源模型最佳水平,并在其他 Agent 相关评测中同样表现优异。
DeepSeek-V4 拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。 相比 DeepSeek-V4-Pro,DeepSeek-V4-Flash 在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下 V4-Flash 能够提供更加快捷、经济的 API 服务。
原生全模态感知 + 1M 上下文 — 支持图像、视频、音频、文本的原生理解,实现跨模态精准感知与长程推理,综合感知能力跻身行业前沿。 强大的全模态 Agent 能力 — 具备原生 Agent 执行能力,可高效完成浏览、理解、推理与操作等复杂任务,日常任务表现比肩 MiMo V2.5 Pro。 性能与效率兼备 — 在保持领先能力的同时,实现更优的 token 效率,位于性能与效率的 Pareto 前沿。
Qwen3.5原生视觉语言系列Plus模型,相较于2月15日快照,本模型在Agentic coding能力上大幅提升;推理速度显著提升;知识、推理与长上下文能力保持较高水准,满足复杂Agent任务的需求,适合应用于编码智能体、生产工作流和高吞吐场景。该版本为2026年4月20日快照。
Providers
Kimi K2.6 是 Kimi 最新最智能的模型,Kimi K2.6 的通用 Agent、代码、视觉理解等综合能力得到全面提升,其中在博士级难度的完整版人类最后的考试(Humanity’s Last Exam)、在考察模型真实软件工程能力的 SWE-Bench Pro、评估 Agent 深度检索能力的 DeepSearchQA 等基准测试中均取得行业领先的成绩,同时支持文本、图片与视频输入,思考与非思考模式,对话与 Agent 任务。
Providers
GLM-5.1 是智谱最新旗舰模型,代码能力大大增强,长程任务显著提升,能够在单次任务中持续、自主地工作长达 8 小时,完成从规划、执行到迭代优化的完整闭环,交付工程级成果。 在综合能力与 Coding 能力上,GLM-5.1 整体表现对齐 Claude Opus 4.6,并在长程自主执行、复杂工程优化与真实开发场景中展现出更强的持续工作能力,是构建 Autonomous Agent 与长程 Coding Agent 的理想基座。
GLM-5V-Turbo 是智谱首个多模态 Agent 基座模型,面向视觉编程与复杂任务场景深度优化,支持图像、视频、文本与文件等多模态输入,强化视觉理解、长程规划与动作执行能力。相比通用多模态模型,它更适合融入 Agent 工作流,完成「环境感知 → 任务规划 → 执行落地」的完整闭环,让多模态能力从“能看懂”走向“能行动”。
Providers
Agentic指令遵循:在包含 50+ skills、60–150 个 feature list 的复杂环境中,M2.7 仍能保持稳定的技能调用与指令遵循能力,有效缓解大规模 skill library 场景下常见的遵从能力下降问题;针对需要 几十个技能协同的复杂任务进行优化,能够在长流程、多步骤的 Agent 场景中稳定完成复杂任务拆解与执行。 领先的 Agent Harness 能力,支持 Agent Teams、多工具检索(Tool Search)、多种 Agent 脚手架功能,便于构建复杂的多 Agent 系统。 强工程与 Coding 能力:在真实工程场景中具备优秀表现,包括 日志分析与 Bug 定位、代码重构、代码安全(生成无漏洞代码)、机器学习、Android 开发 等能力。 复杂 Office 自动化能力:支持复杂 Excel / Word / PPT 办公任务及多轮编辑。
Providers
Agentic指令遵循:在包含 50+ skills、60–150 个 feature list 的复杂环境中,M2.7 仍能保持稳定的技能调用与指令遵循能力,有效缓解大规模 skill library 场景下常见的遵从能力下降问题;针对需要 几十个技能协同的复杂任务进行优化,能够在长流程、多步骤的 Agent 场景中稳定完成复杂任务拆解与执行。 领先的 Agent Harness 能力,支持 Agent Teams、多工具检索(Tool Search)、多种 Agent 脚手架功能,便于构建复杂的多 Agent 系统。 强工程与 Coding 能力:在真实工程场景中具备优秀表现,包括 日志分析与 Bug 定位、代码重构、代码安全(生成无漏洞代码)、机器学习、Android 开发 等能力。 复杂 Office 自动化能力:支持复杂 Excel / Word / PPT 办公任务及多轮编辑。
GLM-5-Turbo 是面向真实 Agent 长链路任务深度优化的模型,重点提升了复杂指令拆解、工具调用、定时持续执行与长任务稳定性。相比通用对话模型,它更适合进入真实业务流程,让龙虾从“能聊”走向“能做”。
Providers
Seed-2.0-Lite 是一款功能全面且极具成本效益的企业级主力模型。它不仅具备强大的多模态与智能体(Agent)能力,还实现了显著降低的延迟,使其成为涵盖文本、视觉及工具应用等各类生产级工作负载的理想默认之选。该模型专为高频视觉理解及智能体驱动型工作流而精心打造,是实现大规模部署并确保极低延迟的绝佳方案。
Providers
Seed-2.0-mini 面向对延迟敏感、高并发及成本敏感的场景,强调快速响应与灵活的推理部署。支持 256k 上下文窗口及四种推理强度模式(极简/低/中/高),具备多模态理解能力,并针对那些将成本与速度置于首位的轻量级任务进行了专门优化。
Providers
Doubao-Seed-Code 针对智能体编程任务进行了深度优化,在多个权威基准测试(包括 Terminal Bench、SWE-Bench-Verified-Openhands 和 Multi-SWE-Bench-Flash-Openhands)中展现出卓越的性能,超越了国内同类模型,并支持高达 256k token 的上下文窗口。
Providers
MiniMax M2.5 的更高吞吐版本,适合对延迟更敏感的生产场景。
Providers