千问刚刚发布了4个新模型!

千问年后这是立刻开工, 刚刚一口气发布了4个模型! 包括 MoE 模型 Qwen3.5-122B-A10B, Qwen3.5-35B-A3B, Dense 模型 Qwen3.5-27B, 以及基模 Qwen3.5-35B-A3B-Base. 加上之前发布的旗舰 Qwen3.5-397B-A17B, Qwen3.5 系列已经集齐了从 3B 激活到 17B 激活的完整产品线.
注意, 这些模型全都是原生多模态的! 文本、图像、视频统统原生支持, 不是拼接的方案. 架构上用了 Gated DeltaNet 线性注意力 + 全注意力的混合架构, 再结合稀疏 MoE, 推理性能爆表. 原生 262K 上下文, 通过 YaRN 可扩展到 1M token. 还支持 Multi-Token Prediction (MTP) 多 token 预测加速推理, 以及原生 FP8 训练.
跑分上这几个模型各有亮点, 给大家梳理一下适用场景:
Qwen3.5-122B-A10B 是中杯里的全能选手, 10B 激活参数就能在大部分任务上逼近旗舰 397B. 性能上也差不多, 非常适合需要强综合能力又想控制推理成本的场景.
Qwen3.5-27B 是唯一的 Dense 模型, 指令遵循能力炸裂 – IFEval 95.0 全系列第一! 数学竞赛 HMMT 92.0 仅次于 397B 旗舰. 代码能力也不弱, SWE-bench 72.4 和 LiveCodeBench 80.7 都超过了 122B. 作为稠密模型部署简单, 不需要 MoE 的特殊推理优化, 特别适合本地部署跑 Agent 任务和编程辅助.
Qwen3.5-35B-A3B 只有 3B 激活参数, 但别小看它 – AndroidWorld 安卓操控 71.1 全系列最高 (是的, 比 397B 旗舰的 66.8 还高)! TAU2-Bench 对话 Agent 也有 81.2, 在非旗舰模型中最优. 超低的激活参数意味着可以在消费级显卡甚至端侧设备上运行, 是做移动端 Agent 和轻量化部署的最佳选择.
至于旗舰 397B-A17B, 则在绝大多数任务上保持领先: 知识、推理、搜索、多语言、视觉几乎全面碾压. 适合不差算力、追求极致性能的场景.
这波 Qwen3.5 不是简单地出个中杯大杯超大杯, 而是每个尺寸都有自己的”优势项目”, 尤其是 35B-A3B 这个尺寸反而是专门为移动端Agent调优的, 有意思
预感一波基于Qwen3.5魔改的有趣模型马上就要在社区诞生了, Qwen这生态真的猛.