Kimi K2.6 是西方开发者现在应该基于构建的模型。Moonshot 最新的开源模型发布巩固了其作为全球领先开源中文模型厂商的地位——更重要的是,它首次为西方研究团队提供了一个真正可行的中文语言基座,可以自由微调、审查和部署,不受许可限制。
该模型采用 1万亿参数 MoE 架构,320亿激活参数,384个专家(8个路由+1个共享),MLA注意力机制,25.6万上下文窗口,原生多模态支持,以及INT4量化。基准测试显示,K2.6在SWE-Bench Pro达到58.6分,SWE-bench多语言版本达到76.7分,数学视觉达到93.2分。更值得关注的是:在Moonshot自有评测中,与Gemini 3.1 Pro的胜率和平局率合计68.6%,在工具调用(HLE 54.0)和文档理解(CharXiv 86.7)上表现尤为突出。
这个发布在架构上真正有趣的是320亿激活参数与25.6万上下文窗口和多模态的组合。你可以在2-4块H100上运行K2.6,同时获得前沿级别的长文档任务和多语言工作负载性能。代理能力进一步扩展了这一边界:4000+工具调用、12小时以上连续运行、300个并行子代理通过"Claw Groups"进行协调——这是Moonshot的多智能体编排层。早期的社区报告显示,有人用K2.6运行了5天的自主基础设施代理、内核重写,以及一个比LM Studio快20 TPS的Zig推理引擎。
发布首日的生态系统支持异常广泛:vLLM、OpenRouter、Cloudflare Workers AI、Baseten、MLX、Hermes Agent和OpenCode都在发布时获得了可用集成。INT4量化使预算有限的开发者也能在本地部署。
对西方研究者而言,"开源"标签才是真正的故事所在。K2.6提供了一个具有真正能力的中文语言模型——320亿激活参数使其在学术计算预算下变得可负担,25.6万上下文窗口能处理真实世界的文档工作负载,而开源权重使得封闭API在结构上无法实现的可解释性研究和安全分析成为可能。构建多语言产品而不牺牲中文能力一直是一个持续的痛点;K2.6是第一个直接解决这一问题的开源模型。
从K2.5到K2.6的三个月差距显示了Moonshot的执行速度。在开源模型军备竞赛中,他们不仅仅是竞争——他们在定义前沿。这是一款为那些追求能力、开放性和可构建性的开发者准备的模型。