本周Meta AI发布最值得关注的数字,不在任何基准测试表里。它是发布后24小时内,从App Store第57位飙升至第5位的排名跃升。
52位的排名跃升才是真正的信号。Muse Spark是Meta首个完全脱离Llama架构的模型——运行在全新内部栈上——而市场正用下载量投票。技术博主Simon Willison的实测揭示了用户实际体验:他的"鹈鹕测试"在Instant模式下生成了一只畸形的鹈鹕骑着变形的自行车,而Thinking模式下则是一只戴着蓝色骑行头盔、清晰可辨的鹈鹕。这个差异不是表面文章——它决定了产品是玩具还是工具。
Thinking模式才是让Muse Spark值得关注的重点。Meta在meta.ai上提供两种截然不同的推理模式:快速的"Instant"响应和更慢但质量更高的"Thinking"路径。基准测试具有竞争力——Meta自报的成绩显示,在选定测试中Muse Spark与Opus 4.6、Gemini 3.1 Pro和GPT 5.4并列。但该公司承认在Terminal-Bench 2.0上落后,特别指出长周期智能体任务和代码工作流是需要改进的领域。计划中的"Contemplating"模式承诺更长的推理链,对标GPT-5.4 Pro的深度。
API访问仍严格受限。Muse Spark目前仅提供托管版本——不开放权重——访问权限仅限于特定合作伙伴的私人API预览。公开定价尚未公布。这使得Muse Spark直接与OpenAI和Google的托管产品竞争,而非Llama曾经主导的开源生态。
但App Store排名实际上告诉我们:用户选择的是质量,而非品牌惯性。Willison生成的鹈鹕SVG不是精心挑选的演示——任何人都可以复现。当人们下载应用、尝试使用、并向他人推荐时,这不是营销投入。这是产品与市场契合正在实时形成。
Meta多年来一直是AI领域的追赶者,发布的Llama模型令研究人员印象深刻,但消费产品却落后于人。Muse Spark表明情况已经改变。问题不再是Meta能否构建有竞争力的模型——而是他们能否在App Store榜单的新鲜感消退后维持用户注意力。未来几周将揭示这次飙升是真正的用户迁移还是短暂的好奇心。无论如何,Meta刚刚证明它能构建人们真正想用的产品。