模型发布综合自 1 个来源

阿里视频模型1334分登顶社区评测榜

要点

• Wan2.7以1334 Elo登顶DesignArena视频模型榜单
• DesignArena采用人类偏好聚合，而非自动评分
• 社区驱动评测有效抵制厂商刷分行为
• 模型在时序一致性和提示词遵从度上均有提升

参考来源 (1)

[1] 阿里视频生成模型Wan2.7登顶DesignArena — 量子位 QbitAI ↗

阿里最新视频生成模型Wan2.7在DesignArena上斩获1334 Elo评分，这一数字让其在所有参评视频AI中排名第一。但这不是某家公司自吹自擂的内测成绩。DesignArena是一个社区驱动的评测平台，用户直接对比不同模型的生成结果，人类偏好最终汇聚成Elo评分。区别在于：传统榜单由厂商选择发布哪些测试，而DesignArena的用户自己决定哪个视频更好看。

Wan2.7的1334分来自平台上的数千次正面交锋。该模型在各类提示词和生成风格下均表现稳定，表明架构具备处理多样化视频生成任务的能力。早期输出显示，时序一致性明显提升——帧与帧之间保持视觉连贯性，提示词遵从度也优于前代版本。

这一排名的意义远超数字本身。DesignArena之所以成为视频AI可信度的标尺，正是因为其评测方法难以被操控。当一款模型登顶DesignArena，意味着它经历了真正使用这些工具的从业者的审视，而非仅仅通过模型创造者设计的考试。在一个benchmark作弊盛行的领域，这件事本身就有分量。

它解锁的是更难量化却更容易感知的东西：对能力声明的信任。Wan2.7的DesignArena排名表明，阿里巴巴打造了一款被AI社区公认具有竞争力的视频模型。能否转化为商业落地或下游应用另当别论，但社区投票已经给出了明确的答案。1334分将Wan2.7推入极少数视频生成模型才达到的行列——而且这个数字来自真正对比过这些输出的数千名用户。