阿里最新视频生成模型Wan2.7在DesignArena上斩获1334 Elo评分,这一数字让其在所有参评视频AI中排名第一。但这不是某家公司自吹自擂的内测成绩。DesignArena是一个社区驱动的评测平台,用户直接对比不同模型的生成结果,人类偏好最终汇聚成Elo评分。区别在于:传统榜单由厂商选择发布哪些测试,而DesignArena的用户自己决定哪个视频更好看。
Wan2.7的1334分来自平台上的数千次正面交锋。该模型在各类提示词和生成风格下均表现稳定,表明架构具备处理多样化视频生成任务的能力。早期输出显示,时序一致性明显提升——帧与帧之间保持视觉连贯性,提示词遵从度也优于前代版本。
这一排名的意义远超数字本身。DesignArena之所以成为视频AI可信度的标尺,正是因为其评测方法难以被操控。当一款模型登顶DesignArena,意味着它经历了真正使用这些工具的从业者的审视,而非仅仅通过模型创造者设计的考试。在一个benchmark作弊盛行的领域,这件事本身就有分量。
它解锁的是更难量化却更容易感知的东西:对能力声明的信任。Wan2.7的DesignArena排名表明,阿里巴巴打造了一款被AI社区公认具有竞争力的视频模型。能否转化为商业落地或下游应用另当别论,但社区投票已经给出了明确的答案。1334分将Wan2.7推入极少数视频生成模型才达到的行列——而且这个数字来自真正对比过这些输出的数千名用户。