长期以来,开发者们习惯性地要求AI助手“输出Markdown”——仿佛简洁语法和token效率是不可撼动的金科玉律。但现在,这个正统观念正受到来自Anthropic内部的挑战,而这场争论揭示了一个更深层的真相:AI输出格式已经成为了一个一级产品哲学问题,而非单纯的工程技术细节。
Anthropic Claude Code团队的工程师Thariq Shihipar发布了一篇被Simon Willison称为“HTML令人难以置信的有效性”的文章——这是一个反对Markdown传统智慧的有力论据。核心论点很简单:当你让AI以HTML而非Markdown格式输出时,你解锁了SVG图表、交互式小部件、页内导航,以及纯文本格式根本无法表达的丰富视觉解释。
这对于开发者工具来说意义重大。试想一个代码审查场景的提示词:“创建一个HTML产物来描述这个PR,重点关注流式处理/背压逻辑。用行内边注渲染diff,按严重程度着色标注。”用Markdown,你只能得到静态文本。用HTML,克劳德可以生成可导航、可视化、真正有用的内容。
这场争论的深层张力在于格式偏好的根本分歧。Markdown支持者长期主张token效率——这种轻量级语法的格式意味着在上下文窗口内有更多空间容纳实际内容。在GPT-4时代的8,192 token限制下,这是一种合理关切。但随着上下文窗口扩大、模型能力增强,计算逻辑已经改变。Simon Willison坦承自己“从GPT-4时代起就默认要求大多数内容用Markdown”——但在读完Thariq的文章后,他开始重新考虑这一做法。
然而,并非所有人都被说服。一些开发者认为HTML输出引入了脆弱性——浏览器渲染不一致、CSS依赖,以及调试标记而非内容的认知负担。还有人担心提示工程的复杂性:获得丰富的HTML通常需要明确指令,而Markdown的格式可以从清晰的请求中自然涌现。
真正的赌注在Willison用GPT-5.5测试这种方法处理一个近期披露的Linux安全漏洞时才变得清晰可见。生成结果是一个深色主题、语法高亮、技术结构化的文档——这是Markdown无论怎么优化提示词都无法企及的。它不仅仅更好看,而是真正更有助于理解。
这场争论标志着一个更广泛的转变:AI输出格式不再是带宽节约的问题,而是语义丰富度的问题——格式能够表达什么,而非它压缩得有多高效。对于开发者工具而言,精确性和可导航性直接影响生产力,“Markdown还是HTML?”这个问题实际上是在问:“你想要AI为你构建什么样的认知产物?”
Anthropic团队正在推动的答案是:能够真正使用的东西,而不仅仅是阅读的东西。