Markdown要凉…卡帕西也站HTML了

量子位 2026-05-12 13:37

Markdown，当死。

这个暴论，出自今天Anthropic工程师Thariq发的一篇引爆全网的长文。

整篇文章，就一个目的——

给MD宣判「死刑」。

是的，这个前不久风靡vibe coding的人机交流格式，正在被Claude的工程师们呼吁抛弃。

我现在几乎不怎么亲手编辑这些文件了，更多是拿它们当规范、参考文档或者头脑风暴的产出。就算真要改，通常也是直接丢给Claude去修。

不是，你等等。

我刚学会用MD……

又死了？？？

那，替代品是啥啊？下一个该学什么？

Thariq的答案，出乎意料：

HTML。

我现在不管是做规划、需求设计、方案探索，还是代码审查和整理报告，全都在用HTML……

其实吧，如果光Thariq这么说，不能代表什么。

关键评论区共鸣的人太多了，这本身就代表一种趋势。

连卡帕西都表示说的太对，反手给出一个认可：

这方法是真的好用。

以下是经过整理，更方便大家阅读的版本。

Enjoy。

Anthropic工程师力推HTML，为什么？

这种格式之争的内容，用对比方式呈现是最方便理解的。

在Thariq看来，HTML大于MD，有5点原因。

我把这5点都一条条列出来了，也做了图，大家可以对照着看。

1、信息密度碾压

Markdown能做什么？标题、加粗、列表、代码块。差不多了。

但HTML可以做的事情，多到离谱——表格、CSS样式、SVG矢量图、JavaScript交互、Canvas画布、绝对定位的空间布局……

几乎没有任何一类信息，是AI读得懂但HTML表达不了的。

你可能见过Claude Code在Markdown里用ASCII码画流程图的样子，或者用Unicode色块去「估算颜色」的名场面。

就是这张图。

太心酸了，就像逼着一个画家用筷子画油画，还要求人家必须画出个蒙娜丽莎。

2、可读性

MD，性缩力拉满了。

Thariq一直这么觉得，超过100行的Markdown文件，他基本就不读了。

更别提让团队里其他人去读。

这一点可太有共鸣了。

不知道大家是不是这样，反正每次Claude Code和Codex吭哧吭哧给我干出的两百多行的plan.md……我从来没认真看过。

瞟一眼，就一句「开工」发出去了。

但HTML应该会好一点。

AI可以把同样的信息组织成带标签页、带导航、带折叠区块的页面，甚至可以做成响应式的，手机上看也舒服。

对比如下，瞅瞅——

说实话，左边的甚至会选择性忽略，大脑算力瞟一眼就感觉要不够用了。

没办法，sorry了小MD，咱们人类还是爱看图啊。

3、分享成本几乎为零

Markdown文件你怎么分享？发附件。对方还得找个能渲染的工具打开。

HTML呢？

往S3上一传，甩个链接，浏览器直接打开。

发给同事或老板，发给朋友炫耀，都很方便。

功利点说，HTML就是颜值即正义，方便即正义。

你的spec、你的报告、你的PR说明，被别人真正读到的概率，HTML比Markdown高出太多了。

这也是为什么，AI时代，个人网站成了新的简历形式。

4、双向交互

HTML是可以交互的。

你可以让Claude给设计稿加上滑块和旋钮，拖一拖就能调整参数。

你可以让它做一个可拖拽的看板来重新排列任务优先级。

你甚至可以让它做一个实时预览的Prompt编辑器。

左边改Prompt，右边立刻看到填充效果。

改完了点一个Copy按钮，把参数直接粘回Claude Code。

5、快乐

这是Thariq给出的最后一点理由：

用HTML做东西，更好玩。

说真的，这可能是最重要的一条。

当你跟一个工具协作时感到快乐，你就会更愿意投入，更愿意打磨，最终产出的东西质量就是更高。

大家之所以会沉迷于vibe coding，不就是因为找回了那份原始的快乐吗。

Thariq的用法清单

不止是纸上谈兵，Thariq自己早已成为忠实的HTML信徒。

他在文章里列了很多具体的使用场景。大家可以照猫画虎，用这个当入门教材。

1、规划和探索

开始一个项目的时候，不再写一个plan.md，而是让Claude Code生成一组HTML文件。

先做头脑风暴，把几个方向做成可视化的对比页面。

然后，选一个方向深入，做mockup、写代码片段。最后整理成一份实施计划。

有Prompt，大家可以存一存：

我不确定入门引导页该怎么做。生成6种完全不同的方案——布局、语气、信息密度都要有差异——放在一个HTML文件里用网格排列，让我能并排比较。每种方案标注它做了什么取舍。

最后长这样。

2、代码审查

这个是真的刚需。

在Markdown里看diff，太痛苦了。

但HTML可以渲染真正的diff视图，加上行内批注、按严重程度标颜色、画流程图来解释代码逻辑。

就像这样。

Thariq说，他现在每个PR都会附一个HTML格式的代码说明。

我们自己内部也有一个类似的错误审查skill，生成的就是HTML，一眼就能看到错字。

3、设计和原型

这个就不用多说了，HTML在交互方面就是天生优势，很适合用来做前端。

4、报告和研究

让Claude Code去翻你的Slack、你的代码库、你的git历史、互联网上的资料，然后把所有信息整合成一份可读性极高的HTML报告。

可以是一份长文档，可以是一个交互式的解释器，甚至，可以是一个幻灯片。

5、一次性编辑器

这个玩法很有意思。

当你用纯文字很难描述你想要什么的时候，让Claude给你做一个「一次性编辑器」。

对，一次性，不是可复用的工具，就是一个专门为你当前这件事做的HTML页面。

比如你有30个Linear ticket需要重新排优先级。让Claude做一个拖拽看板，预排一遍，你调整完，点一下按钮导出成Markdown。

或者说你在调一个system prompt。让Claude做一个左右分栏的编辑器，左边改Prompt，右边实时预览，带token计数器和copy按钮。

奢侈这一块，用完就扔。

但它帮你省下的时间和脑力，远超你花在描述需求上的30秒。

Q&A环节～

写到这里，我知道有些朋友肯定要问了。

HTML不是更费token吗？

其实吧，这篇文章下面不少网友也是在质疑这点。

有网友现身说法：

自己一个人同时维护7个项目，包括代码、设计稿、培训材料和学习模块。

他算了一笔账：

同样内容下，425个Markdown文件一年大约烧6600美元上下文成本；换成HTML后，直接涨到1.1万美元。

等于每年多花5000美元，只是为了那些模型根本用不上的HTML标签。

甚至有网友调侃，这就是Anthropic的小阴招：

Anthropic真是天才，竟然还能想到更快榨干大家usage的新办法。

好吧，Thariq也承认，HTML生成时间大概是Markdown的2到4倍。

但他觉得值。

因为你真的会去读它，而且读完之后获得的信息量远超一份你看两眼就关掉的MD文件。

而且，随着Opus 4.7的100万token上下文窗口，这点额外开销其实感知不强。

另一个问题，版本控制怎么办？

这确实是HTML最大的短板。

HTML的diff很吵，很难review。

Thariq没有给出完美的解决方案。

坦率的讲，我觉得这个问题现阶段确实无解。

所以咱还是以衡量trade off为主吧，如果你用HTML的场景主要是一次性的规划文档、报告、代码审查说明这类东西，版本控制的需求本来就没那么强。

最后一个问题。

假如说，我真的被说服了，假如说，我从今天就开始用HTML。

那——

怎么让AI生成好看的HTML？

最方便的方式就是skill，现在有不少前端设计skill，用上后AI味确实会小很多。

但如果你想匹配自己公司的独特视觉风格，Thariq的建议是：

先让Claude读你的代码库，生成一个设计系统HTML文件，然后用这个文件作为后续所有HTML的参考。

但提醒一句，前提是要有足够的数据资产，并且风格已经高度固定且成熟了。

不然后面可能会被污染，迭代成AI Slop。

卡帕西也附议了

这篇文章发出来之后，全网都炸了。

连卡帕西都跑出来附议:

当下最值得尝试的热门建议：试试要求输出HTML。

但角度不太一样，卡帕西更宏观一点，他画了一条从文字到视觉的进化路线:

纯文本（难读，费劲）
Markdown（加粗、斜体、标题，稍微好看点）
HTML（还是代码驱动的，但在图形、布局、交互上灵活太多了）
……

至于这条路的终点，卡帕西表示，可能是某种由扩散模型直接生成的交互式视频。

听起来很科幻？

其实吧，你看看最近病毒式传播的那个神经渲染demo，也许没那么远。

就这玩意儿。

很多东西的实现成本，都被AI打爆了。

上面说的是输出形式的问题。

卡帕西还提了一个很有意思的点：输入端也需要进化。

光靠语音也不够，他觉得自己需要能「指」东西——

指着屏幕上的某个位置说「这里改一下」，就像你身边坐着一个人的时候会自然做的那样。

现在的解决方案是截图，或者像Stitch里那样可以圈出来，但大家肯定都能感受到，还是不够极致。

归根结底，人类和AI之间的输入/输出心智融合还在进行中，在脑机接口真的之前，还有大量进展空间。

哥白尼式智能观

太魔幻了，2026年，HTML真成了一种「编程语言」。

还是被Anthropic工程师认证的那种……

但我觉得，这件事的意义，远不止格式标准之争这么简单。

Markdown也好，HTML也罢，本质上都是为人机交互而生的一种范式。

Markdown是为人类设计的。它简单、直觉、容易手写手编。它存在的全部理由，就是「方便人类使用」。

但现在，谁在写这些文件？

不是你。是AI。

谁在读这些文件？

也越来越多地，不只是你。是你和AI一起读。

甚至有时候，只有AI在读。

确实，HTML是有些信息冗余。

但它是半结构化的。能精确定位、精准修改，扔进浏览器就能直接出预览。

而这些特质，恰恰完美适配了现在的vibe coding工作流。

读完Thraiq的文章，最大的感叹是：

原来AI原生，一直是一件相当具象化的事情。

一切真的都在被改写。那些过去一切以人类为中心的规则，正在被冲击、被重塑。

CLI正在回归，自然语言正在取代GUI，代码本身正在变成一种中间产物，而不是最终产品。

所有曾经为了「方便人类操作」而精心设计的东西，都在被重新审视。

不是因为它们不好，而是因为它们曾经优化的那个唯一目标——人类体验——现在只能退居其次，变成众多目标中的一个了。

这让我想起陶哲轩说过的一段话。

他说，我们正在经历一场认知上的哥白尼革命：

曾经我们以为人类智能是宇宙的中心，而现在终于发现，宇宙中存在着各种截然不同的智能形态，各有其独特的优势与局限。

过去，一切以人类为中心。文件格式、交互界面、编程语言，乃至整个软件工程的范式，都围绕着「让人类更高效地表达意图」而运转。

而如今，这个中心，正在松动。

当创作者和消费者都不再是纯粹的人类时，那个为「纯粹人类」设计的世界，或许……注定会逐渐坍塌。

但有时我会尝试说服自己，真的，真的不要焦虑。

或许，这个旧「智能世界观」坍塌的过程，反而会帮助人类？

它会帮助我们，逼着我们在废墟中去重新找到那个——

「生而为人」，更精准的意义。

就比如当年，天文学家承认了宇宙的浩大之后，反而激起了人类更强烈的好奇心。所以我们更加渴望走出去了，所以我们更拼命地想跑得快一点，再快一点……

今天，AI正把我们带进一个更远、更陌生的名叫「智能」的宇宙。

一切都回归了起点。大家都在同一片森林里，没人一开始就能看清全貌。

即便是Anthropic的工程师，也是摸爬滚打到现在，才突然意识到「HTML当立」这件事。

所以，或许从现在开始，我们可以试着抛掉人类对于传统智能的那份固执。

试着从第一性原理出发——

去质疑一切吧。

（来源：量子位）

扫码下载app 最新资讯实时掌握

MarkDown HTML AI

上一篇OpenAI 前 CTO 创业大模型首秀，第一剑先斩 ChatGPT 聊天框

下一篇Claude Code终于长出调度台：一个屏幕盯住所有AI会话，无需多开