×
加载中...
Markdown要凉…卡帕西也站HTML了
量子位 2026-05-12 13:37

Markdown,当死。

这个暴论,出自今天Anthropic工程师Thariq发的一篇引爆全网的长文。

整篇文章,就一个目的——

给MD宣判「死刑」。

图片

是的,这个前不久风靡vibe coding的人机交流格式,正在被Claude的工程师们呼吁抛弃。

我现在几乎不怎么亲手编辑这些文件了,更多是拿它们当规范、参考文档或者头脑风暴的产出。就算真要改,通常也是直接丢给Claude去修。

不是,你等等。

我刚学会用MD……

又死了???

图片

那,替代品是啥啊?下一个该学什么?

Thariq的答案,出乎意料:

HTML。

我现在不管是做规划、需求设计、方案探索,还是代码审查和整理报告,全都在用HTML……

图片

其实吧,如果光Thariq这么说,不能代表什么。

关键评论区共鸣的人太多了,这本身就代表一种趋势。

图片
图片

连卡帕西都表示说的太对,反手给出一个认可:

这方法是真的好用。

图片

以下是经过整理,更方便大家阅读的版本。

Enjoy。

Anthropic工程师力推HTML,为什么?

这种格式之争的内容,用对比方式呈现是最方便理解的。

在Thariq看来,HTML大于MD,有5点原因。

我把这5点都一条条列出来了,也做了图,大家可以对照着看。

图片

1、信息密度碾压

Markdown能做什么?标题、加粗、列表、代码块。差不多了。

但HTML可以做的事情,多到离谱——表格、CSS样式、SVG矢量图、JavaScript交互、Canvas画布、绝对定位的空间布局……

几乎没有任何一类信息,是AI读得懂但HTML表达不了的。

图片

你可能见过Claude Code在Markdown里用ASCII码画流程图的样子,或者用Unicode色块去「估算颜色」的名场面。

就是这张图。

图片

太心酸了,就像逼着一个画家用筷子画油画,还要求人家必须画出个蒙娜丽莎。

2、可

MD,性缩力拉满了。

Thariq一直这么觉得,超过100行的Markdown文件,他基本就不读了。

更别提让团队里其他人去读。

这一点可太有共鸣了。

不知道大家是不是这样,反正每次Claude Code和Codex吭哧吭哧给我干出的两百多行的plan.md……我从来没认真看过。

瞟一眼,就一句「开工」发出去了。

但HTML应该会好一点。

AI可以把同样的信息组织成带标签页、带导航、带折叠区块的页面,甚至可以做成响应式的,手机上看也舒服。

对比如下,瞅瞅——

说实话,左边的甚至会选择性忽略,大脑算力瞟一眼就感觉要不够用了。

图片

没办法,sorry了小MD,咱们人类还是爱看图啊。

3、分享成本几乎为零

Markdown文件你怎么分享?发附件。对方还得找个能渲染的工具打开。

HTML呢?

往S3上一传,甩个链接,浏览器直接打开。

发给同事或老板,发给朋友炫耀,都很方便。

功利点说,HTML就是颜值即正义,方便即正义。

你的spec、你的报告、你的PR说明,被别人真正读到的概率,HTML比Markdown高出太多了。

这也是为什么,AI时代,个人网站成了新的简历形式。

4、双向交互

HTML是可以交互的。

你可以让Claude给设计稿加上滑块和旋钮,拖一拖就能调整参数

你可以让它做一个可拖拽的看板来重新排列任务优先级。

你甚至可以让它做一个实时预览的Prompt编辑器。

左边改Prompt,右边立刻看到填充效果。

图片

改完了点一个Copy按钮,把参数直接粘回Claude Code。

5、快乐

这是Thariq给出的最后一点理由:

用HTML做东西,更好玩。

说真的,这可能是最重要的一条。

当你跟一个工具协作时感到快乐,你就会更愿意投入,更愿意打磨,最终产出的东西质量就是更高。

大家之所以会沉迷于vibe coding,不就是因为找回了那份原始的快乐吗。

Thariq的用法清单

不止是纸上谈兵,Thariq自己早已成为忠实的HTML信徒。

他在文章里列了很多具体的使用场景。大家可以照猫画虎,用这个当入门教材。

1、规划和探索

开始一个项目的时候,不再写一个plan.md,而是让Claude Code生成一组HTML文件。

先做头脑风暴,把几个方向做成可视化的对比页面。

然后,选一个方向深入,做mockup、写代码片段。最后整理成一份实施计划。

有Prompt,大家可以存一存:

我不确定入门引导页该怎么做。生成6种完全不同的方案——布局、语气、信息密度都要有差异——放在一个HTML文件里用网格排列,让我能并排比较。每种方案标注它做了什么取舍。

最后长这样。

图片

2、代码审查

这个是真的刚需。

在Markdown里看diff,太痛苦了。

但HTML可以渲染真正的diff视图,加上行内批注、按严重程度标颜色、画流程图来解释代码逻辑。

就像这样。

图片

Thariq说,他现在每个PR都会附一个HTML格式的代码说明。

我们自己内部也有一个类似的错误审查skill,生成的就是HTML,一眼就能看到错字。

3、设计和原型

这个就不用多说了,HTML在交互方面就是天生优势,很适合用来做前端。

图片

4、报告和研究

让Claude Code去翻你的Slack、你的代码库、你的git历史、互联网上的资料,然后把所有信息整合成一份可读性极高的HTML报告。

可以是一份长文档,可以是一个交互式的解释器,甚至,可以是一个幻灯片。

图片

5、一次性编辑器

这个玩法很有意思。

当你用纯文字很难描述你想要什么的时候,让Claude给你做一个「一次性编辑器」。

对,一次性,不是可复用的工具,就是一个专门为你当前这件事做的HTML页面。

图片

比如你有30个Linear ticket需要重新排优先级。让Claude做一个拖拽看板,预排一遍,你调整完,点一下按钮导出成Markdown。

或者说你在调一个system prompt。让Claude做一个左右分栏的编辑器,左边改Prompt,右边实时预览,带token计数器和copy按钮。

奢侈这一块,用完就扔。

但它帮你省下的时间和脑力,远超你花在描述需求上的30秒。

Q&A环节~

写到这里,我知道有些朋友肯定要问了。

HTML不是更费token吗?

其实吧,这篇文章下面不少网友也是在质疑这点。

有网友现身说法:

自己一个人同时维护7个项目,包括代码、设计稿、培训材料和学习模块。

他算了一笔账:

同样内容下,425个Markdown文件一年大约烧6600美元上下文成本;换成HTML后,直接涨到1.1万美元

等于每年多花5000美元,只是为了那些模型根本用不上的HTML标签。

图片

甚至有网友调侃,这就是Anthropic的小阴招:

Anthropic真是天才,竟然还能想到更快榨干大家usage的新办法。

图片

好吧,Thariq也承认,HTML生成时间大概是Markdown的2到4倍。

但他觉得值。

因为你真的会去读它,而且读完之后获得的信息量远超一份你看两眼就关掉的MD文件。

而且,随着Opus 4.7的100万token上下文窗口,这点额外开销其实感知不强。

另一个问题,版本控制怎么办?

这确实是HTML最大的短板。

HTML的diff很吵,很难review。

Thariq没有给出完美的解决方案。

坦率的讲,我觉得这个问题现阶段确实无解。

所以咱还是以衡量trade off为主吧,如果你用HTML的场景主要是一次性的规划文档、报告、代码审查说明这类东西,版本控制的需求本来就没那么强。

最后一个问题。

假如说,我真的被说服了,假如说,我从今天就开始用HTML。

那——

怎么让AI生成好看的HTML?

最方便的方式就是skill,现在有不少前端设计skill,用上后AI味确实会小很多。

但如果你想匹配自己公司的独特视觉风格,Thariq的建议是:

先让Claude读你的代码库,生成一个设计系统HTML文件,然后用这个文件作为后续所有HTML的参考。

但提醒一句,前提是要有足够的数据资产,并且风格已经高度固定且成熟了。

不然后面可能会被污染,迭代成AI Slop。

卡帕西也附议了

这篇文章发出来之后,全网都炸了。

连卡帕西都跑出来附议:

当下最值得尝试的热门建议:试试要求输出HTML。

但角度不太一样,卡帕西更宏观一点,他画了一条从文字到视觉的进化路线:

  • 纯文本(难读,费劲)

  • Markdown(加粗、斜体、标题,稍微好看点)

  • HTML(还是代码驱动的,但在图形、布局、交互上灵活太多了)

  • ……

图片

至于这条路的终点,卡帕西表示,可能是某种由扩散模型直接生成的交互式视频。

听起来很科幻?

其实吧,你看看最近病毒式传播的那个神经渲染demo,也许没那么远。

就这玩意儿。

很多东西的实现成本,都被AI打爆了。

上面说的是输出形式的问题。

卡帕西还提了一个很有意思的点:输入端也需要进化。

光靠语音也不够,他觉得自己需要能「指」东西——

指着屏幕上的某个位置说「这里改一下」,就像你身边坐着一个人的时候会自然做的那样。

现在的解决方案是截图,或者像Stitch里那样可以圈出来,但大家肯定都能感受到,还是不够极致。

归根结底,人类和AI之间的输/输出心智融合还在进行中,在脑机接口真的之前,还有大量进展空间。

哥白尼式智能观

太魔幻了,2026年,HTML真成了一种「编程语言」

还是被Anthropic工程师认证的那种……

图片

但我觉得,这件事的意义,远不止格式标准之争这么简单。

Markdown也好,HTML也罢,本质上都是为人机交互而生的一种范式。

Markdown是为人类设计的。它简单、直觉、容易手写手编。它存在的全部理由,就是「方便人类使用」。

但现在,谁在写这些文件?

不是你。是AI。

谁在读这些文件?

也越来越多地,不只是你。是你和AI一起读。

甚至有时候,只有AI在读。

确实,HTML是有些信息冗余。

但它是半结构化的。能精确定位、精准修改,扔进浏览器就能直接出预览。

而这些特质,恰恰完美适配了现在的vibe coding工作流

读完Thraiq的文章,最大的感叹是:

原来AI原生,一直是一件相当具象化的事情。

一切真的都在被改写。那些过去一切以人类为中心的规则,正在被冲击、被重塑。

CLI正在回归,自然语言正在取代GUI,代码本身正在变成一种中间产物,而不是最终产品。

所有曾经为了「方便人类操作」而精心设计的东西,都在被重新审视。

不是因为它们不好,而是因为它们曾经优化的那个唯一目标——人类体验——现在只能退居其次,变成众多目标中的一个了。

这让我想起陶哲轩说过的一段话。

他说,我们正在经历一场认知上的哥白尼革命

曾经我们以为人类智能是宇宙的中心,而现在终于发现,宇宙中存在着各种截然不同的智能形态,各有其独特的优势与局限。

过去,一切以人类为中心。文件格式、交互界面、编程语言,乃至整个软件工程的范式,都围绕着「让人类更高效地表达意图」而运转。

而如今,这个中心,正在松动。

当创作者和消费者都不再是纯粹的人类时,那个为「纯粹人类」设计的世界,或许……注定会逐渐坍塌。

但有时我会尝试说服自己,真的,真的不要焦虑。

或许,这个旧「智能世界观」坍塌的过程,反而会帮助人类?

它会帮助我们,逼着我们在废墟中去重新找到那个——

「生而为人」,更精准的意义。

就比如当年,天文学家承认了宇宙的浩大之后,反而激起了人类更强烈的好奇心。所以我们更加渴望走出去了,所以我们更拼命地想跑得快一点,再快一点……

图片

今天,AI正把我们带进一个更远、更陌生的名叫「智能」的宇宙。

一切都回归了起点。大家都在同一片森林里,没人一开始就能看清全貌。

即便是Anthropic的工程师,也是摸爬滚打到现在,才突然意识到「HTML当立」这件事。

所以,或许从现在开始,我们可以试着抛掉人类对于传统智能的那份固执。

试着从第一性原理出发——

去质疑一切吧。

(来源:量子位)


扫码下载app 最新资讯实时掌握