GitHub CEO本周官宣离职创业：AI Coding 进入红海，但开发者工具领域不会只有唯一赢家，未来会是多元共存

Z Fiance 2025-08-17 13:19

在最新一期 Decoder 节目中，主持人 Alex Heath 对话 GitHub CEO Thomas Dohmke，这场对话发生在一个微妙的节点：Dohmke 宣布将在年底离职创业，而 GitHub 则并入微软新组建的 CoreAI 团队。在 AI 编程赛道竞争白热化之际，这不仅是一场高层变动，更是一种战略重排，意味着 GitHub 不再只是“开发者社区业务”，而要成为微软 AI 工具链的底座。

面对行业内卷，Dohmke 在节目中给出了一系列激进且颇具争议的判断。他直言未来两年内 90% 的代码都可能由 AI 自动生成。当 AI 真能写出绝大多数代码时，程序员是否还必要存在？他的回答是：开发者不会消失，但会发生分化——有人转型为“提示语导演”，掌控 Agent；有人则坚守写代码的身份，成为“手艺人”。他甚至承认，这种分化本身就是一种新的“职业阶层化”。

更进一步，他提出一个引发热议的观点：AI 编程是通向超级智能的关键路径。如果 AI 能够自己写代码并优化自身，就意味着它具备了自我进化的能力，而这正是智能爆炸的前夜。在他看来，赢得 AI 编程赛道的公司，很可能率先掌握超级智能的门票。这一表态在行业内被视为既是雄心宣言，也是隐忧信号。

Dohmke 还抨击了围绕“AI 写了多少代码”的 KPI 游戏。他直言，这些百分比数据带有营销意味，真正的问题是：AI 生成的代码是否足够可靠、安全，能否在生产系统中大规模使用。他说未来开发者很可能会被“AI Agent 海啸”淹没——数万个 Agent 同时生成、提交代码，迫使人类开发者从写代码转向审核、治理。

他同样没有回避 Copilot 的竞争压力。Cursor、Anthropic 等对手正在重新定义“AI 原生工作流”，并迅速赢得早期开发者心智。Dohmke 承认这种冲击真实存在，但坚持认为 GitHub 的平台优势和微软生态协同，才是决定长期格局的关键。他把竞争比作 F1 赛车——不是每场都能赢，但真正的总冠军要看谁能坚持到赛季最后。

最终，这场对话把一个更尖锐的问题摆在台面上：AI 编程究竟是在解放人类，还是在重写人类在技术世界中的地位？ 当 GitHub 的领导人选择在这个时间点抽身离开，留给行业的不只是 Copilot 的未来命题，更是关于开发者身份、智能边界与权力归属的巨大争议。

AI编程崛起与挑战：GitHub CEO谈未来两年内代码全自动生成的可能性

主持人：欢迎来到Decoder！我是Alex Heath，你们周四节目的特邀主持人，也是The Verge的副主编。本周是Decoder的AI编程专题周。你刚刚听到了我的朋友Casey Newton采访Cursor CEO Michael Trell的内容，而接下来，我将带来与GitHub CEO Thomas Dunka的对话。在很多方面，GitHub Copilot可以说是引爆了我们如今所处的AI编程热潮。

但自从Thomas一年前上过节目以来，AI编程的兴起已经让关注点转向了像Cursor和Windsurfing这样更新的平台。正如你们将在我们的对话中听到的，Thomas正在深入思考竞争形势以及GitHub和软件开发的未来。现在正是进行这场对话的好时机。Thomas对行业的走向有着鸟瞰视角。我想了解他如何看待AI对软件工程师角色的持续变化，以及他自己什么时候会觉得可以放心地进行AI编程。毕竟这是Decoder，我不能不问他如今作为一个独立于微软内部的公司，运营GitHub的生活是怎样的。好了，GitHub CEO Thomas Dunka，开始吧。

Thomas，非常感谢你来参加节目。自从你一年前和Nile一起上Decoder以来，我有很多事情想和你聊。自去年以来，最大的变化就是我们在The Verge和Decoder上不断讨论的AI编程的兴起。作为一个从未写过任何软件的人，当我想到AI编程时，觉得那将是我能够完全不用懂代码就能创建一个应用或网站的时刻。对我来说这非常令人兴奋，但感觉我们还没完全到那个阶段。行业大概什么时候能达到那种程度，让像我这样的人可以从零开始用AI编程创建东西？

Thomas Dohmke：这完全取决于你想要做什么。对于一些小项目，我们已经达到了那个阶段。我挑战你去试试GitHub Spark或者Lovable，你很可能能做出像贪吃蛇、乒乓球或者一些小型的专用应用。我们现在已经到了那个水平。

随着复杂度的增加，你就需要具备一定的系统理解，比如架构设计、数据库等等。我们越来越接近这样一个阶段，越来越多的基础功能——我们称之为primitives——被这些AI编程平台所支持。举个例子，像GitHub Spark，当我们去年十月在GitHub Universe发布它时，它只能创建运行在浏览器里的前端应用，使用的是JavaScript语言，可以做一些浏览器端的操作，并带有一点后端存储功能。而现在新版的GitHub Spark实际上可以生成一个完整的全栈应用，包含后端和数据库，还能连接AI模型等功能。大约九个月的时间，它变得越来越复杂。我相信我们会看到这些AI编程平台生成能力的指数级提升。

挑战在于，从零开始创建东西是一回事，而去修改一个已有的软件系统、弄清楚代码库中哪个功能对应哪个测试用例则是完全不同的事情。大多数软件应用随着时间推移会变得越来越庞大和复杂，可能有成百上千的工程师参与开发。AI要能解决所有这些由系统专家才能应对的用例，离我们还很遥远。

主持人：这正好引出了你最近发表的一篇博客文章，你采访了一些开发者。我很想知道他们是什么类型的开发者。你采访了一批开发者，了解他们对AI编程现状的看法、他们目前的状况以及他们对未来的预期。你都采访了什么样的开发者？这些人不全是你们团队内部的。他们是外部的开发者？

Thomas Dohmke：是的，都是外部开发者，是真正在写代码的人。七年前我第一次接触GitHub时，感触很深，因为GitHub品牌和它在业界的广泛知名度，让我们很容易找到愿意参与30分钟访谈、回答问题的人。所以我采访的开发者有一定比例是与GitHub有联系或者对给我们反馈感兴趣的，但总体来说，采访对象是非常多样化的。

主持人：你收到的最主要反馈是什么？我想把这个和软件工程师的角色变化联系起来，想了解你从大家那里听到的关于工程师角色现在如何变化，以及如果可以的话，他们认为未来一年这个角色会怎样演变。

Thomas Dohmke：有人很快地说，AI已经来了，而且会长期存在。我们采访的大多数开发者以及整个行业的大部分开发者，都已经意识到软件开发这个职业正在发生变化，尤其是那些使用AI的开发者，这种变化已经在进行中了。因此，大多数人都在调整自己的工作方式。今年早些时候我写过另一篇博客，称这为“开发者的奥德赛(the Odyssey of developer)"（ZP注：“开发者的奥德赛”借用古希腊史诗《奥德赛》的意象，形象地描述了软件工程师在AI时代面对技术变革时，经历不断适应、探索与成长的漫长且充满挑战的历程。）

我们经历了从穿孔卡和大型主机，到个人电脑的变迁，这极大地改变了开发的内循环速度。以前我得预约主机时间，我记得去我妈妈办公室时，她桌上堆着穿孔卡，而突然之间，每个人的桌上都有了个人电脑，至少护士们开始用电脑编程。接着，我们经历了从汇编语言、Basic和Pascal到Python、Go和Ruby的演变，从没有互联网到拥有数百万个开源库，能直接从自己的服务器或云端拉取到应用中。技术一直在不断提升抽象层次。

如今，开发完整全栈应用的工程师很可能并不真正了解运行该应用的CPU型号、内存大小、主频等具体硬件参数。除非是游戏开发者，他们通常也不会写汇编代码。技术堆栈自然在不断向上发展，因为我们管理的代码量在过去50年呈指数级增长，未来也会继续这样增长，人类已经处在指数曲线上非常陡峭的阶段。因此，我们需要这些工具来“拉平”这条曲线，虽然不能让它完全平坦，但至少让它不那么陡峭，这样我们才能继续应对如今拥有数十亿行代码的复杂应用。

主持人：你采访的开发者中有一半表示，他们相信在两年内，90%的代码将由AI完成。这也是我从其他人那里听到的观点。Anthropic的CEO Dario Amodei甚至给出了更激进的时间表，他认为三到六个月内就能实现。我很想知道你怎么看这个问题？实现一个几乎所有生产环境代码都至少部分或完全由AI生成的世界，大概需要多长时间？

Thomas Dohmke：每当谈到这个话题，我首先想到的是，我们现在技术栈中90%的代码其实已经是别人写好的，也就是全球数百万开源开发者的贡献。无论是前端网页还是后端，我敢肯定90%都是开源的。按代码行数算，90%来自开源库、开源操作系统、编程语言和各种依赖，而工程团队只负责剩下的10%。GitHub和微软的情况也是如此。我们已经处在一个世界里，专注于定义业务核心的那层薄薄的上层代码，同时借助全球开发者的力量来加速创新和安全保障。AI也会做到类似，写出90%的代码，而我仍然可以专注于自己8小时的工作，写好那10%的代码。这并不意味着我停止写代码，而是意味着我现在能拥有十倍于自己单独完成的代码量、功能和特性。

主持人：这就像开源推动技术进步一样，AI也是对开发效率的巨大放大器。

Thomas Dohmke：我们会看到各种团队和公司的广泛差异，这不仅取决于他们是否愿意使用AI，还取决于他们如何设计公司、软件和基础设施，使AI Agent能够充分利用这些资源。举个例子，如果他们有设计系统，当你让Agent添加功能时，它不会随意创造新的层叠样式表，而是使用已有的组件。这样Agent构建的所有功能都能与产品的设计语言保持一致。可以想象，一种全新的应用架构方式将出现，让Agent像搭乐高积木一样更容易组合新功能。这将极大地影响公司达到90%代码由AI编写这一目标的速度，反过来也会影响AI的应用。

显然，仍有许多公司运行着基于大型主机的老旧代码，使用PHP、Perl等遗留的“意大利面条式”代码库。以GitHub为例，我们有一个和GitHub年龄一样大的Ruby on Rails单体应用。作为CEO，我不能简单地决定去拆分这个单体架构，更别提这往往不仅是工程问题，更是哲学层面的讨论。摆脱这些遗留系统，经历云转型、数字化转型，现在还有AI转型，对于这些组织来说所需的时间远远超过那些能够站在技术前沿、让90%以上代码由AI生成的公司。

主持人：所以听起来你还没有具体的时间线。

Thomas Dohmke：比如现在，很多人在他们的博客里已经在记录这件事了。如果你知道自己在做什么，并且从零开始用类似Claud code这样的工具，你可以让100%的代码都由AI生成。而你唯一需要做的，就是修改这些用自然语言写成的指令文件，来指导Claud code构建应用。所以这个应用从定义上来说，100%的代码都是AI写的，而作者真正写的只是指令规范。如果生成的源代码不能正常运行，你当然可以进去手动修改，或者你也可以选择不去修改，因为那样可能会破坏系统，而是思考如何调整你的指令文件，让Claud code继续帮你写出所有代码。

主持人：说实话，我有点懊恼自己居然问了你这个问题，因为有些CEO说“我们代码中有多少百分比是AI写的”这种说法，实际上让我很烦躁。你的老板Satya Nadella曾表示，微软大约有20%到30%的代码是由AI编写的，你也知道，Sundar Pichai也发布过相关数据。

AI编程工具普及与质量挑战下开发者的疑虑与角色转变

主持人：Marc Benioff发布过相关数据，Mark Zuckerberg也有类似说法。但我一直在想，这些代码到底质量如何？

这是那种你希望随着时间推移不断增加使用比例的代码吗？我看到最近Stack Overflow做的一项调查，采访了很多开发者，我相信你也看过。很有趣的是，绝大多数开发者表示他们已经在使用或计划在明年内使用AI工具，比例超过80%。但更有意思的是，大约一半的受访者表示他们对这些AI编程工具的准确性持怀疑态度，而他们最大的挫败感——调查中约66%的人提到——是AI生成的代码常常不够准确，导致他们不得不花大量时间调试。

而且AI编程实际上花费的时间比带来的生产力提升还多。我想知道你在GitHub的各项工作中，包括GitHub内部，是否也看到类似情况？还是这只是个别现象？这看起来是个很大的问题——虽然AI生成的代码越来越多，但质量可能并不理想。

Thomas Dohmke：你说得没错，不过我没给出具体的百分比。

主持人：说实话，我有点懊恼自己竟然只是问你这些百分比问题，因为我翻看笔记时发现，其实很多人对这些百分比数据持怀疑态度，我们是不是用错了讨论的角度？确实，AI生成的代码量在各家公司不断上升，CEO们也拿这个来炫耀他们的成果，但我们是不是该更多关注代码的质量？我很想听听你对这场讨论的看法。

Thomas Dohmke：从我角度看，这两者其实是相辅相成的。这些百分比多少带点营销成分，具体是90%、80%还是95%其实没那么重要。重要的是，我们必须清楚软件开发这个职业正在发生变化，技术堆栈在不断提升。我们正在从理解每一行代码，转向更多地在规格说明之间切换。

人类语言本质上是非确定性的。我们俩可能说同一句话，但意思却不同，更别说不同语言在描述事物时用的结构也不一样。编程语言其实是对处理器——无论是CPU还是GPU——的一种抽象，本质上就是描述晶体管如何自动切换从0变到1的过程。这两者都会共存，因为机器依然运行在CPU上，这一点不会变，但我们是用人类语言在思考。

所以问题其实是，你想写更多的人类语言，还是想写更多的代码？这不是AI帮你决定的，而是你作为开发者自己做的选择。这正是作为开发者的创造自由——你可以说“我现在知道自己在做什么，我想写代码”，或者“我想用AI Agent帮忙”。事实上，关于Agent，最关键的问题是，用Agent更快，还是自己动手更快？如果我知道自己三秒钟就能搞定，那用Agent反而是浪费时间、精力和资源。就像我希望用ChatGPT帮我回复短信一样。

主持人：我用消费者级Agent的时候也有类似感受，比如你确实能帮我订酒店什么的，但花了一个小时，而且结果也不太对头，最后我还是得自己动手做，自己做反而更高效。

Thomas Dohmke：就拿Outlook里的通知摘要来说，至少对我而言，它通常没有直接阅读邮件的前三行内容来得实用。

接下来第二个问题是，好，AI写了这么多代码。如果AI写了90%的代码，也就是写的代码量是我自己的九倍，那么我是不是要审查这些代码的质量、安全性和编码规范？还是说，我会寻找AI来帮我做这些工作？因为最终，我们人类开发者将被大量Agent“淹没”，这里说的“淹没”是分布式拒绝服务攻击（DDoS）的意思——这些Agent不会休息、不会周末放假，而且可以同时运行。

你看OpenAI的codecs，它们已经会为你给出的每个任务生成四个不同的版本，然后你通过选择自己最喜欢的版本，实际上在帮助它们进行强化学习。但不仅仅是生成四个版本，它们完全可以生成40个甚至400个版本。接着，你还可以用另一个Agent来评估这些代码的质量，给出评分，形成一个Agent之间相互反馈的闭环。

实际上，我们正逐渐达到一个阶段，AI Agent生成的代码质量会持续超越人类，因为它们可以在无限规模上运行，找到那些人类因时间有限而无法发现的所有漏洞。但挑战仍然存在，那就是我们是否信任这些代码。说到这点，其实GitHub的诞生正是为了促进人类之间的协作。

GitHub的核心就是我有一个开源项目，你可以fork这个项目，如果你喜欢或想添加功能，就给我发一个叫做pull request的请求，然后这代码不会直接合并到我的代码库里。相反，我会审核这段代码，给你反馈，比如说：“嘿，Alex，这个挺不错，但你能不能改写一下这部分？”有时候语气甚至会更严厉。最终，我们会决定，“好，这挺不错，合并吧。”这其实就是人类之间协作的质量控制。当然，你也可以用同样的流程来实现人类和Agent的协作，但如果你有成千上万个Agent，那就得重新思考这个流程了。这将是开发者工具最大的差异点——谁能搞清楚如何让Agent生成比人类多得多的代码，同时又让人类保持控制权，确保投入生产、处理客户数据、计费流程等的代码真正可用、质量过关且没有安全漏洞。这才是未来几年的挑战，不是Agent写多少代码，而是我们能接受多少Agent写的代码进入生产系统。

主持人：听起来你的意思是，未来的开发者更多是在全天监控这些Agent的表现，接受或拒绝pull request，审查代码，但不再亲自写代码，可能只给出非常高层次的指令，实际上是在从编码的具体过程里退出来。这将成为普遍的趋势吗？

Thomas Dohmke：你要做的只是写一个提示语。这在图像生成模型中也已经开始出现了。比如你用ChatGPT生成一张吉卜力风格的图像，你并没有写生成图像的代码，只是给出指令，然后模型帮你完成。实际上，有个技巧是你可以上传一张已有的图像，让它分解成JSON格式的数据结构，然后你修改这个数据结构，再用它作为提示语去生成修改过或删除了某部分的图像。所以你有点像在做开发，但并不写代码，而是让模型帮你完成。未来会有一类开发者，专门使用模型和Agent来构建并验证系统。

还会有一类开发者依然热爱写代码，他们会将部分工作交给AI Agent来完成，比如写测试用例、文档等那些他们不喜欢做的事情，从而腾出时间去做自己真正热爱的事。问题是，你一天八小时的工作时间应该如何安排？什么样的工作能激发你的创造力，推动创新，还是更注重把事情做完？这两者需要结合起来。

如今，无论大公司还是小公司，大多数开发者每天可能只写四个小时代码，有时甚至更少。剩下的时间则花在开会、写邮件、审查他人代码、更新服务等各种事务上。开发者还得做很多其他工作。他们大多数人会保留一定时间，用来写代码或者写指令生成代码，这会让他们感觉自己依然在编程。

事实上，打个比方，我们是从汇编语言发展到更高级的AI编程语言和开源库的。我没见过有人说自己再也不用写汇编了，并不是汇编不再存在，而是我们有了编译器，把高级编程语言编译成汇编代码。现在，你可以把AI模型看作是一个编译器，它把人类语言的指令编译成编程语言，然后真正的编译器再把编程语言转成汇编代码。你的代码其实就是人类语言了。你可能再也不用看编程语言了。但问题是，目前的模型仍然会出现幻觉，写出的代码不一定完全符合你的预期。

或者说，我可能会让AI重复生成十次，每次的代码版本都不一样。你看过有人在现场用vibe coding演示玩贪吃蛇游戏吗？每次生成的游戏代码都不一样。所以我们还不够信任人类语言转换成编程语言这一层，无法直接跳过它。但我们已经成功跳过了汇编语言那一层，对这点很有把握。我认为只要这两层依然存在，我们就会继续写代码、学习编程，在确定性和非确定性层面之间来回切换。

主持人：因为LLMs本质上是非确定性的，它们会“编造”内容，这其实是它们架构上的一个特性，而不是bug，是故意设计成会产生幻觉的。那么，是否会有那么一天，像我这样完全不懂编程、分不清各种语言的人，也能可靠地通过自然语言构建需要访问各种API、数据库、网页等功能的应用？如果真的能做到，那将是个巨大突破，对世界产生深远影响。但正如你说的，也许这项技术本质上就达不到那个境界。

Thomas Dohmke：只要范围受限，是能够实现的。而且这个范围会逐渐扩大。

你将能够完成一些特定的任务，比如你现在跟AI Agent对话，让它帮你生成一张图表。实际上，它是在帮你写一段Python脚本，然后用这段脚本来生成图表。而你可以让ChatGPT把这段Python脚本展示给你看。不过大多数用户根本不需要去理解这段Python代码，只要看图表就行了。所以这类用例会快速增长。

但我们所认为的专业软件系统，也就是专业软件开发者开发的产品，将变得更加复杂。因为现在专业开发者能够在同样时间内构建更多功能，而过去可能只是写一个Python脚本来生成合理的图表。今天我们所称之为“最先进”的软件，将远比我们能想象的人类开发者写出的复杂得多。事实上，这一直都是如此，比如现在我的iPhone，功能远远强于1990年代初的Commodore 64。当年为Commodore 64开发的程序员看到如今的iPhone应用，会觉得这简直是魔法，就像我们看待AI一样。如果这样想，我们终会达到那个点，同时专业开发者依然会像魔法师一样，因为他们能写出如此精简且功能强大的应用。

GitHub Copilot与AI编程领域的激烈竞争与未来展望

主持人：我们来聊聊竞争吧。你刚才在对话中已经提到了几个GitHub Copilot的竞争对手，这说明你愿意谈这个话题。编程可以说是目前AI领域竞争最激烈的部分，至少这是我的看法。现在有很多交易在进行，初创公司被收购，实际上，一些历史上增长最快的公司正是AI编程公司。比如Cursor、Lovable，还有我们刚才谈到的Vibe coding应用。

GitHub Copilot确实是最早进入AI编程助手领域的产品，现在依然非常强大，但我好奇的是，特别是过去这一年自你上次在Decoder出现以来，你是否认同这样一种看法——GitHub Copilot似乎在一定程度上失去了市场关注度，至少在那个对这类技术痴迷、每天都在讨论的硅谷小圈子里。我相信你们仍然有大量用户，但我想知道你是否也有这种感觉，是否觉得这对你们推动产品更快迭代带来了压力？另外，你怎么看今年竞争格局的变化？

Thomas Dohmke：整个人工智能、大型语言模型以及这些模型能实现的可能性正以非常快的速度发展。在科技领域，我从未见过这样的局面，我也在这个领域待了很久。你说得没错，AI代码生成正站在这场创新浪潮的最前沿。逻辑上讲，因为所有这些公司都雇佣开发者，所以大家都有内在的动力让编程变得更容易，因为这意味着我可以更快地创新。如果我有一款能让我的开发者比竞争对手快5%的编程工具，我肯定会用。自从我上次在Decoder亮相以来，这个市场已经加速发展。我对此持非常开放的态度。

这真是令人惊叹，我作为开发者这么久，从未见过软件开发工具有如此多的创新。作为GitHub，我们一直明白自己是一个生态系统的一部分，这个生态系统既与行业内的公司竞争，也与它们合作，无论是在AI代码生成领域，还是在CI/CD、应用构建等方面。我们并不决定你更喜欢哪个开源库。大多数人不会只用GitHub提供的JavaScript生态系统，如果你想用Python，你会去别处。没有人愿意看只有一支球队赢球的体育比赛。至于你说我们失去了心智份额，我不同意。我们赢了一些，也失去了一些，有时甚至是周周变化。你会看到有人在他们的社交媒体上发帖说他们又回到VS Code了，因为最新版本、我们每月发布的90个版本中有他们想要的功能。作为行业，这是值得骄傲的事情。

Copilot在从单模态到多模态的转变上起步较晚，但我们去年十月终于实现了这一步。我们引入了AIC支持，构建了MCP（模型上下文协议）集成，现在所有这些编程代理都在使用我们与OpenAI合作打造的GitHub MCP服务器。这是一场竞赛。我们刚刚在微软的财报中宣布，GitHub Copilot现在拥有2000万用户，环比增长达到75%，在企业使用方面，财富100强中有90家在使用。关于数据统计，我可以一一告诉你。

主持人：关于用户数量，我得问问你这个数据。Thomas，这个用户数量听起来有点奇怪。这是累计用户数吗？还是曾经使用过的用户数？还是月活跃用户？或者是日活用户？你能给我更具体一点的细节吗？

Thomas Dohmke：这是指有2000万GitHub用户开启了Copilot功能。这个数字对应的是GitHub总账户数1.5亿的计算方式，测量方法是一样的。另外，我们在Visual Studio Code上有5500万用户。所以这些数据可以让你大致了解我们在各种IDE中激活用户的情况。

主持人：你那篇宣布新用户数统计的帖子里，你写道，一家公司的真正考验从来不是在它的炒作浪潮中显现，而是在压力测试时展现出来的韧性。然后你还写了更有意思的一句话，是你说“即使面对各种限制，我们也证明了少许坚韧能赢得比赛”。你在那篇帖子里说的那些限制具体指什么？因为你是GitHub的CEO，我本以为你们其实并不受限制。你们还是model agnostic（模型无关）的，而微软其他部分似乎至少目前还和OpenAI紧密联系着。但看起来你们能用任何想用的模型，相较微软其他部门还是比较独立的。你说的那些限制具体是什么？

Thomas Dohmke：公司的资源是有限制的。这就是预算的定义。员工人数，或者说人头数什么的。你不可能无限制地一直增加人员，因为那会遇到“人月神话”问题（Mythical Man-Month Problem）(ZP注："人月神话"问题指的是在软件开发中，盲目增加人手并不能线性缩短项目工期，反而因沟通与协作成本上升导致进度放缓的现象，来源于弗雷德里克·布鲁克斯1968年出版的《人月神话》。），增加更多人反而会拖慢团队速度，而不是加快进度。无论你是10人的初创公司，还是3000人的GitHub，甚至是20万人的微软，都必须做出取舍。

苹果公司也著名地说过，每个“Yes”需要1000个“No”。所以其中一个限制是，我们的待办事项清单中有无穷无尽的条目，而且很多这些待办项的差距都是源自AI出现之前的时间，比如客户反馈，有人在GitHub Issues或者GitHub Projects里希望有某个功能，你说得出名字的，我们都有。

事实上，有个流传的笑话是，我们每收到一条客户反馈，实际上早就有一条类似的，可能是几个月甚至几年前的，别人早就有了同样的想法。因为我们的客户群体是开发者，我们自己也是开发者，总会有人提出之前已经存在的想法，或者告诉我们如何做得更好。然后在X上（推特）就会有一拨人说，“GitHub把这设为默认是个愚蠢的决定”，另一拨人说“这是有史以来最棒的决定”。我们生活在这样一个信号输入过多的世界里，而我们的限制就是选择那些真正能让你快速前进的关键点。

而且没人真正知道两三年后AI代码生成或者AI整体会是什么样子。如果我们都诚实面对自己，这是真的。

如果说ChatGPT是2020年代的Netscape时刻，那么现在就像是1995年，当时有了Amazon和Google，但还没出现Facebook、Shopee和iPhone。1995年预测这些事物会发生，是非常荒谬的。

而GitHub自成立以来就是这样一种自信的状态：它走在时代前沿，比如最早使用Git来构建当时没人叫DevOps的东西，但现在它成为了最大的开发者平台之一。之后一直在寻找下一个重大创新，关注行业内其他人在做什么，他们更倾向于和谁合作，而不是自己全部打造。通过Copilot，我们很好地驾驭了这一点。也有过战略决策失误的时刻，那些决策没能把我们拉向正确方向赢得市场。但现在，我可以说，到2025年8月，我们依然走在曲线前端，依然是市场领导者。对此我们感到非常自豪和开心，这些都是我们辛勤努力的成果。

主持人：说到合作还是不合作，大家都知道，编码已经成为影响人们关注的巨大交易，尤其是和AI相关的。我想到Google和Windsurf。Windsurf是一个非常有前途的AI编程工具，他们本来打算卖给OpenAI，但那个交易被叫停了，而这正是微软介入的地方。我知道你是GitHub的，但这事都相互关联。我很好奇，这件事的关键是，为什么Google最终选择招聘了Windsurf团队，而Windsurf没能卖给OpenAI，原因是有人担心Windsurf的知识产权不会被保护免受微软影响，考虑到微软和OpenAI的关系，存在竞争动态。

所以我想知道，为什么这是一个如此重要的问题，以至于直接导致了那笔本可能对AI编程领域乃至整个硅谷都很重要的交易失败？这本来会是一笔数亿美元的大交易。虽然我知道你可能不是这件事的主要推动者，但你能解释一下为什么这件事如此关键吗？

Thomas Dohmke：你问这个问题我可以选择不回答。说实话，我在这些谈判中确实存在利益冲突，所以我没有任何内部背景信息可以分享给你。但这其实反映了另一点，就是担心开发者很快会被AI取代的恐惧其实是不成立的。事实恰恰相反。像Windsurf背后的创始团队和核心成员，或者行业内的其他人，我自己也想到我本人，他们收到的报价已经能和职业篮球运动员媲美，有些人甚至有经纪人帮他们谈合同。对此我们应该感到兴奋。

至于如何达到这一步，是个好问题，适合有渠道接触相关文件的人去探讨，我没有那权限。但作为一个开发者，一直在这个行业里，自己也在构建和使用开发工具，这真的是非常令人激动的事情。因为这说明顶尖开发者的市场价值在不断增长，也希望能激励那些喜欢玩游戏、想自己创造东西的青少年，继续投身这个职业。我坚信，如果事情按我希望的方向发展，我们将比以往任何时候都更需要更多开发者。

主持人：我们具体聊聊Cursor吧，它真的扛起了大旗，至少在硅谷的早期用户群体中，它是目前最火热的AI编程工具。他们抓住了什么关键洞察，才让他们在用户心智认知上迅速领先？我知道GitHub Copilot规模还是更大，但Cursor增长非常快，而且他们的CEO最近在Dakota和Casey Newton的采访中提到，GitHub是他们创业的灵感来源。那他们到底抓住了什么是你之前没看到的？你们现在怎么应对？

Thomas Dohmke：Cursor抓住的关键是认识到，问题不仅仅是把AI加入到传统的集成开发环境（IDE）里，而是要改变整个IDE本身，设计一种你可以称之为“AI原生”的工作流。换句话说，就是从根本上思考如果AI是默认配置而非附加功能，开发者将如何工作。他们是第一个基于GPT-3.5版本开发的Copilot产品。

所以他们还走在前沿，意识到应该让多模型共同发挥作用，给开发者选择权，让他们挑选最适合自己的模型，而不是我们替他们做决定——这就是我一年前和Nilay谈话时我们的理念。这是两种不同的思路。我们当时做了大量进化测试，评估各种模型，然后选出我们认为最好的那个。但这不是非黑即白的选择，因为每种编程语言、每个测试场景，不论是生成功能代码还是测试代码，评分标准都不一样。于是会有不同的评分维度，你必须做出综合判断，认为“这个模型总体表现更好”。

不过根据开发者工具的发展历史，我们GitHub对此非常清楚，给开发者提供选择权永远是最好的做法，让他们自己决定用哪个模型。凭借经验，或者说专业直觉，他们会知道怎么选。这已经改变了今天的市场格局。如果你不提供多模型选择，不拥有被大多数开发者认可的最佳模型，不允许开发者带入自己的模型，没有运行在IDE中的Agent模式，不能将该Agent模式卸载到云端，像我们称之为“Coiled Coding Agent”的服务并且集成在GitHub平台里，你根本无法在AI编程领域竞争。

我很喜欢F1赛车，我总是用这种思维看待世界。有些车队赢得了整个赛季，下一季却落后了，他们不会因此认定“我们输了，永远不会再赢”，而是把这当作动力去重新思考自己的做法。这就是2024年中晚期Copilot经历的过程。而到了2025年8月，我们已经能重新赢得比赛了。虽然不是每场都赢，竞争对手也不会每场都输，但我们确实在AI代码生成上做出了创新，同时也赶上了让其他对手更快的关键技术。

主持人：这个领域看起来非常动态，正如你提到的，关键在于模型本身。无论哪个工具目前在模型领域领先，它们都会用自己的方式来定价模型，而模型领导者经常变化。即使身处其中，也几乎不可能跟上所有这些模型的发布节奏。

Llama3是个不错的模型，Llama4就不那么出色了；而Anthropic现在似乎是代码领域的王者。也许情况会变，也许几个月后OpenAI会重新领先。这会如何影响应用层呢？所以必须理解这个领域变化有多快。现在说你们肯定输了，或者说Cursor肯定赢了，都为时过早。但说到Anthropic，你们跟他们合作很多，你提到了MCP服务器，显然通过GitHub Copilot也可以访问云端。

我一直在问人，为什么Anthropic在编码方面这么强？他们有什么“秘密武器”？Dario（Anthropic联合创始人）最近在Big Technology播客上说，他不想透露他们为什么这么厉害。但这大概是一个价值数十亿甚至上千亿美元的问题——为什么他们在这个领域有如此领先的模型？作为一个和他们紧密合作的人，我很想知道你怎么看，为什么他们在编码领域取得这么大领先？

Thomas Dohmke：让我先回到你问题的第一部分，稍后再谈谈Anthropic到底强在哪里。

在科技领域，我们常有一种观念，觉得一个赢了就意味着另一个必输，但这并未被证明。比如Windows和Mac OS、iPhone和Android，以及许多其他技术，事实证明并非如此。实际上，在开发者工具领域，这种“非此即彼”的情况从未出现过，否则今天也不会有数十种编程语言存在，大家都会转向所谓最好的那一种。

看看GitHub Copilot的竞争对手，比如Cursor、Lovable、Windsurf、旧版Vercel等等，你会发现使用这些工具的人，其源码实际上都存储在GitHub上，他们的Issues和项目管理也在GitHub，CI/CD流程也是在GitHub上运行的，而这些竞争对手很多是在Azure上运行模型推理。作为微软的一部分，我们是整个生态系统的一部分。

我们一直是平台公司，GitHub也一直是平台公司，所以我们既是竞争者，也从这些公司推动整个软件生态系统规模增长中受益。说实话，软件开发只会越来越多，不会减少，开发者人数也在增加。看看那些科技公司在股市上的表现，它们经常跑赢大盘。如果我们的竞争对手赢了，我们其实也赢了。在谈论这些竞争时，保持这种心态非常重要。

主持人：这就是作为超大规模云服务商的优势，Thomas——当竞争对手赢了，你们其实也赢了。不是每个人都能这么说。

Thomas Dohmke：当然，这就是所谓的差异化。具体说到Claude Sonnet，如果你相信YouTuber、博主和专家们，比如Simon Wiles等人，他们认为Claude Sonnet真正胜过其他模型的地方在于“工具使用”——也就是模型为Agent模式的下一步选择合适工具的能力。这说明，训练不仅仅局限于编程语言、代码等内容，更包括训练模型像开发者一样合理使用各种工具。

如果这一步失败了——你可以在一些其他模型身上看到这种情况，工具使用远不如Claude Sonnet——那么你的Agent模式就会崩溃。举个例子，Agent需要安装一个JavaScript依赖的NPM包，但安装失败了。即使Agent拥有世界上最好的训练数据集，如果它完成不了这一步，整个流程就无法正常工作。Anthropic正是在这方面早期有洞察力，或者说拥有更好的进化测试手段，从而赢得了领先地位，其他团队还在努力追赶。但有趣的是，我们现在录制这段话时，等它发布时，这个局面可能又发生了变化。

GitHub CEO详谈微软与OpenAI合作、Copilot盈利现状及AI未来智能展望

主持人：欢迎回来，休息前我和Thomas聊到了GitHub的竞争情况。这给了我一个很好的机会去问问微软和OpenAI之间的进展。我们已经几乎谈到了所有主要竞争者。微软目前正和OpenAI商讨双方未来企业关系的新篇章，因为OpenAI正从非营利转为营利机构，而微软显然是重要的大股东，目前拥有IP的独家访问权。作为GitHub的CEO，我很好奇你希望OpenAI和微软的关系未来如何发展？从你的角度来看，这段关系中最重要的是什么？你希望看到什么？

Thomas Dohmke：对于GitHub和所有开发者来说，这段关系始终需要保持健康。双方的合作方式必须是互惠互利、相互支持的。

最初的Copilot正是OpenAI和微软合作的产物。OpenAI开发了GPT-3和Codex模型，而微软不仅拥有超大规模的基础设施，还有多年在AI扩展和运算方面的经验。想想当初的Copilot，那真是个杰作，因为每次敲击键盘时，都能即时调用大型语言模型进行推理，这在当时和那样的规模下是前所未有的——数百万开发者在极短时间内使用它。正是GitHub、微软和OpenAI之间的这种创新合作，创造了如今这个拥有众多竞争者的市场，未来还会有更多新竞争者加入。双方未来的合作将继续催生新的创新，通过新模型和更高效的模型运行方式实现。关于AI的能耗、成本和利润率，已经有很多讨论。对于GitHub而言，我们始终把开发者放在第一位——这就是我们的核心。GitHub一直强调人对人之间的协作，而现在我们正迈向人与Agent的协作，甚至更可能是Agent与Agent之间的协作。这三层协作模式将逐步叠加起来。

OpenAI现在拥有以ChatGPT为代表的最大AI平台。与他们合作，确保开发者在ChatGPT中生成的内容，尤其是基于OpenAI Codex的内容，能够符合相同的安全合规标准——也就是企业级的控制体系，这对开发者采纳这些工具并将其整合到工作流程中至关重要。AI领域最终的竞争将是在平台层展开的。因为如果所有的Agent都异常强大，那么真正重要的是你如何把它们整合进你的其他业务流程。对我们来说，这显然就是开发者生命周期管理。

主持人：讲得很有道理！那我们就以一些关于GitHub和微软的具体问题来结束吧。距离你上次公布年度收入运行率已经过去一年了，我记得当时数字是20亿美元。为什么没有更新？现在的数字是多少？

Thomas Dohmke：投资者关系团队决定了哪些信息可以公开，哪些不公开。所以像往常一样，我只能告诉你财报里写的内容，这次他们决定不公布具体数字。

主持人：好的，我猜数字应该比那个高，我猜应该超过20亿美元。

Thomas Dohmke：我们还有一些其他令人印象深刻的数据，但我们非常满意第四季度的业绩，真是太棒了。

主持人：Nilay去年曾提过这个问题，我预计你的回答可能差不多。不过，我们有一个关键问题：Copilot对GitHub是否盈利？这一点重要吗？或者说，这是否在决策考量之中？毕竟你们在微软内部，某种程度上是以一个相对独立的组织来管理自己的损益表，那么目前它更像是在创造利润，还是作为争夺市场份额的成本中心存在？

Thomas Dohmke：你说得对，GitHub有自己的盈亏表（P&L），我们是根据那个目标来衡量的。一般来说，从微软整体业务看，各个业务单元肯定希望赚钱，只是时间尺度不同。很多投入很大。更重要的问题是，它能否在客户合同的生命周期内（即LTV）盈利？对此我很有信心，微软领导层会对GitHub的业务感到满意。

我们2018年以75亿美元收购了GitHub，那时GitHub上一次公开的年收入是2亿美元。而你刚才提到去年是20亿美元，七年间收入翻了10倍，可以合理推测这个数字还在增长。你提到Cursor的业务数字，我们对这些数据很公开，我们相信Copilot规模比Cursor还大。你可以根据这些信息去推测我们的数字。所以我们对这笔收购感到非常满意，我个人认为这是微软有史以来最重要的三笔收购之一，Satya Nadella和Amy Hood应该也会同意这个看法。

对此我们感到非常满意。我们以可持续的方式发展了这个平台，没有忽视开源。可以说，我们没搞砸GitHub，GitHub依然是GitHub，依然是开发者生态中最受欢迎的品牌，几乎所有企业都会用，虽然不是每个企业所有开发者都会用，但大多数企业至少部分开发者使用。而且在AI时代，GitHub也实现了自我革新。正如我们用Git来构建GitHub一样，我们用大型语言模型和OpenAI的GPT-3共同打造了史上第一个Copilot，领导了这个市场。

主持人：这回答得不错，我需要好好消化下。那么，Copilot有没有一个明确的盈利目标？比如市场达到某个规模，或者和微软其他产品打包销售，是什么让你们觉得这件事值得投入？

Thomas Dohmke：我们有类似摩尔定律的规律，也许现在应该叫Jensen定律了，就是GPU变得越来越快、越来越便宜。你提到了很多创业公司都在试图发明更高效的变压器处理器。我相信规模的力量，你也可以回顾15年前问Jeff Bezos同样的问题，看看今天超大规模云服务商的盈利情况。

所以我们会有耐心，会努力提升效率。缓存技术已经在Agent里起了巨大作用。商业模式也会不断演进。我们的开发者会因AI变得更高效，不仅仅是优化利润率，而是优化我们内部的软件开发流程。我坚信那些还在怀疑AI作用的公司，最终会落后于创新。如果你不使用AI，就会有巨大的FOMO（错失恐惧症），因为你行业里其他竞争者已经在用AI了，他们的开发者也在用。

使用AI的开发者生产效率能提升10%到20%。虽然有人会问为什么不是30%，但20%已经是巨大的提升了。考虑到软件开发者的成本，以及培训、项目切换所需时间，这种效率提升是非常可观的。

不仅仅是开发者，AI还能提高客户服务、销售、潜在客户发掘等各环节的效率。那些不拥抱AI的公司，无论盈利与否，最终都会在市场竞争中落败。

主持人：这让我想起你们微软内部一位同事最近写的一份备忘录，指示管理层根据员工使用内部AI工具的情况来评估绩效，并且明确表示这“已经不再是可选项”，而是每个岗位每个层级的核心内容。我想你能理解大家对此转变的焦虑感——有些人在职场上已经走得比较远，感觉自己习惯了原来的工作方式；还有刚入职不久的年轻人，面对各种变化感到不知所措。大家都感到很大压力。如果你是微软的一名中级工程师，可能会想：在这场变革中，我会不会被落下？公司能不能真的准确地评估这点？作为GitHub的CEO，微软管理层真的有一个可衡量的、真实反映AI带来生产力提升的内部评估体系吗？员工们能不能真正知道他们的表现是怎么被衡量的？

Thomas Dohmke：那份备忘录其实更微妙一些。它讲的是我们称之为“Connect”的过程，就是员工和经理之间的对话。GitHub也有类似的评审流程，员工会总结过去一年的成就，反思哪里可以做得更好以提升影响力，以及他们下一年的计划和执行路径。这就是一个框架。到了2025年，完全合理让大家反思自己对AI的使用情况，比如你用没用GitHub Copilot，微软的Copilot，Teams的Copilot去总结会议？如果没有，为什么？然后经理会给出反馈，这个过程对经理来说也是一种学习，有时你会发现员工在AI使用上领先你，我自己就有过这种经历，“让我看看你是怎么做的”，才意识到某些功能确实很有效。

这个流程是微软文化的核心。我们谈的所谓“mindset”（心态）其实就是接受自己可以不断进步，知道自己不是生来就完美的，而是有能力不断自我提升。如果你把这份备忘录放在这样的语境下看，它其实和微软的哲学完全一致。

另外专门说说GitHub，公司里没有一个员工可以不使用GitHub。无论你是什么岗位——不只是开发人员和产品经理，HR、财务、法务、销售等所有职能都在用GitHub。我绝不会允许有人说“不，我不想用GitHub”。这是我们的企业文化。同理，我们也希望每个人都能用上Copilot和AI工具。这并不意味着我们会看你今天写了多少代码、提交了多少pull request或者执行了多少Git命令，因为这些指标很容易被“刷”数据。但这反映了一种心态：你在用我们的工具来构建我们的工具，这跟我们的文化是相符的。

主持人：这是个很好的回答，我想用它来结束这个话题。这是个很重的议题，你可以往任何方向去谈。关于AGI（通用人工智能）、超级智能，以及我们怎么到达那一步，有个观点我听过，Zuckerberg也提过，别人也说过，就是AI编程是通往那里的路径，因为它让自我监督的AI去构建和维护其他AI。而最终，赢得AI编程赛道的公司，很可能会率先实现超级智能——不管你怎么定义“超级智能”，如果你有定义的话，我很想听听。你同意这个观点吗？如果不同意呢？还有，如果你有对超级智能的定义，请跟我们分享，Thomas。

Thomas Dohmke：我自己没有对超级智能的定义，因为这些定义其实没那么重要，除非是合同里规定的，或者就是个很好的营销工具。你可以上台说“我们是第一个拥有超级智能的公司”，然后下周别人又会说“不，我们才是第一个真正有超级智能的”。

这些词汇很模糊，定义不断变化。所谓AGI或ASI（人工超级智能）那个决定性的时刻，是AI能够自我提升，自己让自己变得更好。也就是说，模型可以从GPT-4直接跳到GPT-5，不再需要人类干预。当AI突然像个小孩子一样，从会笑一个笑话进步到会讲笑话的阶段，我们才能真正说AGI出现了。那一刻就是AI可以自我改进、持续进步的时刻。那才是我们作为人类真正认可的“智能”。不是说你追求某个目标，就说明你是最聪明的，只是说明你能在问题和答案之间建立良好对应关系，但能不断自我进化和提升，才是真正的智能。这才是我们应该用的定义。

主持人：当它表现得像个孩子的时候，我很喜欢这个说法，之前还没听过。Thomas，非常感谢你抽出时间接受采访。（转载自：Z Fiance）

扫码下载app 最新资讯实时掌握

上一篇430亿，今年AI医药领域最大一笔生意成交了

下一篇万字长文实录：RL 界与 CV 界的「世界模型」有什么不同？