×
加载中...
GitHub CEO本周官宣离职创业:AI Coding 进入红海,但开发者工具领域不会只有唯一赢家,未来会是多元共存
Z Fiance 2025-08-17 13:19

在最新一期 Decoder 节目中,主持人 Alex Heath 对话 GitHub CEO Thomas Dohmke,这场对话发生在一个微妙的节点:Dohmke 宣布将在年底离职创业,而 GitHub 则并入微软新组建的 CoreAI 团队。在 AI 编程赛道竞争白热化之际,这不仅是一场高层变动,更是一种战略重排,意味着 GitHub 不再只是“开发者社区业务”,而要成为微软 AI 工具链的底座。

面对行业内卷,Dohmke 在节目中给出了一系列激进且颇具争议的判断。他直言未来两年内 90% 的代码都可能由 AI 自动生成。当 AI 真能写出绝大多数代码时,程序员是否还必要存在?他的回答是:开发者不会消失,但会发生分化——有人转型为“提示语导演”,掌控 Agent;有人则坚守写代码的身份,成为“手艺人”。他甚至承认,这种分化本身就是一种新的“职业阶层化”。

更进一步,他提出一个引发热议的观点:AI 编程是通向超级智能的关键路径。如果 AI 能够自己写代码并优化自身,就意味着它具备了自我进化的能力,而这正是智能爆炸的前夜。在他看来,赢得 AI 编程赛道的公司,很可能率先掌握超级智能的门票。这一表态在行业内被视为既是雄心宣言,也是隐忧信号。

Dohmke 还抨击了围绕“AI 写了多少代码”的 KPI 游戏。他直言,这些百分比数据带有营销意味,真正的问题是:AI 生成的代码是否足够可靠、安全,能否在生产系统中大规模使用。他说未来开发者很可能会被“AI Agent 海啸”淹没——数万个 Agent 同时生成、提交代码,迫使人类开发者从写代码转向审核、治理。

他同样没有回避 Copilot 的竞争压力。Cursor、Anthropic 等对手正在重新定义“AI 原生工作流”,并迅速赢得早期开发者心智。Dohmke 承认这种冲击真实存在,但坚持认为 GitHub 的平台优势和微软生态协同,才是决定长期格局的关键。他把竞争比作 F1 赛车——不是每场都能赢,但真正的总冠军要看谁能坚持到赛季最后。

最终,这场对话把一个更尖锐的问题摆在台面上:AI 编程究竟是在解放人类,还是在重写人类在技术世界中的地位? 当 GitHub 的领导人选择在这个时间点抽身离开,留给行业的不只是 Copilot 的未来命题,更是关于开发者身份、智能边界与权力归属的巨大争议。

AI编程崛起与挑战:GitHub CEO谈未来两年内代码全自动生成的可能性

主持人:欢迎来到Decoder!我是Alex Heath,你们周四节目的特邀主持人,也是The Verge的副主编。本周是Decoder的AI编程专题周。你刚刚听到了我的朋友Casey Newton采访Cursor CEO Michael Trell的内容,而接下来,我将带来与GitHub CEO Thomas Dunka的对话。在很多方面,GitHub Copilot可以说是引爆了我们如今所处的AI编程热潮。

但自从Thomas一年前上过节目以来,AI编程的兴起已经让关注点转向了像Cursor和Windsurfing这样更新的平台。正如你们将在我们的对话中听到的,Thomas正在深入思考竞争形势以及GitHub和软件开发的未来。现在正是进行这场对话的好时机。Thomas对行业的走向有着鸟瞰视角。我想了解他如何看待AI对软件工程师角色的持续变化,以及他自己什么时候会觉得可以放心地进行AI编程。毕竟这是Decoder,我不能不问他如今作为一个独立于微软内部的公司,运营GitHub的生活是怎样的。好了,GitHub CEO Thomas Dunka,开始吧。

Thomas,非常感谢你来参加节目。自从你一年前和Nile一起上Decoder以来,我有很多事情想和你聊。自去年以来,最大的变化就是我们在The Verge和Decoder上不断讨论的AI编程的兴起。作为一个从未写过任何软件的人,当我想到AI编程时,觉得那将是我能够完全不用懂代码就能创建一个应用或网站的时刻。对我来说这非常令人兴奋,但感觉我们还没完全到那个阶段。行业大概什么时候能达到那种程度,让像我这样的人可以从零开始用AI编程创建东西?

Thomas Dohmke:这完全取决于你想要做什么。对于一些小项目,我们已经达到了那个阶段。我挑战你去试试GitHub Spark或者Lovable,你很可能能做出像贪吃蛇、乒乓球或者一些小型的专用应用。我们现在已经到了那个水平。

随着复杂度的增加,你就需要具备一定的系统理解,比如架构设计、数据库等等。我们越来越接近这样一个阶段,越来越多的基础功能——我们称之为primitives——被这些AI编程平台所支持。举个例子,像GitHub Spark,当我们去年十月在GitHub Universe发布它时,它只能创建运行在浏览器里的前端应用,使用的是JavaScript语言,可以做一些浏览器端的操作,并带有一点后端存储功能。而现在新版的GitHub Spark实际上可以生成一个完整的全栈应用,包含后端和数据库,还能连接AI模型等功能。大约九个月的时间,它变得越来越复杂。我相信我们会看到这些AI编程平台生成能力的指数级提升。

挑战在于,从零开始创建东西是一回事,而去修改一个已有的软件系统、弄清楚代码库中哪个功能对应哪个测试用例则是完全不同的事情。大多数软件应用随着时间推移会变得越来越庞大和复杂,可能有成百上千的工程师参与开发。AI要能解决所有这些由系统专家才能应对的用例,离我们还很遥远。

主持人:这正好引出了你最近发表的一篇博客文章,你采访了一些开发者。我很想知道他们是什么类型的开发者。你采访了一批开发者,了解他们对AI编程现状的看法、他们目前的状况以及他们对未来的预期。你都采访了什么样的开发者?这些人不全是你们团队内部的。他们是外部的开发者?

Thomas Dohmke:是的,都是外部开发者,是真正在写代码的人。七年前我第一次接触GitHub时,感触很深,因为GitHub品牌和它在业界的广泛知名度,让我们很容易找到愿意参与30分钟访谈、回答问题的人。所以我采访的开发者有一定比例是与GitHub有联系或者对给我们反馈感兴趣的,但总体来说,采访对象是非常多样化的。

主持人:你收到的最主要反馈是什么?我想把这个和软件工程师的角色变化联系起来,想了解你从大家那里听到的关于工程师角色现在如何变化,以及如果可以的话,他们认为未来一年这个角色会怎样演变。

Thomas Dohmke:有人很快地说,AI已经来了,而且会长期存在。我们采访的大多数开发者以及整个行业的大部分开发者,都已经意识到软件开发这个职业正在发生变化,尤其是那些使用AI的开发者,这种变化已经在进行中了。因此,大多数人都在调整自己的工作方式。今年早些时候我写过另一篇博客,称这为“开发者的奥德赛(the Odyssey of developer)"(ZP注:“开发者的奥德赛”借用古希腊史诗《奥德赛》的意象,形象地描述了软件工程师在AI时代面对技术变革时,经历不断适应、探索与成长的漫长且充满挑战的历程。)

我们经历了从穿孔卡和大型主机,到个人电脑的变迁,这极大地改变了开发的内循环速度。以前我得预约主机时间,我记得去我妈妈办公室时,她桌上堆着穿孔卡,而突然之间,每个人的桌上都有了个人电脑,至少护士们开始用电脑编程。接着,我们经历了从汇编语言、Basic和Pascal到Python、Go和Ruby的演变,从没有互联网到拥有数百万个开源库,能直接从自己的服务器或云端拉取到应用中。技术一直在不断提升抽象层次。

如今,开发完整全栈应用的工程师很可能并不真正了解运行该应用的CPU型号、内存大小、主频等具体硬件参数。除非是游戏开发者,他们通常也不会写汇编代码。技术堆栈自然在不断向上发展,因为我们管理的代码量在过去50年呈指数级增长,未来也会继续这样增长,人类已经处在指数曲线上非常陡峭的阶段。因此,我们需要这些工具来“拉平”这条曲线,虽然不能让它完全平坦,但至少让它不那么陡峭,这样我们才能继续应对如今拥有数十亿行代码的复杂应用。

主持人:你采访的开发者中有一半表示,他们相信在两年内,90%的代码将由AI完成。这也是我从其他人那里听到的观点。Anthropic的CEO Dario Amodei甚至给出了更激进的时间表,他认为三到六个月内就能实现。我很想知道你怎么看这个问题?实现一个几乎所有生产环境代码都至少部分或完全由AI生成的世界,大概需要多长时间?

Thomas Dohmke:每当谈到这个话题,我首先想到的是,我们现在技术栈中90%的代码其实已经是别人写好的,也就是全球数百万开源开发者的贡献。无论是前端网页还是后端,我敢肯定90%都是开源的。按代码行数算,90%来自开源库、开源操作系统、编程语言和各种依赖,而工程团队只负责剩下的10%。GitHub和微软的情况也是如此。我们已经处在一个世界里,专注于定义业务核心的那层薄薄的上层代码,同时借助全球开发者的力量来加速创新和安全保障。AI也会做到类似,写出90%的代码,而我仍然可以专注于自己8小时的工作,写好那10%的代码。这并不意味着我停止写代码,而是意味着我现在能拥有十倍于自己单独完成的代码量、功能和特性。

主持人:这就像开源推动技术进步一样,AI也是对开发效率的巨大放大器。

Thomas Dohmke:我们会看到各种团队和公司的广泛差异,这不仅取决于他们是否愿意使用AI,还取决于他们如何设计公司、软件和基础设施,使AI Agent能够充分利用这些资源。举个例子,如果他们有设计系统,当你让Agent添加功能时,它不会随意创造新的层叠样式表,而是使用已有的组件。这样Agent构建的所有功能都能与产品的设计语言保持一致。可以想象,一种全新的应用架构方式将出现,让Agent像搭乐高积木一样更容易组合新功能。这将极大地影响公司达到90%代码由AI编写这一目标的速度,反过来也会影响AI的应用。

显然,仍有许多公司运行着基于大型主机的老旧代码,使用PHP、Perl等遗留的“意大利面条式”代码库。以GitHub为例,我们有一个和GitHub年龄一样大的Ruby on Rails单体应用。作为CEO,我不能简单地决定去拆分这个单体架构,更别提这往往不仅是工程问题,更是哲学层面的讨论。摆脱这些遗留系统,经历云转型、数字化转型,现在还有AI转型,对于这些组织来说所需的时间远远超过那些能够站在技术前沿、让90%以上代码由AI生成的公司。

主持人:所以听起来你还没有具体的时间线。

Thomas Dohmke:比如现在,很多人在他们的博客里已经在记录这件事了。如果你知道自己在做什么,并且从零开始用类似Claud code这样的工具,你可以让100%的代码都由AI生成。而你唯一需要做的,就是修改这些用自然语言写成的指令文件,来指导Claud code构建应用。所以这个应用从定义上来说,100%的代码都是AI写的,而作者真正写的只是指令规范。如果生成的源代码不能正常运行,你当然可以进去手动修改,或者你也可以选择不去修改,因为那样可能会破坏系统,而是思考如何调整你的指令文件,让Claud code继续帮你写出所有代码。

主持人:说实话,我有点懊恼自己居然问了你这个问题,因为有些CEO说“我们代码中有多少百分比是AI写的”这种说法,实际上让我很烦躁。你的老板Satya Nadella曾表示,微软大约有20%到30%的代码是由AI编写的,你也知道,Sundar Pichai也发布过相关数据。

AI编程工具普及与质量挑战下开发者的疑虑与角色转变

主持人:Marc Benioff发布过相关数据,Mark Zuckerberg也有类似说法。但我一直在想,这些代码到底质量如何?

这是那种你希望随着时间推移不断增加使用比例的代码吗?我看到最近Stack Overflow做的一项调查,采访了很多开发者,我相信你也看过。很有趣的是,绝大多数开发者表示他们已经在使用或计划在明年内使用AI工具,比例超过80%。但更有意思的是,大约一半的受访者表示他们对这些AI编程工具的准确性持怀疑态度,而他们最大的挫败感——调查中约66%的人提到——是AI生成的代码常常不够准确,导致他们不得不花大量时间调试。

而且AI编程实际上花费的时间比带来的生产力提升还多。我想知道你在GitHub的各项工作中,包括GitHub内部,是否也看到类似情况?还是这只是个别现象?这看起来是个很大的问题——虽然AI生成的代码越来越多,但质量可能并不理想。

Thomas Dohmke:你说得没错,不过我没给出具体的百分比。

主持人:说实话,我有点懊恼自己竟然只是问你这些百分比问题,因为我翻看笔记时发现,其实很多人对这些百分比数据持怀疑态度,我们是不是用错了讨论的角度?确实,AI生成的代码量在各家公司不断上升,CEO们也拿这个来炫耀他们的成果,但我们是不是该更多关注代码的质量?我很想听听你对这场讨论的看法。

Thomas Dohmke:从我角度看,这两者其实是相辅相成的。这些百分比多少带点营销成分,具体是90%、80%还是95%其实没那么重要。重要的是,我们必须清楚软件开发这个职业正在发生变化,技术堆栈在不断提升。我们正在从理解每一行代码,转向更多地在规格说明之间切换。

人类语言本质上是非确定性的。我们俩可能说同一句话,但意思却不同,更别说不同语言在描述事物时用的结构也不一样。编程语言其实是对处理器——无论是CPU还是GPU——的一种抽象,本质上就是描述晶体管如何自动切换从0变到1的过程。这两者都会共存,因为机器依然运行在CPU上,这一点不会变,但我们是用人类语言在思考。

所以问题其实是,你想写更多的人类语言,还是想写更多的代码?这不是AI帮你决定的,而是你作为开发者自己做的选择。这正是作为开发者的创造自由——你可以说“我现在知道自己在做什么,我想写代码”,或者“我想用AI Agent帮忙”。事实上,关于Agent,最关键的问题是,用Agent更快,还是自己动手更快?如果我知道自己三秒钟就能搞定,那用Agent反而是浪费时间、精力和资源。就像我希望用ChatGPT帮我回复短信一样。

主持人:我用消费者级Agent的时候也有类似感受,比如你确实能帮我订酒店什么的,但花了一个小时,而且结果也不太对头,最后我还是得自己动手做,自己做反而更高效。

Thomas Dohmke:就拿Outlook里的通知摘要来说,至少对我而言,它通常没有直接阅读邮件的前三行内容来得实用。

接下来第二个问题是,好,AI写了这么多代码。如果AI写了90%的代码,也就是写的代码量是我自己的九倍,那么我是不是要审查这些代码的质量、安全性和编码规范?还是说,我会寻找AI来帮我做这些工作?因为最终,我们人类开发者将被大量Agent“淹没”,这里说的“淹没”是分布式拒绝服务攻击(DDoS)的意思——这些Agent不会休息、不会周末放假,而且可以同时运行。

你看OpenAI的codecs,它们已经会为你给出的每个任务生成四个不同的版本,然后你通过选择自己最喜欢的版本,实际上在帮助它们进行强化学习。但不仅仅是生成四个版本,它们完全可以生成40个甚至400个版本。接着,你还可以用另一个Agent来评估这些代码的质量,给出评分,形成一个Agent之间相互反馈的闭环。

实际上,我们正逐渐达到一个阶段,AI Agent生成的代码质量会持续超越人类,因为它们可以在无限规模上运行,找到那些人类因时间有限而无法发现的所有漏洞。但挑战仍然存在,那就是我们是否信任这些代码。说到这点,其实GitHub的诞生正是为了促进人类之间的协作。

GitHub的核心就是我有一个开源项目,你可以fork这个项目,如果你喜欢或想添加功能,就给我发一个叫做pull request的请求,然后这代码不会直接合并到我的代码库里。相反,我会审核这段代码,给你反馈,比如说:“嘿,Alex,这个挺不错,但你能不能改写一下这部分?”有时候语气甚至会更严厉。最终,我们会决定,“好,这挺不错,合并吧。”这其实就是人类之间协作的质量控制。当然,你也可以用同样的流程来实现人类和Agent的协作,但如果你有成千上万个Agent,那就得重新思考这个流程了。这将是开发者工具最大的差异点——谁能搞清楚如何让Agent生成比人类多得多的代码,同时又让人类保持控制权,确保投入生产、处理客户数据、计费流程等的代码真正可用、质量过关且没有安全漏洞。这才是未来几年的挑战,不是Agent写多少代码,而是我们能接受多少Agent写的代码进入生产系统。

主持人:听起来你的意思是,未来的开发者更多是在全天监控这些Agent的表现,接受或拒绝pull request,审查代码,但不再亲自写代码,可能只给出非常高层次的指令,实际上是在从编码的具体过程里退出来。这将成为普遍的趋势吗?

Thomas Dohmke:你要做的只是写一个提示语。这在图像生成模型中也已经开始出现了。比如你用ChatGPT生成一张吉卜力风格的图像,你并没有写生成图像的代码,只是给出指令,然后模型帮你完成。实际上,有个技巧是你可以上传一张已有的图像,让它分解成JSON格式的数据结构,然后你修改这个数据结构,再用它作为提示语去生成修改过或删除了某部分的图像。所以你有点像在做开发,但并不写代码,而是让模型帮你完成。未来会有一类开发者,专门使用模型和Agent来构建并验证系统。

还会有一类开发者依然热爱写代码,他们会将部分工作交给AI Agent来完成,比如写测试用例、文档等那些他们不喜欢做的事情,从而腾出时间去做自己真正热爱的事。问题是,你一天八小时的工作时间应该如何安排?什么样的工作能激发你的创造力,推动创新,还是更注重把事情做完?这两者需要结合起来。

如今,无论大公司还是小公司,大多数开发者每天可能只写四个小时代码,有时甚至更少。剩下的时间则花在开会、写邮件、审查他人代码、更新服务等各种事务上。开发者还得做很多其他工作。他们大多数人会保留一定时间,用来写代码或者写指令生成代码,这会让他们感觉自己依然在编程。

事实上,打个比方,我们是从汇编语言发展到更高级的AI编程语言和开源库的。我没见过有人说自己再也不用写汇编了,并不是汇编不再存在,而是我们有了编译器,把高级编程语言编译成汇编代码。现在,你可以把AI模型看作是一个编译器,它把人类语言的指令编译成编程语言,然后真正的编译器再把编程语言转成汇编代码。你的代码其实就是人类语言了。你可能再也不用看编程语言了。但问题是,目前的模型仍然会出现幻觉,写出的代码不一定完全符合你的预期。

或者说,我可能会让AI重复生成十次,每次的代码版本都不一样。你看过有人在现场用vibe coding演示玩贪吃蛇游戏吗?每次生成的游戏代码都不一样。所以我们还不够信任人类语言转换成编程语言这一层,无法直接跳过它。但我们已经成功跳过了汇编语言那一层,对这点很有把握。我认为只要这两层依然存在,我们就会继续写代码、学习编程,在确定性和非确定性层面之间来回切换。

主持人:因为LLMs本质上是非确定性的,它们会“编造”内容,这其实是它们架构上的一个特性,而不是bug,是故意设计成会产生幻觉的。那么,是否会有那么一天,像我这样完全不懂编程、分不清各种语言的人,也能可靠地通过自然语言构建需要访问各种API、数据库、网页等功能的应用?如果真的能做到,那将是个巨大突破,对世界产生深远影响。但正如你说的,也许这项技术本质上就达不到那个境界。

Thomas Dohmke:只要范围受限,是能够实现的。而且这个范围会逐渐扩大。

你将能够完成一些特定的任务,比如你现在跟AI Agent对话,让它帮你生成一张图表。实际上,它是在帮你写一段Python脚本,然后用这段脚本来生成图表。而你可以让ChatGPT把这段Python脚本展示给你看。不过大多数用户根本不需要去理解这段Python代码,只要看图表就行了。所以这类用例会快速增长。

但我们所认为的专业软件系统,也就是专业软件开发者开发的产品,将变得更加复杂。因为现在专业开发者能够在同样时间内构建更多功能,而过去可能只是写一个Python脚本来生成合理的图表。今天我们所称之为“最先进”的软件,将远比我们能想象的人类开发者写出的复杂得多。事实上,这一直都是如此,比如现在我的iPhone,功能远远强于1990年代初的Commodore 64。当年为Commodore 64开发的程序员看到如今的iPhone应用,会觉得这简直是魔法,就像我们看待AI一样。如果这样想,我们终会达到那个点,同时专业开发者依然会像魔法师一样,因为他们能写出如此精简且功能强大的应用。

GitHub Copilot与AI编程领域的激烈竞争与未来展望

主持人:我们来聊聊竞争吧。你刚才在对话中已经提到了几个GitHub Copilot的竞争对手,这说明你愿意谈这个话题。编程可以说是目前AI领域竞争最激烈的部分,至少这是我的看法。现在有很多交易在进行,初创公司被收购,实际上,一些历史上增长最快的公司正是AI编程公司。比如Cursor、Lovable,还有我们刚才谈到的Vibe coding应用。

GitHub Copilot确实是最早进入AI编程助手领域的产品,现在依然非常强大,但我好奇的是,特别是过去这一年自你上次在Decoder出现以来,你是否认同这样一种看法——GitHub Copilot似乎在一定程度上失去了市场关注度,至少在那个对这类技术痴迷、每天都在讨论的硅谷小圈子里。我相信你们仍然有大量用户,但我想知道你是否也有这种感觉,是否觉得这对你们推动产品更快迭代带来了压力?另外,你怎么看今年竞争格局的变化?

Thomas Dohmke:整个人工智能、大型语言模型以及这些模型能实现的可能性正以非常快的速度发展。在科技领域,我从未见过这样的局面,我也在这个领域待了很久。你说得没错,AI代码生成正站在这场创新浪潮的最前沿。逻辑上讲,因为所有这些公司都雇佣开发者,所以大家都有内在的动力让编程变得更容易,因为这意味着我可以更快地创新。如果我有一款能让我的开发者比竞争对手快5%的编程工具,我肯定会用。自从我上次在Decoder亮相以来,这个市场已经加速发展。我对此持非常开放的态度。

这真是令人惊叹,我作为开发者这么久,从未见过软件开发工具有如此多的创新。作为GitHub,我们一直明白自己是一个生态系统的一部分,这个生态系统既与行业内的公司竞争,也与它们合作,无论是在AI代码生成领域,还是在CI/CD、应用构建等方面。我们并不决定你更喜欢哪个开源库。大多数人不会只用GitHub提供的JavaScript生态系统,如果你想用Python,你会去别处。没有人愿意看只有一支球队赢球的体育比赛。至于你说我们失去了心智份额,我不同意。我们赢了一些,也失去了一些,有时甚至是周周变化。你会看到有人在他们的社交媒体上发帖说他们又回到VS Code了,因为最新版本、我们每月发布的90个版本中有他们想要的功能。作为行业,这是值得骄傲的事情。

Copilot在从单模态到多模态的转变上起步较晚,但我们去年十月终于实现了这一步。我们引入了AIC支持,构建了MCP(模型上下文协议)集成,现在所有这些编程代理都在使用我们与OpenAI合作打造的GitHub MCP服务器。这是一场竞赛。我们刚刚在微软的财报中宣布,GitHub Copilot现在拥有2000万用户,环比增长达到75%,在企业使用方面,财富100强中有90家在使用。关于数据统计,我可以一一告诉你。

主持人:关于用户数量,我得问问你这个数据。Thomas,这个用户数量听起来有点奇怪。这是累计用户数吗?还是曾经使用过的用户数?还是月活跃用户?或者是日活用户?你能给我更具体一点的细节吗?

Thomas Dohmke:这是指有2000万GitHub用户开启了Copilot功能。这个数字对应的是GitHub总账户数1.5亿的计算方式,测量方法是一样的。另外,我们在Visual Studio Code上有5500万用户。所以这些数据可以让你大致了解我们在各种IDE中激活用户的情况。

主持人:你那篇宣布新用户数统计的帖子里,你写道,一家公司的真正考验从来不是在它的炒作浪潮中显现,而是在压力测试时展现出来的韧性。然后你还写了更有意思的一句话,是你说“即使面对各种限制,我们也证明了少许坚韧能赢得比赛”。你在那篇帖子里说的那些限制具体指什么?因为你是GitHub的CEO,我本以为你们其实并不受限制。你们还是model agnostic(模型无关)的,而微软其他部分似乎至少目前还和OpenAI紧密联系着。但看起来你们能用任何想用的模型,相较微软其他部门还是比较独立的。你说的那些限制具体是什么?

Thomas Dohmke:公司的资源是有限制的。这就是预算的定义。员工人数,或者说人头数什么的。你不可能无限制地一直增加人员,因为那会遇到“人月神话”问题(Mythical Man-Month Problem)(ZP注:"人月神话"问题指的是在软件开发中,盲目增加人手并不能线性缩短项目工期,反而因沟通与协作成本上升导致进度放缓的现象,来源于弗雷德里克·布鲁克斯1968年出版的《人月神话》。),增加更多人反而会拖慢团队速度,而不是加快进度。无论你是10人的初创公司,还是3000人的GitHub,甚至是20万人的微软,都必须做出取舍。

苹果公司也著名地说过,每个“Yes”需要1000个“No”。所以其中一个限制是,我们的待办事项清单中有无穷无尽的条目,而且很多这些待办项的差距都是源自AI出现之前的时间,比如客户反馈,有人在GitHub Issues或者GitHub Projects里希望有某个功能,你说得出名字的,我们都有。

事实上,有个流传的笑话是,我们每收到一条客户反馈,实际上早就有一条类似的,可能是几个月甚至几年前的,别人早就有了同样的想法。因为我们的客户群体是开发者,我们自己也是开发者,总会有人提出之前已经存在的想法,或者告诉我们如何做得更好。然后在X上(推特)就会有一拨人说,“GitHub把这设为默认是个愚蠢的决定”,另一拨人说“这是有史以来最棒的决定”。我们生活在这样一个信号输入过多的世界里,而我们的限制就是选择那些真正能让你快速前进的关键点。

而且没人真正知道两三年后AI代码生成或者AI整体会是什么样子。如果我们都诚实面对自己,这是真的。

如果说ChatGPT是2020年代的Netscape时刻,那么现在就像是1995年,当时有了Amazon和Google,但还没出现Facebook、Shopee和iPhone。1995年预测这些事物会发生,是非常荒谬的。

而GitHub自成立以来就是这样一种自信的状态:它走在时代前沿,比如最早使用Git来构建当时没人叫DevOps的东西,但现在它成为了最大的开发者平台之一。之后一直在寻找下一个重大创新,关注行业内其他人在做什么,他们更倾向于和谁合作,而不是自己全部打造。通过Copilot,我们很好地驾驭了这一点。也有过战略决策失误的时刻,那些决策没能把我们拉向正确方向赢得市场。但现在,我可以说,到2025年8月,我们依然走在曲线前端,依然是市场领导者。对此我们感到非常自豪和开心,这些都是我们辛勤努力的成果。

主持人:说到合作还是不合作,大家都知道,编码已经成为影响人们关注的巨大交易,尤其是和AI相关的。我想到Google和Windsurf。Windsurf是一个非常有前途的AI编程工具,他们本来打算卖给OpenAI,但那个交易被叫停了,而这正是微软介入的地方。我知道你是GitHub的,但这事都相互关联。我很好奇,这件事的关键是,为什么Google最终选择招聘了Windsurf团队,而Windsurf没能卖给OpenAI,原因是有人担心Windsurf的知识产权不会被保护免受微软影响,考虑到微软和OpenAI的关系,存在竞争动态。

所以我想知道,为什么这是一个如此重要的问题,以至于直接导致了那笔本可能对AI编程领域乃至整个硅谷都很重要的交易失败?这本来会是一笔数亿美元的大交易。虽然我知道你可能不是这件事的主要推动者,但你能解释一下为什么这件事如此关键吗?

Thomas Dohmke:你问这个问题我可以选择不回答。说实话,我在这些谈判中确实存在利益冲突,所以我没有任何内部背景信息可以分享给你。但这其实反映了另一点,就是担心开发者很快会被AI取代的恐惧其实是不成立的。事实恰恰相反。像Windsurf背后的创始团队和核心成员,或者行业内的其他人,我自己也想到我本人,他们收到的报价已经能和职业篮球运动员媲美,有些人甚至有经纪人帮他们谈合同。对此我们应该感到兴奋。

至于如何达到这一步,是个好问题,适合有渠道接触相关文件的人去探讨,我没有那权限。但作为一个开发者,一直在这个行业里,自己也在构建和使用开发工具,这真的是非常令人激动的事情。因为这说明顶尖开发者的市场价值在不断增长,也希望能激励那些喜欢玩游戏、想自己创造东西的青少年,继续投身这个职业。我坚信,如果事情按我希望的方向发展,我们将比以往任何时候都更需要更多开发者。

主持人:我们具体聊聊Cursor吧,它真的扛起了大旗,至少在硅谷的早期用户群体中,它是目前最火热的AI编程工具。他们抓住了什么关键洞察,才让他们在用户心智认知上迅速领先?我知道GitHub Copilot规模还是更大,但Cursor增长非常快,而且他们的CEO最近在Dakota和Casey Newton的采访中提到,GitHub是他们创业的灵感来源。那他们到底抓住了什么是你之前没看到的?你们现在怎么应对?

Thomas Dohmke:Cursor抓住的关键是认识到,问题不仅仅是把AI加入到传统的集成开发环境(IDE)里,而是要改变整个IDE本身,设计一种你可以称之为“AI原生”的工作流。换句话说,就是从根本上思考如果AI是默认配置而非附加功能,开发者将如何工作。他们是第一个基于GPT-3.5版本开发的Copilot产品。

所以他们还走在前沿,意识到应该让多模型共同发挥作用,给开发者选择权,让他们挑选最适合自己的模型,而不是我们替他们做决定——这就是我一年前和Nilay谈话时我们的理念。这是两种不同的思路。我们当时做了大量进化测试,评估各种模型,然后选出我们认为最好的那个。但这不是非黑即白的选择,因为每种编程语言、每个测试场景,不论是生成功能代码还是测试代码,评分标准都不一样。于是会有不同的评分维度,你必须做出综合判断,认为“这个模型总体表现更好”。

不过根据开发者工具的发展历史,我们GitHub对此非常清楚,给开发者提供选择权永远是最好的做法,让他们自己决定用哪个模型。凭借经验,或者说专业直觉,他们会知道怎么选。这已经改变了今天的市场格局。如果你不提供多模型选择,不拥有被大多数开发者认可的最佳模型,不允许开发者带入自己的模型,没有运行在IDE中的Agent模式,不能将该Agent模式卸载到云端,像我们称之为“Coiled Coding Agent”的服务并且集成在GitHub平台里,你根本无法在AI编程领域竞争。

我很喜欢F1赛车,我总是用这种思维看待世界。有些车队赢得了整个赛季,下一季却落后了,他们不会因此认定“我们输了,永远不会再赢”,而是把这当作动力去重新思考自己的做法。这就是2024年中晚期Copilot经历的过程。而到了2025年8月,我们已经能重新赢得比赛了。虽然不是每场都赢,竞争对手也不会每场都输,但我们确实在AI代码生成上做出了创新,同时也赶上了让其他对手更快的关键技术。

主持人:这个领域看起来非常动态,正如你提到的,关键在于模型本身。无论哪个工具目前在模型领域领先,它们都会用自己的方式来定价模型,而模型领导者经常变化。即使身处其中,也几乎不可能跟上所有这些模型的发布节奏。

Llama3是个不错的模型,Llama4就不那么出色了;而Anthropic现在似乎是代码领域的王者。也许情况会变,也许几个月后OpenAI会重新领先。这会如何影响应用层呢?所以必须理解这个领域变化有多快。现在说你们肯定输了,或者说Cursor肯定赢了,都为时过早。但说到Anthropic,你们跟他们合作很多,你提到了MCP服务器,显然通过GitHub Copilot也可以访问云端。

我一直在问人,为什么Anthropic在编码方面这么强?他们有什么“秘密武器”?Dario(Anthropic联合创始人)最近在Big Technology播客上说,他不想透露他们为什么这么厉害。但这大概是一个价值数十亿甚至上千亿美元的问题——为什么他们在这个领域有如此领先的模型?作为一个和他们紧密合作的人,我很想知道你怎么看,为什么他们在编码领域取得这么大领先?

Thomas Dohmke:让我先回到你问题的第一部分,稍后再谈谈Anthropic到底强在哪里。

在科技领域,我们常有一种观念,觉得一个赢了就意味着另一个必输,但这并未被证明。比如Windows和Mac OS、iPhone和Android,以及许多其他技术,事实证明并非如此。实际上,在开发者工具领域,这种“非此即彼”的情况从未出现过,否则今天也不会有数十种编程语言存在,大家都会转向所谓最好的那一种。

看看GitHub Copilot的竞争对手,比如Cursor、Lovable、Windsurf、旧版Vercel等等,你会发现使用这些工具的人,其源码实际上都存储在GitHub上,他们的Issues和项目管理也在GitHub,CI/CD流程也是在GitHub上运行的,而这些竞争对手很多是在Azure上运行模型推理。作为微软的一部分,我们是整个生态系统的一部分。

我们一直是平台公司,GitHub也一直是平台公司,所以我们既是竞争者,也从这些公司推动整个软件生态系统规模增长中受益。说实话,软件开发只会越来越多,不会减少,开发者人数也在增加。看看那些科技公司在股市上的表现,它们经常跑赢大盘。如果我们的竞争对手赢了,我们其实也赢了。在谈论这些竞争时,保持这种心态非常重要。

主持人:这就是作为超大规模云服务商的优势,Thomas——当竞争对手赢了,你们其实也赢了。不是每个人都能这么说。

Thomas Dohmke:当然,这就是所谓的差异化。具体说到Claude Sonnet,如果你相信YouTuber、博主和专家们,比如Simon Wiles等人,他们认为Claude Sonnet真正胜过其他模型的地方在于“工具使用”——也就是模型为Agent模式的下一步选择合适工具的能力。这说明,训练不仅仅局限于编程语言、代码等内容,更包括训练模型像开发者一样合理使用各种工具。

如果这一步失败了——你可以在一些其他模型身上看到这种情况,工具使用远不如Claude Sonnet——那么你的Agent模式就会崩溃。举个例子,Agent需要安装一个JavaScript依赖的NPM包,但安装失败了。即使Agent拥有世界上最好的训练数据集,如果它完成不了这一步,整个流程就无法正常工作。Anthropic正是在这方面早期有洞察力,或者说拥有更好的进化测试手段,从而赢得了领先地位,其他团队还在努力追赶。但有趣的是,我们现在录制这段话时,等它发布时,这个局面可能又发生了变化。

GitHub CEO详谈微软与OpenAI合作、Copilot盈利现状及AI未来智能展望

主持人:欢迎回来,休息前我和Thomas聊到了GitHub的竞争情况。这给了我一个很好的机会去问问微软和OpenAI之间的进展。我们已经几乎谈到了所有主要竞争者。微软目前正和OpenAI商讨双方未来企业关系的新篇章,因为OpenAI正从非营利转为营利机构,而微软显然是重要的大股东,目前拥有IP的独家访问权。作为GitHub的CEO,我很好奇你希望OpenAI和微软的关系未来如何发展?从你的角度来看,这段关系中最重要的是什么?你希望看到什么?

Thomas Dohmke:对于GitHub和所有开发者来说,这段关系始终需要保持健康。双方的合作方式必须是互惠互利、相互支持的。

最初的Copilot正是OpenAI和微软合作的产物。OpenAI开发了GPT-3和Codex模型,而微软不仅拥有超大规模的基础设施,还有多年在AI扩展和运算方面的经验。想想当初的Copilot,那真是个杰作,因为每次敲击键盘时,都能即时调用大型语言模型进行推理,这在当时和那样的规模下是前所未有的——数百万开发者在极短时间内使用它。正是GitHub、微软和OpenAI之间的这种创新合作,创造了如今这个拥有众多竞争者的市场,未来还会有更多新竞争者加入。双方未来的合作将继续催生新的创新,通过新模型和更高效的模型运行方式实现。关于AI的能耗、成本和利润率,已经有很多讨论。对于GitHub而言,我们始终把开发者放在第一位——这就是我们的核心。GitHub一直强调人对人之间的协作,而现在我们正迈向人与Agent的协作,甚至更可能是Agent与Agent之间的协作。这三层协作模式将逐步叠加起来。

OpenAI现在拥有以ChatGPT为代表的最大AI平台。与他们合作,确保开发者在ChatGPT中生成的内容,尤其是基于OpenAI Codex的内容,能够符合相同的安全合规标准——也就是企业级的控制体系,这对开发者采纳这些工具并将其整合到工作流程中至关重要。AI领域最终的竞争将是在平台层展开的。因为如果所有的Agent都异常强大,那么真正重要的是你如何把它们整合进你的其他业务流程。对我们来说,这显然就是开发者生命周期管理。

主持人:讲得很有道理!那我们就以一些关于GitHub和微软的具体问题来结束吧。距离你上次公布年度收入运行率已经过去一年了,我记得当时数字是20亿美元。为什么没有更新?现在的数字是多少?

Thomas Dohmke:投资者关系团队决定了哪些信息可以公开,哪些不公开。所以像往常一样,我只能告诉你财报里写的内容,这次他们决定不公布具体数字。

主持人:好的,我猜数字应该比那个高,我猜应该超过20亿美元。

Thomas Dohmke:我们还有一些其他令人印象深刻的数据,但我们非常满意第四季度的业绩,真是太棒了。

主持人:Nilay去年曾提过这个问题,我预计你的回答可能差不多。不过,我们有一个关键问题:Copilot对GitHub是否盈利?这一点重要吗?或者说,这是否在决策考量之中?毕竟你们在微软内部,某种程度上是以一个相对独立的组织来管理自己的损益表,那么目前它更像是在创造利润,还是作为争夺市场份额的成本中心存在?

Thomas Dohmke:你说得对,GitHub有自己的盈亏表(P&L),我们是根据那个目标来衡量的。一般来说,从微软整体业务看,各个业务单元肯定希望赚钱,只是时间尺度不同。很多投入很大。更重要的问题是,它能否在客户合同的生命周期内(即LTV)盈利?对此我很有信心,微软领导层会对GitHub的业务感到满意。

我们2018年以75亿美元收购了GitHub,那时GitHub上一次公开的年收入是2亿美元。而你刚才提到去年是20亿美元,七年间收入翻了10倍,可以合理推测这个数字还在增长。你提到Cursor的业务数字,我们对这些数据很公开,我们相信Copilot规模比Cursor还大。你可以根据这些信息去推测我们的数字。所以我们对这笔收购感到非常满意,我个人认为这是微软有史以来最重要的三笔收购之一,Satya Nadella和Amy Hood应该也会同意这个看法。

对此我们感到非常满意。我们以可持续的方式发展了这个平台,没有忽视开源。可以说,我们没搞砸GitHub,GitHub依然是GitHub,依然是开发者生态中最受欢迎的品牌,几乎所有企业都会用,虽然不是每个企业所有开发者都会用,但大多数企业至少部分开发者使用。而且在AI时代,GitHub也实现了自我革新。正如我们用Git来构建GitHub一样,我们用大型语言模型和OpenAI的GPT-3共同打造了史上第一个Copilot,领导了这个市场。

主持人:这回答得不错,我需要好好消化下。那么,Copilot有没有一个明确的盈利目标?比如市场达到某个规模,或者和微软其他产品打包销售,是什么让你们觉得这件事值得投入?

Thomas Dohmke:我们有类似摩尔定律的规律,也许现在应该叫Jensen定律了,就是GPU变得越来越快、越来越便宜。你提到了很多创业公司都在试图发明更高效的变压器处理器。我相信规模的力量,你也可以回顾15年前问Jeff Bezos同样的问题,看看今天超大规模云服务商的盈利情况。

所以我们会有耐心,会努力提升效率。缓存技术已经在Agent里起了巨大作用。商业模式也会不断演进。我们的开发者会因AI变得更高效,不仅仅是优化利润率,而是优化我们内部的软件开发流程。我坚信那些还在怀疑AI作用的公司,最终会落后于创新。如果你不使用AI,就会有巨大的FOMO(错失恐惧症),因为你行业里其他竞争者已经在用AI了,他们的开发者也在用。

使用AI的开发者生产效率能提升10%到20%。虽然有人会问为什么不是30%,但20%已经是巨大的提升了。考虑到软件开发者的成本,以及培训、项目切换所需时间,这种效率提升是非常可观的。

不仅仅是开发者,AI还能提高客户服务、销售、潜在客户发掘等各环节的效率。那些不拥抱AI的公司,无论盈利与否,最终都会在市场竞争中落败。

主持人:这让我想起你们微软内部一位同事最近写的一份备忘录,指示管理层根据员工使用内部AI工具的情况来评估绩效,并且明确表示这“已经不再是可选项”,而是每个岗位每个层级的核心内容。我想你能理解大家对此转变的焦虑感——有些人在职场上已经走得比较远,感觉自己习惯了原来的工作方式;还有刚入职不久的年轻人,面对各种变化感到不知所措。大家都感到很大压力。如果你是微软的一名中级工程师,可能会想:在这场变革中,我会不会被落下?公司能不能真的准确地评估这点?作为GitHub的CEO,微软管理层真的有一个可衡量的、真实反映AI带来生产力提升的内部评估体系吗?员工们能不能真正知道他们的表现是怎么被衡量的?

Thomas Dohmke:那份备忘录其实更微妙一些。它讲的是我们称之为“Connect”的过程,就是员工和经理之间的对话。GitHub也有类似的评审流程,员工会总结过去一年的成就,反思哪里可以做得更好以提升影响力,以及他们下一年的计划和执行路径。这就是一个框架。到了2025年,完全合理让大家反思自己对AI的使用情况,比如你用没用GitHub Copilot,微软的Copilot,Teams的Copilot去总结会议?如果没有,为什么?然后经理会给出反馈,这个过程对经理来说也是一种学习,有时你会发现员工在AI使用上领先你,我自己就有过这种经历,“让我看看你是怎么做的”,才意识到某些功能确实很有效。

这个流程是微软文化的核心。我们谈的所谓“mindset”(心态)其实就是接受自己可以不断进步,知道自己不是生来就完美的,而是有能力不断自我提升。如果你把这份备忘录放在这样的语境下看,它其实和微软的哲学完全一致。

另外专门说说GitHub,公司里没有一个员工可以不使用GitHub。无论你是什么岗位——不只是开发人员和产品经理,HR、财务、法务、销售等所有职能都在用GitHub。我绝不会允许有人说“不,我不想用GitHub”。这是我们的企业文化。同理,我们也希望每个人都能用上Copilot和AI工具。这并不意味着我们会看你今天写了多少代码、提交了多少pull request或者执行了多少Git命令,因为这些指标很容易被“刷”数据。但这反映了一种心态:你在用我们的工具来构建我们的工具,这跟我们的文化是相符的。

主持人:这是个很好的回答,我想用它来结束这个话题。这是个很重的议题,你可以往任何方向去谈。关于AGI(通用人工智能)、超级智能,以及我们怎么到达那一步,有个观点我听过,Zuckerberg也提过,别人也说过,就是AI编程是通往那里的路径,因为它让自我监督的AI去构建和维护其他AI。而最终,赢得AI编程赛道的公司,很可能会率先实现超级智能——不管你怎么定义“超级智能”,如果你有定义的话,我很想听听。你同意这个观点吗?如果不同意呢?还有,如果你有对超级智能的定义,请跟我们分享,Thomas。

Thomas Dohmke:我自己没有对超级智能的定义,因为这些定义其实没那么重要,除非是合同里规定的,或者就是个很好的营销工具。你可以上台说“我们是第一个拥有超级智能的公司”,然后下周别人又会说“不,我们才是第一个真正有超级智能的”。

这些词汇很模糊,定义不断变化。所谓AGI或ASI(人工超级智能)那个决定性的时刻,是AI能够自我提升,自己让自己变得更好。也就是说,模型可以从GPT-4直接跳到GPT-5,不再需要人类干预。当AI突然像个小孩子一样,从会笑一个笑话进步到会讲笑话的阶段,我们才能真正说AGI出现了。那一刻就是AI可以自我改进、持续进步的时刻。那才是我们作为人类真正认可的“智能”。不是说你追求某个目标,就说明你是最聪明的,只是说明你能在问题和答案之间建立良好对应关系,但能不断自我进化和提升,才是真正的智能。这才是我们应该用的定义。

主持人:当它表现得像个孩子的时候,我很喜欢这个说法,之前还没听过。Thomas,非常感谢你抽出时间接受采访。(转载自:Z Fiance)

扫码下载app 最新资讯实时掌握