×
加载中...
杨植麟不认输
范晓东 NOUS努斯学社 2025-07-17 20:47

AGI就和月球暗面一样,很神秘,要看到它很难。但在AGI的登月时刻到来之前,杨植麟不会认输。

 

2025年的中国大模型赛道,像被谁按了暂停键。DeepSeek-R1在春节后的一次“奇袭”,把调用成本打到骨折,把性能拉到天际,也把同行们的未来降到了冰点。此后半年,江湖只剩三种声音:裁员、砍业务、暂无更多消息。

 

外界看来,月之暗面也要“熄火了”。杨植麟谢绝所有的公开活动,按下另一个暂停键:停掉所有投流,停掉K1系列的修修补补,把算力、人力、钱包全部押注到K2——全球首个万亿参数、320亿激活的MoE怪物。

 

7月11日晚,K2开源模型突然发布,像一颗深水炸弹。

 

技术圈先是沉默,随后炸裂。开源不到24 小时,Star 破 1.8 万,MLX 社区放出 4bit 量化版;一位在东京的独立开发者用K2-Base复现了Claude-3.5的代码能力;LMSYS的匿名评测里,K2-Instruct冲到总榜第四,仅次于GPT-4o、Claude-3.5、Gemini-1.5-Pro,却把DeepSeek-R1挤到第五。

 

近几天,随着越来越多开发者在智能体、前端开发等领域体验发布,K2的好评还在不断增加。Perplexity CEO Aravind 便在多个场合表达对K2的赞美

 

当我向其表达祝贺时,杨植麟告诉我:“得搞下一个大模型了。”



PART 01


大模型没有“垃圾时间”


对于中国的大模型创业者而言,无疑经历了痛苦而难熬的半年。面对DeepSeek的横空出世,字节阿里腾讯的资本碾压,所有人都在怀疑,创业者还能怎么活?

 

大模型似乎进入了“垃圾时间”。但对于还揣着AGI理想的技术创业者而言,所谓的“垃圾时间”只是个伪命题。

 

杨植麟曾和我分享AGI的第一性原理是智能,产品的第一性原理是好用。他判断技术发展分为三个阶段:

1、原理探索期:大众对术第一性原理不清楚;

2、技术创新期:第一性原理有共识,但技术还在持续创新;

3、纯产品应用:技术完全成熟,比拼产品构建网络。


图片
(月之暗面杨植麟、努斯学社范晓东)


尽管行业对AGI没有统一的定义标准,但AGI仍将在相当长时间内处于技术创新期,这意味着,技术和智能水平的高低,是最重要的护城河。DeepSeek爆火后,梁文锋没有热衷于APP应用端的体验优化和用户增长,或许基于同样的判断

 

我们看看此次月之暗面K2大模型所实现的技术突破:

 

1、万亿 MoE:1T 总参数、32B 激活,推理成本仅GPT-4 的 1/5;

2、MuonClip优化器首次scale到惊人的万亿级别,取代AdamW,收敛更快、显存减半,15.5T token 全程零崩溃;

QK-Clip:解决注意力 MaxLogit 爆炸,稳定长上下文 128 K;

3、动态路由 + 更少注意力头:专家利用率↑ ,长序列效率↑;

4、Agentic 数据工厂:自生成百万级工具调用轨迹,模型原生支持17步工具链;

5、端到端 RL:用可验证奖励训练不可验证任务,代码/数学/Agent 三项基准均超 GPT-4;

6、全开源商用:MIT 协议 + OpenAI 兼容 API,一天内社区即出 4-bit 量化。

 

图片

Kimi用MuonClip优化器训练万亿参数的损失曲线,AI研究员Azeem Azhar称为机器学习历史上最优美的曲线之一)


无论是大厂还是创业公司,未来都还有机会。DeepSeek的奇迹本身就是最好的说明:大模型不存在忠诚度,用户随时会用脚投票,选择更好用更智能AI产品。


杨植麟幸运之处在于,为月之暗面搭建了一个价值观接近、结构稳定的200人左右的技术人才组织。这构成了公司核心价值,保证了其还能提供持续的创新能力。


在杨植麟看来,组织是比战略更底层的东西。旧体系长不出新物种AGI 公司必须“ 先造钟,再报时”,这需要一张白纸式的组织


杨植麟觉得,摇滚和创业很像,都代表反叛和打破常规的精神。“招聘时我有时会问对方最喜欢的专辑,答案能让我快速判断他/她是不是和Kimi有共同的审美和价值观”。



PART 02


杨植麟的暗面


I'm a million different people from one day to the next——杨植麟的朋友圈签名,出自Bitter sweet Symphony里的一句歌词。摇滚会如何塑造一个人?遵从自己的内心,反叛世俗的人生方式和评价标准;我是芸芸众生里的普通一个,但也是自由而特别的那个。

 

产品上线仅4个月的月之暗面拿下阿里10亿美金融资后,近百位年轻人挤在海淀知春路的一二百平米狭小空间办公,以前去拜访时,在那些简陋会议室的门上,发现了自己年轻时曾在地下室排练过的乐队名字,Metallica、Queen、Nirvana、Guns N' Roses……



什么是月之暗面?地球上的我们永远无法看到The Dark Side of the Moon。在Pink Floyd那张摇滚史伟大专辑里对此有不同表达——可以是人类首次登月背后的探索精神;可以是事物的本质规律,因为月亮本来就没光;也可以是我们内心深处不为人知的隐秘世界


身为这家30亿美金估值AI初创公司的创始人,杨植麟是一位信仰AI的年轻科学家,也是一位摇滚迷。自由,叛逆,创新,资本,热爱,失落,压力,那些复杂而矛盾的力量在过去的2024-2025急速交织,推着他必须更加笃定,更快进化。


毕竟,通往AGI 的路很窄,容不下犹豫的人。


所有投资人、创业者都明白,想入局就意味着一场资金、智力、速度、身体乃至运气的豪赌,想玩下去,就得坚守创新和长期主义


大模型创业拼的是实打实的人才密度、组织能力;除此之外,杨植麟最在意的一个关键词是“taste”。


杨植麟跟我说,微信、小红书等是他认为国内为数不多有“taste”的产品,杨植麟最推崇的则是苹果和乔布斯。但苹果的“taste”究竟从哪来?


杨植麟开始思考Kimi的价值观问题。“真正伟大的公司需要人文底蕴,而不仅是技术和产品。对审美的追求能让我们做出更好、更有灵魂的产品。”


乔布斯曾用“Think Different”解释苹果的核心价值观。“我们要赞美能Think Different的人。它触及到了苹果公司的灵魂,我们坚信有激情的人能让这个世界变得更美好。” Think Different广告中没有展示任何苹果产品,只是向甘地、毕加索、爱迪生、爱因斯坦、约翰·列侬、鲍勃·迪伦等具有革新精神的天才致敬。


生活不仅仅是工作、家庭、财产、娱乐,我们每个人都能感受到某种冲动。乔布斯说许多人想找回生命的意义,有人去流浪,有人在宗教仪式里寻找答案,他们想寻找生活的真相。正是因为这种精神,有人宁愿当诗人也不愿意做银行家。


乔布斯由嬉皮士出离,又因悟禅而回归。


我分享杨植麟的观点是:连接乔布斯的摇滚精神和禅之间的通道是空性。摇滚本质是对现代世俗生活价值的怀疑,相比于外部世界,更专注人本心的体验。这种质疑推动我们思考生命意义,在《金刚经》里,这是证悟空性的起点,也是慈悲心和大爱的起点。由此,乔布斯可“无所住而生其心”,无中生有,自由创新。


在这轮AI大模型创业浪潮中,技术之难、商业之难、竞争之难,使得行业和从业者背负太多沉重的色彩。我和杨植麟说,对价值观有一个通俗的理解:许一个让自己真正有使命感、了无私心的宏愿。


杨植麟给我分享了他的答案,出自Make Something Wonderful》中的一句话—— Make new things with a great deal of care and love. (转载自NOUS努斯学社)

扫码下载app 最新资讯实时掌握