这几天,估计不少朋友都被一款叫Sora的“文生视频”工具狠狠地刷屏了。马斯克、杨立昆、贾扬清、Jim Fan、谢赛宁、周鸿祎、李志飞等科技大佬纷纷下场评论。马斯克感叹“人类愿赌服输”;正在AI infra赛道创业的前阿里高管贾扬清直呼:真的非常牛;360的周鸿祎预言“AGI实现将从10年缩短到1年”……国内外社交平台上,人们也对Sora的横空出世展开热烈讨论,“炸裂”“史诗级”“现实不存在了”等言辞溢满屏幕。眼下文生视频蔚然成风,成为全球新一轮AIGC竞赛的焦点。尽管Sora尚未面向公众开放,但其带来的颠覆性的影响却已在路上。
-1-
Sora横空出世,大佬们怎么看?
一位穿着时尚的女性走在东京街头,时长将近60秒,画面质感堪比广告片。无论是人物脸上的雀斑,还是水中的倒影都显得极其逼真。
让人难以置信,这竟然是AI生成的,而且只需要输入一段文字提示词就可以达到这样的效果。正如有人所总结的,如果此前的AI“文生视频”工具是“模拟现实”,而Sora则是“构建现实”,也就是为真实世界建模。而OpenAI也没有单纯地把Sora叫做视频模型,而是称为“世界模拟器”。马斯克、杨立昆、贾扬清、Jim Fan、谢赛宁、周鸿祎、李志飞等科技大佬纷纷下场评论。马斯克在社交平台X上留言,“人类愿赌服输(gg humans)”。出门问问创始人李志飞感叹:“LLM ChatGPT是虚拟思维世界的模拟器,以LLM为基础的视频生成模型Sora是物理世界的模拟器,物理和虚拟世界都被建模和模拟了,到底什么是现实?”前阿里巴巴副总裁,Lepton AI公司创始人贾扬清则直接评价Sora“真的非常牛”,他表示“对标OpenAI的公司有一波被其他大厂fomo(害怕错过机会而导致的收购)收购的机会”。贾扬清认为,开源大模型仍然需要一段时间才能追赶上,从算法小厂的角度来看,要么在算法上与OpenAI媲美,要么深耕垂直领域的应用,要么选择开源;最后,基础设施的需求将继续猛增。在周鸿祎看来,Sora展现的不仅仅是视频制作能力,而是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。他认为,AGI(通用人工智能)的到来,不是10年20年的问题,可能一两年就可以实现。有人赞美,也有人唱衰。Meta首席AI科学家杨立昆并不怎么看好Sora,他在twitter上表示,一个AI模型可以生成逼真的视频,但并不代表这个AI可以理解世界。纽约大学助理教授谢赛宁高赞Sora是“难以置信的、将重塑视频生成社区”,发长文分析Sora基于DiT架构、可能用到谷歌NaViT技术,推算Sora参数量约30亿。多伦多大学计算机科学AI助理教授Animesh Garg说Sora像是“模型质量的飞跃,它不需要快速的工程来实现随时间一致的RTX渲染质量生成”。英伟达高级研究科学家Jim Fan评价Sora是“视频生成的GPT-3时刻”“数据驱动的物理引擎”,认为它通过一些去噪、梯度下降去学习复杂渲染、长镜头推理和语义基础等。
-2-
Sora的出现,意味着什么?
几个月前,不少大佬都还在谈论实现AGI,需要10年甚至20年的时间。这才没过多久,OpenAI带来的Sora又一次颠覆人们的想象。有人说,Sora的出现是向AGI前进路上的“里程碑”,它意味着AGI正在加速到来。OpenAI也在Sora的技术文档写道,“我们的结果表明,视频生成模型是有希望向构建通用物理世界模拟器迈进的路径”。就在所有人都在为Sora惊叹狂欢时,大量AI视频创业者、投资人,传统影视、广告等行业从业人员或许正思考着新的出路。Sora问世之前,Runway、Pika、Stable Video Diffusion等大量创业公司还在百家争鸣,Sora发布之后,这些公司瞬间黯然失色。要知道,就在Sora直接可以生成60秒既流畅又逼真的视频时,全球最火的两家AI视频公司Runway和Pika还在把生成15秒的流畅视频当梦想。这简直是“降维打击”。难怪有人说,ChatGPT的出现终结了那些AI文本生成的创业公司,现在轮到Sora终结AI视频生成公司了。不过,面对Sora的冲击,Pika创始人郭文景却表现得很淡定。她在回应钛媒体采访时称,“我们觉得这是一个很振奋人心的消息,我们已经在筹备直接冲,将直接对标Sora。”周鸿祎预言,Sora可能给广告业、电影预告片、短视频行业带来巨大的颠覆。美国旧金山早期投资人Zak Kukoff预测:一个不到5人的团队将在5年内用文生视频模型和非工会的劳动力。制作一部票房收入超过5000万美元的电影。这也让一些视频、影视、营销从业者开始担心自己的饭碗。有国内导演表示,Sora对电影行业的影响只是一个时间问题,它已经把画面做到非常真实、有细节。它对广告、宣传片行业的冲击可能会更快到来。未来大量的广告和短视频将由AI生成,对设计师、摄影师、后期制作岗位的需求会大量减少。Sora可能被应用于建模、生成游戏动画和场景等,游戏开发者的门槛也将被大大降低。据说,连某总台台长都开始焦虑了。连夜把Sora发布的视频转发到工作群里,让大家学习并讨论,Sora可能在未来对他们所在行业的影响。Sora的出现,再次说明了赢者通吃的道理。OpenAI又一次“走自己的路让其他人都无路可走”。在巨头的阴影和压力之下,AI创业者需要重新思考自己能力施展的生存和机会空间究竟在哪里。
-3-
Sora尚未开启公测
第一波靠Sora赚钱人已经出现了
面对AI带来的机会,总有人猴急地想要赚钱。Sora才亮相,一些嗅觉灵敏的人就看到了新的造富曙光。有人整理出了业务涉及文生视频的A股上市公司名单。一批AIGC概念股又开始在资本市场“狂飙”。最搞笑的是,Sora还尚未开启公测,OpenAI还没靠Sora赚到钱,已经有人“卖课”了。据说,有人已经卖了2w多份,一天到手200万元。有网友表示,该课程主打人群是内容创作者、广告营销从业者、教育工作者等。其教授的主要内容为Sora专属词库、专属提示词教程、30个专用提示词技巧。在文生视频市场真正成熟之前,部分掘金者已经通过知识付费掘到了第一桶金。如今Sora又带动了其他GPT相关知识付费课程的售卖。只是,贩卖焦虑的,都是为了赚你的钱。大家还是要擦亮眼,避免被割韭菜。事实上,就单点突破来看,Sora具有里程碑意义。但从商业化角度来说,其本身价值还有待验证。OpenAI明确表示,在模拟复杂的物理环境下,Sora会出现明显的逻辑和因果关系推理错误。比如,跑步时方向搞反、人吹蜡烛火光不灭、塑料椅子会变形飘起来等。目前Sora尚未全面放开使用,想要制作出高质量的长视频,或者电影、电视剧,肯定还有漫长的路要走。此外,在看完了Sora生成的视频之后,在震惊之余,也不免让人忧虑,未来Sora可能带来的风险。
比如,造假问题。AI生成的视频越真实,造假就越容易。由于人们在日常生活中通常不会逐帧分辨视频真伪,以假乱真的AI视频生成和深度伪造技术,带来的AI欺诈案件已经越来越频发。还有版权问题。比如,对版权的争论的焦点之一在于,AI通过学习别的艺术家的风格在此基础上进行的创作,和人类以同样方式进行的创作,本质上有没有区别?这些问题一个比一个难解决,这也意味着Sora在短时间内或许不会向公众开放。有分析认为,此前OpenAI花了大约半年来测试其大语言模型GPT-4。如果测试Sora需要差不多的时长,可能会在8月份开放。不过,考虑到深伪技术带给美国大选的负面影响,OpenAI估计会谨慎考虑正式公开Sora的时间。从某种角度来看,这或许是个好消息。相关创业者或从业者至少有了更多的缓冲时间,来思考如何应对Sora带来的冲击。