2023年开始的ChatGPT,在互联网行业掀起了翻天大浪,OpenAI成为全球最关注的AI公司,微软、Meta,英伟达的股价也在这拨AI浪潮中持续攀升。
那么,在中国的互联网大厂中,各家的AI大模型实力到底如何?
第一档:BAT
百度
从真实情况来看,百度仍然是互联网大厂AI实力排在第一梯队的公司。
在ChatGPT发布后,百度是中国互联网公司中最早发布自研大模型平台“文心一言”的公司,并且也很快发布了面向C端用户的文心一言APP和面向B端的大模型解决方案,并在百度搜索,百度智能云、百度文库、百度等百度系产品上。2023年10月17日,百度世界2023大会上发布文心一言4.0,用国内另外一家大厂大模型从业者的话:文心一言4.0的实力基本能跟ChatGPT持平。
当然,百度能迅速在大模型领域发布产品也跟之前的积累不无关系,2016 年,百度开源了深度学习框架 PaddlePaddle,并于 2019 年发布中文名“飞桨”。百度最早的大模型,也是文心一言大模型前身的ERNIE 1.0也是在飞桨平台基础上诞生的。文心大模型(ERNIE)在语言理解、文本生成、跨模态语义理解等领域取得多项技术突破。
除此之外,百度在AI人才上也有很深的积累,从余凯(地平线创始人)负责的深度学习研究院(IDL)到吴恩达带队的百度大脑(baidu brain),再到现在的CTO王海峰,都是AI领域的知名人士。在十几年的AI发展中,百度也为公司和行业培养了无数的AI人才,比如现任百度集团副总裁、小度科技CEO李莹,百度副总裁、深度学习技术及应用国家工程实验室副主任、飞桨负责人吴甜等。
阿里
在AI发展和人才储备上,阿里也不遑多让。
2017年10月11日,阿里达摩院成立,此后,阿里先后从学术界、硅谷互联网大厂(谷歌,微软、Meta)和国内大厂(如百度)招揽了大批AI人才,如贾扬清,周靖人、漆远、金榕、鄢志杰等人。此后,阿里在机器学习,自然语言,图像识别、云计算等人工智能领域开展了轰轰烈烈的研究,并产出了一定成效。
2023年,继百度之后,阿里旗下的阿里云和达摩院强强联手,推出了通义千问大模型。功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持,能够跟人类进行多轮的交互,也融入了多模态的知识理解,且有文案创作能力,能够续写小说,编写邮件等。2023年4月11日,阿里巴巴所有产品未来将接入通义千问大模型,进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷等。
2023年10月31日,2023云栖大会现场,通义千问2.0正式升级发布,通义千问App也随之发布。
此前,达摩院在2022年损失了一批人才,包括达摩院城市大脑实验室的原负责人华先胜,XR实验室(X Lab)原负责人谭平,达摩院自动驾驶实验室负责人王刚等AI人才,但此后也引进了前滴滴首席科学家叶杰平、前京东数科 AI 实验室首席科学家薄列峰等人,阿里的AI人才储备在中国互联网大厂中依然名列前茅。
腾讯
在BAT三强中,腾讯在AI和大模型方向的动作稍微慢了一些。
2023年9月7日,腾讯正式发布混元大模型,并通过国家网信办备案,但直到10月26日,腾讯混元大模型才正式对外开放“文生图”功能,比百度晚了半年时间。
据腾讯云副总裁、腾讯混元大模型负责人刘煜宏表示,腾讯混元大模型技术架构已升级为混合专家模型(MoE)架构,参数规模达万亿,擅长处理复杂场景和多任务场景。此后,腾讯旗下企业微信、腾讯会议、腾讯文档、腾讯乐享、腾讯电子签、腾讯问卷、TAPD、腾讯云AI代码助手等腾讯协作SaaS产品,已全部接入腾讯混元大模型。
但直到2024年5月31日,基于混元大模型的面向C端的App“腾讯元宝”的才正式上架,而在测评中,元宝的表现也比文心一言、通义千问略逊一筹。
在曾经的BAT中,百度强于技术,阿里强于运营,腾讯强于产品,此前,腾讯在AI底层技术的重视程度和水平比其他两家公司都差一些,腾讯AiLab的名气和知名度也比百度和达摩院差,作为中国市值最高,也是最赚钱的互联网公司,希望腾讯未来能继续加强自己的AI实力。
第二档:字节、蚂蚁、快手、美团
字节
虽然抖音势头很猛,Tik Tok也在国外大杀四方,但在技术上,字节比较强的是他的推荐算法,而在底层的AI技术上,字节比BAT还是有一定差距的。
作为伴随着移动互联网的发展成长起来的公司,字节的推荐算法可以说是整个中国互联网,甚至比起meta和谷歌也是不遑多让,但底层的AI和应用层的推荐算法还是略有不同,而字节在多年的发展中也没时间,或者说是顾不上去发展AI实力,导致字节在“大模型时代落后了,对机会的敏感度不如创业公司”。
今年1月30日,字节CEO梁汝波在全员会上表示:“公司层面的半年度技术回顾,直到2023年才开始讨论GPT,而业内做得比较好的大模型创业公司都是在2018年至2021年创立的”。
2023年下半年,字节开始整合大模型团队和其他业务小组,成立专注于AI创新业务的新部门Flow,部门也成为字节在AI技术研究和研发产品的排头兵。此后,字节Flow部门发布云雀大模型和“豆包”、“扣子”等产品,火山引擎也发布大模型服务平台“火山方舟”。
不过,2023年12月16日,据外媒报道,在生成式AI竞争中处于落后的字节跳动想要“抄近道”,该公司一直在秘密使用OpenAI的技术开发自家大语言模型,这违反了OpenAI的服务条款,字节跳动的账户已被OpenAI暂停。
不过,作为App工场,字节在C端的用户体验和交互上,比百度还是强不少的。因此,豆包app在用户中的口碑也还是不错。
在AI人才储备上,早在2016年,字节就成立了人工智能实验室AI Lab,聚焦于自然语言处理、机器学习、数据挖掘等方面的研究。但此后,字节AI lab副总裁马维英和总监李磊先后离职,字节在基础AI上的人才还是略显不足。
5、蚂蚁、美团、快手
和上面几家公司比,蚂蚁旗下的“百灵”大模型主要是面向B端使用,毕竟蚂蚁是一家以互联网+金融科技公司,大模型更适合用在金融、保险、理财、银行、医疗等相关领域,到目前为止,蚂蚁并没有发布针对C端的大模型APP产品。
美团这边,虽然美团在去年收购了王慧文旗下的光年之外,但收购之后,光年之外核心的算法和研发人员并没能留在美团,而是跟着光年之外联合创始人、一流科技创始人袁进辉离职。AI人才的缺失,导致美团的自营大模型依然没能发布。
快手这边,除了发布了一款自研文生图大模型“可图”(Kolors)之外,并没有在大模型底座上投入更多的精力和人力,毕竟快手只是一家成立十几年的公司,公司规模也比其他大厂小很多。除了在图生文和短视频、直播领域外,对自研大模型的需求并不是很强烈。
第三档:拼多多、滴滴、京东
和前面两档公司相比,拼多多,滴滴,京东因为需求不充分,AI人才储备较少等原因,在大模型领域迟迟没有动静,目前也没看到相关的新动向,估计也就是会利用开源的Llama3大模型,在应用层面做一些动作了。(申妈的朋友圈)
