大模型技术哪家强？BAT遥遥领先，字节仍需努力

申小飞申妈的朋友圈 2024-06-11 16:50

2023年开始的ChatGPT，在互联网行业掀起了翻天大浪，OpenAI成为全球最关注的AI公司，微软、Meta，英伟达的股价也在这拨AI浪潮中持续攀升。

那么，在中国的互联网大厂中，各家的AI大模型实力到底如何？

第一档：BAT

百度

从真实情况来看，百度仍然是互联网大厂AI实力排在第一梯队的公司。

在ChatGPT发布后，百度是中国互联网公司中最早发布自研大模型平台“文心一言”的公司，并且也很快发布了面向C端用户的文心一言APP和面向B端的大模型解决方案，并在百度搜索，百度智能云、百度文库、百度等百度系产品上。2023年10月17日，百度世界2023大会上发布文心一言4.0，用国内另外一家大厂大模型从业者的话：文心一言4.0的实力基本能跟ChatGPT持平。

当然，百度能迅速在大模型领域发布产品也跟之前的积累不无关系，2016 年，百度开源了深度学习框架 PaddlePaddle，并于 2019 年发布中文名“飞桨”。百度最早的大模型，也是文心一言大模型前身的ERNIE 1.0也是在飞桨平台基础上诞生的。文心大模型(ERNIE)在语言理解、文本生成、跨模态语义理解等领域取得多项技术突破。

除此之外，百度在AI人才上也有很深的积累，从余凯（地平线创始人）负责的深度学习研究院（IDL）到吴恩达带队的百度大脑（baidu brain），再到现在的CTO王海峰，都是AI领域的知名人士。在十几年的AI发展中，百度也为公司和行业培养了无数的AI人才，比如现任百度集团副总裁、小度科技CEO李莹，百度副总裁、深度学习技术及应用国家工程实验室副主任、飞桨负责人吴甜等。

阿里

在AI发展和人才储备上，阿里也不遑多让。

2017年10月11日，阿里达摩院成立，此后，阿里先后从学术界、硅谷互联网大厂（谷歌，微软、Meta）和国内大厂（如百度）招揽了大批AI人才，如贾扬清，周靖人、漆远、金榕、鄢志杰等人。此后，阿里在机器学习，自然语言，图像识别、云计算等人工智能领域开展了轰轰烈烈的研究，并产出了一定成效。

2023年，继百度之后，阿里旗下的阿里云和达摩院强强联手，推出了通义千问大模型。功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持，能够跟人类进行多轮的交互，也融入了多模态的知识理解，且有文案创作能力，能够续写小说，编写邮件等。2023年4月11日，阿里巴巴所有产品未来将接入通义千问大模型，进行全面改造，包括天猫、钉钉、高德地图、淘宝、优酷等。

2023年10月31日，2023云栖大会现场，通义千问2.0正式升级发布，通义千问App也随之发布。

此前，达摩院在2022年损失了一批人才，包括达摩院城市大脑实验室的原负责人华先胜，XR实验室（X Lab）原负责人谭平，达摩院自动驾驶实验室负责人王刚等AI人才，但此后也引进了前滴滴首席科学家叶杰平、前京东数科 AI 实验室首席科学家薄列峰等人，阿里的AI人才储备在中国互联网大厂中依然名列前茅。

腾讯

在BAT三强中，腾讯在AI和大模型方向的动作稍微慢了一些。

2023年9月7日，腾讯正式发布混元大模型，并通过国家网信办备案，但直到10月26日，腾讯混元大模型才正式对外开放“文生图”功能，比百度晚了半年时间。

据腾讯云副总裁、腾讯混元大模型负责人刘煜宏表示，腾讯混元大模型技术架构已升级为混合专家模型（MoE）架构，参数规模达万亿，擅长处理复杂场景和多任务场景。此后，腾讯旗下企业微信、腾讯会议、腾讯文档、腾讯乐享、腾讯电子签、腾讯问卷、TAPD、腾讯云AI代码助手等腾讯协作SaaS产品，已全部接入腾讯混元大模型。

但直到2024年5月31日，基于混元大模型的面向C端的App“腾讯元宝”的才正式上架，而在测评中，元宝的表现也比文心一言、通义千问略逊一筹。

在曾经的BAT中，百度强于技术，阿里强于运营，腾讯强于产品，此前，腾讯在AI底层技术的重视程度和水平比其他两家公司都差一些，腾讯AiLab的名气和知名度也比百度和达摩院差，作为中国市值最高，也是最赚钱的互联网公司，希望腾讯未来能继续加强自己的AI实力。

第二档：字节、蚂蚁、快手、美团

字节

虽然抖音势头很猛，Tik Tok也在国外大杀四方，但在技术上，字节比较强的是他的推荐算法，而在底层的AI技术上，字节比BAT还是有一定差距的。

作为伴随着移动互联网的发展成长起来的公司，字节的推荐算法可以说是整个中国互联网，甚至比起meta和谷歌也是不遑多让，但底层的AI和应用层的推荐算法还是略有不同，而字节在多年的发展中也没时间，或者说是顾不上去发展AI实力，导致字节在“大模型时代落后了，对机会的敏感度不如创业公司”。

今年1月30日，字节CEO梁汝波在全员会上表示：“公司层面的半年度技术回顾，直到2023年才开始讨论GPT，而业内做得比较好的大模型创业公司都是在2018年至2021年创立的”。

2023年下半年，字节开始整合大模型团队和其他业务小组，成立专注于AI创新业务的新部门Flow，部门也成为字节在AI技术研究和研发产品的排头兵。此后，字节Flow部门发布云雀大模型和“豆包”、“扣子”等产品，火山引擎也发布大模型服务平台“火山方舟”。

不过，2023年12月16日，据外媒报道，在生成式AI竞争中处于落后的字节跳动想要“抄近道”，该公司一直在秘密使用OpenAI的技术开发自家大语言模型，这违反了OpenAI的服务条款，字节跳动的账户已被OpenAI暂停。

不过，作为App工场，字节在C端的用户体验和交互上，比百度还是强不少的。因此，豆包app在用户中的口碑也还是不错。

在AI人才储备上，早在2016年，字节就成立了人工智能实验室AI Lab，聚焦于自然语言处理、机器学习、数据挖掘等方面的研究。但此后，字节AI lab副总裁马维英和总监李磊先后离职，字节在基础AI上的人才还是略显不足。

5、蚂蚁、美团、快手

和上面几家公司比，蚂蚁旗下的“百灵”大模型主要是面向B端使用，毕竟蚂蚁是一家以互联网+金融科技公司，大模型更适合用在金融、保险、理财、银行、医疗等相关领域，到目前为止，蚂蚁并没有发布针对C端的大模型APP产品。

美团这边，虽然美团在去年收购了王慧文旗下的光年之外，但收购之后，光年之外核心的算法和研发人员并没能留在美团，而是跟着光年之外联合创始人、一流科技创始人袁进辉离职。AI人才的缺失，导致美团的自营大模型依然没能发布。

快手这边，除了发布了一款自研文生图大模型“可图”（Kolors）之外，并没有在大模型底座上投入更多的精力和人力，毕竟快手只是一家成立十几年的公司，公司规模也比其他大厂小很多。除了在图生文和短视频、直播领域外，对自研大模型的需求并不是很强烈。

第三档：拼多多、滴滴、京东

和前面两档公司相比，拼多多，滴滴，京东因为需求不充分，AI人才储备较少等原因，在大模型领域迟迟没有动静，目前也没看到相关的新动向，估计也就是会利用开源的Llama3大模型，在应用层面做一些动作了。（申妈的朋友圈）

扫码下载app 最新资讯实时掌握

百度 大模型

上一篇粉笔：将于8月推出自研AI智能老师

下一篇维权or过度维权？360回应图片事件：系重绘，对方要求十倍价格购买模型