×
加载中...
大模型的「京东模式」
施然 财经十一人 2023-07-13 19:53

大模型发挥生产力作用,路径设计是关键。


出于对下一代人工智能长期演进的笃定,中国大模型狂飙7个月,科技部《中国人工智能大模型地图研究报告》显示,中国研发的10亿参数规模以上大模型已发布79个,位居全球第二。
盘点“遍地开花”的大模型,不难发现,在当前中国大模型的语境下,“通用模式”和“垂直模式”都有其拥护者。后续入场“投票”的用户们,将决定哪条路径更受欢迎。


7月13日,京东发布言犀大模型,大模型领域又出现了新入场者。


图片

“模式”之别:通用求广 垂直求专


2023京东全球科技探索者大会暨京东云峰会上,京东推出言犀大模型。言犀大模型源于产业、服务产业融合70%通用数据与30%数智供应链原生数据,致力于深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景,解决真实产业问题。           
图片
京东认为,言犀不是通用模式也非垂直模式
通用模式的ChatGPT推出时,瞄准的是C端应用。上线不到两个月,月活用户就超过1亿,迅速成为全球最热门的应用之一。这个通用大模型,因为精度高和应用广,展现出了巨大的想象力,被部分行业人士视作通往AGI(通用人工智能,具备与人类同等智能、或超越人类的人工智能)的坦途,并一度成为辨别科技公司前沿技术能力的检验器。
ChatGPT之后,中国科技公司纷纷推出相关产品,比如百度的“文心”大模型、阿里巴巴的“通义”大模型。通用大模型对数据、算力的要求极高,高昂的成本,对大公司而言都稍感压力,更遑论本身就资金紧张的小公司,让大模型C端的变现路径更加扑朔迷离。
业界人士坦言,“(通用大模型)目前仍是一门烧钱生意”。公开报道称,推出ChatGPT的OpenAI,去年一年亏损5.4亿美元。分析公司Similarweb数据显示,今年6月,ChatGPT首次出现用户数量下滑,其全球桌面和移动设备流量较5月下降9.7%,网站的独立用户访问量下降5.78%。
与此同时,通用大模型也经常出现“一本正经瞎编”的现象,暴露了专业领域知识储备不足的问题。像法律、医疗、金融这类严肃行业,AI精准率如果不能达到95%,就无法实现商用。
因此,很多公司偏向于有具体场景的行业大模型。这种“垂直模式”的大模型,为付费能力更强的B端客户提供服务,或许是当下更实际的商业化选择。最近一个月,腾讯云推出金融、政府、教育等一系列行业大模型,华为同样发布面向政务、金融、制造、矿山等行业的“盘古3.0”大模型。
中国科学院院士张钹表示,专业的企业和组织将加速大模型在实体产业落地,具有数智供应链优势的企业,要将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为行业提供大模型服务。


供应链“气质”是行业对京东的共识。京东认为,言犀大模型是在“通用模式”和“垂直模式”之外,开辟了有京东特色的“供应链模式”。


图片

京东模式:做透供应链 做实大模型


只有将供应链做透,才能将大模型做实。京东集团技术委员会主席、京东云事业部总裁曹鹏表示,数智供应链,是大模型走向产业应用的着力点,大模型要以数智供应链为抓手,走向产业,深入实体。
20年来,京东从一家B2C电商企业,逐步进化成以供应链整合为核心能力、融入产业链上下游、提高产业链整体运转效率的科技公司。供应链是京东的核心竞争力。自2017年全面向技术转型以来,京东体系投入超1000亿元技术研发费用,不断强化技术能力和产业数字化效能。
为大模型注入产业能力,高质量的专业数据必不可少。言犀大模型的训练数据,包含70%的通用数据和30%的数智供应链原生数据。京东数智供应链,服务超千万商品SKU、800多万家活跃企业客户(其中世界500强企业超90%、全国专精特新中小企业近70%)、全国2000多条产业带。这条长链路、场景复杂、数据丰富的数智供应链,能为大模型提供“训练场”。
京东集团副总裁、京东健康技术产品部总经理李欣介绍,在京东健康平台上,每天超过30万次问诊,已经积累了上亿级的医疗问诊数据,还有超过10万执业医生,这些数据还在不断增加,“这是我们训练医疗大模型的基础。”
数智供应链的能量,也在京东物流场景释放。京东平台上,每天有超过1000万的包裹流动,从仓库货架、储位、人工,到网点、车辆、配送员,再到每个包裹的搬运流程,以及配送员和用户的交流过程,都有多模态数据沉淀。京东集团副总裁、京东物流技术专委会主席何田表示,对于京东来说,供应链每优化1分,带来的都是巨大成果,例如物流中某一项指标,仅提升0.1%,每年都能影响超过1000万个包裹。
有了这些真实场景的数据,京东训练出了面向产业的大模型,而言犀大模型,又将帮助京东进一步做透供应链。
今年京东618,言犀数字人在4000多家品牌直播间里带动了8亿元GMV。商家只需要5分钟拍摄,就能定制形象、音色、动作,生成专属数字人,降低了中小商家的使用门槛。
而商家想要卖货,抓住客户眼球,可以在京东云AIGC内容营销平台上调用大模型能力。商家上传一张产品图片,能自动生成商品图、海报、卖点、详情等营销素材。京东表示,新商家开店、上品、营销物料准备的周期,从7天缩短到半天。
在医疗健康领域,京东健康整合大模型能力、积累的3千万条高质量数据、百万级规模医学知识图谱,以及庞大的医疗专家团队,来提升健康助手和辅助诊疗的效率
在物流领域的“质量检测”场景中,涉及仓内工作、调车、运输、配送等检测环节。何田说,整个链条至少有上千个环节。想要整个物流系统高效运转,就必须保障每个环节都顺畅运行,过去是用人工来做检测,未来大模型能够极大提升效率。


京东集团技术委员会主席、京东云事业部总裁曹鹏表示,所有技术都是工具而非目标,“发大模型不是目的,我们希望的是用新技术来带动产业变革。”


图片
落地产业:协同是基础 “可用”是标准
尽管不少业内人士都提到“所有行业都值得用大模型再做一次”,但并非所有行业都会很快用上。现阶段,如果要拿出“可用”的大模型,还需要科技公司和行业用户的协同合作。京东云针对不同客户的诉求,提供一系列的大模型,从10亿级、百亿级到千亿级,也会提供大模型和小模型的搭配使用,因为在B端“1分钱都能影响成本。”
京东表示,在言犀AI开发计算平台上,沉淀了京东零售、物流、健康、金融等行业知识,部署100多种训练和推理优化工具,结合低代码应用平台,可以为客户提供数据建设、模型应用一站式服务。该平台搭载了100多种训练和推理优化工具,1到2个算法人员在此环境中,不到一周就能完成数据准备、模型训练和模型部署,为企业打造更适配的垂直大模型。而这一工作,此前需10余人的科学家团队协作完成。                    


扫码下载app 最新资讯实时掌握