×
加载中...
探访京东全球具身智能数据采集中心
财联社AI daily 2026-06-02 13:54

2026年被业内视作具身智能规模化落地的关键元年。作为物理AI的核心底座,具身智能机器人想要真正融入家居、工业、服务等真实场景,摆脱“实验室智能”局限,离不开海量、真实、多元的物理交互数据——这是行业公认的“AI石油”,也是制约全球具身产业落地的核心瓶颈。

《科创板日报》记者近日实地探访坐落于江苏宿迁的京东全球具身智能数据采集中心,走进标准化采集大楼、外贸纺织工厂、社区居民家庭三大一线场景,直击京东具身数据采集的全链条落地实景,解码其破解行业数据困境、重构人机协作关系的差异化路径。

▍一座4000平方米的“物理世界工厂”

走进京东江苏宿迁具身智能数据采集中心,4000平方米的采集基地内,百余组场景错落排布。没有实验室的刻板精密,却满是实在人类场景与工业质感——这里1:1还原了零售商超、物流仓储、医药康养、家庭家政、工业制造五大核心场景,小到厨房擦拭滑轨、收纳餐具,大到服装厂缝纫工序、仓储分拣搬运,上万种细分日常动作与工业操作在此落地实训。

图片


在商超与物流模拟采集区,货架、商品、分拣设备一应俱全。采集人员佩戴京东自研的头戴式EGO采集设备,以第一视角完成商品上架、货物分拣等常规操作。整套设备轻便贴合头部,指示灯清晰区分待机、录制、结束状态。工作人员告诉记者,采集全程无需刻意放慢动作,只需还原人类自然作业状态,真实记录手部动作、肢体姿态、场景交互细节。

图片


来到家居家政采集实训区,这里是居家采集员的核心“练兵场”。覆盖客厅、厨房、卫生间、卧室等全居家空间。记者看到,采集人员严格遵循标准化规范,摘除首饰、美甲,避免镜头遮挡。从擦拭电器面板、整理衣柜抽屉,到清洁厨卫缝隙,每一个生活化动作都被设备还原捕捉。

“家居场景数据是目前占比最高的采集品类。”现场负责人介绍,依托宿迁本地社区网格体系,大量居民将设备带回家中完成入户采集。千家万户的差异化户型、光线、物品布局,构建出海量长尾场景数据,彻底打破单一实训场地的场景局限。

数据采集完成后,形成“居民回传-社区初筛-中心精检”的闭环流程。采集员每日完成作业后,可当日或次日将数据回传至社区网点,工作人员现场初筛,及时反馈问题。初筛合格的数据统一流转至京东专业数据采集中心,经过清洗、分类、标准化质检,最终有效数据率稳定在95%以上。

科创板日报了解到,京东该园区配套的五大数据标注职场,可容纳近万人同步作业,依托京东众智平台完成多模态数据标注、测评与人机协同审核,形成“采集-清洗-标注-训练-应用”的全链条闭环。

▍社区宝妈与工厂缝纫女工:两种采集,同一种逻辑

走出标准化采集大楼,京东已将数据采集场景深度延伸至社区民生与工业生产一线,构建起“社区众包+工业定点”的双轨采集模式。

社区:灵活就业,宝妈也能灵活上岗

宿迁市宿豫区惠民社区是京东核心社区采集示范点。“我们社区有21个小组、19个党小组,常住人口8000人。”社区负责人站在培训室门口向记者介绍。社区内常设专属培训室,全年常态化开展人员招募、理论授课与实操指导。

社区采集人员以50岁以内本地居家人员为主,全职宝妈群体占比最高。“每天工作6小时就能达到全职标准,月收入稳定在4000元左右,时间自由,随时可以暂停照顾孩子。”一位入职一月的全职采集员告诉记者,自己通过线上报名、线下1-2天培训即可上岗,操作简单,薪资按有效作业时长核算。

工厂:重复工序的“数据化”

当天下午,记者跟随探访团来到宿迁一家专供日本市场的外贸服装厂。缝纫车间里,有几位工人的头上戴着和社区培训室里一模一样的设备。工人张姐坐在缝纫机前,手脚并用,缝线的节奏和之前完全一样,唯一的区别是额头前方多了一颗闪烁的蓝色指示灯,记录着每一次手眼协同、每一道针脚判断的微妙细节。

在工位旁,记者问她担不担心这是在训练机器人替代自己。张姐颇有自信地说:

“不担心。就算以后机器人能代替一部分重复的工作,我们可以做精致的技术活——提高自己,机器人达不到我们工匠一样的手艺。”

图片


工厂负责人接过话茬,给记者算了一笔账:他们每年向日本出口约200万件服装,如今在缝制环节面临的最大痛点是招工难。

“现在工厂里的缝制工作只有五六十岁的人愿意做,二三十岁的年轻人几乎没人愿意做。以后谁来做这个工作?机器人如果能帮我们做这些重复、繁琐的事情,反而好。” 该负责人说。

▍数据饥荒何解?京东押注“网格化采集”

在媒体交流环节,《科创板日报》记者直言不讳地提出了整个行业都在焦虑的问题:“我们参观时看到收银、保洁这些岗位被采集,恰恰是中低收入人群的就业底线。京东发动超十万市民参与采集,两年后机器人真的学会了这些技能,他们怎么办?”

京东科技副总裁赖倩回应:“这两年计划已经创造出了新的岗位——采集员、数据标注员、多模态训练师,这些都是过去不曾存在的职业。谁都说不好明天会有什么新变化,但京东跟政府一定会谋划更多更好的就业机会。”

那么,在具身智能数据采集上,京东为何要下大成本做这件事?

答案指向一个冰冷的数字:当前具身智能领域的高质量真实数据规模仅约50万小时,而一个技能点要达到交付级水准,就需要2000至5000小时的训练数据。以此推算,行业现有的全部数据存量几乎只够支撑几十个技能点——距离大规模商用所需的数万技能点还有“四个数量级”的差距。

问题不只是“量少”,更在于数据本身的质量。此前行业内主要依赖三条技术路径:互联网视频提供“第三方视角”,能告诉AI发生了什么,却无法还原动作的力度与手眼协同;遥操作数据成本极高,一小时动辄数百美元;仿真数据缺乏真实物理交互,面临“仿真到现实”的数据鸿沟。

京东的策略是“自建场景+网格化采集”。一方面,京东依托自身庞大的供应链体系——物流仓储、零售超市、医药康养——构建真实的产业场景库;另一方面,通过覆盖宿迁全市的社区网络,动员全职宝妈、退休人员、大学生等灵活就业群体在家中完成各类家务场景的真实数据采集。

京东云高级产品总监郝鹏也告诉记者:“机器器人最终更多是帮助人类做一些难以做到的事情——救灾、高危险的工作、苛刻条件下的生产。它能帮人类提升生产效率,而不是替代人。”

▍当机器替代重复,人往何处去?

长期以来,全球具身智能发展面临四大核心难点:

一是数据成本高昂,传统真机采集依赖专业示教人员,单小时采集成本居高不下,规模化落地难度极大;

二是场景覆盖不足,多数企业聚焦实验室仿真或单一垂直场景,难以覆盖真实世界海量长尾场景,模型泛化能力薄弱;

三是合规风险突出,物理数据采集涉及大量个人生活、生产场景,隐私泄露风险高,行业缺乏标准化合规体系;

四是虚实鸿沟显著,仿真数据效率高但无法完全还原物理细节,真机数据真实但产能有限、成本偏高。

纵观全球赛道,海外巨头与国内头部企业已形成差异化布局路径。海外方面,谷歌Open X-Embodiment、Sunday Robotics等企业依托技术先发优势,主打高端仿真数据+专业真机示教模式,数据精度高、技术成熟,但场景覆盖集中于海外居家、科研场景,适配国内产业场景度低,且采集成本极高、规模化难度大;特斯拉依托自动驾驶数据积累优势,尝试通过物理场景回流数据迭代模型,但聚焦交通单一赛道,难以适配多元化生活、工业场景。

国内赛道呈现两极分化格局。智元机器人主打真机开源路径,发布百万级真机数据集,覆盖百余种生活技能,侧重高端人形机器人场景;光轮智能深耕仿真合成数据,通过自研物理模拟引擎降低采集成本,但仿真数据难以完全复刻真实物理交互细节;多数中小厂商则依赖小规模众包采集,存在数据质量参差不齐、合规体系缺失、场景单一等问题。

在这片硝烟弥漫的战场上,京东的“网格化采集”主要针对当前具身智能数据采集的行业痛点——成本高、场景窄、合规难。

但更深层的命题,始终是人与机器的关系。

脉脉创始人兼CEO林凡在近期的一场行业对话中透露,2026年前四个月,具身智能相关岗位招聘量同比暴增15倍,平均月薪接近6.2万元。一方面是部分岗位面临被替代的焦虑,另一方面是高技能、高创造性的新兴职位正飞速成长。

在中国电子学会机器人分会副主任委员、国地共建人形机器人创新中心首席科学家江磊看来,真正的关键并不在技术本身:“人形机器人可能最终会取代一些重体力的蓝领型活动,人类就能够很轻松地跟机器人交互,那一定会产生更多财富、更多生产力,可能会迎来一个生产力飞跃的时代。”他坦言,现在最大的瓶颈可能已经不是技术,而是公众认知。

服装厂女工张姐的话,或许是对这一命题最朴素也最深刻的回应:“如果机器人能代替我们重复的工作,我们就要做更精致的手艺人。”

(来源:财联社AI daily)


扫码下载app 最新资讯实时掌握