突发!美团开源LongCat 560B语言模型
美团科技近日正式发布了其自主研发的开源语言模型LongCat‑Flash‑Chat(绰号“长猫”),该模型拥有高达5600亿参数,基于Mixture-of-Experts(MoE)架构,具备动态参数激活能力,每次处理根据上下文激活约27B参数,显著提高计算效率与性能表现。模型采用了新颖的Shortcut-connected MoE(ScMoE)设计,优化了通信与计算重叠,进一步提升推理吞吐量(超过 100 TPS)并降低延迟和成本。
该模型在结构稳定性、推理效率与agentic智能任务表现上均具竞争力,并首次对外发布了LongCat-Flash-Chat的完整开源版本,彰显了美团在AI基础技术开放与自主创新上的重要布局。
此前,有媒体报道美团在营收持续增长(季度同比增长20%,营收达885亿元人民币)推动下推出自研模型“LongCat”,意在强化其在即时零售和消费服务场景中的AI能力,加速将AI智能力下沉至平台服务与运营环节。(转载自AI普瑞斯)
