×
加载中...
行业首次!百度发布“蒸汽机”,实现AI长视频实时交互
Horch 鞭牛士 2025-10-15 15:18

10月15日,百度旗下视频生成模型 “蒸汽机” 完成重大升级,行业首次实现 AI 长视频实时交互生成。依托流式视频技术突破,该模型不仅打破传统 AI 视频 10 秒左右的时长限制,更将生成模式从 “单向输出” 升级为 “双向共创”,重新定义 AIGC 内容创作范式。

45a30413d30117020d45b92d4b3ea612.jpg

此次升级核心采用流式生成技术与动态缓冲区管理机制,通过帧级噪声独立控制与历史参考帧优化,实现理论上 “无限时长” 视频生成,画面连贯性较传统 “首尾帧续写” 技术显著提升 —— 西部牛仔风格视频中,人物行走、镜头摇移等复杂运镜可实现一镜到底的丝滑过渡。生成速度上,经工程优化的模型推理效率超越国内主流产品,较 Vidu 2.0 等模型 “10 秒生成 4 秒视频” 的效率实现质的飞跃。

4510c013e80e8ecd664b5d906682a260.jpg

交互体验方面,用户上传单张图片与提示词即可启动生成,过程中可随时暂停或修改提示词,实时调控视频剧情、画面及转场效果。例如生成赛车动画时,中途调整提示词即可让赛车顺序调整,背景切换,全程无需重新渲染。这种 “无限画布” 式创作,使 AI 视频从被动素材生成工具转变为实时协作的创作伙伴。

同步推出的两大功能进一步拓展应用边界:

  • 可交互数字人:支持沉浸式双向互动与情感识别,可应用于 AI 导购、教育、陪伴等场景,如导购场景中能根据用户提问实时调整产品演示;

  • 开放世界动态构建:允许用户自行操控,在 AI 生成的游戏地图、旅游景点、宇宙空间等环境中自由探索,场景细节随交互实时渲染,解决传统预生成内容的僵化问题。

百度蒸汽机自 5 月起持续迭代,先后实现音视频一体化生成、多人对话生成、移动端适配等能力。本次长视频实时交互功能的推出,进一步拓展 AI 视频在影视预演、互动娱乐、个性化营销等场景的应用边界,推动 AIGC 从 “素材生成工具” 向 “内容共创平台” 演进。

百度商业研发总经理刘林表示,长时一致性与实时交互技术的结合,标志着AIGC从“素材生产”向“内容共创平台”的关键跨越。

业内分析指出,该技术将加速AI视频在互动娱乐、虚拟社交等领域落地,推动内容产业进入 “低门槛、高创意” 新阶段。(转自AI普瑞斯)

更多AI资讯请点击:http://www.aipress.com.cn/

扫码下载app 最新资讯实时掌握