

中国青年报客户端北京1月29日电(中青报·中青网记者 贾骥业)1月29日,蚂蚁灵波科技开源发布世界模型LingBot-World,旨在为具身智能、自动驾驶及游戏开发提供高保真、高动态、可实时操控的“数字演练场”。该模型在视频质量、动态程度、长时一致性、交互能力等关键指标上均媲美Google Genie 3。
比如,针对视频生成中最常见的“长时漂移”问题(视频生成时间一长,就可能出现物体变形、细节塌陷、主体消失或场景结构崩坏等现象——记者注),LingBot-World通过多阶段训练以及并行化加速,实现了近10分钟的连续稳定无损生成,为长序列、多步骤的复杂任务训练提供支撑。
在交互性能上,LingBot-World可实现约16 FPS(帧率)的生成吞吐,并将端到端交互延迟控制在1秒以内。用户可通过键盘或鼠标实时控制角色与相机视角,画面随指令即时反馈。同时,用户可通过文本触发环境变化与世界事件,例如调整天气、改变画面风格或生成特定事件,并在保持场景几何关系相对一致的前提下完成变化。
具身智能的规模化落地面临一个核心挑战——复杂长程任务的真机训练数据极度稀缺。LingBot-World凭借长时序一致性(即记忆能力——记者注)、实时交互响应,以及对“动作-环境变化”因果关系的理解,能够在数字世界中“想象”物理世界,为智能体的场景理解和长程任务执行提供低成本、高保真的试错空间。
目前,LingBot-World模型权重及推理代码已面向社区开源。
来源:中国青年报客户端
国汇策略-国汇策略官网-专业炒股配资网-股票配资的流程提示:文章来自网络,不代表本站观点。