超全的 World Model 与 VLA 论文收集
《World Model & VLA论文综述:机器人领域必收藏资源》介绍了一个由song2yu维护的开源项目,聚焦世界模型与视觉-语言-动作模型的前沿研究。该项目通过交互式HTML页面(支持离线浏览和中文版本)系统梳理了环境表征建模、多模态控制范式、方法分类对比等核心内容,并持续追踪2024-2026年趋势,包括自动驾驶VLA、3D感知融合等热点方向。提供GitHub仓库和在线访问两种使用
World Model & VLA
最近发现了一个非常棒的开源项目——World Model & VLA 论文综述,由研究者 song2yu 维护。这是一个面向机器人 & 具身智能领域的交互式Survey,绝对是学习必收藏!
🔗 项目主页:https://song2yu.github.io/world-model-vla/
🔗 GitHub:https://github.com/song2yu/world-model-vla
📚 这个综述涵盖了什么?
World Models(世界模型):如何让智能体学习环境的内部表征,建模"物理世界"
VLA(视觉-语言-动作模型):融合视觉、语言、动作的机器人控制范式
Taxonomy & 对比:结构化梳理现有方法
关键论文 & Benchmark:精选参考文献和评估指标
未来方向:开放挑战与前沿趋势
🔥 2026年核心趋势一览
趋势 代表工作
World Model 成为 VLA 后训练标配 WoVR、VLAW、RISE、AtomVLA、World2Act
潜在空间 CoT 替代文本 CoT Chain of World、DynVLA、LaST-VLA
3D/空间感知注入 GST-VLA、FutureVLA
自动驾驶 VLA 热潮 DynVLA、StyleVLA、EvoDriveVLA、SAMoE-VLA
推理效率优化 DepthCache、WorldCache、Planning in 8 Tokens
神经科学/符号融合 SaiVLA-0、NS-VLA
⭐ 亮点
交互式 HTML 页面——无需安装,浏览器直接打开就能看
自包含文件——下载 index.html 离线也能看
持续更新——追踪 2024-2026 最新论文
中文友好——页面有中文版本
🚀 如何使用?
克隆项目
git clone https://github.com/song2yu/world-model-vla.git
或者直接下载 HTML 文件
然后用浏览器打开 index.html
不想动手?直接访问:https://song2yu.github.io/world-model-vla/
如果你对 World Model、VLA、具身智能、自动驾驶 这些方向感兴趣,这个项目绝对值得 Star 和收藏!⭐
更多推荐
所有评论(0)