论文速读|推进人形运动：通过降噪世界模型学习掌握具有挑战性的地形

28BoundlessHope

784人浏览 · 2024-08-28 09:58:36

28BoundlessHope · 2024-08-28 09:58:36 发布

这篇论文跟humanoid_gym（GitHub - roboterax/humanoid-gym: Humanoid-Gym: Reinforcement Learning for Humanoid Robot with Zero-Shot Sim2Real Transfer https://arxiv.org/abs/2404.05695）这个著名项目息息相关

论文地址：https://arxiv.org/pdf/2408.14472

摘要

本文详细介绍了去噪世界模型学习（DWL）的方法和实验结果。DWL 旨在通过有效的状态表示学习框架来消除模拟与现实之间的差距，从而实现对现实世界挑战性地形的适应。研究团队设计了一个自编码器架构，用于在线适应和状态估计，通过在模拟环境中引入噪声并使用域随机化方法来模拟现实世界中的不确定性。DWL 框架中的策略梯度方法和策略优化算法（PPO）进一步提高了控制策略的鲁棒性和适应性。研究人员还展示了 DWL 在两种不同尺寸的人型机器人上的应用，这两种机器人分别为 XBot-S 和 XBot-L。通过实验验证，DWL 使人型机器人能够在多种复杂地形上进行稳定的行走，并且能够抵抗大的外部扰动。此外，研究人员还提出了一种双自由度踝关节控制机制，进一步提高了机器人的稳定性和灵活性。实验结果表明，与传统方法相比，DWL 在各种挑战性环境中都表现出了更高的行走性能。

论文初读：

全球具身智能开发者社区

更多推荐

ksubdomain源码深度剖析：gopacket库在网络嗅探中的高效应用

ksubdomain作为一款无状态子域名爆破工具，其核心优势在于通过底层网络数据包处理实现高效的DNS查询与响应捕获。本文将深入解析项目如何利用gopacket库构建高性能网络嗅探模块，揭示其在子域名爆破场景下的技术实现细节。## gopacket库在ksubdomain中的技术定位gopacket作为Go语言生态中功能强大的网络数据包处理库，为ksubdomain提供了完整的网络层操作能

全球具身智能开发者社区

Nacos2.x核心源码深度剖析：从通信到业务

通过对 Nacos 2.x 核心源码的剖析，我们可以看到其高性能与高可用的实现细节。Nacos 2.x 的架构演进，其核心在于通信协议的升级与内部模块的解耦。本文将从源码层面，深入剖析其 gRPC 通信层的建立、配置中心（Config）的发布与监听机制，以及注册中心（Naming）的服务注册与发现流程，揭示其高性能与高可用背后的代码实现。在源码层面，config 和 naming 模块的职责划分非

全球具身智能开发者社区

阿里首个世界模型：快乐…生蚝

比如在文旅展陈、线下娱乐、机器人训练、数字人陪伴、教育演练、智能空间交互等方向，模型都可以作为一个实时演化的世界引擎，与摄像头、麦克风、空间传感器、显示终端、机械装置或可穿戴设备连接，根据人的位置、动作、语言和环境变化，动态生成对应的视觉内容、事件反馈或交互结果。你可以推门而入，可以亲手改写，可以离开又回来，也可以带朋友进去。正如团队所强调的，过去几年生成式AI完成了“文本→图像→视频”的跃迁，但