Simulated-to-real 性能差距

由于模拟无法准确收集真实环境的所有方面,在模拟中训练的模型可能在真实环境中的表现不如人意。此类差异通常被称为 simulated-to-real (sim2real)性能差距。

AWS 已努力最大限度 DeepRacer 地减少 sim2real 的性能差距。例如,模拟代理设计为每秒执行 10 个操作。这与 AWS DeepRacer 设备运行推理的频率相匹配,大约每秒 10 次推理。再例如,在训练的每个情节的开始时,代理的位置是随机的。这可以最大限度提升代理平均地学习赛道所有部分的可能性。

为了帮助减少 real2sim 性能差距,对于模拟赛道和真实赛道,请确保使用相同或相似的颜色、形状和尺寸。为减少视觉干扰,请在真实赛道周围使用隔板。此外,还要仔细校准设备的速度范围和转向角度,以使训练中使用的动作空间与现实世界相匹配。在与训练所用赛道不同的模拟赛道中评估模型性能可以展示出 real2real 性能差距的程度。

有关在训练 AWS DeepRacer 模型时如何缩小 sim2real 差距的更多信息,请参阅针对真实环境优化训练 AWS DeepRacer 模型。

标签: none