Mdp_rl_vs_control

2025-11-30 00:00:00 +0000 Dragonking

🧠 从马尔可夫链到强化学习：理解 MDP 与传统控制的核心差异

✨ 前言

今天晚上读完一篇关于Effects_of_Prior_Knowledge_for_Stair_Climbing_of_Bipedal_Robots_Based_on_Reinforcement_Learning的论文后，感觉很多概念比以往更清晰了。于是决定用GPT5.1水一篇文章： ////公式lateX转化有点问题删掉重写

评论区

使用GitHub账号登录后即可评论

深色模式

浅色阅读

护眼模式

暖色模式

高对比度