Mdp_rl_vs_control
🧠 从马尔可夫链到强化学习:理解 MDP 与传统控制的核心差异
✨ 前言
今天晚上读完一篇关于Effects_of_Prior_Knowledge_for_Stair_Climbing_of_Bipedal_Robots_Based_on_Reinforcement_Learning的论文后,感觉很多概念比以往更清晰了。于是决定用GPT5.1水一篇文章: ////公式lateX转化有点问题删掉重写
今天晚上读完一篇关于Effects_of_Prior_Knowledge_for_Stair_Climbing_of_Bipedal_Robots_Based_on_Reinforcement_Learning的论文后,感觉很多概念比以往更清晰了。于是决定用GPT5.1水一篇文章: ////公式lateX转化有点问题删掉重写
评论区
使用GitHub账号登录后即可评论