搜索结果: 1-3 共查到“工学 MDP”相关记录3条 . 查询时间(0.093 秒)
基于MDP框架的飞行器隐蔽接敌策略
近似动态规划 空战决策 近似值函数
<
2013/5/15
基于近似动态规划(approximate dynamic programming, ADP)对空战飞行器隐蔽接敌决策问题进行研究。基于作战飞行器的战术使用原则,提出了隐蔽接敌过程中的优势区域与暴露区域;构建了基于马尔科夫决策过程(Markov decision process, MDP)的隐蔽接敌策略的强化学习方法;通过态势得分函数对非连续的即时收益函数进行修正,给出了基于ADP方法的策略学习与策...
基于近似动态规划(approximate dynamic programming, ADP)对空战飞行器隐蔽接敌决策问题进行研究。基于作战飞行器的战术使用原则,提出了隐蔽接敌过程中的优势区域与暴露区域;构建了基于马尔科夫决策过程(Markov decision process, MDP)的隐蔽接敌策略的强化学习方法;通过态势得分函数对非连续的即时收益函数进行修正,给出了基于ADP方法的策略学习与策...