搜索结果: 1-1 共查到“仪器科学与技术 MDP”相关记录1条 . 查询时间(0.046 秒)
为降低马尔可夫决策模型生成MAS协作策略的复杂度,减少协作通信量,在无线传感器网络中利用agent状态之间存在的条件独立性与上下文独立性关系提出了一种新的优化方法。方法通过分解并优化SPI算法生成的策略树,使得MAS中处于独立状态的agent可以分布独立运行,只有在需要同其他agent协商时才进行通信。并在协作中采用Q分解机制实现共享资源的分配,减少资源使用冲突,获取更大奖励。使用STATLOGO...