基于混合模仿學習的多智能體追捕決策方法
計算機科學
頁數(shù): 8 2024-10-12
摘要: 針對傳統(tǒng)模仿學習方法在處理多樣化專家軌跡時的局限性,尤其是難以有效整合質(zhì)量參差不齊的固定模態(tài)專家數(shù)據(jù)的問題,創(chuàng)新性地融合了多專家軌跡生成對抗模仿學習(Multiple Trajectories Generative Adversarial Imitation Learning, MT-GAIL)方法與時序差分誤差行為克隆(Temporal-Difference Error Be... (共8頁)