基于強化學習的無人機安全避障與圍捕制導
戰(zhàn)術導彈技術
頁數(shù): 13 2024-04-15
摘要: 針對無人機在受約束環(huán)境下面臨繞飛障礙物與跟蹤目標相互掣肘的問題,提出了一種基于強化學習的無人機安全避障與圍捕制導方法。根據(jù)極坐標原理設計環(huán)繞跟蹤控制器,驅(qū)使無人機在GPS拒止的情況下到達預設的圓形軌道。將環(huán)繞約束和障礙物約束轉化為馬爾可夫過程,以速度、徑向誤差、角速度誤差和碰撞函數(shù)為狀態(tài)空間,以控制器的補償量為動作空間,設計考慮跟蹤誤差和碰撞概率的獎勵函數(shù),利用深度確定性策略梯... (共13頁)