當前位置:首頁 > 科技文檔 > 航空航天科學(xué)與工程 > 正文

改進TD3算法的機械臂三維路徑規(guī)劃方法

電光與控制 頁數(shù): 6 2024-12-25
摘要: 在軍事航空領(lǐng)域中,復(fù)雜任務(wù)對機械臂路徑規(guī)劃提出了挑戰(zhàn)。針對雙延遲深度確定性策略梯度(TD3)算法學(xué)習(xí)效率低、樣本利用率低的問題,提出了一種改進的TD3算法(Recurrent-TD3算法)。首先,將LSTM結(jié)合到策略網(wǎng)絡(luò)與價值網(wǎng)絡(luò)中,捕獲航空控制任務(wù)中的時間序列信息,增強對時間序列變化的響應(yīng)能力,使其能夠在決策時考慮歷史動作和狀態(tài),提高網(wǎng)絡(luò)的表達能力;然后,將事后經(jīng)驗回放(HE... (共6頁)

開通會員,享受整站包年服務(wù)立即開通 >