基于深度強(qiáng)化學(xué)習(xí)的機(jī)械臂多?;旌峡刂?/H1>
計算機(jī)工程與設(shè)計
頁數(shù): 9 2024-09-16
摘要: 針對基于深度強(qiáng)化學(xué)習(xí)控制的機(jī)械臂動態(tài)避障能力不足,在作業(yè)過程中存在多任務(wù)沖突問題,提出一種基于雙重角色和正則化批評者算法(DARC)的多模混合控制方法。將任務(wù)分解為多段避障模式,借助人工勢場法的斥力引力思想設(shè)計獎勵函數(shù)并分別進(jìn)行訓(xùn)練;將經(jīng)過初步訓(xùn)練的多個模式以距離閾值或獎勵積累閾值進(jìn)行切換控制,消除混合控制存在的沖突;結(jié)合機(jī)械臂單元運動學(xué)特點設(shè)計具有軟體性質(zhì)的多連桿機(jī)械臂平面仿... (共9頁)