多模態(tài)信息引導的三維數(shù)字人運動生成綜述
中國圖象圖形學報
頁數(shù): 25 2024-09-16
摘要: 基于多模態(tài)信息的三維數(shù)字人運動生成技術旨在通過文本、音頻、圖像和視頻等數(shù)據(jù)實現(xiàn)特定輸入條件下的人體運動生成。這項技術在電影、動畫、游戲制作和元宇宙等領域具有重要的應用價值和廣泛的經(jīng)濟社會效益,是近年來計算機圖形學和計算機視覺等領域研究的熱點問題之一。然而,基于多模態(tài)信息的三維數(shù)字人運動生成面臨著諸多挑戰(zhàn),包括跨模態(tài)信息的表征和融合困難、高質量數(shù)據(jù)集缺乏、生成的運動質量較差(如抖... (共25頁)