基于多語(yǔ)言-視覺(jué)公共空間學(xué)習(xí)的多語(yǔ)言文本-視頻跨模態(tài)檢索模型
計(jì)算機(jī)學(xué)報(bào)
頁(yè)數(shù): 16 2024-06-17
摘要: 本文針對(duì)具有挑戰(zhàn)性的多語(yǔ)言文本-視頻跨模態(tài)檢索問(wèn)題進(jìn)行研究.傳統(tǒng)文本-視頻跨模態(tài)檢索模型通常針對(duì)單一語(yǔ)言進(jìn)行設(shè)計(jì),比如英語(yǔ),模型僅支持某一特定語(yǔ)言的文本查詢(xún).如果有不同語(yǔ)言檢索需求,則需另收集目標(biāo)語(yǔ)言的訓(xùn)練數(shù)據(jù)并重新訓(xùn)練構(gòu)建新的檢索模型,這使得模型很難快速有效地適用于其他語(yǔ)言的檢索任務(wù).近年來(lái),針對(duì)多語(yǔ)言問(wèn)題的研究逐漸深入,這為多語(yǔ)言跨模態(tài)檢索的實(shí)現(xiàn)打下了良好的基石.為了解決多... (共16頁(yè))