細粒度圖像分類上Vision Transformer的發(fā)展綜述
計算機工程與應(yīng)用
頁數(shù): 17 2023-12-12
摘要: 細粒度圖像分類(fine-grained image classification,FGIC)一直是計算機視覺領(lǐng)域中的重要問題。與傳統(tǒng)圖像分類任務(wù)相比,F(xiàn)GIC的挑戰(zhàn)在于類間對象極其相似,使任務(wù)難度進一步增加。隨著深度學(xué)習(xí)的發(fā)展,Vision Transformer(ViT)模型在視覺領(lǐng)域掀起熱潮,并被引入到FGIC任務(wù)中。介紹了FGIC任務(wù)所面臨的挑戰(zhàn),分析了ViT模型及其特... (共17頁)