非關(guān)系型表格理解前沿進(jìn)展
中文信息學(xué)報(bào)
頁數(shù): 21 2024-05-15
摘要: 表格理解是指通過計(jì)算機(jī)對廣泛存在于互聯(lián)網(wǎng)、垂直領(lǐng)域的表格進(jìn)行自動識別、解析和應(yīng)用的過程。表格可大致分為關(guān)系型表格和非關(guān)系型表格。前者類似關(guān)系數(shù)據(jù)庫表格,具有結(jié)構(gòu)固定、機(jī)器易解析等特點(diǎn),其研究歷史由來已久。后者通常布局多變,語法靈活,具有更明顯的語言特性,這也導(dǎo)致計(jì)算機(jī)在解析和應(yīng)用非關(guān)系型表格時面臨著極大挑戰(zhàn)。非關(guān)系型表格理解是自然語言和計(jì)算機(jī)視覺多模態(tài)交叉的重要新興領(lǐng)域之一。隨... (共21頁)