面向SW26010-Pro的1、2級(jí)BLAS函數(shù)眾核并行優(yōu)化技術(shù)
軟件學(xué)報(bào)
頁(yè)數(shù): 16 2022-12-01
摘要: BLAS (basic linear algebra subprograms)是高性能擴(kuò)展數(shù)學(xué)庫(kù)的一個(gè)重要模塊,廣泛應(yīng)用于科學(xué)與工程計(jì)算領(lǐng)域. BLAS 1級(jí)提供向量-向量運(yùn)算, BLAS 2級(jí)提供矩陣-向量運(yùn)算.針對(duì)國(guó)產(chǎn)SW26010-Pro眾核處理器設(shè)計(jì)并實(shí)現(xiàn)了高性能BLAS 1、2級(jí)函數(shù).基于RMA通信機(jī)制設(shè)計(jì)了從核歸約策略,提升了BLAS 1、2級(jí)若干函數(shù)的歸約效率.針... (共16頁(yè))