大點(diǎn)數(shù)FFT在“申威26010”上的并行優(yōu)化
浙江大學(xué)學(xué)報(bào)(工學(xué)版)
頁數(shù): 9 2023-09-21
摘要: 根據(jù)“神威·太湖之光”超級(jí)計(jì)算機(jī)所用國產(chǎn)“申威26010”處理器的架構(gòu)特點(diǎn)和編程規(guī)范,提出針對(duì)大點(diǎn)數(shù)FFT的眾核并行優(yōu)化方案.該方案源自經(jīng)典的Cooley-Tukey FFT算法,通過將一維大點(diǎn)數(shù)數(shù)據(jù)迭代分解為二維小規(guī)模矩陣進(jìn)行并行加速.為了解決矩陣“列FFT”的讀寫、轉(zhuǎn)置和計(jì)算問題,提出“列均分-行連續(xù)”的讀寫策略,通過對(duì)數(shù)據(jù)進(jìn)行合理的分配、重排、交換,結(jié)合SIMD向量化、旋... (共9頁)