海洋所實(shí)現(xiàn)具有自主知識(shí)產(chǎn)權(quán)的風(fēng)暴潮模式的GPU加速
近日,中國(guó)科學(xué)院海洋研究所近海動(dòng)力環(huán)境研究及其工程應(yīng)用研究組利用CUDA技術(shù)對(duì)海洋研究所自主研發(fā)的風(fēng)暴潮數(shù)值模式IOCASM(Implicit Ocean Current and Storm Surge Model)進(jìn)行全面加速,成功構(gòu)建了新一代GPU-IOCASM。GPU-IOCASM在保證模擬精度與穩(wěn)定性的同時(shí),相較于原有CPU版本實(shí)現(xiàn)了超過312倍的加速效果。相關(guān)研究成果已發(fā)表在海洋領(lǐng)域國(guó)際期刊 Applied Ocean Research。
準(zhǔn)確模擬潮汐、潮流和風(fēng)暴潮對(duì)沿海城市的可持續(xù)發(fā)展和保護(hù)居民生命財(cái)產(chǎn)安全具有重要意義。傳統(tǒng)數(shù)值模式的加速主要依靠基于CPU的并行化技術(shù)(如OpenMP和MPI),其效率受到CPU計(jì)算核心數(shù)量限制。隨著CUDA技術(shù)的快速發(fā)展,GPU中數(shù)千核心所帶來(lái)的強(qiáng)大并行能力成為提升數(shù)值模式并行效率的理想途徑。因此,研究團(tuán)隊(duì)提出并探索了將 CUDA 技術(shù)應(yīng)用于風(fēng)暴潮數(shù)值模式的新思路。

圖1?CUDA線程到矩陣計(jì)算的映射
研究團(tuán)隊(duì)通過引入掩碼計(jì)算減少線程分支、提出自適應(yīng)迭代次數(shù)預(yù)測(cè)策略、設(shè)計(jì)異步數(shù)據(jù)傳輸機(jī)制等方法,大幅提升了計(jì)算效率。驗(yàn)證結(jié)果顯示,GPU-IOCASM的模擬結(jié)果與觀測(cè)數(shù)據(jù)及國(guó)際主流模式的模擬結(jié)果高度一致。在保證數(shù)值模式穩(wěn)定性的同時(shí),GPU-IOCASM實(shí)現(xiàn)了相較于原模式超過312倍的加速效果。這意味著以往依賴高性能計(jì)算集群的風(fēng)暴潮模擬如今可在小型工作站上高效完成。

圖2?不同垂向分層和線程下CPU和GPU每計(jì)算步的執(zhí)行時(shí)間對(duì)比
中國(guó)科學(xué)院海洋研究所博士后謝建斌為論文第一作者,馮興如研究員為論文通訊作者。合作者包括中國(guó)科學(xué)院海洋研究所尹寶樹研究員、高天海博士,南京信息工程大學(xué)董昌明教授,中國(guó)科學(xué)院軟件研究所吳長(zhǎng)茂副研究員。研究得到了國(guó)家重點(diǎn)研發(fā)計(jì)劃、國(guó)家自然科學(xué)基金等項(xiàng)目的聯(lián)合資助。
論文信息:
Xie J, Feng X*, Gao T, et al. Accelerating an implicit ocean model using CUDA C. Applied Ocean Research, 2025, 163: 104740. doi:https://doi.org/10.1016/j.apor.2025.104740
附件下載:
魯公網(wǎng)安備37020202001323號(hào) | 古鎮(zhèn)口園區(qū)地址:青島市西海岸新區(qū)海軍路88號(hào) 南海路園區(qū)地址:青島市市南區(qū)南海路7號(hào) 科考船碼頭基地:青島市西海岸新區(qū)長(zhǎng)江東路8號(hào) |
郵編:266000 郵件:iocas@qdio.ac.cn 電話:0532-82898611 傳真:0532-82898612 |
