帳號:guest(3.137.220.166)          離開系統
字體大小: 字級放大   字級縮小   預設字形  

詳目顯示

以作者查詢圖書館館藏以作者查詢臺灣博碩士論文系統以作者查詢全國書目
作者(中文):羅仕為
作者(外文):Lo, Shih-Wei
論文名稱(中文):基於OpenACC之GPU加速性能案例研究
論文名稱(外文):Performance case studies for OpenACC-based GPU acceleration
指導教授(中文):陳人豪
指導教授(外文):Chen, Jen-Hao
口試委員(中文):劉晉良
陳仁純
口試委員(外文):Liu, Jinn-Liang
Chen, Ren-Chuen
學位類別:碩士
校院名稱:國立清華大學
系所名稱:計算與建模科學研究所
學號:106026502
出版年(民國):108
畢業學年度:107
語文別:英文
論文頁數:28
中文關鍵詞:平行化顯示卡計算OpenACCBiCGSTAB演算法與時間相關之薛丁格方程式
外文關鍵詞:parallelizationGPUOpenACCBiCGSTABTDSE
相關次數:
  • 推薦推薦:0
  • 點閱點閱:49
  • 評分評分:*****
  • 下載下載:10
  • 收藏收藏:0
在本論文中,呈現了以OpenACC來使用GPU計算的加速性能。一般常見使用GPU計算的工具是使用CUDA,我們使用OpenACC的原因是使用它比CUDA更為簡單。我們將其運用於兩個不同的案例,第一個是將BiCGSTAB平行化,用來解Poisson-Fermi模型構建的TRPV通道矩陣,另一個則是以split-operation方法來解與時間相關的薛丁格方程式。結果表明,以OpenACC使用GPU加速,可以將這兩個案例分別加速大約45.1倍以及52.3倍。
This thesis presents graphics processing unit (GPU) parallelization by using OpenACC. The reason for choosing OpenACC is that the usage of OpenACC is more simpler than compute unified device architecture (CUDA). Two cases are performed to test the performance of OpenACC. One is the Poisson-Fermi model for TRPV channel simulation solved by biconjugate gradient stabilized method (BiCGSTAB), and another case is that solve time-dependent Schrödinger equation (TDSE) by using split-operation method. The results show that OpenACC can achieve 45.1X and 52.3X speedups for the cases of TRPV and TDSE, respectively.
Contents
Abstract i
1 Introduction 1
2 OpenACC with standard C/C++ 3
2.1 Parallel Region Directives . . . . . . . . . . . . . . 3
2.2 Data Optimization Directives . . . . . . . . . . . . . 3
2.3 Loop Optimization Directive . . . . . . . . . . . . . 4
2.4 Examples . . . . . . . . . . . . . . . . . . . . . . . 4
3 Poisson-Fermi Model for TRPV Channel 12
3.1 Poisson-Fermi Equation . . . . . . . . . . . . . . . . 12
3.2 BiCGSTAB . . . . . . . . . . . . . . . . . . . . . . . 12
4 Time-Dependent Schrödinger Equation 16
4.1 Time-Dependent Schrödinger Equation . . . . . . . . . 16
4.2 Split-Operation Method for Energy Representation . . . 17
5 Result 23
5.1 Poisson-Fermi Model for TRPV Channel . . . . . . . . . 24
5.2 Time-Dependent Schrödinger Equation . . . . . . . . . 25
6 Conclusion 27
Reference 28
[1] Wikipedia contributors. Cuda — Wikipedia, the free encyclopedia, 2018. [Online;
accessed 20-March-2018].
[2] NVIDIA. Nvidia, developer, 2019. [Online; accessed 20-March-2019].
[3] Jen-Hao Chen, Ren-Chuen Chen, and Jinn-Liang Liu. A gpu poisson-fermi
solver for ion channel simulations. arXiv preprint arXiv:1711.04060, 2017.
[4] Liu J.-L. Numerical methods for the poisson–fermi equation in electrolytes. J.
Comput. Phys., 247, 2013.
[5] Youcef Saad and Martin H Schultz. Gmres: A generalized minimal residual
algorithm for solving nonsymmetric linear systems. SIAM Journal on scientific
and statistical computing, 7(3):856–869, 1986.
[6] Zhongyuan Zhou and Shih-I Chu. Precision. PHYSICAL REVIEW A 83,
013405, 2011.
[7] Tsin-Fu Jiang. Tdse of circular, elliptical polarized pulse on sae-atom under
dipole approximation in momentum space. Preprint.
 
 
 
 
第一頁 上一頁 下一頁 最後一頁 top
* *