作者(外文):Hsu, Chia-Chen
論文名稱(外文):Optimized Memory Access Support for Data Layout Conversion on Heterogeneous Multi-core Systems
異質多核心系統在因應現代科技之龐大複雜的運算需求下成為一重點發展項目。其中通用圖形處理器(GPGPU)與中央處理器(CPU)是當中熱門的整合方向。然而,在異質多核系統中,由於資料需在不同處理器之間大量傳遞與搬移,以及不同的處理器間硬體架構與特性不同,導致在不同的處理架構中對於相同資料排列存取的memory locality將存在差異性,而此差異性會導致整體系統的效能降低。因此需要重新對資料排列進行重組以適應目標硬體架構,如適用於CPU的陣列結構(AOS),與適用於GPGPU的結構陣列(SOA)之轉換,以及

Abstract i
Contents iii
List of Figures v
List of Tables vii
1 Introduction 1
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Related Work . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2 Architecture of Memory Manager 7
2.1 System Overview . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Transpose Unit . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3 Control Unit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.4 Sparse Converter . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.5 Software Interface . . . . . . . . . . . . . . . . . . . . . . . . . 13
3 Advanced Design Issues 18
3.1 The Design of Transpose Unit . . . . . . . . . . . . . . . . . . 18
3.2 Synchronous-Pipeline by PPTU . . . . . . . . . . . . . . . . . 19
3.3 Out-of-Order Data Flow . . . . . . . . . . . . . . . . . . . . . 19
3.4 Finite State Machine . . . . . . . . . . . . . . . . . . . . . . . 21
3.5 Details of Sparse Converter . . . . . . . . . . . . . . . . . . . 23
4 CUDA Kernel Adaptation 27
5 Experiment Results 29
5.1 Coalesced Transpose evaluation . . . . . . . . . . . . . . . . . 29
5.2 Application-level Analysis for Coalescing Converter . . . . . . 33
5.3 Analysis of Sparse Converter . . . . . . . . . . . . . . . . . . . 35
5.4 Potential Application Discussion . . . . . . . . . . . . . . . . . 36
6 Conclusion 39
