CPU和GPU真融合 APU異構系統架構解析
分享
可以看到,在硬件層面,HSA架構當中的異構統一內存訪問是一項關鍵技術,因此有必要詳細介紹一下UMA:
一個真正的UMA系統中,所有的計算核心共享一個單一的內存地址空間,而NUMA采用非統一內存訪問的GPU計算系統,不同的地址需要額外的數據來實現堆棧管理,頻繁的拷貝,同步和地址轉換增加了編程復雜性。HSA恢復GPU到統一內存訪問,異構計算取代GPU計算。
hUMA的主要特性:
1. 雙向的一致性,CPU和GPU任何一個處理單元做出的更新對其他的處理單元都是可見的。
2. GPU支持分頁內存管理,GPU可以產生缺頁異常,不再受限于傳統的頁表鎖定內存;
3. 系統整體內存空間的全局管理,CPU和GPU進程可以從整個內存空間中動態分配內存。
以往的處理器都不支持hUMA架構,此時數據需要在CPU和GPU之間復制,CPU先把數據從內存復制到顯存中,等GPU完成計算之后,再從顯存中復制到內存中。如此頻繁的轉移數據,會浪費不少處理器時間,導致處理器效能不高,同時占據了大量的系統總線帶寬。
未來處理器采用hUMA架構之后,數據就無需復制了,CPU只需將指針傳遞到GPU,GPU處理完畢后,CPU就可以直接讀取結果,這樣將極大的提高處理器效能,并降低對總線帶寬的占用。
最后再來回顧一下hUMA架構的特性:整體內存空間訪問、分頁內存、雙向一致性、GPU快速訪問系統內存、動態內存分配。值得一提的是,目前已經上市的APU產品還不能支持hUMA架構,AMD會在下半年發布的下一代APU產品中提供支持,屆時異構計算的效能將會得到釋放。
2人已贊
關注我們



