CPU和GPU真融合 APU異構系統架構解析
由于目前還沒有支持HSA的處理器產品問世,所以所有的技術介紹及數據都來自于AMD內部。AMD大中華區游戲,軟件及異構計算合作與技術總監楚含進向大家分享了HSA架構的應用實例——人臉識別技術:
人臉識別技術看似簡單,實則是通過暴力計算的方式來實現,處理器需要在一張圖片中畫出無數個搜索框,從中尋找人臉的關鍵特征,一張1080p像素的全高清圖片需要分析200萬次……
一張圖片中可能會有無數個人臉,處理器一開始并不知道人臉有多大,所以需要不斷地對圖片進行縮放從而尋找合適大小的臉。
最終,人臉識別的過程被細分為22個階段,每一個搜索框都需要重復這22個階段,如果是靜態圖像還好,動態視頻的話30FPS就需要每秒1.4萬億次的計算能力……而且這個速度僅能識別正面人臉。
經過測試,這22個階段中,并不是所有階段都是GPU處理速度更快,也有CPU占據明顯優勢的,也有性能速度差不多的,畢竟兩者計算架構完全不同,適應不同的運算。
22個階段CPU和GPU各有所長,最終根據效率高低,第0階段讓CPU獨立計算,第9-22階段讓GPU獨立計算,而1-8階段讓CPU和GPU協同計算會更快一些。
最終經過測試獲得的數據顯示,HSA為CPU和GPU智能分配任務后,人臉識別速度提高了2.5倍之多!
這個案例意味著什么呢?我們再來回顧一下本文第一頁提到的內容:用戶越來越希望能夠借助手勢、眼睛、身體,用自然表達的方式和機器交互——沒錯,體感!然后呢?游戲機——索尼PS4和微軟Xbox One——它們都用的是AMD下一代的APU,都是基于HSA架構而設計的,而且是低功耗的CPU架構搭配為計算優化的GCN GPU架構!
只有HSA架構才能徹底的將GPU強大的運算能力釋放出來,從而降低對CPU的依賴,大幅提升性能功耗比,降低應用開發難度,這就是索尼和微軟不約而同的選用AMD APU的根本原因,否則傳統PC架構優異CPU搭配獨立顯卡不是更好么?游戲機硬件一旦確立,未來5年內甚至更長時間都不會再改變,因此必須選用前瞻性的架構,索尼的微軟為次世代游戲主機選擇了HSA和APU,PC同樣是大勢所趨,讓我們一同期待AMD下一代桌面級APU的表現吧!■<
關注我們



