X86架構的GPU?解讀Larrabee規格特性
分享
首先要說明的是,larrabee并不是傳統意義上的GPU,本質上講,它就是CPU,由多顆X86架構的CPU通過環形總線并行組成,接替傳統GPU的功能。
從上圖我們可以看到,在Larrabee的內部,每一個處理核心都可以發出2條指令,這種架構是繼承了最初的奔騰處理器的設計。在老奔騰的基礎上,Intel的工程師們也作了許多修改和提升。首先讓老Pentium核心可以支持64bit指令處理,提升了x86指令集的處理,為處理核心加裝了更大容量的高速緩存。另外還支持4路SMT/Hyper Threading超線程和16路矢量ALU算數邏輯單元。
類似IBM的cell處理器,Intel吸取了一些經驗來設計Larrabee。為了避免高頻帶來的困擾,發熱量加大,功耗升高等,Larrabee的設計思路是多路并行,即通過多核心來提高性能。
通過上表我們可以比較Core2與Larrabee的數據吞吐量,理論上說明每個時鐘周期之內,多核心處理器可以處理更多的數據和指令。運行一個單一的指令流,例如單指令的應用程序,那么Core 2處理器每個時鐘周期可以執行4次操作,每個時鐘周期可以發出4條指令,但是執行單元無法在每個時鐘周期內執行4條指令。在10核心的架構中,盡管它每個時鐘周期僅僅可以發出2條指令。在一個單指令流的程序中,它的峰值是每個時鐘周期2次操作。僅有Core 2處理器的一半。但Core 2處理器只有2個處理核心,每個核心在每個時鐘周期內可以執行4個SSE指令,那么Core 2總計每個時鐘周期可以進行8次操作。但是具備10核心的Larrabee就大不一樣了。它每個時鐘周期可以執行160次操作,這相當于20倍Core 2的數據吞吐量。
0人已贊
關注我們



