鈦平盛世 精彩視界 GTX660Ti首發評測
● 從SM到SMX:流處理器和每瓦性能雙飛
基于效能和計算能力方面的考慮,NVIDIA與AMD不約而同的改變了架構,NVIDIA雖然還是采用SIMT架構,但也借鑒了AMD“較老”的SIMD架構之作法,降低控制邏輯單元和指令發射器的比例,用較少的邏輯單元去控制更多的CUDA核心。于是一組SM當中容納了192個核心的壯舉就變成了現實!
通過上面這個示意圖就看的很清楚了,CUDA核心的縮小主要歸功于28nm工藝的使用,而如此之多的CUDA核心,與之搭配的控制邏輯單元面積反而縮小了,NVIDIA強化運算單元削減控制單元的意圖就很明顯了。
Fermi的硬件相關性檢查變為Kepler的軟件預解碼
此時相信有人會問,降低控制單元的比例那是不是意味著NVIDIA賴以成名的高效率架構將會一去不復返了?理論上來說效率肯定會有損失,但實際上并沒有想象中的那么嚴重。NVIDIA發現線程的調度有一定的規律性,編譯器所發出的條件指令可以被預測到,此前這部分工作是由專門的硬件單元來完成的,而現在可以用簡單的程序來取代,這樣就能節約不少的晶體管。
● 擺脫CUDA核心的束縛:GPU核心頻率暴漲
除了CUDA核心數量大增之外,開普勒架構還有個很明顯的改變,那就是CUDA核心的頻率不再是GPU頻率的兩倍,現在整顆GPU所有單元的工作頻率都是相同的!
NVIDIA官方對CUDA與核心同頻的解釋是——功耗原因,為了盡可能的控制GTX680的功耗,不再讓CUDA工作在兩倍頻率下。
總而言之,表面上看來來這個改變似乎不是什么好事,但實際上卻意義重大。之前GTX580之所以核心頻率低而顯卡功耗高很大程度上就是受到過高CUDA核心頻率的影響。如今擺脫CUDA核心的束縛,GPU核心頻率輕而易舉就能突破1GHz,這樣一來顯卡運行效率更高,同時功耗也控制在了很低的水平。
● 顯存頻率后來居上 全面超越對手
顯存作為顯卡數據交換的“倉庫”,其效率高低直接影響到整體的性能。在開普勒核心誕生之前,AMD一直在顯存方面占據絕對優勢。
現在,NVIDIA在顯存頻率上面終于反超AMD,重新設計的顯存控制器突破了頻率的桎梏,瞬間從4000MHz飆升至6000MHz,帶寬提升達50%之多!
關注我們



