DX11性價比之王!GTX460雙雄權威評測
第二章 GF104核心架構全解析
第二章/第一節 GF104核心SM架構的改進
相信細心的讀者已經看出來了,GF104相比GF100,最主要改變就是GPC(圖形處理器集群)從4個減至2個,顯存控制器從6個64bit(共384bit)減至4個64bit(共256bit),而最最重要的改變就是——
● 每組SM當中的CUDA核心數量從32個增至48個
按照常理來說,對于SM(流處理器簇)這一級的模塊,已經沒必要再重新設計或者進行調整了,直接保留GF100的設計,然后根據需要復制出一定的規模,新的核心就誕生了。但是在規格直接減半之后,雖然晶體管數和核心面積都會減半(參照Cypress與Juniper),但性能也會損失近50%,NVIDIA認為這并不是非常好的的方案。
那該怎么辦呢?我們知道,對GPU性能影響最大的模塊就是流處理器(CUDA核心),如果能在GPU內部盡可能多的塞入CUDA核心的話,性能方面就會有很大的提升。但是CUDA核心也會消耗不少的晶體管,如果晶體管數太過龐大的話,GPU制造成本、良品率、功耗、發熱也會受到較大影響。
那有沒有兩全其美的方法呢?大家可以注意看GF100芯片透視圖,其中間位置有1/3的面積,這些是GF100一體式的二級緩存。NVIDIA為了提升GPU并行計算的效率,像CPU那樣不惜成本的設計了大容量L2。L2對于性能的貢獻主要集中在密集型計算任務當中,而對于普通的圖形渲染來說,貢獻就非常小了。那么如果將這些L2的容量進一步壓縮,把節約出來的晶體管都變成CUDA核心的話,那么圖形渲染性能將會得到顯著提升。
GF104的SM要比GF100“胖”一些,CUDA核心橫向擴張
于是,擁有較小L2、較多CUDA核心的GF104就誕生了,新核心每組SM中包含CUDA核心的數量從32個增至48個,增加了50%,流處理器總數達到了384個。NVIDIA在晶體管數一定的情況下,通過優化核心與緩存的配比,制造出了一顆實力超乎預期的核心。
● 每組SM當中的紋理單元數量從4個增至8個
當然,NVIDIA也沒有單純增加CUDA核心的數量,針對GF100核心的不足之處也做了較大的改進——紋理單元數量加倍!
紋理單元數量加倍
GF100核心的每組SM當中擁有32個CUDA核心,還包括了4個紋理單元,這樣GF100總共就擁有64個紋理單元(GTX480屏蔽了一組是60個),遠少于Cypress的80個紋理單元。較少的紋理單元使得GTX400系列在大量使用了紋理貼圖的游戲中表現不佳,最有代表性的游戲就是《孤島危機》。
GF104核心只有8組SM,如果還是保持GF100的設計不變,那么紋理單元將只有32個,還沒有HD5770多(40個)。所以NVIDIA對紋理單元部分也做了改良,每組SM中的數量直接加倍,最終GF104擁有64個紋理單元,與GF100相等!
CUDA核心數量增加了50%,而紋理單元增加了100%,改進意圖顯而易見。
關注我們



