超越公版!銘鑫GTX460中國玩家版解析
GTX480/GTX470使NVIDIA再次奪回了單核心性能王者的寶座,不過NVIDIA似乎并不滿足于此,在6月1日又發布基于GF100核心的第三款產品——GTX465。這款產品在性能上略低于GTX470,但憑借較高的性價比依然獲得了不少玩家的親睞。
今天,NVIDIA再次發布了支持DX11的第四款產品——GTX460。與之前產品不同的是GTX460基于全新的GF104核心。這款核心不僅僅只是GF100的低規格版這么簡單,而是在GF100的基礎上進行了大幅改進,在保證產品性能優勢的同時,使功耗及發熱量大幅下降,從而也提升了產品的超頻能力。下面小編就為大家詳細介紹一下GF104核心以及采用GF104核心的產品GTX460,究竟都有哪些特點!
按理說,NVIDIA也應該會把GF100核心的主要規格全部減半,從而制造出一顆擁有256SP 256Bit的主流核心。事實上之前國內外的媒體都是這樣猜測的,因為GF100模塊化四核心的設計,很容易將其“拆分為”規模大小不一的中低端核心:
如上圖所示,GF100為四核心設計,將它變為1/2、1/4就能輕而易舉的獲得中端和低端GPU,但NVIDIA卻沒有這樣做,最終GF104核心的規模出乎所有人的預料:
乍一看,GF104就是GF100被一刀切成兩半的規模,但請大家仔細看看到底有何不同?這里提醒大家一下:完整的GF100核心擁有512個CUDA核心,完整的GF104核心擁有384個CUDA核心,顯然GF104核心并非是GF100一半的規格,NVIDIA在微觀架構方面做了不小的改動。
● 每組SM當中的CUDA核心數量從32個增至48個
按照常理來說,對于SM(流處理器簇)這一級的模塊,已經沒必要再重新設計或者進行調整了,直接保留GF100的設計,然后根據需要復制出一定的規模,新的核心就誕生了。但是在規格直接減半之后,雖然晶體管數和核心面積都會減半(參照Cypress與Juniper),但性能也會損失近50%,NVIDIA認為這并不是非常好的的方案。
那該怎么辦呢?我們知道,對GPU性能影響最大的模塊就是流處理器(CUDA核心),如果能在GPU內部盡可能多的塞入CUDA核心的話,性能方面就會有很大的提升。但是CUDA核心也會消耗不少的晶體管,如果晶體管數太過龐大的話,GPU制造成本、良品率、功耗、發熱也會受到較大影響。
GF100核心透視圖,二級緩存消耗了太多的晶體管
那有沒有兩全其美的方法呢?大家可以注意看GF100芯片透視圖,其中間位置有1/3的面積,這些是GF100一體式的二級緩存。NVIDIA為了提升GPU并行計算的效率,像CPU那樣不惜成本的設計了大容量L2。L2對于性能的貢獻主要集中在密集型計算任務當中,而對于普通的圖形渲染來說,貢獻就非常小了。那么如果將這些L2的容量進一步壓縮,把節約出來的晶體管都變成CUDA核心的話,那么圖形渲染性能將會得到顯著提升。
于是,擁有較小L2、較多CUDA核心的GF104就誕生了,新核心每組SM中包含CUDA核心的數量從32個增至48個,增加了50%,流處理器總數達到了384個。NVIDIA在晶體管數保持不變的情況下,通過優化核心與緩存的配比,制造出了一顆實力超乎預期的核心。
關注我們



