9系游戲神器 影馳GTX970黑將顯卡評測
NVIDIA Kepler GPU架構于2012年初問世,它前所未有的能效比催生出全球最快的游戲PC、工作站以及超級計算機和云游戲服務器。甚至智能手機、平板電腦乃至汽車的信息娛樂系統都得益于TegraK1系統(SoC)獲得了空前的視覺計算功能。
而NVIDIA的第一代“Maxwell”架構在上一代的基礎上又獲得了全新的提升。事實上“GM107”在研發期間的定位是專為筆記本和小型(SFF)PC等功率受限的使用場合而設計。但事實上它的性能已經達到了桌面低端甚至中端的水準,NVIDIA在最后時刻將其打造成GTX650Ti的接班人,強行推入主流市場。
在1080p分辨率下,GeForceGTX750Ti的性能通常可與四年前的旗艦GPU——GeForceGTX480比肩,然而熱設計功耗僅為區區60W,是后者的四分之一!那Maxwell高端產品又當如何?是什么革新讓它有如此驚人的表現呢?
Maxwell在流式多處理器(SM)方面采用了一種全新設計,可大幅提高每瓦特性能和每單位面積的性能。雖然Kepler SMX設計在這一代產品中已經相當高效,但是隨著它的發展,NVIDIA的GPU架構師再次在能效比利用方面突破了難關。
MaxwellSM設計實現證明了這一點,控制邏輯分區、負荷均衡、時鐘門控粒度、編譯器調度、每時鐘周期發出指令條數等方面的改進以及其它諸多增強之處讓Maxwell SM(亦稱“SMM”)能夠在效率上遠超Kepler SMX。全新的Maxwell SM架構能夠在GM107中把SM的數量增至五個(GK107中僅有兩個),而芯片面積僅增加25%。下表提供了高級對比,對比雙方分別為Maxwell以及上一代GK107 Kepler GPU:
具體來說,首先Maxwell采用了容量大增的二級高速緩存設計,Maxwell核心架構中二級高速緩存容量為2048KB,而GK107中的容量僅為256KB。由于片上高速緩存容量更大,因此需要向顯卡DRAM發送的請求更少,從而降低了整體顯卡功耗、提升了性能。
除了上述變化以外,NVIDIA的工程師還雄心勃勃地在晶體管水平上調整了Maxwell GPU中每個單元的實現方式,以便最大限度提高節能性。所有這些努力的最終結果是,采用相同的28納米制造工藝,Maxwell能夠提供相當于Kepler兩倍的每瓦特性能!
雖然說起來簡單,但事實上這些就意味著Maxwell內部所有單元和橫梁結構均得到了重新設計,數據流得到了優化,功率管理實現了大幅改變。
雖然從圖形特性的視角來看,第一代Maxwell GPU可提供與Kepler GPU相同的API功能,但從深層來上,Maxwell還在單個GPC(圖形處理簇)內實現了多個SM單元,每個SM包含一個多形體引擎(Polymorph Engine)和紋理單元,而每個GPC包含一個光柵引擎(Raster Engine)。ROP依然與二級高速緩存片(L2 Cache Slice)以及顯存控制器聯系在一起。
GM 204 GPU包含4個GPC、16個Maxwell流式多處理器(SMM)以及4個64位顯存控制器(共256位)。這就是這一芯片的完整實現形式,規格大約是GeForce GTX 750Ti中的GM107的3倍。
上一代Kepler的方法是劃分為非2冪(non-power-of-two)數量的CUDA核心,其中一些是共享核心,這種方法需要的SM調度器數量較少,但復雜程度較高,在各種各樣的游戲引擎環境中表現并不理想。
上一代Kepler的方法是劃分為非2冪(non-power-of-two)數量的CUDA核心,其中一些是共享核心,這種方法需要的SM調度器數量較少,但復雜程度較高,在各種各樣的游戲引擎環境中表現并不理想。
而現在每個SM分為四個獨立的處理塊,每個處理塊具備自己的指令緩沖區、調度器以及32個CUDA核心。新的劃分方法簡化了設計與調度邏輯、節省了晶體管與功耗、降低了計算延遲。
總體而言,在這一全新設計上,每個“SM”的尺寸得到大幅縮減,而性能卻能夠達到一個KeplerSM的90%。更小的晶體管消耗讓NVIDIA能夠在每顆GPU中實現更多數量的SM。通過對比Kepler和Maxwell SM總數的相關指標可發現,后者的峰值紋理性能比前者高25%,CUDA核心數量多1.7倍,著色器性能大約高2.3倍。
對GM204來說,要在顯存位寬與上一代Kepler架構核心相同的情況下實現性能大幅提升的目標,增強顯存系統也同樣重要。內部顯存系統帶寬實現了提升,效率也得到了改善。此外,2MB大容量二級高速緩存配置(比之前的任何GPU設計都大)十分有效地降低了顯存帶寬需求,確保了DRAM帶寬不成為瓶頸。
其他關于Maxwell架構的基本信息,例如通過Giga Thread引擎的主PCI Express接口數據流、Polymorph與Raster單元的基本操作等等過于晦澀的知識這里就不再贅述了。
關注我們



