DX11性價(jià)比之王!GTX460雙雄權(quán)威評(píng)測(cè)
第二章/第三節(jié) GF104專為游戲玩家設(shè)計(jì):刪除顯存ECC、去掉雙精度運(yùn)算
GF100核心當(dāng)中有很多功能都是普通用戶根本用不到的,比如顯存ECC、雙精度浮點(diǎn)運(yùn)算和CUDA C++指令,這些技術(shù)和功能是NVIDIA為專業(yè)用戶而定制的。
● GF104刪除顯存ECC功能
GF100核心是第一顆在顯存中提供了基于糾錯(cuò)碼(ECC)數(shù)據(jù)保護(hù)功能的GPU。GPU計(jì)算用戶使用ECC來在高性能計(jì)算環(huán)境中增強(qiáng)數(shù)據(jù)完整性。ECC是諸如醫(yī)療成像以及大型集群計(jì)算等領(lǐng)域中一個(gè)迫切需要的特性。
顯存ECC可以減少數(shù)據(jù)運(yùn)算出錯(cuò)的幾率,而對(duì)于圖形渲染來說,算錯(cuò)幾個(gè)像素可能無傷大雅。所以GTX480系列都沒有用到顯存ECC功能,目前還只有Tesla系列支持顯存ECC,備受超級(jí)計(jì)算數(shù)據(jù)中心的親睞。
定位較低的GTX460就更不需要顯存ECC功能了,所以在GF104核心設(shè)計(jì)之初就直接被刪除。
● GF104精簡(jiǎn)雙精度浮點(diǎn)運(yùn)算能力
GF100相對(duì)于以往的GPU,大幅度改進(jìn)了雙精度浮點(diǎn)運(yùn)算能力,其效率達(dá)到了單精度浮點(diǎn)運(yùn)算的1/2,而ATI全系列顯卡是1/5,NV上代顯卡是1/8。目前尚不清楚GF104核心到底是完全刪除了雙精度運(yùn)算單元、還是降低了雙精度運(yùn)算效率。無論是哪種方式,對(duì)于普通用戶來說都沒有任何影響,因?yàn)樗械?D圖形渲染和民用CUDA軟件都不會(huì)用到雙精度運(yùn)算。
NVIDIA稱,沒有計(jì)劃使用GF104核心來制造Tesla GPU計(jì)算產(chǎn)品,事實(shí)上此前的Tesla都使用的是高端GPU。GF104是專門針對(duì)普通用戶和游戲玩家而設(shè)計(jì)的,并沒有“一心二用”的去兼顧HPC市場(chǎng)。
● GF104核心的二級(jí)緩存容量為512KB,與Cypress相等
GF100的二級(jí)緩存容量為768KB,GF104減少至512KB。如果平均下來GF100的每顆CUDA核心可以分到1.5KB的緩存,而GF104的每顆CUDA核心可以分到1.33KB的緩存,新核心的緩存配比略有減少。
二級(jí)緩存和顯存控制器是關(guān)聯(lián)的
不過即便如此,GF104核心512KB的L2容量也與ATI優(yōu)異的Cypress相等。此外二級(jí)緩存容量還是與顯存控制器有一定的關(guān)聯(lián)關(guān)系。其中GTX460 1GB 256Bit的版本,L2可以使用全部的512KB,而768MB 192bit的版本只能使用到384KB L2。
GF100的緩存架構(gòu)讓各流水線之間可以高效地通信,減少了顯存讀寫操作
緩存容量的減少,或多或少的會(huì)影響GPU的性能,3D圖形渲染也會(huì)有損失。但GF104繼承了GF100共享式的二級(jí)緩存設(shè)計(jì),緩存利用率非常高,即便緩存容量遭到了縮水,也要比ATI獨(dú)享式二級(jí)緩存(L2綁定顯存控制器)的效率高。其原理大家可以參照CPU領(lǐng)域奔騰雙核與速龍2系列的性能表現(xiàn)即可。
關(guān)注我們



