輪番拷問!專訪NVIDIA GPU事業部經理
★ 泡泡網
問題一:從GTX285到GTX480,NVIDIA優異GPU內部的CUDA核心數目翻了一倍(從240到480個)甚至更多(完整規格應該是512個),但顯存帶寬卻沒有增加多少,即便它使用了最新的GDDR5顯存,那么是不是顯存帶寬一定程度上限制了GTX480的性能發揮?
GTX480的顯存帶寬并不比GTX285和HD5870高多少
問題二:GTX480所使用的顯存顆粒與對手HD5870完全相同,這種GDDR5理論運行頻率可達5000MHz,HD5870的默認顯存頻率是4800MHz,而GTX480的頻率僅為3700MHz,為什么兩者的差距如此之大?是NVIDIA的顯存控制器設計有BUG呢?還是NVIDIA對于GDDR5的特性尚未完全掌握?
左:GTX480的顯存 右:HD5870的顯存
Drew Henry:NVIDIA擁有世界上最優秀的GPU工程師,而我們的Fermi架構以及基于Fermi架構的GTX480/470產品也是由這些最好的工程師們所設計的。所以我不覺得在產品設計上他們遇到了什么問題,應該說他們成功的完成了當初所制訂的設計目標。
Fermi是一種全新的架構,顯存管理方式完全不同于上代產品,跟競爭對手的產品更不具可比性。
在GF100 GPU內部,一級、二級緩存都經過了重新設計。一級緩存方面,除了保留傳統的一級紋理緩存外,NVIDIA還設計了全新的一級數據緩存和一級共享緩存,可動態的在16K或48K之間切換。二級緩存則是一整塊768KB容量的緩存,讓所有的SM和CUDA核心都可以共享使用,而GTX285和HD5870都是分離式的緩存,不但容量小而且利用率較低。
GF100的緩存架構讓各流水線之間可以高效地通信
在一級二級緩存利用效率提高的同時,大大減少了顯存讀寫操作,也提高了顯存空間利用率,強化了多線程密集型數據處理能力。正因為改良的多層級緩存架構,使得GF100對于顯存帶寬的依賴程度大大降低,因此GTX480沒必要使用高位寬、高頻率的顯存,即便帶寬維持在與上代產品相同的水平,也能提供非常強悍的性能。
所以,你要看整個架構有多快,而不是單獨看訪問內存的速度,更不能單純的比較NVIDIA和AMD的顯存帶寬,因為兩者的架構差異實在是太大了。
許哲銘:我補充一下,GF100是近年來架構變化最大的一款GPU,因此單純在某些局部技術和設計方面與上代產品或競爭對手的產品做對比是沒有意義的,我們應該從全局考察一款產品的性能,比如游戲性能、計算性能、Tessellation性能等等,GTX480領先GTX285的幅度都在1.8倍以上,這足以說明顯存不但不是瓶頸,而且效率更好。
關注我們



