GDDR3顯卡值得買?顯存技術分析與測試
泡泡網顯卡頻道7月9日 顯存對于一款專業游戲顯卡來說,重要性不言而喻,顯存顆粒體質的好壞同樣關乎玩家們超頻的樂趣,時代變遷技術發展,曾經的GDDR3和如今的GDDR5到底有哪些性能上的提升呢?為什么常見的中高端游戲顯卡配備GDDR5顯存,低端顯卡有配備GDDR3顯存?GDDR5到底強在哪里?兩者有何不同?我們帶著這些問題走進今天的技術探究。
● GDDR3:一代王者GDDR3源于DDR2技術
無論GDDR還是GDDR2,由于在技術方面與DDR/DDR2并無太大差別,因此最終在頻率方面GDDR并不比DDR高太多。在經歷了GDDR2的失敗之后,兩大圖形巨頭NVIDIA和ATI對JEDEC組織慢如蝸牛般的標準制訂流程感到越來越失望,認為他們制定的顯存不能適應GPU快節奏的產品更新換代周期,于是NVIDIA和ATI的工作人員積極參與到了JEDEC組織當中,以加速顯存標準的起草及制定。
雙方一致認為,顯存與內存在數據存儲的應用方面完全不同,在內存核心頻率(電容刷新頻率)無法提升的情況下,單純提高I/O頻率來獲得高帶寬很不現實。因此,必須要有一種針對高速點對點環境而重新定義的I/O接口。于是GDDR3誕生了,這是第一款真正完全為GPU設計的存儲器。
GDDR3和GDDR2/DDR2一樣,都是4Bit預取架構,GDDR3主要針對GDDR2高功耗高發熱的缺點進行改進,并提升傳輸效率來緩解高延遲的負面影響。
-
點對點DQS,讀寫無需等待
GDDR2只有一條數據選擇脈沖(DQS),是單一雙向的,而GDDR3則擁有讀與寫兩條獨立的DQS,而且是點對點設計。這樣做的好處在于,在讀取之后如果馬上進行寫入時,不必再等DQS的方向轉變,由此實現讀寫操作的快速切換。
相比GDDR2/DDR2,GDDR3的讀寫切換動作可以少一個時鐘周期,如果需要對某一個連續的區塊同時讀寫數據時,GDDR3的速度就要比GDDR2快一倍。
由于存儲單元自身的特性,內存顆粒的邏輯Bank是無法同時讀寫數據的,并不存在“全雙工”一說,但GDDR3的這項改進讓順序讀寫成為可能。GPU本身緩存很小,與顯存之間的數據交換極其頻繁,讀寫操作穿插進行,因此GDDR3點對點設計的DQS可以讓顯存存儲效率大增。但對于CPU來說,讀寫切換并不如GPU那么頻繁,而且CPU擁有大容量的二三級緩存,所以GDDR3這種設計并不能極大的提升內存帶寬,也沒有引入到下一代DDR3當中。
-
改進I/O接口,簡化數據處理,控制功耗

同時GDDR3也對I/O控制電路和終結電阻進行了修改,它不再沿用GDDR2的“推式(Push Pull)”接收器,而將其改為虛擬開極邏輯方式(Pseudo Open Drain Logic),并且通過將所有的三相數據信號轉移到本位電路上,來簡化數據處理,將DC電流壓至最小,只有當邏輯LOW移至總線上時才會消費電力,從而很好的控制了功耗和發熱。
即便使用了8bit預取技術,可GDDR4還是沒有與GDDR3拉開頻率差距,因為瓶頸在I/O控制器上面而不是內核,而GDDR5就是用來解決這一瓶頸的。
● GDDR5:恐怖的頻率是如何達成的
和GDDR4一樣,GDDR5采用了DDR3的8bit預取技術,核心頻率顯然不是瓶頸,如何提升I/O頻率才是當務之急。但GDDR5并沒有讓I/O頻率翻倍,而是使用了兩條并行的DQ總線,從而實現雙倍的接口帶寬。
雙DQ總線的結果就是,GDDR5的針腳數從GDDR3/4的136Ball大幅增至170Ball,相應的GPU顯存控制器也需要重新設計。GDDR5顯存擁有多達16個物理Bank,這些Bank被分為四組,雙DQ總線交叉控制四組Bank,達到了實時讀寫操作,一舉將數據傳輸率提升至4GHz以上!
以往GDDR1/2/3/4和DDR1/2/3的數據總線都是DDR技術(通過差分時鐘在上升沿和下降沿各傳輸一次數據),官方標稱的頻率X2就是數據傳輸率,也就是通常我們所說的等效頻率。而GDDR5則不同,它有兩條數據總線,相當于Rambus的QDR技術,所以官方標稱頻率X4才是數據傳輸率。比如HD4870官方顯存頻率是900MHz,而大家習慣稱之為3600MHz。
NVIDIA對于GDDR5當然很感興趣,但卻一點都不著急,保守的NVIDIA決定堅守GDDR3,GTX200核心使用了512Bit顯存控制器來提升帶寬。比起R600的環形總線,NVIDIA從256Bit到384Bit再到512Bit一步一個腳印走出來的交叉總線顯然更加成熟。
以256Bit對抗512Bit,ATI只能將籌碼全部押在GDDR5身上,于是在GDDR5標準尚未完全確立之前,ATI已經在緊鑼密鼓的測試性能,并督促DRAM廠投產。可以說GDDR5和GDDR2/4一樣也是個早產兒,但失敗乃成功之母,有了完善的技術規格和制造工藝的支持,GDDR5一出世便令人刮目相看。
我們目前從大部分的顯卡身上都可以看到GDDR5顯存顆粒的身影,GDDR5在GDDR3/4優秀特性的基礎上,還有諸多改進和新特性,下面就對它們進行詳細分析。
-
數據和地址總線轉位技術:信號質量高、功率消耗少
在1Byte數據中的8個值中,如果超過一半的數值是0,那么GDDR5就會自動執行轉位傳輸,把0變成1、1變成0,通過1個附加的DBI(數據總線轉位值)來判定數據流是正位還是反位。GDDR5的這項技術是從GDDR4繼承發展而來的。
DRAM在傳輸數據時,只有0會消耗電能,減少0的傳輸數量,既能保證信號質量,也能減少內部終結電阻和外部終結電路的功率消耗。GDDR5的地址總線也使用了類似的技術,通過額外的ABI通道來轉位數據流,從而較少信號噪聲,并降低功耗。
-
智能的可編程I/O控制接口:簡化PCB設計和成本
GDDR5對I/O控制器做了很多改進,加入了全新的自動校準引擎,保證GDDR5顯存顆粒更好的適應GPU顯存控制器的需求,確保數據傳輸穩定可靠。
自動校準引擎可以監控電壓和溫度變化,通過校驗數據輸出驅動器導通電阻與ODT終結電阻值來作出補償,數據、地址、指令終結電阻都可以被軟件或驅動控制。
此外GDDR5還能支持時間延遲和信號強度調整,靈活的協調數據同步,以往通過“蛇形走線”平衡延遲的方法徹底成為歷史,GDDR5沒有這種顧慮,因此能極大的簡化PCB布線和成本,并有利于沖擊更高頻率。
-
數據遮蓋技術:減輕數據總線壓力
GDDR5的Burst Length(對相鄰存儲單元連續進行數據傳輸的周期數)是8bit,也就是說GDDR5顆粒一次至少要傳輸256bit數據,但很多時候并不是所有的數據都需要被改寫,導致無效的數據傳輸。
為此,GDDR5使用了一項數據遮蓋技術,通過地址線傳輸保護信息,所有被保護的數據在傳輸過程中就不會被改寫,只有暴露的數據才會被寫入新的數據。如此以來,GDDR5的數據線壓力減輕不少,功耗發熱也得到進一步控制。
-
誤差補償技術:提高傳輸效率,避免災難性錯誤
為了保證數據在高速傳輸過程中的有效性,GDDR5新增一項錯誤偵測與修正技術。GDDR5使用了成熟的CRC(循環冗余校驗),通過DQ和DBI總線,實時檢查錯誤,第一時間重新發送數據。
這項技術對于高頻率傳輸數據尤為重要,它能有效的減少數據傳輸錯誤導致系統崩潰的概率,大幅減少了由超頻或高溫導致的一系列問題,而且能夠一定程度上提升數據傳輸效率。
-
折疊模式:32bit顆粒當作16bit用
GDDR5作為高端顯卡專用的顯卡,只有32bit的顆粒。由于GDDR5擁有兩條并行的數據總線,這就使得GDDR5的工作模式變得更加靈活,它既可以工作在32bit模式下也可以工作在16bit模式下。這樣一個32bit顯存控制器就可以控制兩顆GDDR5顯存,顯存容量可以輕松翻倍。
其實,GDDR3/4都可以通過這種方式擴充顯存容量,但原理則完全不同。此前必須GPU的顯存控制器在設計時支持雙Bank模式才能支持更多的顯存顆粒。而現在,8顆GDDR5顯存總計256bit可以直接被128bit的GPU使用,從而簡化了顯存控制器設計,HD4770就是很好的例子。
此次測試的顯卡主要定位高端,測試時所有游戲中開啟全部特效,包括4X抗鋸齒(AA)和16X各向異性過濾(AF)。雖然很多游戲提供了更高精度的AA,但由于實用價值不高,且沒有可對比性,所以不做測試。

也有部分顯示器是(1920x1200),游戲在這種分辨率下的性能表現與1920x1080差不多,FPS稍低一點點,使用這種顯示器的朋友依然可以參考我們的測試成績。
● 測試平臺主板:技嘉Z87X-UD3H

Z87X-UD3H就是8系主板中的主力軍,這款Intel Z87芯片組的主板采用LGA1150接口,用于搭配第四代酷睿處理器使用。全能是這款產品的最好概括:IR全數字供電方案帶來最效率電氣性能,兩倍銅、兩倍金奢華用料保證最堅固品質,全新的BIOS界面、應用中心讓技嘉主板有了更多亮點。這款產品之中,足以見證技嘉走上王座的決心。
● 測試平臺電源:Antec HCP1200

安鈦克Antec HCP1200電源在世界超頻大賽中非常常見,通過了80PLUS認證,轉換效率高達92.4%,支持4路12V輸出,最高電流72A,支持四卡SLI/交火。平均無故障運行時間為10萬小時。配備一顆8cm靜音風扇,運行噪音極低。
●測試平臺SSD:OCZ Vetrx3 240GB

OCZ的Vertex系列屬于它的高端固態硬盤,專門為高端玩家和存儲發燒友設計。隨著Sandforce控制器大紅大紫,OCZ也將Vertex系列升級到了全新的SF1200方案。如今SATA3.0 6Gbps接口大行其道,OCZ推出了基于SF2200系列主控芯片的Vertex 3固態硬盤,涵蓋60-480GB容量范圍。
說了這么多關于兩種主流顯存顆粒的技術分析,可能有些玩家已經看得很頭暈了,不過沒關系,技術方面的知識大家了解下就足夠了,因為對于我們玩家來說,最重要的是想知道在游戲性能方面兩種顯存顆粒到底存在多大區別?GDDR5提升到底有多大?ok,下面我們就通過兩款同型號顯卡在不同顯存顆粒下的實測表現來看一看GDDR5和GDDR3他們到底如何。
既然針對平臺不同,測試項目自然也相去甚遠。三大平臺除了PC追求極致性能外,筆記本和平板都受限于電池和移動因素,性能不是很高,因此之前的3Dmark11雖然有三檔可選,依然不能準確衡量移動設備的真實性能。

3DMARK主界面
而這次Futuremark為移動平臺量身定做了專有測試方案,新一代3DMark三個場景的畫面精細程度以及對配置的要求可謂天差地別。

Fire Strike、Cloud Gate、Ice Storm三大場景,他們分別對應當前最熱門的三大類型的電腦——臺式電腦、筆記本電腦和平板電腦。
GDDR5顯存顯卡跑分成績
GDDR3顯存顯卡跑分成績
GDDR5顯存顯卡跑分成績
GDDR3顯存顯卡跑分成績
在3DMark跑分測試中,我們可以明顯看出兩款顯存顆粒的性能差距,FireStrike拉開了500分、Ice Storm相差30000分之多,高下立判。


3DMark11的測試重點是實時利用DX11 API更新和渲染復雜的游戲世界,通過六個不同測試環節得到一個綜合評分,藉此評判一套PC系統的基準性能水平。
● 3DMark 11的特色與亮點:
1、原生支持DirectX 11:基于原生DX11引擎,全面使用DX11 API的所有新特性,包括曲面細分、計算著色器、多線程。
2、原生支持64bit,保留32bit:原生64位編譯程序,獨立的32位、64位可執行文件,并支持兼容模式。
3、新測試場景:總計六個測試場景,包括四個圖形測試(其實是兩個場景)、一個物理測試、一個綜合測試,全面衡量GPU、CPU性能。
4、拋棄PhysX,使用Bullet物理引擎:拋棄封閉的NVIDIA PhysX而改用開源的Bullet專業物理庫,支持碰撞檢測、剛體、軟體,根據ZLib授權協議而免費使用。
上圖中我們可以清晰看出,GDDR3確實已經“扛不住”了,3DMark11 P檔落后了400多分,顯然顯存的用料水平已經足以影響一款顯卡的性能。反觀GDDR5,出色的頻率表現已經說明了一切。
這些年我們看到了不少形態各異的勞拉,從豐乳肥臀的動作游戲主角到喜歡探索亞特蘭蒂斯文明的睿智貴族。不過我們從未見過這樣的勞拉。Crystal Dynamics的《古墓麗影9》讓我們看到了一個參加初次探險的年輕勞拉,她遭遇海難被困在刀槍林立的小島上,必須將自己的智謀和求生欲望提升到極限。
劇情介紹:故事從年少時期的勞拉開始,勞拉所乘坐的“堅忍號”仿佛是被宿命所呼喚,在日本海的魔鬼海遭遇到了臺風,不幸擱淺。勞拉也被迫到島上開始自己的求生經歷。
古墓麗影9的游戲畫面較之前代上升了不少,游戲要求也提高了不少。
這是我們開啟不同畫質的游戲截圖對比,可以看出“高”特效的畫質已經非常不錯了。
古墓麗影9使我們玩家都玩過的游戲,實測當中兩款顯卡的表現基本上差出了一個層級,13幀的差距說明GDDR3的確已經老了。
GDDR5顯存顆粒用料可謂是優異的,在低端卡中使用如此用料的廠商多半會將顯卡價格抬高一個層級,我們玩家熟悉的EVGA品牌顯卡多會采用這樣的價格策略,而在使用過程中,與打價格戰的顯卡產品沒有本質上的性能差距,優勢也就是毫厘之間,所以我們玩家在挑選低端顯卡時還是要注重性價比的。
京東商城出售的GT730 1GD5顯卡就具備了這種性價比的優勢。
在眾多采用GDDR3顯存顆粒的低端顯卡中,廠家方面的態度還是很有誠意的,隨說貴了幾十塊錢,但是性能提升了一大塊,頗具性價比的舉措。
之前的技術解析方面也提到了,GDDR5顯存顆粒的功耗表現十分突出,性能強功耗低,展現了科技的價值。
GDDR5在硬件指標和性能上全面壓制GDDR3,價格又與GDDR3相差無幾。所以找不到理由不選GDDR5。可以看到,目前的GDDR5顯存顆粒在多個方面存在絕對優勢,而在我們比較關心的頻率、傳輸速率、顯存帶寬、等效頻率、封裝工藝、功耗、理論成績、游戲成績等方面,GDDR5是完勝于上一代的老顯存,這個時代還能看到GDDR3顯存,絕對是廠家在成本上的妥協,我們玩家需要認清這一點。■
關注我們


