1. <blockquote id="lwgwu"></blockquote>
    2. <kbd id="lwgwu"><samp id="lwgwu"></samp></kbd>
    3. <abbr id="lwgwu"><tt id="lwgwu"></tt></abbr>
      免费专区丝袜调教视频,亚洲午夜无码极品久久,亚洲乳大丰满中文字幕,乱乱网,两个人看的www视频中文字幕,中文字幕日韩精品无码内射,欧美成aⅴ人高清免费,女人被爽到高潮视频免费国产
      泡泡網(wǎng)顯卡頻道 PCPOP首頁      /      顯卡     /      新聞    /    正文

      GPU挑戰(zhàn)CPU地位!詳解CUDA+OpenCL威力

          較多核CPU確實(shí)很誘人,但只能存在于實(shí)驗(yàn)室中,距離我們似乎非常遙遠(yuǎn)。由于較多核CPU的架構(gòu)與目前的雙核/四核CPU有很大的不同,因此大家不必拘泥于傳統(tǒng)處理器的概念。其實(shí)較多核處理器“遠(yuǎn)在天邊、近在眼前”——高配置電腦當(dāng)中肯定擁有一顆GPU(顯卡),9800GTX+是128核心、GTX280則擁有240顆核心,GPU的每一個(gè)流處理器就是一顆核心。

      GPGPU大戰(zhàn)一觸即發(fā)!NV即將發(fā)布新品牌

          目前X86架構(gòu)的處理器經(jīng)過30年的發(fā)展,指令集、平臺(tái)、系統(tǒng)和軟件支持已經(jīng)接近完美,因此使用CPU處理數(shù)據(jù)是天經(jīng)地義的。GPU雖然也誕生了近20年,但它從來都只能渲染圖形,想要讓他進(jìn)入全新并行計(jì)算領(lǐng)域,無論硬件架構(gòu)還是軟件平臺(tái)都需要作相應(yīng)的調(diào)整。

      GPU在硬件架構(gòu)方面的進(jìn)步

          傳統(tǒng)GPU的核心組成部分是Shader(著色器),分為Pixel Shader(像素單元)和Vertex Shader(頂點(diǎn)單元),每一個(gè)Shader是一個(gè)4D或5D的矢量運(yùn)算單元,之所以設(shè)計(jì)成這樣是因?yàn)樵趫D形處理中,最常見的像素都是由RGB(紅黃藍(lán))三種顏色構(gòu)成的,加上它們共有的信息說明(Alpha),總共是4個(gè)通道。而頂點(diǎn)數(shù)據(jù)一般也是由XYZW四個(gè)坐標(biāo)構(gòu)成,這樣也是4個(gè)通道。在3D圖形進(jìn)行渲染時(shí),其實(shí)就是改變RGBA四個(gè)通道或者XYZW四個(gè)坐標(biāo)的數(shù)值。為了一次性處理1個(gè)完整的像素渲染或幾何轉(zhuǎn)換,GPU的像素著色單元和頂點(diǎn)著色單元從一開始就被設(shè)計(jì)成為同時(shí)具備4次運(yùn)算能力的運(yùn)算器(ALU)。

      完美DX10!ATI新王者HD2900XT權(quán)威評(píng)測(cè)
      傳統(tǒng)Shader結(jié)構(gòu)的GPU只適合做圖形渲染

          這樣的4D矢量運(yùn)算單元在渲染3D圖形時(shí)會(huì)有很高的效率,但在處理復(fù)雜指令時(shí)的效率會(huì)大打折扣,比如DX10新引入的幾何著色、物理加速等,尤其在面對(duì)非圖形渲染指令時(shí)優(yōu)勢(shì)全無。

          NVIDIA的科學(xué)家對(duì)圖形指令結(jié)構(gòu)進(jìn)行了深入研究,它們發(fā)現(xiàn)標(biāo)量數(shù)據(jù)流所占比例正在逐年提升,如果渲染單元還是堅(jiān)持SIMD(單指令多數(shù)據(jù)流)設(shè)計(jì)會(huì)讓效率下降。為此NVIDIA在G80中做出大膽變革:流處理器不再針對(duì)矢量設(shè)計(jì),而是統(tǒng)統(tǒng)改成了標(biāo)量ALU單元。用通俗的話說就是:Shader單元內(nèi)部ALU完全打散,設(shè)計(jì)成為各自獨(dú)立的流處理器,并分配相應(yīng)的指令發(fā)射端和控制單元,這樣的架構(gòu)在面對(duì)任何形式的指令(包括組合指令)時(shí)都能保證最高的執(zhí)行效率,這也就是NVIDIA在DX10時(shí)代游戲性能大幅領(lǐng)先于競爭對(duì)手的根本原因!

      開創(chuàng)視覺計(jì)算帝國GTX280/260權(quán)威評(píng)測(cè)
      G80革命性的標(biāo)量流處理器架構(gòu)設(shè)計(jì),每一個(gè)SP都是一個(gè)核心

          隨著圖形畫面越來越復(fù)雜,1D、2D、3D指令所占比例正在逐年增多,而G80在遇到這種指令時(shí)可說是如魚得水,與普通4D指令一樣不會(huì)有任何效能損失,指令轉(zhuǎn)換效率高并且對(duì)指令的適應(yīng)性非常好,這樣G80就將GPU Shader執(zhí)行效率提升到了新的境界!

          這種富有彈性的架構(gòu)不僅擁有很強(qiáng)的圖形渲染能力,而且能夠處理以往不敢奢想的非圖形運(yùn)算指令,理論上來講只要是浮點(diǎn)運(yùn)算指令都可以交給GPU來處理。而在以往,程序員必須針對(duì)GPU的架構(gòu)特點(diǎn),對(duì)指令重新分類打包并模擬圖形指令交給GPU處理器,工作量可想而知,效率也極為低下。

      開創(chuàng)視覺計(jì)算帝國GTX280/260權(quán)威評(píng)測(cè)

          G80的架構(gòu)無論對(duì)于圖形渲染還是并行計(jì)算都是革命性的,但NVIDIA并沒有滿足于此,為了進(jìn)一步提高GPU的并行計(jì)算效能,把GPU改造成為一顆真正的通用處理器,NVIDIA在GTX200核心大規(guī)模擴(kuò)充流處理器數(shù)量的同時(shí),也對(duì)內(nèi)核架構(gòu)進(jìn)行了諸多優(yōu)化與改進(jìn),使之更適合做超大規(guī)模并行數(shù)據(jù)處理。

      開創(chuàng)視覺計(jì)算帝國GTX280/260權(quán)威評(píng)測(cè)

          GTX200核心的主要改進(jìn)有:

      • 每個(gè)SM(8個(gè)流處理器為一簇)可執(zhí)行線程從768提升至1024條;
      • 每個(gè)SM的指令寄存器容量翻倍,從16K提升至32K;
      • 將雙指令執(zhí)行(Dual-Issue)效率提升至94%,接近于理論值;
      • 512Bit顯存控制器,4GB顯存容量支持,防止指令排隊(duì)溢出;
      • 支持雙精度64Bit浮點(diǎn)運(yùn)算,55nm版GTX200的雙精度運(yùn)算能力提高4倍!

          以上所有的改進(jìn)(顯存位寬除外)并不會(huì)讓GTX200核心的圖形渲染能力得到提高,但卻能夠大幅提升GPU在進(jìn)行海量數(shù)據(jù)處理時(shí)的效率。由此我們可以看出NVIDIA的野心與實(shí)力——G80與GTX200已經(jīng)不再是一顆圖形處理器,而是較多核通用處理器!而NVIDIA這種圖形架構(gòu)與并行計(jì)算架構(gòu)合二為一的架構(gòu)就被稱為CUDA。

      2人已贊

      關(guān)注我們

      泡泡網(wǎng)

      手機(jī)掃碼關(guān)注
      主站蜘蛛池模板: 人妻少妇综合一区二区| 欧美老妇牲交videos| 久久狠狠高潮亚洲精品| 久久99精品中文字幕| 亚洲a∨国产av综合av网站| 91精品aⅴ无码中文字字幕蜜桃| 亚洲成人视频| 交换一区二区三区va在线| 久久激情人妻中文字幕| 亚洲一卡二卡三卡四卡无卡麻豆 | 高清无码一区| 91福利免费| 丰满少妇高潮惨叫正在播放| 91在线观看| 福利视频欧美一区二区三区| 国产成人亚洲综合图区| 久久精品国产亚洲精品2020| 手机在线a视频| 亚州性无码不卡免费视频| 韩国精品视频一区二区在线播放| 99re国产精品视频首页| 日韩国产成人精品视频| 国产女人的高潮大叫毛片| 国产成人av免费观看| 巨胸喷奶水WWW视频网站| 精品人妻潮喷久久久又裸又黄| 狠狠色丁香久久婷婷综合五月| 亚洲av成人久久18禁| 亚洲成人又粗又大又色| 中文字幕第一页国产| 丁香五月天堂| 日本欧美一区二区三区在线播放| 免费国产好深啊好涨好硬视频| 国产国产久热这里只有精品| 欧美啪啪网| 欧美人牲口杂交在线播放免费| 久久99色综合| 亚洲综合AV在线在线播放| 国产成人啪精品午夜网站| 国产丝袜视频| 日韩有码玖玖资源中文字幕人妻不卡|