英偉達(dá)RTX 30系列顯卡性能
本次上市的有三個(gè)型號GPU,分別是GeForce RTX 3070、RTX3080以及RTX3090,總體來看,RTX 30系列顯卡包攬GPU界的多項(xiàng)第一,首款搭載鎂光24G GDDR6X 顯卡的游戲圖形卡,是有史以來最快的存儲(chǔ)裝置;首批支持最新顯示標(biāo)準(zhǔn)HDMI 2.1的PC CPU,能實(shí)現(xiàn)4k高刷新率和運(yùn)行8k游戲;首批帶有AV1解碼器的離散GPU,使用戶能在臺(tái)式機(jī)和媒體中心中使用AV1。
另外,相比于上一代旗艦級顯卡GeForce RTX 2080 Ti,GeForce RTX 3090的性能要強(qiáng)大很多。具體而言,RTX 3090的等效CUDA核心數(shù)為10496個(gè),大約是RTX 2080 Ti的兩倍以上。同前代泰坦一樣,RTX 3090 擁有24G的顯存,但型號從DDR6升級為DDR6X,顯存速度19.6Gbps,顯存位寬384bit。在散熱效率方面,RTX 3090的TDP達(dá)到350W,比前代泰坦增加了100W,這是因?yàn)镽T3090采用了正反雙面風(fēng)扇的散熱設(shè)計(jì)。
另外,RTX 3080等效核心8704個(gè),顯存速度19Gpbs,顯存位寬320bit,TDP320w。RTX 3070 的等效CUDA核心數(shù)為5888,比2080和核心數(shù)多1536顆,同時(shí)前者TDP比后者低30w?;诎才嗉軜?gòu),三項(xiàng)技術(shù)性能翻倍。與上一代RTX不同的是,新一代RTX是基于安培架構(gòu)而非圖靈架構(gòu),這使得GeForce RTX 30 系列顯卡性能得到了提升。
不過,此次發(fā)布的GeForce RTX 30 系列屬于消費(fèi)級顯卡,采用的是三星8nm制程工藝,集成280億個(gè)晶體管。根據(jù)黃仁勛的介紹,RTX GPU 擁有三項(xiàng)基礎(chǔ)處理技術(shù):英偉達(dá)在15年前首次推出的可編程著色器、用于加光線三角形和光線邊界框相交的RT Core,以及稱為Tensor Core的AI處理管線。Tensor Core可加速用于深度神經(jīng)網(wǎng)絡(luò)功能的線性代數(shù),這也是現(xiàn)代AI的基礎(chǔ)所在。尤其是在圖形領(lǐng)域,可以使用Tensor Core通過英偉達(dá)研究多年的DLSS將低分辨率的圖像還原稱高分辨率,從而提高畫面幀率,增強(qiáng)視頻的畫質(zhì)。具體而言,在游戲中增加光線追蹤會(huì)增加計(jì)算工作負(fù)載,使用著色器會(huì)降低幀速率,增加RT core可將著色器工作負(fù)載減少60%。RT Core 實(shí)際上每秒執(zhí)行34 TFLOPS 浮點(diǎn)運(yùn)算的著色器,而在進(jìn)行光線追蹤時(shí),圖靈相當(dāng)于每秒執(zhí)行45 TFLOPS浮點(diǎn)運(yùn)算。即使是使用RT Core ,也要消耗大量時(shí)間,因此RT Core和著色器必須同時(shí)運(yùn)行。同時(shí)使用時(shí),即使是20毫秒,每秒也只有50幀,這對前幾代產(chǎn)品而言,性能仍然落后,例如,2018年,英特爾基于圖靈架構(gòu)的GeForce RTX 20系列GPU就在光線追蹤方面引起過許多爭議。不過,要是加上Tensor Core,就可以實(shí)現(xiàn)高分辨率和高幀率,TRX的性能得以提升。
黃仁勛表示,新款RTX GPU 基于安培架構(gòu)在性能方面實(shí)現(xiàn)了巨大飛躍,安培架構(gòu)每個(gè)時(shí)鐘執(zhí)行2次著色器計(jì)算,執(zhí)行一次著色器算力為30 TFLOPS ,圖靈架構(gòu)為11,安培架構(gòu)翻倍了吞吐量。另外,安培架構(gòu)的RT Core可達(dá)58 RT TFLOPS,圖靈架構(gòu)為34。安培架構(gòu)全新的Tensor Core硬件處理稀疏網(wǎng)絡(luò)的速率是圖靈的兩倍,可自動(dòng)識(shí)別并忽略次要的DNN權(quán)重,相較于圖靈 tensor Core 的89tensor TFLOPS ,安培為238。在這三項(xiàng)基礎(chǔ)技術(shù)上,新一代RTX性能提升均為上一代的兩倍。搭配新工具,游戲愛好者的新選擇。除了新一代圖像顯卡,英偉達(dá)還推出了Nvidia Reflex、Nvidia Broadcast、Omniverse Machinima和圖像增強(qiáng)工具DLSS 2.0,這對游戲玩家而言意味著更優(yōu)質(zhì)的畫面、更低的延遲以及更安靜的環(huán)境。
黃仁勛表示,Nvidia Reflex可在CPU和GPU中優(yōu)化渲染管道,最多可將延遲時(shí)間減少50%,該項(xiàng)工具將同Game Ready Driver一起推出。Nvidia Broadcast可以實(shí)現(xiàn)虛擬背景和音頻降噪,還可以實(shí)時(shí)追中主播頭部,讓主播居于畫面正中央。Omniverse Machinima是一款面對動(dòng)畫特效制作人員的動(dòng)畫制作專業(yè)軟件,支持Maya、3D max等主流動(dòng)畫軟件。在光追技術(shù)方面,黃仁勛表示,“現(xiàn)在,全球排名前二的最受歡迎游戲,《我的世界》和《堡壘之夜》,都已支持光追。”
另外,英偉達(dá)還宣布推出專為電競設(shè)計(jì)的擁有360Hz刷新率 G-SYNC顯示器,內(nèi)置精確的延遲分析工具,今年秋天宏基、華碩、微星、外星人等品牌將上市這款顯示器。在英偉達(dá)的測試比較中,360Hz顯示器能夠幫助玩家更好地定位和追蹤對手。
總體看來,RTX 30系列顯卡的性能強(qiáng)勁,如此性能強(qiáng)大的游戲顯卡,簡直就是游戲愛好者的福音。