一、前言:性價比爆棚的GeForce RTX 40 SUPER系列顯卡
新一代的Ada Lovelace架構帶來了令人咋舌的能效比,RTX 40系列顯卡在性能相同的情況下,功耗只有上代一半甚至更低,只是價格并不是那么親民。
2024年1月9日,NVIDIA發布了GeForce RTX 40 SUPER系列顯卡,包括RTX 4070 SUPER、RTX 4070 Ti SUPER和RTX 4080 SUPER三款型號。
其中RTX 4070 SUPER以4899元的售價提供了接近于RTX 4070 Ti的性能;
而RTX 4070 Ti SUPER售價與RTX 4070 Ti同為6499元,但性能與9499元的RTX 4080相差無幾;
至于RTX 4080 SUPER,它在規格大幅度提升的情況下,將售價降到了8099元,比起RTX 4080足足便宜了1400元。
新一代RTX 40系列SUPER GPU的到來,瞬間讓NVIDIA顯卡性價比爆棚!
完整的AD104核心
RTX 4070 SUPER使用了與RTX 4070(Ti)相同的AD104核心。
完整的AD104核心共有7680個CUDA核心(分為5組GPC/30組TPC/60組SM)、240個第四代Tensor Core張量核心、60個第三代RT Core光追核心、240個紋理單元、80個ROP單元、3MB一級緩存、48MB二級緩存。
AD104-350核心(RTX 4070 SUPER)
RTX 4070 SUPER做了部分精簡,依然是5組GPC,只是將其中2組中的6個TPC減到了5個,也就是5組GPC、28個TPC、7168個流處理器、228個Tensor Core、56個RT Core、80個ROP單元、36MB二級緩存。
除了二級緩存之外,其他規格削減不到7%,而顯存規格維持不變,可以想象,它的性能會非常接近RTX 4070 Ti。
RTX 4070 SUPER的詳細規格參數如下:
二、圖賞:與RTX 4070長一樣 6+3相供電電路
包裝盒和RTX 4070公版差不多,區別在于原來是白字,現在改成了黑色字體。
開箱。
上面是RTX 4070 SUPER,下面是RTX 4070,長相也幾乎一模一樣,差別在于4070的金屬條是銀灰色,4070 SUPER是深黑色,而且還能反光。
背面。
依然是16Pin供電接口,不過功耗很低,完全不用擔心燒化接口的情況。
3個DP1.4和1個HDMI 2.1接口。
沒有用均熱板,和RTX 4070一樣,都是銅底+熱管的散熱設計。
依舊是RTX 4070的PCB版,非常mini,改造成ITX版型也不難。
6+3相供電電路設計,雖然簡單,但也足夠應付220W的TGP。
這是RTX 4070的PCB板,對比一下,二者區別在于RTX 4070多一個空焊位,也就是少一相供電。
PCB板背面。
RTX 4070 SUPER采用的是AD104-350核心,芯片面積295mm2,擁有358億晶體管。
GPU旁邊是6顆美光GDDR6X顯存,單顆2GB,總容量12GB,等效頻率21GHz,帶寬504GB/s。
三、理論性能測試:3DMark運行頻率可達2805MHz
測試平臺如下:
1、3DMark Fire Strike
在2K分辨率3DMark Fire Strike Extreme測試中,RTX 4070 SUPER圖形分數達到了24185分,核心溫度最高68℃,熱點溫度最高85℃,核心運行最高頻率為2805MHz,最高風扇轉速1397PM,整卡最高功耗222W。
在4K分辨率3DMark Fire Strike Ultra測試中,RTX 4070 SUPER圖形分數達到了12112分,核心溫度最高69℃,核心運行最高頻率為2805MHz,最高風扇轉速1397RPM,最高功耗222W。
2、3DMark Time Spy
在2K分辨率3DMark Time Spy測試中,RTX 4070 SUPER圖形分數達到了20649分,核心溫度最高753℃,核心運行最高頻率為2790Hz,最高風扇轉速2028RPM,最高功耗223W。
在4K分辨率3DMark Time Spy Extreme測試中,RTX 4070 SUPER圖形分數達到了9948分,核心溫度最高74℃,核心運行最高頻率為2790Hz,最高風扇轉速13990RPM,最高功耗224W。
四、1080P游戲性能測試:與RTX 3090 Ti旗鼓相當
1、刺客信條:英靈殿
2、地平線:零之曙光
3、孤島驚魂5
4、孤島驚魂6
5、古墓麗影:暗影
6、霍格沃茨之遺
7、極限競速:地平線5
8、賽博朋克2077
9、巫師3
10、無主之地3
11、星空
12、戰爭機器5
測試結果匯總如下:
在1080P分辨率下,RTX 4070 SUPER的性能與RTX 3090 Ti不相上下,差距僅有1%。比起RTX 4070強了13%,和RTX 4070 Ti相比就差了3%。
六、2K性能測試:強于RTX 3080 Ti
1、刺客信條:英靈殿
2、地平線:零之曙光
3、孤島驚魂5
4、孤島驚魂6
5、古墓麗影:暗影
6、霍格沃茨之遺
7、極限競速:地平線5
8、賽博朋克2077
9、巫師3
10、無主之地3
11、星空
12、戰爭機器5
測試數據匯總如下:
2K分辨率下,RTX 4070 SUPER依然比RTX 3080 Ti強2%,與RTX 4070相比,也有14%的優勢,但是比RTX 4070 Ti則有5%的差距。
此外我們還測試了4K分辨率下的成績,匯總如下:
由于192Bit顯存位寬的關系,RTX 4070 SUPER在4K分辨率下的性能會明年不如RTX 3080 Ti,但大多數游戲依舊能保持60FPS以上的幀率。
我們測試的12款3A大作,有3款幀率低于60FPS,但這幾款游戲都支持DLSS 3,開啟之后幀率會有翻倍提升。
六、Stable Diffusion體驗:TensorRT加持 生圖速度提升350%
2023年9月,NVIDIA推出了用于Stable Diffusion Web UI 的TensorRT 加速插件,能讓具備Tensor單元的GeForce顯卡在Stable Diffusion Web UI中獲得翻倍的性能。
本次我們將對比SDXL加速方法與PyTorch xFormers(常規加速方法)的性能差異。
我們生成10張太空大戰圖像,分辨率1024*1024,使用PyTorch xFormers加速時,耗時9分17秒。
使用SDXL加速之后,耗時僅為2分02秒,性能提升350%。
從終端中也可以看到,RTX 4070 SUPER使用默認加速器時,生圖速度只有1.1it/s,而在TensorRT加持下,生圖速度猛然提升到了4.50it/s。
七、DLSS 3游戲測試之一:3款DLSS 3游戲
此次我們一共測試了6款游戲,包括3款支持DLSS 3的游戲:《3DMark》、《毀滅全人類》、《燕云十六聲》。
另外還有3款同時支持DLSS與光追的游戲:《光明記憶》:《生死輪回》、《賽博朋克2077》。
所有DLSS 3以及光追測試都是在2K分辨率下進行。
1、DLSS3 測試--燕云十六聲
《燕云十六聲》是一款開放世界中國風武俠動作游戲,畫質精良,號稱國產3A破陣制作。目前這款游戲還處于內測階段。
這款游戲于日前推送了對于DLSS 3支持的更新,下面我們來看看RTX 4070 SUPER SUPER的表現,測試分辨率為2560*1440,畫質選項為“超高”。
默認超高畫質下,游戲幀率為91FPS。
開啟DLSS 2(性能模式)之后,幀率達到了146FPS,提升了60%。
打開DLSS 3(插幀)之后,幀率來到了198FPS,相比默認畫質幀率提升了117%。
2、3DMark
DLSS 2模式下幀率為140FPS,比默認的65FPS提升了133%。
DLSS 3的成績為150FPS,相比默認提升了150%。
3、毀滅全人類2:重新探測
最高畫質下,RTX 4070 Ti的幀率為131FPS。
開啟DLSS 3之后,幀率來到了242FPS,近乎翻倍。
八、DLSS 3游戲測試之二:3款支持DLSS 3的光追游戲
1、光明記憶:無限
開啟RTX時,游戲的幀率為109FPS。
開啟DLSS 3之后,幀率提升到了235FPS,提升了116%。
2、生死輪回
開啟光追之后,游戲的幀率僅有65FPS。
打開DLSS 3之后,幀率提升到了195FPS,提升幅度為195%。
3、賽博朋克2077
開啟光追時,幀率為40FPS。
這是DLSS 3的畫面,與原生畫面的差距難以分辨,但是幀率提升到了155FPS。
九、功耗測試:2K游戲平均功耗僅為3080 Ti的62%
將Furmark的參數設定為1920*1200分辨率、0AA。
運行13分鐘之后,RTX 4070 SUPER的溫度穩定在74度附近,功耗穩定在220W,烤機時GPU頻率為1620MHz,CPU風扇轉速只有2153RPM。
2)、真實游戲功耗測試
1、GTA V
這是1080P分辨率。RTX 4070 SUPER功耗126W,溫度53度。
2K分辨率下,RTX 4070 SUPER功耗164W。
2、絕地求生
1080P分辨率下,RTX 4070 SUPER功耗203W,溫度689度,運行頻率2760MHz。
2K分辨率下,RTX 4070 SUPER0功耗212W。
3、古墓麗影:暗影
1080P分辨率下,RTX 4070 SUPER的功耗為207W。
2K分辨率下,RTX 4070 SUPER功耗是212W,運行頻率2745MHz,溫度64度。
測試數據匯總如下:
在1080P分辨率下,RTX 4070 SUPER在3A游戲中的平均功耗不到200W,2K分辨率也只有207W;就算是到了4K分辨率,平均功耗也只有214W,僅相當于RTX 3080 Ti的62%。
十、總結:堪稱業界良心
本次測試小結如下:
1、AI性能
即使沒有TensorRT 加速插件,RTX 40系列GPU也是Stable Diffusion畫圖首選,而今在TensorRT加持下,RTX 4070 SUPER的生圖速度在原有基礎上提升了350%,這樣的表現相信是不會再有任何競爭對手了。
2、1080P游戲性能
我們所測的12款游戲,除了《星空》之外 ,剩余11款游戲RTX 4070 SUPER的幀率全部都超過了160FPS,就連顯卡殺手《賽博朋克2077》也有169FPS。
就性能而言,1080P分辨率下,RTX 4070 SUPER幾乎能與RTX 3090 Ti并駕齊驅,相比RTX 3080 Ti強了6%,比RTX 4070則強了13%,和4070 Ti的差距只有3%。
3、2K游戲性能
2K分辨率下,同樣是除了《星空》之外,RTX 4070 SUPER在其他11款游戲中都能保持120FPS以上的幀率。
在2K分辨率下,RTX 4070 SUPER依舊能比RTX 3080 Ti強2%,不過和RTX 4070 Ti的差距也拉大到了5%,比起RTX 4070則強了15%左右。
另外,我們也測試了4K,RTX 4070 SUPER在此分辨率下幀率會有較大損失,不過在絕大部分游戲中依舊能夠跑出60FPS以上的幀率。
少數幾款顯卡殺手游戲雖然幀率只有50PFS左右,但好在這些游戲都支持DLSS 3,開啟之后幀率甚至能突破100FPS。
4、功耗
我們測試了6款3A大作的真實游戲功耗,在1080P分辨率下,RTX 4070 SUPER的平均功耗是192W,而RTX 3080 Ti是312W。
2K分辨率下,RTX 4070 SUPER在6款游戲中的平均功耗是207W,RTX 3080 Ti則是332W。
4K分辨率下,RTX 4070 SUPER在6款游戲中的平均功耗為214W,RTX 3080 Ti則已經跑到了350W的TGP上限。
5、DLSS 3和光追
目前能玩的DLSS 3游戲多達數十款,我們測試了6款。
在開啟DLSS 2之后,游戲幀率平均提升幅度為107%。打開DLSS 3,游戲幀率平均提升幅度達到了159%。
如今的NVIDIA GPU早已不是單純的游戲顯卡,特別是在AI應用方面,有了SDXL,能將Stable Diffusion生圖速度提升4倍左右,讓原本已經大幅度領先對手的N卡徹底無敵。
至于價格,4899元就能買到一塊1080P性能堪比RTX 3090 Ti、2K性能強于RTX 3080 Ti的顯卡,同時游戲功耗僅有200W左右,堪稱業界良心。
RTX 4070 SUPER只是開始,接下來的RTX 4070 Ti SUPER和RTX 4080 SUPER將會帶來更多的驚喜。
NVIDIAGeForceRTX40SIUPER系列現已上市,請到京東DIYSUPER超能年貨節上選購GeForceRTX4070SUPER/4080SUPER公版和合作伙伴顯卡。
審核編輯:劉清
-
NVIDIA
+關注
關注
14文章
5188瀏覽量
105436 -
流處理器
+關注
關注
1文章
45瀏覽量
9482 -
CUDA
+關注
關注
0文章
122瀏覽量
14005 -
GPU芯片
+關注
關注
1文章
304瀏覽量
6085
原文標題:2024年的第一張良心顯卡!RTX 4070 SUPER首發評測
文章出處:【微信號:hdworld16,微信公眾號:硬件世界】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
NVIDIA RTX 4500 Ada與NVIDIA RTX A5000的對比
NVIDIA JetPack 6.2引入Super模式

技嘉科技發布GeForce RTX 5090 D 和RTX 5080系列顯卡

英偉達 RTX 5090 顯卡 3DMark 跑分曝光
$1999 的 RTX 5090 來了

機械革命與NVIDIA聯手首發RTX 50系列游戲本
倒反天罡!RTX 5080首發登場、RTX 5090/5090D得再等等

影馳 RTX 4070 Ti SUPER 星曜OC,領略《使命召喚:黑色行動6》戰場的震撼

《黑神話:悟空》潮流來了!Nvidia GPU 合作伙伴推出八款全新 RTX 40 Super 顯卡

英偉達推出搭載GDDR6顯存的GeForce RTX 4070顯卡
TecLab和Paulo Gomes聯手改建RTX 4070 Ti Super顯卡,性能超越RTX
CMOS四路異或與異或非門CD4070B CD4077B 數據表

評論