NVIDIA Ada Lovelace架構(gòu)的RTX 40系GPU繼續(xù)朝向縱深的主流市場(chǎng)延伸,繼RTX 4090、RTX 4080和RTX 4070系先后布局了4K+及1440p游戲市場(chǎng)之后,面向當(dāng)前最為主流的1080p游戲市場(chǎng)的RTX 4060系GPU也在這個(gè)5月全面發(fā)布,而且NVIDIA一口氣發(fā)布了三款“60”家族的產(chǎn)品——GeForce RTX 4060 Ti 16GB、RTX 4060 Ti 8GB和RTX 4060。
相較于7月才會(huì)正式上市的GeForce RTX 4060 Ti 16GB和RTX 4060來說,RTX 4060 Ti 8GB將在5月下旬正式上市銷售。按照NVIDIA的構(gòu)想,RTX 4060系GPU將在1080p全特效光追游戲的市場(chǎng)上找到屬于自己的位置,并取代當(dāng)前的RTX 3060系級(jí)更老的RTX 2060系GPU完成產(chǎn)品的換代更迭。那么,RTX 4060系是否有這個(gè)實(shí)力扛旗前進(jìn),為RTX 40系GPU在主流級(jí)游戲市場(chǎng)上繼續(xù)開疆辟土呢?先上市的RTX 4060 Ti 8GB或許能告訴我們一些答案。
NVIDIA對(duì)RTX 40系GPU的游戲市場(chǎng)定位布局還是比較清晰的,最初面世的頂級(jí)產(chǎn)品RTX 4090和RTX 4080毫無(wú)疑問是主打4K+全特效游戲市場(chǎng),而之后的RTX 4070系則主打1440p@100fps+的全特效光追游戲市場(chǎng)。那么按照系列的傳承邏輯,RTX 4060系GPU自然就應(yīng)該是應(yīng)對(duì)1080p分辨率的主流級(jí)游戲市場(chǎng)。在目前這個(gè)市場(chǎng)上,核心戰(zhàn)力還是RTX 3060 Ti、RTX 3060以及RTX 2060 SUPER等產(chǎn)品,RTX 4060系GPU的主要目標(biāo)之一無(wú)疑是完成基于這些前一代甚至前兩代GPU的游戲升級(jí),從RTX 20系、30系的“60”家族,進(jìn)化到RTX 40系的“60”家族,為有此需求的游戲玩家?guī)碛螒蝮w驗(yàn)的一波新定義升級(jí)——全特效、高光追的1080p@100fps+游戲,這就是RTX 4060系GPU的核心目標(biāo)。而對(duì)于首發(fā)的RTX 4060 Ti 8GB GPU來說,按照NVIDIA官方對(duì)其的定位,其主要特色在于性能相較 RTX 3060Ti GDDR6提升 15%~70%(DLSS 3),相較 2060 SUPER 提升60%-160%(DLSS 3),同時(shí)得益于32MB大容量L2緩存的配置,CUDA核心、光追核心的執(zhí)行效率也更高,能為玩家?guī)?080p分辨率下的高幀率、低延遲優(yōu)秀游戲體驗(yàn)。同時(shí)在AI內(nèi)容和設(shè)計(jì)創(chuàng)作上,也有非常明顯的加速效果。因此對(duì)主流消費(fèi)群體來說,它算是一款真正意義上的甜點(diǎn)級(jí)產(chǎn)品。
RTX 4060 Ti GPU核心解析
核心架構(gòu)全面進(jìn)化
作為首發(fā)上市的“60”家族成員,RTX 4060 Ti GPU在架構(gòu)上是完全傳承了RTX 40系GPU Ada Lovelace核心的全部精髓。采用第三代光追核心和第四代AI核心設(shè)計(jì),第三代 RT Cores 的有效光線追蹤計(jì)算能力達(dá)到 191 TFLOPS,是上一代產(chǎn)品 2.8 倍。新的 Tensor Cores 新增 FP8 引擎,具有高達(dá) 1.32 petaflops 的張量處理性能,超過上一代的5倍。
同時(shí),在SM單元的設(shè)計(jì)上也是全新進(jìn)化,效率達(dá)到了上一代的2倍。RTX 40系GPU所支持的著色器執(zhí)行重排序SER可以重新調(diào)度著色器的工作排序,從而避免部分著色器在等待中浪費(fèi)算力和電能,以獲得更好的效率和性能。著色器執(zhí)行重排序 SER 為光線追蹤帶來最高可達(dá) 3 倍的性能提升,整體游戲性能提升可高達(dá) 25%以上。
DLSS 3與OFA光流加速器
基于Ada光流加速器的DLSS 3最高可帶來相對(duì)于DLSS 2達(dá)2 倍的性能提升,使 DLSS 3 能夠預(yù)測(cè)場(chǎng)景中幀和幀之間的運(yùn)動(dòng)變化,使神經(jīng)網(wǎng)絡(luò)能夠在保持圖像質(zhì)量的同時(shí)提高幀率。DLSS 3 技術(shù)支持 GeForce RTX 40 系列 GPU,它包括 3 個(gè)功能:幀生成技術(shù)、超分辨率(DLSS 2 的關(guān)鍵創(chuàng)新)和 NVIDIA Reflex。開發(fā)者只需整合 DLSS 3,即可默認(rèn)支持 DLSS 2。
為DLSS 3優(yōu)化,更高效的GPU存儲(chǔ)系統(tǒng)設(shè)計(jì)
GPU的存儲(chǔ)系統(tǒng)整體由L1緩存、L2緩存、顯存(位寬、帶寬、頻率)以及系統(tǒng)內(nèi)存四部分組成。
▲L1緩存位于SM單元內(nèi),與CUDA核心幾乎是一體的。
▲L2緩存,位于RTX 40系GPU芯片內(nèi),通過高速總線橋梁與SM單元(GPC)通信,由所有SM單元共享。
▲顯存位于顯卡的PCB板上,通過顯存控制器總線與GPU核心通信。
GPU在工作時(shí)需要頻繁且有效地訪問數(shù)據(jù),數(shù)據(jù)訪問越快、越準(zhǔn)確,那么GPU所表現(xiàn)出來的游戲或創(chuàng)作性能就越高。在RTX 40系GPU的每個(gè)SM單元內(nèi)都存在一個(gè)超低延遲的L1緩存,這是CUDA核心、AI核心和光追核心在進(jìn)行計(jì)算時(shí)的數(shù)據(jù)訪問首選項(xiàng),理論速度上它是最快的。但由于L1緩存位于SM單元內(nèi),因此不可能設(shè)計(jì)得非常大(空間、散熱與成本的綜合考慮)。
如果GPU的核心在L1中訪問不到所需要的運(yùn)算數(shù)據(jù),那么就會(huì)轉(zhuǎn)向L2緩存中尋找,在L2緩存中如果找到了所需數(shù)據(jù),則會(huì)直接調(diào)用到GPU內(nèi)核,這叫緩存信息命中。反之,如果在L2緩存中仍然找不到數(shù)據(jù)(緩存信息缺失),那么就要由GPU的顯存控制器通過顯存總線接口去訪問GPU外部更大容量的顯存,這一速度是遠(yuǎn)低于訪問GPU內(nèi)部緩存的,而且產(chǎn)生了額外的工作流程。相比L1、L2緩存的信息訪問而言,在性能和功耗效率上都大大降低了。
▲傳統(tǒng)GPU的存儲(chǔ)系統(tǒng)設(shè)計(jì)中,如果在較低的L2緩存設(shè)計(jì)下,訪問未命中的情況會(huì)比較多(圖中紅色部分),此時(shí)這些訪問未命中的數(shù)據(jù)就需要通過總線接口到顯存(VRAM)中尋找,速度大大降低。如果顯存中仍然未找到需要的數(shù)據(jù),那么就要通過系統(tǒng)總線去訪問系統(tǒng)內(nèi)存,并復(fù)制到顯存中進(jìn)行調(diào)用,這一過程是效率最低的。
▲RTX 40系GPU上,L2緩存容量得到了極大增強(qiáng),RTX 4060 Ti GPU配置了32MB的大容量緩存,大大提高了L2緩存中的訪問命中率。因此在相同甚至更低的顯存帶寬下,大容量的L2緩存設(shè)計(jì)能有效提升GPU核心的效率,表現(xiàn)在游戲性能上就是大幅度提升了游戲幀率。
簡(jiǎn)單來講,更高的L2緩存設(shè)計(jì)能極大提升GPU的數(shù)據(jù)訪問命中率,從而讓GPU核心能在整體顯存帶寬和容量成本控制上有更大的冗余空間,且擁有更高的效率。尤其是對(duì)于DLSS 3來說,更大的L2緩存也在很大程度上提升了DLSS 3的執(zhí)行效率,對(duì)整體游戲性能的表現(xiàn)提升有著巨大貢獻(xiàn)。
更多的GPU存儲(chǔ)系統(tǒng)控制理論在這里我們就不贅述了,后續(xù)我們會(huì)專門出一篇相關(guān)的技術(shù)解析文章為讀者解惑。
新一代NVIDIA編碼器(NVENC)
RTX 40系GPU全部采用了第八代NVENC編碼器的配置,能夠?qū)?a target="_blank">視頻導(dǎo)出時(shí)間至多縮短一半,并支持 AV1 編碼。OBS、Blackmagic Design DaVinci Resolve、Discord 以及更多公司都已在采用 NVENC AV1 編碼器。RTX 4060 Ti也搭配了第八代NVENC編碼器和第五代NVDEC解碼器。
更強(qiáng)的Studio性能
除了游戲性能之外,RTX 40系GPU也是用于內(nèi)容創(chuàng)作的優(yōu)秀GPU,在加速3D設(shè)計(jì)創(chuàng)作、視頻剪輯處理和AI計(jì)算方面,都有非常不錯(cuò)的表現(xiàn)。
同時(shí)嗎,專用的NVIDIA Studio Driver在頂級(jí)創(chuàng)意應(yīng)用上經(jīng)過全面測(cè)試,能夠最大限度地提高可靠性,比如:
●主播可以用支持AV1的全新第八代編碼器來提高現(xiàn)場(chǎng)直播質(zhì)量,利用 NVIDIA Broadcast AI
特效改善麥克風(fēng)和網(wǎng)絡(luò)攝像頭,并進(jìn)入AI驅(qū)動(dòng)的 VTubing。
●得益于RTX 40 系列的雙編碼器和高達(dá)2倍的AI工具性能,視頻編輯的輸出速度最高可提升2倍。
●得益于第三代RT Core、SER、DLSS 3和NVIDIA Omniverse,3D 設(shè)計(jì)創(chuàng)作者可以在4K@60fps 下進(jìn)行創(chuàng)作。
●Modder可以重制經(jīng)典游戲,并通過RTX Remix開啟RTX。
AD106核心,1080p游戲設(shè)計(jì)優(yōu)化
▲完整版AD106核心(上)、RTX 4060 Ti 采用的AD106-350核心(中)、7月將會(huì)上市的RTX 4060所采用的AD106核心(下)。
從規(guī)格上來看,本次測(cè)試的主角RTX 4060 Ti 8GB FE采用的是代號(hào)為AD106的Ada Lovelace核心。完整版的AD106擁有三個(gè)完整的GPC,36個(gè)SM模組。RTX 4060 Ti的設(shè)計(jì)則去掉了一個(gè)GPC中的2個(gè)SM模組,共有三個(gè)GPC、34個(gè)SM模組。因此,RTX 4060 Ti 8GB FE配置了34個(gè)第三代光追核心和136個(gè)第四代AI核心,擁有4352個(gè)CUDA核心。同時(shí),GPU配置了4個(gè)32bit的16Gb GDDR6顯存控制器(每個(gè)控制器控制2GB顯存),實(shí)現(xiàn)了128bit的顯存帶寬和8GB GDDR6顯存容量配置,整體顯存帶寬為288GB/s。與RTX 4070相比,硬件規(guī)格上的差距約35%。
和前一代的RTX 3060 Ti FE相比,RTX 4060 Ti 8GB FE在CUDA核心數(shù)和顯存位寬上都有所落后,不過在L2緩存容量上達(dá)到了前者的8倍之多,結(jié)合更高效的SM單元和更高的核心頻率,因此在游戲運(yùn)行效率上有望超越RTX 3060 Ti不少。再加上DLSS 3的支持,RTX 4060 Ti 8GB FE的游戲性能表現(xiàn)還是可以期待的。
TGP設(shè)計(jì)為160W的GeForce RTX 4060 Ti 8GB FE在外觀尺寸上與RTX 4070 FE保持了一致,仍然是非常輕盈的“小卡”設(shè)計(jì),而且傳承了RTX 40系公版顯卡的風(fēng)格——X形的金屬中框搭配正反交錯(cuò)的散熱風(fēng)扇,而散熱片仍然是外露的分布式散熱片。不過與RTX 4070 FE不同的是,在金屬中框部分的顏色由RTX 4070 FE的香檳銀色改為了亮銀色,以與RTX 4070 FE在外觀上有一個(gè)顯眼的區(qū)隔。
▲整體設(shè)計(jì)樸素大方,沒有RGB燈效,非常素雅。
▲RTX 40系的特色標(biāo)配——ATX 3.0電源規(guī)范支持的PCIe 5.0 16Pin 12VHPWR接口供電接口。
▲輸出接口部分仍然是3DP 1.4a+1 HDMI 2.1的組合
NVIDIA GeForce RTX 4060 Ti Founders Edition(8GB)產(chǎn)品參數(shù)
核心架構(gòu):Ada Lovelace
核心代號(hào):AD106-350
制程工藝:TSMC 4N定制
SM單元:34
CUDA核心數(shù)(流處理器):4352
光追核心數(shù)(RT Cores):34
AI核心數(shù)(Tensor Cores):136
核心頻率:2310MHz~2535MHz
顯存容量:8GB GDDR6
顯存速率:16Gbps
顯存位寬:128bit
顯存帶寬:288GB/s
支持DLSS版本:DLSS 3
TGP:160W
建議搭配電源額定功率:550W
顯卡厚度:雙槽
首發(fā)參考價(jià)格:3199元
性能實(shí)測(cè)
傳統(tǒng)游戲性能超RTX 3060 Ti 15%左右,DLSS 3作用下增幅巨大
接下來讓我們進(jìn)入實(shí)測(cè)環(huán)節(jié)。在這一環(huán)節(jié)中,我們將主要考察GeForce RTX 4060 Ti 8GB FE顯卡在游戲性能和設(shè)計(jì)創(chuàng)作性能兩大方面的實(shí)際表現(xiàn)。綜合玩家的實(shí)際情況與顯卡升級(jí)的需求,我們將前一代的GeForce RTX 3060 Ti FE(8GB GDDR6)、RTX 3070(8GB GDDR6,替代我們手中暫時(shí)沒有的RTX 3060 Ti GDDR6X版本,二者性能比較接近,RTX 3070 FE略強(qiáng)一點(diǎn))以及更前一代的圖靈核心的GeForce RTX 2060 SUPER納入了對(duì)比參考測(cè)試的范疇,主要是看看對(duì)還在使用RTX 2060 SUPER這類老顯卡的用戶來說,從RTX 20系的“60”家族升級(jí)到RTX 40系的“60”家族,能帶來多大的性能提升。
測(cè)試平臺(tái)
GPU:NVIDIA GeForce RTX 4060 Ti 8GB FE、RTX 3070 FE、RTX 3060 Ti FE、RTX 2060 SUPER FE
主板:英特爾Z790
內(nèi)存:影馳名人堂DDR5 6000 32GB
電源:鑫谷昆侖冰山1250W(ATX 3.0)
顯示器:戴爾UP3218K(7680×4320@60Hz)
操作系統(tǒng):Windows 11 Pro 22H2
顯卡驅(qū)動(dòng):NVIDIA Game Ready Driver 531.93
傳統(tǒng)游戲性能測(cè)試
先來看下在非DLSS 3的傳統(tǒng)游戲環(huán)境下,RTX 4060 Ti 8GB FE會(huì)有怎樣的性能表現(xiàn)。在這部分測(cè)試中,我們主要目的是考察在不開啟DLSS 3的狀態(tài)下,GeForce RTX 4060 Ti 8GB FE的游戲性能。測(cè)試選取了當(dāng)前比較熱門的共16款游戲大作,來檢驗(yàn)RTX 4060 Ti 8GB FE在1440p和1080p分辨率下的具體表現(xiàn)。游戲統(tǒng)一設(shè)置為最高畫質(zhì)和最高光追效果,DLSS模式統(tǒng)一設(shè)置為“平衡”。
在3DMark理論性能測(cè)試部分,RTX 4060 Ti 8GB FE領(lǐng)先RTX 3060 Ti FE約13%,領(lǐng)先RTX 2060 SUPER FE近60%。在與RTX 3070 FE的比較中,RTX 4060 Ti 8GB FE平均性能落后約3%。
與前一代的對(duì)位產(chǎn)品RTX 3060 Ti FE相比,無(wú)論是1080p分辨率還是1440p分辨率,RTX 4060 Ti 8GB FE的性能都領(lǐng)先15%~18%,表現(xiàn)還是比較不錯(cuò)的。而與更前一代的圖靈核心的RTX 2060 SUPER FE相比,RTX 4060 Ti 8GB FE的整體游戲性能領(lǐng)先更是達(dá)到了75%以上,這無(wú)疑大大增添了從RTX 2060 SUPER升級(jí)到RTX 4060 Ti的價(jià)值。
同時(shí)我們可以看到,在最高畫質(zhì)、最高光追特效設(shè)置下,開啟DLSS之后,RTX 4060 Ti 8GB FE幾乎在所有游戲中都實(shí)現(xiàn)了60fps+的流暢游戲水平,在半數(shù)以上的游戲中甚至都達(dá)到了100fps+的絕對(duì)流暢游戲水平線,表現(xiàn)不錯(cuò)。
從實(shí)際游戲的測(cè)試情況來看,RTX 4060 Ti 8GB FE在所有游戲的綜合測(cè)試結(jié)果中性能表現(xiàn)基本與RTX 3070 FE相差不大,綜合差距在2%左右。在不開啟DLSS時(shí),RTX 4060 Ti 8GB FE整體綜合成績(jī)略略遜色于RTX 3070,開啟DLSS之后則略微領(lǐng)先,也說明第四代AI核心在DLSS的執(zhí)行效率上要強(qiáng)于RTX 30系所配置的第三代AI核心。
RTX 4060 Ti 8GB FE與RTX 3070 FE的紙面規(guī)格差距比較大,二者在核心規(guī)模,包括CUDA、AI和光追核心的數(shù)量上存在35%以上的差距,而且顯存位寬也相差一倍。我們?cè)跍y(cè)試前曾想過RTX 4060 Ti 8GB FE相比RTX 3070 FE是否會(huì)有明顯的領(lǐng)先優(yōu)勢(shì),測(cè)試結(jié)果顯示二者的傳統(tǒng)游戲性能基本相當(dāng),還讓我們感覺略有一點(diǎn)點(diǎn)意外。不過在核心規(guī)格相差35%的硬條件前提下,RTX 4060 Ti 8GB FE表現(xiàn)出與RTX 3070 FE跨代次與檔次而持平的性能,仔細(xì)想想,這也是可以接受的吧。何況它的首發(fā)價(jià)格也只是399美元而已,遠(yuǎn)低于RTX 3070的首發(fā)價(jià)格499美元。
DLSS 3,性能跨越提升的主要價(jià)值
光追游戲環(huán)境目前來看肯定是已經(jīng)成為未來游戲大作的發(fā)展主流,目前已經(jīng)有超過300款游戲和應(yīng)用提供了對(duì)DLSS的支持,而且已經(jīng)有超過30款的游戲和應(yīng)用已經(jīng)實(shí)現(xiàn)了對(duì)DLSS 3的支持。從近期推出的各類熱門游戲大作來看,對(duì)實(shí)時(shí)光線追蹤的支持已經(jīng)占據(jù)了游戲發(fā)展趨勢(shì)的主流。而為了在全特效+高光追的極致環(huán)境中流暢游戲,NVIDIA賦予RTX 40系GPU的正是DLSS 3。
在之前的多次首發(fā)評(píng)測(cè)中,我們都再三提到了RTX 40系GPU的這一秘密黑科技武器。現(xiàn)在有不少玩家還認(rèn)為DLSS 3只是RTX 40系GPU的一個(gè)“添頭”,它只存在附加價(jià)值,而不是GPU本身的硬件性能表現(xiàn)。在衡量顯卡綜合性能乃至綜合性價(jià)比時(shí),不能成為其中的加分項(xiàng)或參考水平,甚至很多玩家根本對(duì)其無(wú)視。
其實(shí)我們對(duì)此倒是有一些不同的看法。DLSS 3作為RTX 40系GPU的黑科技武器,正如我們之前在多次測(cè)試中再三強(qiáng)調(diào)過的一樣——它是GPU自身的價(jià)值體現(xiàn)之一,也是在綜合衡量GPU性能時(shí)的重要參考指數(shù)。支持DLSS幀生成功能,這就是RTX 40系GPU的一項(xiàng)巨大優(yōu)勢(shì),也是它相較于前兩代光追GPU及與競(jìng)爭(zhēng)對(duì)手產(chǎn)品進(jìn)行市場(chǎng)競(jìng)爭(zhēng)時(shí)的重要閃光點(diǎn)。
在DLSS 3的性能測(cè)試部分,我們選取了8款目前支持DLSS 3的熱門游戲大作在RTX 4060 Ti 8GB FE顯卡上進(jìn)行了詳細(xì)測(cè)試。
毫無(wú)意外,DLSS 3再一次表現(xiàn)出了超強(qiáng)的游戲性能提升效果。相對(duì)于關(guān)閉DLSS的游戲環(huán)境,開啟DLSS 3之后,游戲幀率都獲得了100%以上的提升,部分游戲中的提升幅度甚至超過了200%。相比不開啟幀生成功能的DLSS 2而言,游戲幀率的提升也達(dá)到了50%~100%不等。表現(xiàn)非常優(yōu)秀。
再來看前后代產(chǎn)品在DLSS 2環(huán)境和DLSS 3環(huán)境下的游戲性能實(shí)際表現(xiàn)。前面的測(cè)試中我們看到在不開啟DLSS 3時(shí),RTX 4060 Ti 8GB FE的游戲性能基本與RTX 3070相當(dāng)。但在開啟DLSS 3之后,相比只支持DLSS 2的RTX 3070 FE而言,RTX 4060 Ti 8GB FE在1080p分辨率下的性能達(dá)到了RTX 3070 FE的1.5倍左右,在1440p分辨率下的性能也達(dá)到了RTX 3070 FE的1.4倍,徹底實(shí)現(xiàn)了對(duì)RTX 3070 FE的跨代跨檔次完全超越。
與前一代的對(duì)位產(chǎn)品RTX 3060 Ti FE相比,開啟DLSS 3之后,RTX 4060 Ti 8GB FE的性能領(lǐng)先優(yōu)勢(shì)達(dá)到了70%(1440p)和80%(1080p)。而對(duì)老顯卡RTX 2060 SUPER的用戶來說,升級(jí)到RTX 4060 Ti 8GB FE后,DLSS 3環(huán)境下的性能增幅更是可以達(dá)到150%以上。
開啟DLSS 3之后,可以看到在1080p分辨率下全部的測(cè)試游戲中,RTX 4060 Ti 8GB FE都實(shí)現(xiàn)了100fps+的絕對(duì)流暢游戲水準(zhǔn)。即使在1440p分辨率下,也有半數(shù)游戲在最高畫質(zhì)、最高光追效果的設(shè)置下實(shí)現(xiàn)了100fps+的游戲水平,表現(xiàn)還是非常搶眼的。
接下來再看看NVIDIA Reflex。NVIDIA在DLSS 3中囊括了NVIDIA Reflex低延遲技術(shù),能夠極大地改善游戲體驗(yàn)的流暢性,尤其是對(duì)FPS游戲來說更是意義重大,畢竟更低的延遲也就意味了更快速的反應(yīng)操作。目前已經(jīng)有超過70款的游戲和應(yīng)用支持NVIDIA Reflex。另外隨著FrameView 1.4版本的更新,現(xiàn)在FrameView已經(jīng)能夠在支持的游戲中監(jiān)測(cè)、記錄游戲的PCL系統(tǒng)延遲時(shí)間與1%L fps低幀,這兩個(gè)指標(biāo)都是關(guān)系到游戲流暢與否的主要因素。
在RTX 4060 Ti 8GB FE的平臺(tái)上,開啟DLSS 3之后,游戲延遲是否能得到有效降低?1%L fps有沒有明顯的改善呢?
在這個(gè)部分的測(cè)試中,我們?nèi)匀换谇耙粶y(cè)試選擇的八款支持DLSS 3的游戲進(jìn)行了全面的測(cè)試。而從測(cè)試結(jié)果來看,也完全符合我們的預(yù)期。
從整體結(jié)果來看,DLSS 3不只是在幀率表現(xiàn)上相對(duì)于Native原生幀率有100%~400%的提升,而且在1%L fps和PCL系統(tǒng)延遲上也有驚艷的表現(xiàn)。比如在1440p分辨率設(shè)置的《賽博朋克2077》游戲中,在DLSS關(guān)閉的情況下游戲幀率不足30fps,游戲的1%L fps僅為22fps左右,說明游戲已經(jīng)基本無(wú)法正常進(jìn)行,卡頓的情況十分嚴(yán)重,而且PCL系統(tǒng)延遲在DLSS關(guān)閉時(shí)也高達(dá)118ms。在開啟DLSS 3的平衡模式之后,游戲幀率飆升到立刻90fps左右,達(dá)到了絕對(duì)流暢水準(zhǔn)。同時(shí)1%L fps也提升到了64fps,說明已經(jīng)不會(huì)在任何情況下影響到游戲的流暢運(yùn)行。另一方面系統(tǒng)延遲也在開啟DLSS 3之后從118ms下降到了56ms,讓游戲更加絲滑順暢,能有效提升游戲體驗(yàn)。在其余幾款測(cè)試游戲中,包含了NVIDIA Reflex技術(shù)的DLSS 3也有著同樣的表現(xiàn),比如在《巫師3:狂獵》測(cè)試中,1080p分辨率下開啟DLSS 3之后,游戲幀率從42fps飆升到105fps,同時(shí)在Reflex的作用下系統(tǒng)延遲也從131ms降低到了44ms左右,效果十分明顯。
最后再說兩句。DLSS 3的各大模式(除了在低于4K分辨率環(huán)境下開啟為8K分辨率準(zhǔn)備的超級(jí)性能模式之外)開啟之后對(duì)游戲畫質(zhì)幾乎沒有實(shí)質(zhì)性的影響,肉眼幾乎不可察覺,甚至在質(zhì)量和平衡模式下,游戲畫質(zhì)還有略優(yōu)化的跡象。所以,面對(duì)支持DLSS 3的游戲,RTX 40系顯卡的用戶根本不需要考慮,直接開啟就好!魚與熊掌兼得的機(jī)會(huì)就擺在面前,為啥不要呢?
設(shè)計(jì)創(chuàng)作性能測(cè)試
從NVIDIA重點(diǎn)打造Studio生態(tài)圈以來,RTX GPU就在設(shè)計(jì)創(chuàng)作領(lǐng)域綻放出了異彩,當(dāng)下RTX GPU已經(jīng)能夠?yàn)槌^110款的設(shè)計(jì)創(chuàng)作應(yīng)用提供加速性能,無(wú)論是3D渲染加速,還是視頻剪輯、轉(zhuǎn)碼,都有著優(yōu)異的表現(xiàn)。我們之前在測(cè)試RTX 4090、RTX 4080和RTX 4070系GPU時(shí)也驗(yàn)證過RTX 40系GPU的設(shè)計(jì)創(chuàng)作加速性能。到了面向主流群體的甜點(diǎn)GPU——RTX 4060系上市之時(shí),它在設(shè)計(jì)創(chuàng)作性能上是否也還是有相對(duì)前一代產(chǎn)品的明顯優(yōu)勢(shì)呢?
在視頻轉(zhuǎn)碼測(cè)試部分,我們選擇了兩款主流的視頻剪輯處理軟件Davinci Resolve Studio和剪映Pro的最新版本進(jìn)行了詳細(xì)測(cè)試。從測(cè)試結(jié)果可以看出,在Davinci Resolve Studio中,在視頻轉(zhuǎn)碼部分性能RTX 4060 Ti 8GB FE比RTX 3070 FE強(qiáng)10%,比RTX 3060 Ti強(qiáng)20%左右。魔法遮罩AI處理則比后二者強(qiáng)23%。相比RTX 2060 SUPER FE來說,性能領(lǐng)先程度更是達(dá)到了40%左右。新一代的NVENC性能更加強(qiáng)悍。
在剪映Pro的測(cè)試中結(jié)果也比較類似,除了在8K源視頻轉(zhuǎn)碼測(cè)試中RTX 4060 Ti 8GB FE與RTX 3070 FE和RTX 3060 Ti FE基本相當(dāng)之外,在4K轉(zhuǎn)碼性能測(cè)試中性能也領(lǐng)先約20%。在AV1轉(zhuǎn)碼性能上,RTX 4060 Ti 8GB FE更是領(lǐng)先達(dá)到了200%左右,相比RTX 2060 SUPER FE,在AV1轉(zhuǎn)碼性能上領(lǐng)先超過了300%(RTX 30系與RTX 20系的NVENC不支持GPU硬件加速編碼AV1,只能采用軟算法轉(zhuǎn)碼)。
這里還是要強(qiáng)調(diào)一下RTX 40系GPU的第八代NVENC編碼器所支持的AV1格式硬件編碼加速。AV1格式相比H.264等傳統(tǒng)視頻格式,在同碼率下的視頻質(zhì)量更優(yōu)秀,同時(shí)占用的體積也較小,代表著未來的視頻主流方向。對(duì)AV1格式硬件編碼加速的支持,也是RTX 40系GPU的特色之一。
▲我們用OBS錄制了《毀滅全人類2:重新探測(cè)》游戲中的一段原始視頻,并在Davinci Resolve Studio中用RTX 4060 Ti 8GB FE將其分別轉(zhuǎn)碼輸出為1080p@30fps、6000Kbps碼率的H.264格式(圖右)和AV1格式(圖左)的兩段視頻。通過在NVIDIA ICAT軟件中的逐幀比較分析,可以清晰地看到,AV1格式的視頻在相同碼率下視頻質(zhì)量明顯比H.264格式的視頻要優(yōu)秀得多(圖片可點(diǎn)擊放大觀察)。
再來看3D渲染性能。在V-Ray Benchmark測(cè)試中,GPU CUDA加速性能測(cè)試中,由于CUDA核心數(shù)量相差了35%左右,RTX 4060 Ti 8GB FE性能略略小負(fù)于RTX 3070 FE,不過差距僅有2%左右,基本可以認(rèn)為性能相當(dāng)。而在GPU RTX加速性能測(cè)試部分,RTX 4060 Ti 8GB FE性能領(lǐng)先RTX 3070 FE約6%,領(lǐng)先RTX 3060 Ti FE約20%,也充分展現(xiàn)了第三代光追核心的優(yōu)秀架構(gòu)與性能。相比前兩代的產(chǎn)品RTX 2060 SUPER FE而言,RTX 4060 Ti 8GB FE更是在兩項(xiàng)V-Ray Benchmark測(cè)試中平均性能領(lǐng)先達(dá)到150%左右。
Blender Opendata Benchmark與Blender 3.5的實(shí)際模型渲染測(cè)試中的結(jié)果也比較類似。RTX 4060 Ti 8GB FE綜合性能領(lǐng)先RTX 3070 FE約10%~15%,領(lǐng)先RTX 3060 Ti FE約20%~30%,相比RTX 2060 SUPER則有著平均約60%的性能領(lǐng)先幅度。
AI運(yùn)算性能
在這部分的測(cè)試中,我們主要考察第四代Tensor Core AI核心配合全新設(shè)計(jì)的SM帶來的高效CUDA核心配合之下,RTX 4060 Ti 8GB FE在當(dāng)下熱門的AI計(jì)算應(yīng)用中會(huì)有怎樣的性能表現(xiàn)。
首先是ON1 Resize AI 2022軟件中的圖片AI縮放處理性能測(cè)試。和之前測(cè)試RTX 40系GPU時(shí)的方法與設(shè)置一樣,我們選擇了5張5K照片,并將其等比無(wú)損縮放到200%(10K+級(jí)精度照片)。從測(cè)試結(jié)果來看,RTX 4060 Ti 8GB FE的圖片AI處理性能明顯遙遙領(lǐng)先,相對(duì)RTX 3070和RTX 3060 Ti FE的領(lǐng)先程度分別達(dá)到了15%和25%,相對(duì)于RTX 2060 SUPER的性能領(lǐng)先達(dá)到了40%以上。
早在RTX 4070 Ti發(fā)布時(shí),NVIDIA就公布了RTX VSR(RTX Video Super Resolution,RTX視頻超分辨率)的相關(guān)信息,這是一種基于RTX GPU之上的視頻縮放增強(qiáng)技術(shù)。在RTX 4070發(fā)布時(shí),NVIDIA也正式在驅(qū)動(dòng)控制面板中實(shí)現(xiàn)了對(duì)VSR的支持。簡(jiǎn)單來說,它可以通過AI計(jì)算的細(xì)節(jié)增強(qiáng),讓視頻播放更加清晰。
目前要實(shí)現(xiàn)VSR需要兩個(gè)硬性條件,其一是必須基于RTX 30系以上的GPU并得到驅(qū)動(dòng)程序的支持,其二則是需要支持VSR功能的瀏覽器或播放器。我們測(cè)試所用的Game Ready Driver 531.91驅(qū)動(dòng)程序已經(jīng)開放了對(duì)VSR的支持,我們就通過FireFox瀏覽器(不支持VSR)和Google Chrome瀏覽器(支持VSR),播放兩段來自Bilibili網(wǎng)站的視頻,來體驗(yàn)一下RTX VSR的表現(xiàn)。
▲勾選RTX視頻增強(qiáng)選項(xiàng)下的“超分辨率”,就能在支持VSR功能的瀏覽器中開啟RTX 視頻增強(qiáng)。增強(qiáng)等級(jí)有1~4可選。
▲在《黑神話:悟空》游戲8分鐘實(shí)戰(zhàn)演示視頻中,可以明顯地看到在Chrome瀏覽器中開啟VSR(圖右)后,視頻質(zhì)量得到了較大程度的增強(qiáng),相比FireFox瀏覽器中播放質(zhì)量更好,更清晰(點(diǎn)擊放大觀察)。
▲在東方廢土題材的游戲《Ashfall》的演示視頻中,同樣可以看到在Chrome瀏覽器(圖左)中開啟VSR之后,相比FireFox瀏覽器播放時(shí),視頻質(zhì)量得到了明顯的增強(qiáng),清晰度更好,細(xì)節(jié)更豐富(點(diǎn)擊放大觀察)。
最后我們?cè)賮砜匆幌耂table Diffusion AI圖片生成計(jì)算性能的測(cè)試。和之前我們測(cè)試RTX 4070 FE時(shí)一樣,測(cè)試中我們也選擇了“一座都鐸風(fēng)格的房子,在水邊,美麗渲染圖,日落,夢(mèng)幻森林,照片般逼真,電影般構(gòu)圖,電影般高細(xì)節(jié),超高逼真,電影般的照明,景深,超精細(xì),色彩編碼精美,8k,多細(xì)節(jié),明暗錯(cuò)落,夢(mèng)幻”作為構(gòu)圖的關(guān)鍵詞,分別按照這樣的關(guān)鍵詞生成1、4張高精度AI圖片。
考慮到RTX 4060 Ti 8GB FE及對(duì)比顯卡的顯存容量與硬件規(guī)格,參數(shù)設(shè)置如下:
采樣迭代步數(shù):20
生成批次-每批數(shù)量:1-1、4-1
提示詞相關(guān)性:7.5
分辨率:768×768
我們就通過生成單張圖片與4張圖片的兩次簡(jiǎn)單測(cè)試,來考察RTX 4060 Ti 8GB FE的AI圖片生成計(jì)算能力。
從最終測(cè)試結(jié)果來看,基于CUDA和Tensor Core加速的Stable Diffusion測(cè)試中,RTX 4060 Ti 8GB FE的性能領(lǐng)先RTX 3070 FE約6%~7%,領(lǐng)先RTX 3060 Ti FE約20%,領(lǐng)先RTX 2060 SUPER FE則達(dá)到了35%~45%。在CUDA核心與Tensor Core數(shù)量都遠(yuǎn)低于RTX 3070 FE的情況下,RTX 4060 Ti 8GB FE的Stable Diffusion AI計(jì)算性能卻更強(qiáng),顯然是Ada架構(gòu)的CUDA核心與第四代Tensor Core的性能與效率更高所導(dǎo)致。
功耗與溫度
RTX 4060 Ti 8GB FE的TGP官方數(shù)據(jù)為160W,這顯卡的理論功耗上限。但在實(shí)際應(yīng)用場(chǎng)景中,不同的顯卡卻有不同的表現(xiàn),比如4K游戲狀態(tài)、1440p游戲狀態(tài)、視頻編輯處理狀態(tài),3D建模渲染狀態(tài)等等,都有不同的功耗表現(xiàn)。在不同的應(yīng)用場(chǎng)景下,RTX 4060 Ti 8GB FE在功耗上又會(huì)有怎樣的表現(xiàn)呢?
在《賽博朋克2077》游戲的1440p及1080p分辨率、最高畫質(zhì)、超級(jí)光追效果、DLSS平衡設(shè)置下(關(guān)閉DLSS Frame Generation),可以清晰地看到,在1440p分辨率下,RTX 4060 Ti 8GB FE的功耗在140W左右波動(dòng),1080p分辨率下則在130W左右波動(dòng)。對(duì)比RTX 3070 FE功耗則平均達(dá)到了200W左右。同時(shí)RTX 3070 FE功耗的波動(dòng)幅度非常大且頻繁,相比之下RTX 4060 Ti 8GB FE的表現(xiàn)則非常穩(wěn)定,性能發(fā)揮更穩(wěn)定,有助于提升1%L fps,確保游戲運(yùn)行更加順暢,減少卡頓的情況。
我們用《霍格沃茨之遺》《原子之心》《賽博朋克2077》以及《CS:GO》四款游戲測(cè)試了1080p和1440p分辨率下最高畫質(zhì)、最高光追效果(如果支持光追)、DLSS平衡模式(關(guān)閉DLSS Frame Generation,如果支持DLSS 3)下的游戲幀率,并取其平均值匯總。最終我們發(fā)現(xiàn),在1080p分辨率和1440p分辨率下,RTX 4060 Ti 8GB FE的平均游戲功耗為130W和141W,對(duì)比之下RTX 3070 FE的平均游戲功耗則分別達(dá)到了163W和182W,RTX 3060 Ti FE更是在兩種分辨率下都達(dá)到了接近200W的程度。這也清晰地表明了全新架構(gòu)設(shè)計(jì)的RTX 4060 Ti 8GB FE有著更高的能耗比。
▲在散熱部分,RTX 4060 Ti 8GB FE烤機(jī)溫度為71℃,與RTX 3070 FE相當(dāng),表現(xiàn)中規(guī)中矩。
主流游戲市場(chǎng)新甜點(diǎn),重新定義1080p游戲升級(jí)
首先是測(cè)試總結(jié),懶人福利:
1.RTX 4060 Ti 8GB FE的傳統(tǒng)游戲性能相比RTX 3060 Ti FE約有15%~20%的性能提升,相比RTX 2060 SUPER FE的性能提升則在80%左右。跨檔次對(duì)比RTX 3070 FE,在傳統(tǒng)游戲性能上二者基本相當(dāng),各有勝負(fù)。不開啟DLSS時(shí),RTX 4060 Ti小幅度落后,DLSS開啟時(shí),RTX 4060 Ti 8GB FE略略小幅領(lǐng)先,但差距都在2%以內(nèi)。整體來看傳統(tǒng)游戲性能中規(guī)中矩,算是正常的迭代,不能說有特別驚艷的表現(xiàn),不過倒也不算差。
2.DLSS 3再次成為RTX 40系的核心亮點(diǎn)。在開啟DLSS 3之后,RTX 4060 Ti 8GB FE的游戲性能猛漲,相比RTX 3070 FE性能增幅達(dá)到了40%左右,相比RTX 3060 Ti的性能增幅也達(dá)到了70%以上,更是擁有了相對(duì)于RTX 2060 SUPER約2.7倍的性能。此時(shí)RTX 4060 Ti 8GB的表現(xiàn)是驚艷的。
3.全新的SM、第八代NVENC和第四代Tensor Core使得RTX 4060 Ti 8GB FE在設(shè)計(jì)創(chuàng)作性能上有著不俗的表現(xiàn),視頻轉(zhuǎn)碼性能整體領(lǐng)先RTX 3070 FE近15%,領(lǐng)先RTX 3060 Ti FE約15%~20%。設(shè)計(jì)創(chuàng)作性能上也表現(xiàn)不俗,領(lǐng)先RTX 3070 FE和RTX 3060 Ti FE分別達(dá)到接近10%和20%。
4.能耗比出色仍然是RTX 4060 Ti 8GB FE的一大亮點(diǎn),平均游戲功耗僅為135W左右,遠(yuǎn)低于RTX 3070 FE的170W左右以及RTX 3060 Ti FE的195W左右。
5.盡管CUDA核心相比RTX 3070 FE和RTX 3060 Ti FE更少,但憑借更高效的CUDA架構(gòu)與效率,以及第四代的Tensor Core核心,RTX 4060 Ti 8GB FE在AI相關(guān)計(jì)算上仍然表現(xiàn)出了較為明顯的優(yōu)勢(shì),相對(duì)于RTX 3070 FE和RTX 3060 Ti FE分別達(dá)到了7%和20%左右。
按照NVIDIA的官方定位,RTX 4060系GPU都是面向1080p主流游戲市場(chǎng)的,但3199元起的價(jià)格可能會(huì)讓很多玩家感到迷惑——這是1080p游戲顯卡的定位嗎?很顯然,NVDIA所說的1080p游戲市場(chǎng)應(yīng)該是一個(gè)升級(jí)的概念——全特效、全光追下的高幀率1080p游戲市場(chǎng),在最好的游戲環(huán)境中玩1080p游戲。從實(shí)際測(cè)試的情況來看,RTX 4060 Ti FE在傳統(tǒng)游戲環(huán)境下開啟DLSS之后,幾乎所有的測(cè)試游戲大作都能在全特效、全光追的設(shè)置環(huán)境下在1080p分辨率下達(dá)到60fps以上的流暢游戲水平,而在開啟DLSS 3之后,游戲幀率在全特效、全光追環(huán)境下則幾乎都能達(dá)到100fps+的絕對(duì)流暢游戲水準(zhǔn),達(dá)到了NVIDIA的預(yù)設(shè)構(gòu)想。
這些年來我們一直在提倡消費(fèi)升級(jí),現(xiàn)在NVIDIA很明顯是要想帶來游戲體驗(yàn)的升級(jí),RTX 4090和RTX 4080帶來4K+游戲的體驗(yàn)升級(jí),RTX 4070系帶來1440p游戲升級(jí),而這次面世的RTX 4060系則想要帶來的是1080p游戲升級(jí)。確實(shí),受限于硬件規(guī)格配置,不開DLSS 3的話,RTX 4060 Ti 8GB FE跟RTX 3070 FE大差不差,性能非常接近,沒有表現(xiàn)出對(duì)RTX 3070的明顯性能領(lǐng)先,相信這也會(huì)讓不少玩家有些“吐槽”。但開了DLSS 3后性能突飛猛進(jìn),就明顯領(lǐng)先RTX 3070 FE。結(jié)合Ada架構(gòu)大緩存的針對(duì)性設(shè)計(jì)思路,NVIDIA為RTX 4060系預(yù)設(shè)的戰(zhàn)場(chǎng)就是DLSS 3下的全特效1080p@100fps+光追游戲,這是RTX 3070和RTX 3060Ti 都達(dá)不到的。而且對(duì)DLSS 3的支持也是大加分項(xiàng),它的戰(zhàn)場(chǎng)在更深遠(yuǎn)的未來,我們也非常看好DLSS 3的發(fā)展,全特效光追+DLSS 3應(yīng)該已經(jīng)成為今后3A級(jí)游戲大作的核心方向之一。
最后實(shí)話實(shí)說,不吹不黑,不能說RTX 4060 Ti 8GB是一款非常優(yōu)秀的高性價(jià)比GPU產(chǎn)品,畢竟性能未能明顯超越RTX 3070相信在不少玩家看來都是一種遺憾。不過我們認(rèn)為它算是一款合格的游戲市場(chǎng)布局產(chǎn)品。如果你追求的只是1080p下的“能游戲”,那么千元級(jí)的顯卡就能實(shí)現(xiàn),RTX 4060 Ti 8GB確實(shí)不是你的菜。但如果要追求高幀率、低延遲、高能耗比的1080p全特效光追游戲,目前來看RTX 4060 Ti 8GB是一個(gè)不錯(cuò)的選擇。尤其是對(duì)于那些追求極致高能小鋼炮的玩家來說,擁有出色能耗比、低功耗、優(yōu)秀1080p游戲性能的RTX 4060 Ti 8GB更是合適的佳選。而對(duì)于RTX 2060 SUPER甚至是GTX 1660這類老顯卡玩家來說,升級(jí)到RTX 4060 Ti 8GB之后,1080p的游戲體驗(yàn)也能直接從全特效能玩飛躍提升到全特效、全光追的高幀率體驗(yàn)。如果你有足夠的預(yù)算,那它也是老的“60”家族顯卡升級(jí)或是萬(wàn)元內(nèi)新裝機(jī)的值得考慮的對(duì)象。
審核編輯 :李倩
-
加速器
+關(guān)注
關(guān)注
2文章
821瀏覽量
38780 -
gpu
+關(guān)注
關(guān)注
28文章
4882瀏覽量
130394 -
存儲(chǔ)系統(tǒng)
+關(guān)注
關(guān)注
2文章
422瀏覽量
41187
原文標(biāo)題:DLSS 3加持40系甜點(diǎn)上市,NVIDIA GeForce RTX 4060 Ti 8GB FE解析
文章出處:【微信號(hào):Microcomputer,微信公眾號(hào):Microcomputer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
技嘉正式推出 RTX? 5060 Ti 和 5060 顯卡,先進(jìn)散熱方案提升游戲與 AI 體驗(yàn)
NVIDIA RTX 4500 Ada與NVIDIA RTX A5000的對(duì)比
技嘉 GeForce RTX? 50 系列顯示卡正式上市,散熱方案全面升級(jí)釋放強(qiáng)勁性能
英偉達(dá)RTX 4060系列顯卡供應(yīng)將大幅縮減
技嘉科技發(fā)布GeForce RTX 5090 D 和RTX 5080系列顯卡

英偉達(dá)介紹RTX 5090 FE 顯卡
技嘉CES 2025發(fā)布RTX 50系列顯卡,升級(jí)散熱縮小體積
NVIDIA GeForce RTX 50系列:AI計(jì)算機(jī)圖形新紀(jì)元
$1999 的 RTX 5090 來了

NVIDIA推出GeForce RTX 50系列臺(tái)式機(jī)和筆記本電腦GPU
技嘉于 CES 2025 首度亮相升級(jí)散熱設(shè)計(jì)與精實(shí)體積的 NVIDIA GeForce RTX 50 系列顯卡
NVIDIA和GeForce RTX GPU專為AI時(shí)代打造
Nvidia 再推出特供版顯卡 GeForce RTX 5090D

評(píng)論