在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GPU設計實時光線追蹤面臨的挑戰(zhàn)

汽車玩家 ? 來源:Imagination ? 作者:RYS SOMMEFELDT ? 2020-03-08 16:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

盡管在理論上實現(xiàn)現(xiàn)代GPU的方法是無限的,但真正有效的方法是切實的了解問題并著手將方案變?yōu)楝F(xiàn)實。制造現(xiàn)代高性能半導體器件以及試圖加速當前可編程光柵化技術所面臨的問題揭示了GPU硬件行業(yè)發(fā)展的未來趨勢。

例如在現(xiàn)代GPU中SIMD處理和固定功能紋理單元是必不可少的,以至于不使用它們來設計的GPU方案幾乎肯定意味著在研究之外不具有商業(yè)上的可行性和實用性。即使是過去20年來,任何一個GPU最瘋狂的愿景也沒有舍棄這些核心原則(安息吧,Larrabee(英特爾公司(GPU 的芯片代號))。

過去15年來實時光線追蹤加速一直被默認為是GPU設計中最令人煩心的問題,關于光線追蹤應該如何在GPU上實現(xiàn)的主流規(guī)范是微軟推出的DXR,它要求的執(zhí)行模型卻不能真正融入到GPU的工作模式,這無疑給任何需要支持它的GPU設計者帶來一些嚴重的潛在問題。如果實時光線追蹤是它們過去十年時間沒有考慮過的事情,那么這個問題會更加明顯,而Imagination一直在關注這個問題。

光線追蹤面臨的關鍵挑戰(zhàn)

如果你遵循DXR規(guī)范并考慮需要在GPU中實現(xiàn)些什么從而提供計算加速性能,那么你將很可能快速梳理出不管采用何種設計方案都需要解決的以下幾個問題:
首先你需要一種方法來生成和處理一組包含幾何體的數(shù)據(jù)結構,從而能以更有效的方式根據(jù)幾何體來跟蹤光線。其次當追蹤光線時,GPU要測試光線是否與之相交,要提供一些用戶可定義的編程接口。第三被跟蹤的光線可以發(fā)出新的光線!DXR規(guī)范定義的實現(xiàn)方案還需要考慮其他問題,但是從全局來看這三個因素是最重要的。

PowerVR光線追蹤混合渲染效果

生成和使用加速數(shù)據(jù)結構來有效的表示需要做相交測試的幾何體意味著GPU可能要完成一個全新的執(zhí)行階段,然后我們需要用全新的接口函數(shù)處理這些新的數(shù)據(jù)結構,測試是否相交,之后在程序員的控制下根據(jù)相交測試的結果實現(xiàn)一些功能。GPU是并行的設計,所以同時處理一堆光線意味著什么?這樣做是否發(fā)現(xiàn)了新挑戰(zhàn),而這些挑戰(zhàn)與傳統(tǒng)的幾何和像素并行處理所帶來的挑戰(zhàn)卻大不相同?

上一個問題的答案是非常肯定的,的確這些差異對如何將光線追蹤映射到現(xiàn)有的GPU執(zhí)行的模型中有著深遠的影響。這些GPU存在計算資源和內存資源的不平衡,導致內存訪問成為一種寶貴的資源,而浪費這些資源是導致效率和性能低下的最主要原因之一。

哦不——我們做了些什么?

GPU被設計成可以以任何形式充分利用與之連接的DRAM的訪問,利用內存訪問的空間或時間局部性來作為實現(xiàn)這一目的的方法。值得慶幸的是最常見和最現(xiàn)代化的光柵化渲染有一個很好的特性,即在著色期間(尤其是像素著色通常是任何給定幀的主要工作負載)三角形和像素頂點有可能與它們的近鄰共享相關數(shù)據(jù)。因此,您訪問一組像素所需的任何緩存數(shù)據(jù),很可能下一個相鄰的組將需要使用您已經從DRAM中提取并緩存的部分或全部內存數(shù)據(jù)。對于當今大多數(shù)柵格化渲染工作負載而言,這都是正確的,因此我們都可以松一口氣,并圍繞該屬性設計GPU架構。
當我們使用光線追蹤,這些就都失效了。光線追蹤使所有空間局部性消失。下面讓我們來分析其中的原因。

物體表面的問題

最簡單的思考方式就是觀察四周,在你坐下來閱讀這篇文章時注意光線在你所處環(huán)境中的作用。由于光線追蹤建模了光線從所有光源傳播時的屬性,因此它必須處理光線照射在場景中任何表面時發(fā)生的情況。也許我們只關心光線照射哪些物體,也許物體的表面以均勻的方向散射光線,但它也可能完全是隨機的。也許表面吸收了所有的光,因此不會有次級光線的傳播。也許表面有一種材質屬性,使它能夠部分吸收幾乎所有照射來的光線,然后隨機散射它不能捕獲的少量光線。

只有第一種場景可以映射到GPU的利用內存訪問局部性的工作模式,即使如此也只有當所有并行處理的光線都照射到同一類型的三角形時才可以。

正是這種明顯分歧的可能性導致了這些問題,如果并行處理的任何光線相互之間可能會有不同的作用,包括撞擊不同的加速數(shù)據(jù)結構或發(fā)出新的光線,那么GPU能高效工作的基本前提就會被破壞,而且這通常比在傳統(tǒng)的幾何圖形或像素處理中遇到的發(fā)散現(xiàn)象更具有破壞性。

相干性聚集

PowerVR對光線追蹤硬件加速的實現(xiàn)所做的是硬件光線追蹤和排序,它與當今行業(yè)內任何其他硬件光線追蹤加速相比都是獨一無二的,這對軟件方面來說是完全透明的,確保硬件上并行追蹤的發(fā)射光線具有潛在的相似性。我們稱之為相干性聚集。
硬件維護了一個數(shù)據(jù)結構,用于層次化的存儲軟件發(fā)出的正在被硬件處理的光線,并能夠根據(jù)它們的方向按它們在加速結構中前進的位置進行選擇和分組。這意味著當它們被處理時更可能共享存儲器中被訪問的加速數(shù)據(jù)結構中的數(shù)據(jù),且額外的優(yōu)勢是能夠最大化隨后要并行處理的光線-幾何體相交計算的數(shù)量。

通過分析由硬件調度的光線我們可以確保以GPU友好的方式對它們進行分組,從而更高效的進行后續(xù)處理,這些是該系統(tǒng)成功的關鍵,有助于避免打破GPU行業(yè)為高效的光柵化渲染而精心設計的運行模式,這就避免了光線追蹤硬件對特殊類型存儲系統(tǒng)的需求,因此提供了與GPU的其他部分更容易集成的方案。

相干性聚集機制本身相當?shù)膹碗s,因為它需要快速的追蹤,排序和調度所有的被提交到硬件中處理的光線,從而不會反壓前級用于發(fā)射光線的調度系統(tǒng),也不會造成后級以排序好的光線和加速數(shù)據(jù)結構為輸入的硬件的空閑。

如果沒有硬件系統(tǒng)來幫助GPU處理光線排序,那么就需要依賴應用程序或游戲開發(fā)人員以某種方式在主機上處理光線的相干性問題,或者在GPU上加入一個中間的計算環(huán)節(jié)來處理光線排序——前提是這種方式被硬件所支持,以上假設的方式中沒有一個能在實時的硬件平臺上提升效率和性能,然而Imagination是市場上唯一擁有這種硬件光線追蹤系統(tǒng)的GPU IP供應商。

緊跟潮流

我們之所以成為行業(yè)內唯一針對硬件光線追蹤提供解決方案的供應商是因為我們已經致力于解決這個問題很長時間了,與行業(yè)中其他正在緩慢的進展相比,光線追蹤已經成為當今圖形技術廣泛采用API之一了。

我們的相干性聚集特性與目前行業(yè)的光線追蹤相互兼容(如果光線恰好發(fā)射出新的光線,堆棧將會被釋放也可能發(fā)射出新的光線等等),在每個階段進行相干性聚集處理并確保我們盡可能的實現(xiàn)硬件光線追蹤的強大性能。

在現(xiàn)代的硬件光線追蹤系統(tǒng)中最重要的是測量光線束、峰值并行測試率或空光線發(fā)射和未命中率,這些是描述光線追蹤硬件性能的簡單方式,但是也并不是非常的有用,畢竟開發(fā)人員并不只關心高峰值并行測試率或漏測率。

我們的目標是在整個加速系統(tǒng)中使用全面的光線追蹤,這樣開發(fā)人員就可以用光線束預算要實現(xiàn)哪些有用的功能。我們的相干性聚集系統(tǒng)與我們提供的解決方案共同實現(xiàn)了這個目標,與行業(yè)內的其他方案相比都是獨一無二的。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4923

    瀏覽量

    130856
  • 光線追蹤
    +關注

    關注

    0

    文章

    185

    瀏覽量

    21767
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    光線追蹤及降噪技術綜述

    過程傳遞3D場景的結果。渲染主要包括光柵化(rasterization)[5]和光線追蹤[6]兩種方式。光柵化渲染采用局部光照原理,根據(jù)光源照射到物體上直接可見的
    的頭像 發(fā)表于 04-01 11:31 ?303次閱讀
    <b class='flag-5'>光線</b><b class='flag-5'>追蹤</b>及降噪技術綜述

    NVIDIA Omniverse Kit 107的安裝部署步驟

    NVIDIA Omniverse 是一個模塊化平臺,使用高級 API 和微服務來構建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 應用。OpenUSD 功能強大的 3D 框架與 NVIDIA RTX 用于視覺渲染和模擬的實時光線追蹤相結合,使開發(fā)者能夠為
    的頭像 發(fā)表于 03-28 10:37 ?402次閱讀
    NVIDIA Omniverse Kit 107的安裝部署步驟

    智慧路燈的推廣面臨哪些挑戰(zhàn)

    引言 在智慧城市建設的宏偉藍圖中,叁仟智慧路燈的推廣面臨哪些挑戰(zhàn)?叁仟智慧路燈作為重要的基礎設施,承載著提升城市照明智能化水平、實現(xiàn)多功能集成服務的使命。然而,盡管叁仟智慧路燈前景廣闊,在推廣過程中
    的頭像 發(fā)表于 03-27 17:02 ?252次閱讀

    從圖形處理到AI加速,一文看懂Imagination D系列GPU

    。這種特性也被沿用到消費設備中。是以,隨著新興GPU應用的出現(xiàn),其重點已從提供游戲和高級圖形效果(如光線追蹤)轉向能夠作為高效的AI加速器。為了應對日益嚴苛的應用
    的頭像 發(fā)表于 02-27 08:33 ?434次閱讀
    從圖形處理到AI加速,一文看懂Imagination D系列<b class='flag-5'>GPU</b>

    提升焊接質量:實時監(jiān)測技術的應用與挑戰(zhàn)

    的應用也面臨著諸多挑戰(zhàn)。本文將探討實時監(jiān)測技術在提升焊接質量方面的應用及其面臨挑戰(zhàn)。 ###
    的頭像 發(fā)表于 02-18 09:15 ?469次閱讀
    提升焊接質量:<b class='flag-5'>實時</b>監(jiān)測技術的應用與<b class='flag-5'>挑戰(zhàn)</b>

    Triton編譯器與GPU編程的結合應用

    優(yōu)化,以及生成高效的并行執(zhí)行計劃。 GPU編程的挑戰(zhàn) GPU編程面臨的主要挑戰(zhàn)包括: 編程復雜性 :GP
    的頭像 發(fā)表于 12-25 09:13 ?776次閱讀

    GPU在虛擬現(xiàn)實中的表現(xiàn) 低功耗GPU的優(yōu)缺點

    數(shù)據(jù),以實現(xiàn)沉浸式的體驗。以下是GPU在虛擬現(xiàn)實中的幾個關鍵表現(xiàn): 圖像渲染能力 :GPU需要快速渲染復雜的三維場景,以保持高幀率,這對于減少運動模糊和暈動癥至關重要。 實時光線追蹤
    的頭像 發(fā)表于 11-19 10:58 ?990次閱讀

    機器視覺要面臨挑戰(zhàn)及其解決方法

    機器視覺是指使用計算機和圖像處理技術從圖像中提取信息,并將其轉換為機器可理解的格式。這種方法已經被廣泛應用于自動化生產、質量控制、測量和檢測等領域。然而,機器視覺仍然面臨著一些挑戰(zhàn),需要采取相應
    的頭像 發(fā)表于 11-11 01:03 ?911次閱讀

    基于光線追蹤實現(xiàn)反射折射效果

    本文翻譯自Scratchapixel3.0[1],是一個關于計算機圖形學的系統(tǒng)性的學習教程。如果有誤,歡迎在評論區(qū)討論。光線追蹤的另一個優(yōu)點是,通過擴展光線傳播的思想,我們可以非常容易地「模擬反射
    的頭像 發(fā)表于 11-09 01:07 ?563次閱讀
    基于<b class='flag-5'>光線</b><b class='flag-5'>追蹤</b>實現(xiàn)反射折射效果

    挑戰(zhàn)12小時光線變化!海信電視U8AI精控好畫質始終如一

    ,去定格“完美視界”? 從近期網上流傳的一支《12小時光線挑戰(zhàn)視頻》中,我們或許可以得到答案。實驗者將海信電視U8與競品S放在了同一家庭空間,通過兩臺電視在不同時間、不同地點的場景對比,可以看到無論環(huán)境光線如何改變,AI精控都能
    的頭像 發(fā)表于 11-06 10:25 ?616次閱讀
    <b class='flag-5'>挑戰(zhàn)</b>12小<b class='flag-5'>時光線</b>變化!海信電視U8AI精控好畫質始終如一

    12小時光線挑戰(zhàn)!AI畫質專家才是大平層首選

    帶來巨大挑戰(zhàn),如強光下屏幕泛白、倒影,人走過總有人影晃動等。而當一堆朋友齊聚看球、玩游戲時,開闊的空間也讓視覺C位顯得格外重要。其實,一臺畫質夠頂?shù)碾娨?完全可以不懼光線、不挑角度。 11月1日,知名科技媒體手機中國發(fā)布了一則《
    的頭像 發(fā)表于 11-04 13:16 ?374次閱讀
    12小<b class='flag-5'>時光線</b><b class='flag-5'>挑戰(zhàn)</b>!AI畫質專家才是大平層首選

    基于光線追蹤的渲染算法實現(xiàn)

    我們已經涵蓋了所有需要說的內容!我們現(xiàn)在準備寫我們的第一個光線追蹤器。你現(xiàn)在應該能夠猜到光線追蹤算法是如何工作的了。首先,注意到自然界中光的傳播只是從光源發(fā)出無數(shù)條射線,反彈直到它們撞
    的頭像 發(fā)表于 10-30 08:06 ?604次閱讀
    基于<b class='flag-5'>光線</b><b class='flag-5'>追蹤</b>的渲染算法實現(xiàn)

    AMD與NVIDIA GPU優(yōu)缺點

    ,NVIDIA的RTX系列顯卡以其強大的光線追蹤和DLSS技術領先于市場。例如,NVIDIA的RTX 3080在4K分辨率下提供了卓越的游戲體驗,而AMD的Radeon RX 6800 XT雖然在某些游戲中表現(xiàn)接近,但在光線
    的頭像 發(fā)表于 10-27 11:15 ?2262次閱讀

    大模型發(fā)展下,國產GPU的機會和挑戰(zhàn)

    電子發(fā)燒友網站提供《大模型發(fā)展下,國產GPU的機會和挑戰(zhàn).pdf》資料免費下載
    發(fā)表于 07-18 15:44 ?13次下載
    大模型發(fā)展下,國產<b class='flag-5'>GPU</b>的機會和<b class='flag-5'>挑戰(zhàn)</b>

    AMD光線追蹤專家加盟高通,共筑Adreno GPU性能新高度

    在科技行業(yè)日新月異的今天,頂尖人才的流動往往預示著技術創(chuàng)新與突破的新篇章。近日,一則令人矚目的消息在半導體與圖形處理領域引起了廣泛關注——AMD前光線追蹤技術領域的杰出專家Paritosh
    的頭像 發(fā)表于 07-11 10:03 ?880次閱讀
    主站蜘蛛池模板: 视色4se在线视频播放 | 免费在线成人网 | 免费的黄色大片 | 天堂影 | 黄色午夜影院 | 日本黄色大片免费观看 | 在线播放免费视频 | 亚洲www视频 | 午夜影院404 | 亚洲精品乱码久久久久久蜜桃图片 | 色婷婷5月 | 最近在线观看免费完整视频 | 一区二区三区在线观看免费 | 黄色一级a毛片 | 亚洲啪啪免费视频 | 亚洲天堂视频在线播放 | 毛片不卡一区二区三区 | 日本久操| 奇米影视四色7777 | 一级毛片看真人在线视频 | 日本69xxⅹxxxxxx19 | 二区中文字幕 | 五月天丁香花婷婷 | 国产成人亚洲综合a∨婷婷 国产成人一区二区三中文 国产成人一区二区在线不卡 | 欧美在线成人午夜影视 | 日本一道高清不卡免费 | 天堂网www在线资源 天堂网www在线资源链接 | 欧美一区二区三区四区视频 | 啪啪网站免费 | 婷婷久久综合九色综合九七 | 欧美一级看片免费观看视频在线 | a毛片网站 | 国产免费播放一区二区三区 | 国产在线五月综合婷婷 | www.成人在线 | 天天碰夜夜| 在线看你懂得 | 天天射网| 欧美奇米 | 男人都懂得网址 | 91大神在线看 |