在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

從Shader編成入手了解GPU應用方案

Dbwd_Imgtec ? 來源:未知 ? 作者:胡薇 ? 2018-05-17 09:18 ? 次閱讀

Graphics Processing Unit(GPU),即可編程圖形處理單元, 通常也稱之為可編程圖形硬件。

由于GPU有高并行結構(highly parallel structure),所以GPU在處理圖形數據和復雜算法方面擁有比CPU更高的效率。圖 1 GPU VS CPU 展示了 GPU 和 CPU 在結構上的差異,CPU 大部分面積為控制器寄存器,與之相比,GPU擁有更多的 ALU(Arithmetic Logic Unit,邏輯運算單元)用于數據處理,而非數據高速緩存和流控制,這樣的結構適合對密集型數據進行并行處理。CPU 執行計算任務時,一個時刻只處理一個數據,不存在真正意義上的并行,而 GPU 具有多個處理器核,在一個時刻可以并行處理多個數據。

GPU 采用流式并行計算模式,可對每個數據進行獨立的并行計算,所謂“對 數據進行獨立計算”,即,流內任意元素的計算不依賴于其它同類型數據,例如,計算一個頂點的世界位置坐標,不依賴于其他頂點的位置。而所謂“并行計算” 是指“多個數據可以同時被使用,多個數據并行運算的時間和 1 個數據單獨執行的時間是一樣的”。圖 2 中代碼目的是提取 2D 圖像上每個像素點的顏色值,在 CPU 上運算的 C++代碼通過循環語句依次遍歷像素;而在 GPU 上,則只需要一條語句就足夠。

其一,object space coordinate 就是模型文件中的頂點值,這些值是在模型建模時得到的,例如,用 3DMAX 建 立一個球體模型并導出為.max 文件,這個文件中包含的數據就是 object space coordinate;其二,object space coordinate 與其他物體沒有任何參照關系,注意,這個概念非常重要,它是將 object space coordinate 和 world space coordinate 區分 開來的關鍵。無論在現實世界,還是在計算機的虛擬空間中,物體都必須和一個固定的坐標原點進行參照才能確定自己所在的位置,這是 world space coordinate 的實際意義所在。

從 object space coordinate 到 world space coordinate 的變換過程由一個四階矩陣控制,通常稱之為 world matrix。需要高度注意的是:頂點法向量在模型文件中屬于 object space,在 GPU 的 頂點程序中必須將法向量轉換到 world space 中才能使用,如同必須將頂點坐標從 object space 轉換到 world space 中一樣,但兩者的轉換矩陣是不同的,準確的說,法向量從 object space 到 world space 的轉換矩陣是 world matrix 的轉置矩陣的逆矩陣。

每個人都是從各自的視點出發觀察這個世界,無論是主觀世界還是客觀世界。同樣,在計算機中每次只能從唯一的視角出發渲染物體。在游戲中,都會提供視點漫游的功能,屏幕顯示的內容隨著視點的變化而變化。這是因為 GPU 將 物體頂點坐標從 world space 轉換到了 eye space。 所謂 eye space,即以 camera(視點或相機)為原點,由視線方向、視角和遠近平面,共同組成一個梯形體的三維空間,稱之為 viewing frustum(視錐), 如圖 4 所示。近平面,是梯形體較小的矩形面,作為投影平面,遠平面是梯形體 較大的矩形,在這個梯形體中的所有頂點數據是可見的,而超出這個梯形體之外的場景數據,會被視點去除(Frustum Culling,也稱之為視錐裁剪)。

從視點坐標空間到屏幕坐標空間 (screen coordinate space)事實上是由三步組成:

1. 用透視變換矩陣把頂點從視錐體中變換到裁剪空間的 CVV 中;2. 在 CVV 進行圖元裁剪;3. 屏幕映射:將經過前述過程得到的坐標映射到屏幕坐標系上。

從物理結構而言,寄存器是 cpu 或 gpu 內部的存儲單元,即寄存器是嵌入在 cpu 或者 gpu 中的,而內存則可以獨立存在;

從功能上而言,寄存器是有限存儲 容量的高速存儲部件,用來暫存指令、數據和位址。

Shader 編成是基于計算機圖形硬件的,這其中就包括 GPU 上的寄存器類型,glsl 和 hlsl 的著色虛擬機版本就是基于 GPU 的寄存器和指令集而區分的。

頂點著色器控制頂點坐標 轉換過程;片段著色器控制像素顏色計算過程。這樣就區分出頂點著色程序和片 段著色程序的各自分工:Vertex program 負責頂點坐標變換;Fragment program 負責像素顏色計算;前者的輸出是后者的輸入。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 寄存器
    +關注

    關注

    31

    文章

    5427

    瀏覽量

    123742
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4923

    瀏覽量

    130830

原文標題:GPU學習筆記

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術應用到原理

    自家GPU 提出的多卡算力互連技術,是早期為了應對深度學習對超高算力需求而單卡算力不足的局面的解決方案,當然這都是官方用來吹牛的話術。我自己在2019年左右第一次接觸到多卡交火的GIY玩法(學生到
    發表于 06-18 19:31

    GPU架構深度解析

    GPU架構深度解析圖形處理到通用計算的進化之路圖形處理單元(GPU),作為現代計算機中不可或缺的一部分,已經最初的圖形渲染專用處理器,發展成為強大的并行計算引擎,廣泛應用于人工智能
    的頭像 發表于 05-30 10:36 ?269次閱讀
    <b class='flag-5'>GPU</b>架構深度解析

    搭建算力中心,了解GPU 特性開始

    ABSTRACT摘要本文介紹如何搭建算力,并介紹A100、H100、H200和B200這些GPU的特性。JAEALOT2025年4月23日隨著人工智能、大數據和高性能計算(HPC)的快速發展,市場上
    的頭像 發表于 04-24 11:08 ?605次閱讀
    搭建算力中心,<b class='flag-5'>從</b><b class='flag-5'>了解</b>的<b class='flag-5'>GPU</b> 特性開始

    可以手動構建imx-gpu-viv嗎?

    使用 imx-gpu-viv-6.4.3.p4.2.aarch64.bin。 https://www.nxp.com/lgfiles/NMG/MAD/YOCTO//imx-gpu-viv-6.4.3.p4.2-aarch64.bin 我需要
    發表于 03-28 06:35

    OpenVINO?檢測到GPU,但網絡無法加載到GPU插件,為什么?

    OpenVINO?安裝在舊的 Windows 10 版本 Windows? 10 (RS1) 上。 已安裝 GPU 驅動程序版本 25.20.100.6373,檢測到 GPU,但網絡無法加載
    發表于 03-05 06:01

    CPU到GPU:渲染技術的演進和趨勢

    渲染技術是計算機圖形學的核心內容之一,它是將三維場景轉換為二維圖像的過程。渲染技術一直在不斷演進,最初的CPU渲染到后來的GPU渲染,性能和質量都有了顯著提升。一、CPU到GPU
    的頭像 發表于 02-21 11:11 ?678次閱讀
    <b class='flag-5'>從</b>CPU到<b class='flag-5'>GPU</b>:渲染技術的演進和趨勢

    GPU是如何訓練AI大模型的

    在AI模型的訓練過程中,大量的計算工作集中在矩陣乘法、向量加法和激活函數等運算上。這些運算正是GPU所擅長的。接下來,AI部落小編帶您了解GPU是如何訓練AI大模型的。
    的頭像 發表于 12-19 17:54 ?676次閱讀

    PyTorch GPU 加速訓練模型方法

    在深度學習領域,GPU加速訓練模型已經成為提高訓練效率和縮短訓練時間的重要手段。PyTorch作為一個流行的深度學習框架,提供了豐富的工具和方法來利用GPU進行模型訓練。 1. 了解GPU
    的頭像 發表于 11-05 17:43 ?1322次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--了解算力芯片GPU

    本篇閱讀學習第七、八章,了解GPU架構演進及CPGPU存儲體系與線程管理 █圖形到計算的GPU架構演進 GPU圖像計算發展 ●
    發表于 11-03 12:55

    【一文看懂】大白話解釋“GPUGPU算力”

    隨著大模型的興起,“GPU算力”這個詞正頻繁出現在人工智能、游戲、圖形設計等工作場景中,什么是GPU,它與CPU的區別是什么?以及到底什么是GPU算力?本篇文章主要從以下5個角度,讓您全方位
    的頭像 發表于 10-29 08:05 ?2405次閱讀
    【一文看懂】大白話解釋“<b class='flag-5'>GPU</b>與<b class='flag-5'>GPU</b>算力”

    GPU超頻設置技巧

    超頻GPU(圖形處理單元)可以提高顯卡的性能,但同時也可能增加熱量和功耗,甚至可能縮短硬件的壽命。在進行GPU超頻之前,確保你了解可能的風險,并且愿意承擔這些風險。以下是一些基本的GPU
    的頭像 發表于 10-27 11:09 ?1357次閱讀

    如何選擇適合的GPU

    在現代計算領域,GPU(圖形處理單元)的作用已經遠遠超出了傳統的圖形渲染。深度學習到科學計算,再到視頻編輯,GPU都在發揮著越來越重要的作用。然而,市場上的GPU型號繁多,性能和價格
    的頭像 發表于 10-27 11:07 ?943次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

    GPU、NPU,給我們剖析了算力芯片的微架構。書中有對芯片方案商處理器的講解,理論聯系實際,使讀者能更好理解算力芯片。 全書共11章,由淺入深,較系統全面進行講解。下面目錄對全書內容有一個整體了解
    發表于 10-15 22:08

    GPU云服務器架構解析及應用優勢

    GPU云服務器作為一種高性能計算資源,近年來在人工智能、大數據分析、圖形渲染等領域得到了廣泛應用。它結合了云計算的靈活性與GPU的強大計算能力,為企業和個人用戶提供了一種高效、便捷的計算解決方案。下面我們將從架構解析和技術優勢兩
    的頭像 發表于 08-14 09:43 ?822次閱讀

    暴漲預警!NVIDIA GPU供應大跳水

    gpu
    jf_02331860
    發布于 :2024年07月26日 09:41:42
    主站蜘蛛池模板: 6969精品视频在线观看 | 国产精品一区二区三区免费视频 | 一区二区三区免费在线 | 美女扒开下面让男人捅 | www.四虎.com| 免费观看在线观看 | 国内精品哆啪啪 | 影视精品网站入口 | 国产毛片毛片精品天天看 | 欧美生活性色 | 亚洲国产一区二区三区在线观看 | 天天在线干 | 全部免费特黄特色大片视频 | 九九热免费观看 | 五月综合激情网 | www.毛片网站 | 皇帝受h啪肉np文 | 亚洲免费人成在线视频观看 | 美女涩涩网站 | 性xxxxbbbb在线| free欧美性| 最近最新免费视频 | 国产情侣出租屋露脸实拍 | 亚洲伊人久久大香线蕉啊 | 国内精品99 | 五月婷婷丁香花 | 天天摸天天躁天天添天天爽 | 四虎国产精品永久免费网址 | 国产一区二区精品 | 亚州色吧| a久久久久一级毛片护士免费 | 福利视频一区二区 | 天堂资源网 | 亚洲1234区乱码| 色性网| 五月天婷婷视频在线观看 | 男女交性高清视频无遮挡 | 国产农村乱色xxxx | 又粗又大又爽又色又过瘾视频 | 明日花在线观看 | 涩涩涩丁香色婷五月网视色 |