耳根,完结小说排行榜,听中国有声小说

Graphics Processing Unit（GPU），即可編程圖形處理單元，通常也稱之為可編程圖形硬件。

由于GPU有高并行結構（highly parallel structure），所以GPU在處理圖形數據和復雜算法方面擁有比CPU更高的效率。圖 1 GPU VS CPU 展示了 GPU 和 CPU 在結構上的差異，CPU 大部分面積為控制器和寄存器，與之相比，GPU擁有更多的 ALU（Arithmetic Logic Unit，邏輯運算單元）用于數據處理，而非數據高速緩存和流控制，這樣的結構適合對密集型數據進行并行處理。CPU 執行計算任務時，一個時刻只處理一個數據，不存在真正意義上的并行，而 GPU 具有多個處理器核，在一個時刻可以并行處理多個數據。

GPU 采用流式并行計算模式，可對每個數據進行獨立的并行計算，所謂“對數據進行獨立計算”，即，流內任意元素的計算不依賴于其它同類型數據，例如，計算一個頂點的世界位置坐標，不依賴于其他頂點的位置。而所謂“并行計算” 是指“多個數據可以同時被使用，多個數據并行運算的時間和 1 個數據單獨執行的時間是一樣的”。圖 2 中代碼目的是提取 2D 圖像上每個像素點的顏色值，在 CPU 上運算的 C++代碼通過循環語句依次遍歷像素；而在 GPU 上，則只需要一條語句就足夠。

其一，object space coordinate 就是模型文件中的頂點值，這些值是在模型建模時得到的，例如，用 3DMAX 建立一個球體模型并導出為.max 文件，這個文件中包含的數據就是 object space coordinate；其二，object space coordinate 與其他物體沒有任何參照關系，注意，這個概念非常重要，它是將 object space coordinate 和 world space coordinate 區分開來的關鍵。無論在現實世界，還是在計算機的虛擬空間中，物體都必須和一個固定的坐標原點進行參照才能確定自己所在的位置，這是 world space coordinate 的實際意義所在。

從 object space coordinate 到 world space coordinate 的變換過程由一個四階矩陣控制，通常稱之為 world matrix。需要高度注意的是：頂點法向量在模型文件中屬于 object space，在 GPU 的頂點程序中必須將法向量轉換到 world space 中才能使用，如同必須將頂點坐標從 object space 轉換到 world space 中一樣，但兩者的轉換矩陣是不同的，準確的說，法向量從 object space 到 world space 的轉換矩陣是 world matrix 的轉置矩陣的逆矩陣。

每個人都是從各自的視點出發觀察這個世界，無論是主觀世界還是客觀世界。同樣，在計算機中每次只能從唯一的視角出發渲染物體。在游戲中，都會提供視點漫游的功能，屏幕顯示的內容隨著視點的變化而變化。這是因為 GPU 將物體頂點坐標從 world space 轉換到了 eye space。所謂 eye space，即以 camera（視點或相機）為原點，由視線方向、視角和遠近平面，共同組成一個梯形體的三維空間，稱之為 viewing frustum（視錐），如圖 4 所示。近平面，是梯形體較小的矩形面，作為投影平面，遠平面是梯形體較大的矩形，在這個梯形體中的所有頂點數據是可見的，而超出這個梯形體之外的場景數據，會被視點去除（Frustum Culling，也稱之為視錐裁剪）。