關(guān)于OpenCL
OpenCL是Open Computing Language的簡(jiǎn)寫,目前已經(jīng)形成了標(biāo)準(zhǔn),是跨平臺(tái)的,通常由圖形處理器(GPU)提供硬件層面支持。OpenCL的設(shè)計(jì)目的,主要是為了將GPU強(qiáng)大的浮點(diǎn)和并行運(yùn)算能力,以及能與CPU協(xié)作的能力,從軟件層面開(kāi)放給用戶使用。用法跟OpenGL類似。
通常情況下,對(duì)同一組數(shù)據(jù)進(jìn)行并行運(yùn)算,使用OpenCL比執(zhí)行普通CPU端程序,要快很多倍。
站在應(yīng)用軟件的角度,OpenCL簡(jiǎn)單來(lái)說(shuō),就是一組API函數(shù)名稱,操作系統(tǒng)通常會(huì)提供具體實(shí)現(xiàn)庫(kù),以及運(yùn)行于GPU之上的程序(OpenCL中稱為kernel),文件后綴通常為.cl,基于OpenCL語(yǔ)法編寫的程序,由CPU加載編譯后,傳輸?shù)絆penCL設(shè)備的內(nèi)存供GPU執(zhí)行。各個(gè)圖形處理器廠商,針對(duì)自己的具體芯片,在GPU驅(qū)動(dòng)程序中適配這些API,用戶就可以基于這些標(biāo)準(zhǔn)的API進(jìn)行相關(guān)的OpenCL應(yīng)用程序開(kāi)發(fā)。
需要指出的是:跟OpenGL的shader程序類似,OpenCL的kernel程序也是具體GPU芯片相關(guān)的,不能跨GPU型號(hào)使用。同一段代碼,可能換了GPU型號(hào)之后就不能編譯通過(guò),第一個(gè)GPU使用的二進(jìn)制kernel程序,不應(yīng)該直接加載到第二個(gè)不同型號(hào)GPU上面使用。
OpenCL應(yīng)用運(yùn)行框圖
OpenCL設(shè)備內(nèi)部,通常會(huì)有大量的并行計(jì)算單元(上圖中的CU),每個(gè)計(jì)算單元內(nèi)部又包含有若干個(gè)處理單元(圖中的PE),PE可以同時(shí)并行地執(zhí)行相同OpenCL代碼,從而實(shí)現(xiàn)高性能并行運(yùn)算,具體CU以及PE數(shù)量已經(jīng)運(yùn)算性能,跟具體GPU廠商的具體GPU型號(hào)有關(guān)。
OpenCL代碼被CPU加載到設(shè)備內(nèi)存之后,CPU通過(guò)相應(yīng)的OpenCL API來(lái)啟動(dòng)OpenCL設(shè)備的運(yùn)行,同時(shí)還能查詢執(zhí)行狀態(tài),實(shí)現(xiàn)CPU-GPU之間的同步,設(shè)備關(guān)閉等操作。
RZ/G2L上的OpenCL支持
RZ/G2L微處理器配備Cortex-A55(1.2 GHz)CPU、16 位 DDR3L/DDR4接口、帶Arm Mali-G31的3D圖形加速引擎以及視頻編解碼器(H.264),如下圖紅色框所示。此外,這款微處理器還配備有大量接口,如攝像頭輸入、顯示輸出、USB 2.0和千兆以太網(wǎng),因此特別適用于入門級(jí)工業(yè)人機(jī)界面(HMI)和具有視頻功能的嵌入式設(shè)備等應(yīng)用。
此GPU支持2D/3D圖形,以及通用GPU運(yùn)算(GPGPU)。具體支持如下標(biāo)準(zhǔn)API:
● OpenCL 2.0 Full Profile
●OpenGL ES 1.1 2.0 3.0 3.1 and 3.2
RZ/G2L上的OpenCL Library及其使用
RZ/G2L的VLP開(kāi)發(fā)環(huán)境里面有提供Linux版OpenCL Library(需要從官網(wǎng)另外下載)以及對(duì)應(yīng)頭文件。
RZ/G2L的OpenCL庫(kù)支持3種運(yùn)行模式:
● CPU Mode:并行運(yùn)算在CPU端完成,應(yīng)用程序仍然需要調(diào)用OpenCL庫(kù)API,OpenCL庫(kù)內(nèi)部會(huì)基于ARMv8 NEON SIMD指令集做針對(duì)性優(yōu)化。
● GPU Mode:并行運(yùn)行在GPU端完成,驅(qū)動(dòng)程序會(huì)充分利用OpenCL設(shè)備的PE單元,提示并行性和運(yùn)算效率。
● BOTH Mode:上面兩種模式的結(jié)合。
通常情況下,BOTH Mode能提供最佳性能,典型做法是將待處理的并行數(shù)據(jù),平均分成連續(xù)的兩部分,CPU和GPU各自處理一半的數(shù)據(jù)(BOTH模式)。結(jié)合CPU模式,是因?yàn)镃PU端有高主頻,大Cache,高DDR帶寬等優(yōu)勢(shì)。由于GPU端PE的特殊性,對(duì)待處理的數(shù)據(jù),要求是,所有輸入數(shù)據(jù)運(yùn)算方法相同,沒(méi)有依賴性,比如:兩組輸入數(shù)組A[1024]和B[1024]分別存放有1024字節(jié)的float類型數(shù)據(jù),將A和B同序號(hào)的數(shù)據(jù)分別做乘法,結(jié)果保存于浮點(diǎn)數(shù)組C[1024],即:
C[0] = A[0] * B[0];
C[1] = A[1] * B[1];
… …
因?yàn)樗蠵E只能并行執(zhí)行相同的kernel程序。
OpenCL庫(kù)的使用,主要分為如下步驟:
●獲取平臺(tái)信息
●獲取設(shè)備信息
●創(chuàng)建上下文
●創(chuàng)建命令隊(duì)列
●創(chuàng)建和編譯kernel程序
●創(chuàng)建kernel對(duì)象
●創(chuàng)建內(nèi)存對(duì)象
●設(shè)置kernel參數(shù)
●執(zhí)行kernel程序
●同步操作
●獲取處理結(jié)果
●清理資源
部分OpenCL API介紹
OpenCL API通常以 cl_ 開(kāi)頭,很容易識(shí)別。
獲取平臺(tái)信息
cl_int clGetPlatformIDs(cl_uint num_entries,
cl_platform_id *platforms,
cl_uint *num_platforms);
這個(gè)函數(shù)是OpenCL應(yīng)用程序必須調(diào)用的第一個(gè)API,用來(lái)獲取可使用的Platform ID數(shù)組,當(dāng)平臺(tái)數(shù)未知時(shí),第一次調(diào)用clGetPlatformIDs函數(shù)獲取平臺(tái)數(shù)量,第二次調(diào)用clGetPlatformIDs函數(shù)獲取平臺(tái)對(duì)象,供后續(xù)API使用。
cl_int clGetPlatformInfo(cl_platform_id platform,
cl_platform_info param_name,
size_t param_value_size,
void *param_value,
size_t *param_value_size_ret);
用于獲取OpenCL的Profile信息、版本、平臺(tái)制造商、支持的擴(kuò)展等。
獲取設(shè)備信息
cl_int clGetDeviceIDs(cl_platform_id_platform,
cl_device_type device_type,
cl_uint num_entries,
cl_device_id *devices,
cl_uint *num_devices);
這個(gè)API用來(lái)獲取平臺(tái)可使用的設(shè)備對(duì)象數(shù)組。可用于獲取CPU/GPU/專用加速器等OpenCL設(shè)備數(shù)量等。
cl_int clGetDeviceInfo(cl_device_id device,
cl_device_info param_name,
size_t param_value_size,
void *param_value,
size_t *param_value_size_ret);
用于獲取選定設(shè)備相關(guān)信息,如并行計(jì)算單元最大數(shù)量、設(shè)備端全局內(nèi)存大小等信息。
由于OpenCL API涉及的內(nèi)容比較多,另一方面,OpenCL相關(guān)標(biāo)準(zhǔn)已經(jīng)很成熟,網(wǎng)上有很多的示例資源可供參考,瑞薩也可以提供MPU上的OpenCL例子給到客戶,剩下的OpenCL應(yīng)用程序步驟相關(guān)API,就不進(jìn)一步介紹了。
審核編輯:劉清
-
微處理器
+關(guān)注
關(guān)注
11文章
2354瀏覽量
83463 -
圖形處理器
+關(guān)注
關(guān)注
0文章
202瀏覽量
25878 -
視頻編解碼器
+關(guān)注
關(guān)注
0文章
22瀏覽量
11677 -
OpenCL
+關(guān)注
關(guān)注
2文章
48瀏覽量
33581 -
GPU芯片
+關(guān)注
關(guān)注
1文章
304瀏覽量
6064
原文標(biāo)題:RZ/G2L OpenCL使用介紹
文章出處:【微信號(hào):瑞薩MCU小百科,微信公眾號(hào):瑞薩MCU小百科】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
【飛凌RZ/G2L開(kāi)發(fā)板試用體驗(yàn)】+01.開(kāi)箱(zmj)
瑞薩G2L系列核心板-RZ/G2L處理器簡(jiǎn)介
RZ G2L核心板以太網(wǎng)接口性能測(cè)試

RZ/G2L核心板e(cuò)MMC測(cè)試

RZ/G2L RZ/G2LC RZ/G2UL RZ/G3S靈活軟件包應(yīng)用說(shuō)明

評(píng)論