資料介紹
描述
在本教程中,我們將學習如何將您的草圖與超級優(yōu)化的英特爾庫集成以進行大量數(shù)學計算(朋友的 MKL)。
首先,您需要一個合適的物聯(lián)網(wǎng)網(wǎng)關(guān),有幾個可用的 GB 硬盤空間(庫有時可能很重)。按照 Create 的 Getting Started 部分啟動并運行您的 Gateway(例如,選擇 Ubuntu 發(fā)行版)。
為什么我需要這么大的空間
(又名:我如何學會愛上共享庫)
在 Arduino 世界中,庫是幫助您與特定硬件交互或執(zhí)行特定操作的代碼集合。
在 Linux 上,一個庫具有相同的屬性,但可以在多個程序之間共享。這可以節(jié)省大量空間,因為它們包含的功能可以被不同的進程免費使用。
設(shè)置董事會
庫通常通過包管理器或使用安裝程序提供(我們將在本例中使用后一種)。首先,使用您在安裝過程中提供的 IP 地址和用戶名/密碼,通過 ssh 訪問您的開發(fā)板。為此,您可以使用 Putty(如果您在 Windows 上)或串行終端。端口必須設(shè)置為 22 才能使 SSH 登錄正常工作。
現(xiàn)在我們需要下載 MKL 包。打開瀏覽器并訪問https://software.intel.com/en-us/mkl ,點擊“免費下載”并完成注冊過程。選擇“Intel Performance Libraries for Linux”并右鍵單擊“Intel Math Kernel Library”,選擇“Copy link address”(或類似的,取決于您的瀏覽器)。
現(xiàn)在重新打開 SSH shell,輸入:
?
wget
?
并粘貼您剛剛復制的鏈接。按 [Enter] 并開始下載。下載后,通過鍵入以下內(nèi)容提取包:
?
tar xvf l_mkl_2017*
?
讓我們cd 進入解壓文件夾(通常與下載的包同名,不帶擴展名)并輸入:
?
./install.sh
?
按照屏幕上的說明進行操作,幾分鐘后您的系統(tǒng)將準備就緒。
是時候編碼了!
使用提供的示例打開創(chuàng)建。我們將演示 MKL 庫的一個非常方便的功能,它有助于并行化代碼執(zhí)行,而無需擔心線程或類似問題。
在示例中,使用MKL 中包含的優(yōu)化函數(shù)執(zhí)行矩陣乘法。cblas_dgemm該功能針對各種 Intel 硬件平臺進行了優(yōu)化,使用目標 CPU(AVX、SSE4 等)上可用的最新矢量化功能。
但是如果我們有一個多核架構(gòu)會發(fā)生什么呢?我們正在失去很多功能,因為函數(shù)只在線程上運行,即使它必須解決的問題可以“拆分”成多個更小的問題,因此它是并行化的完美候選者。
使用 mkl_set_num_threads 我們可以指示庫在多個線程(和內(nèi)核)上運行,而無需額外的編程工作。
該示例使用多個線程數(shù)執(zhí)行相同的計算,從 1 到目標 CPU 的內(nèi)核數(shù)(如果 HyperThreading 處于活動狀態(tài),可能會加倍)并對各種運行進行基準測試。
讓我們釋放怪物
準備就緒后,打開左側(cè)面板上的監(jiān)視器,按“上傳”并等待幾秒鐘以開始上傳和草圖。程序的輸出將打印在監(jiān)視器上。
我們學到了什么?
如果我們看一下結(jié)果,與單線程相比,在兩個線程上執(zhí)行將帶來幾乎兩倍的性能(當然是在雙核處理器上)。性能影響并不完全是x2 因為在啟動任何額外線程時會有一點開銷,只要執(zhí)行時間很短,這種懲罰就會變得更大。如果大部分時間都花在處理數(shù)字上,那么加速比接近理論最大值。
- 基于英特爾QuickAssist的EP80579 IP電話語音應用軟件
- 英特爾64和IA-32體系結(jié)構(gòu)軟件開發(fā)人員手冊 5次下載
- 2021年英特爾處理器排行榜文件下載 61次下載
- 英特爾Atom推出的16內(nèi)核芯片的說明
- 用于OpenCL的英特爾FPGA SDK資料 8次下載
- 英特爾最小型內(nèi)核實現(xiàn)邊緣智能 0次下載
- 面向嵌入式應用的英特爾Q965高速芯片組 24次下載
- 第二代英特爾奔騰M處理器 248次下載
- 帶英特爾3100芯片組開發(fā)包的奔騰M處理器 39次下載
- 英特爾賽揚440處理器產(chǎn)品簡介 50次下載
- 英特爾BOOT Loader開發(fā)套件-高級嵌入式開發(fā)基礎(chǔ) 59次下載
- 基于英特爾至強處理器C5500_C3500系列平臺 35次下載
- 支持嵌入式計算的英特爾酷睿2雙核處理器E8400 30次下載
- 基于英特爾XScale微體系結(jié)構(gòu)的英特爾80219通用PCI處理器 56次下載
- 英特爾(intel)815主板PCB板文件
- 使用英特爾AI PC為YOLO模型訓練加速 432次閱讀
- 使用PyTorch在英特爾獨立顯卡上訓練模型 651次閱讀
- 英特爾CPU部署Qwen 1.8B模型的過程 2734次閱讀
- 英特爾、三星和臺積電公布下一代晶體管進展 597次閱讀
- 基于C#和OpenVINO?在英特爾獨立顯卡上部署PP-TinyPose模型 2574次閱讀
- 英特爾電腦棒拆解 1.2w次閱讀
- 英特爾為什么要找三星代工生產(chǎn)芯片 8111次閱讀
- 英特爾推出的Ice Lake筆記本處理器能使圖形性能提升2倍 4128次閱讀
- 英特爾的Agilex FPGA發(fā)布 必將對當前的FPGA市場帶來一波最強的沖擊 1186次閱讀
- 英特爾的全新芯片架構(gòu)和六大技術(shù)新動向戰(zhàn)略說明 4864次閱讀
- 英特爾、蘋果、高通、AMD的CPU有什么重大Bug嗎? 5746次閱讀
- 優(yōu)化引擎和控制器,加速AI火箭 3900次閱讀
- 全新的英特爾無人機技術(shù) 5324次閱讀
- 一文詳解英特爾CPU驚天漏洞事件 4867次閱讀
- 英特爾對自動駕駛所做的準備工作 2501次閱讀
下載排行
本周
- 1涂鴉各WiFi模塊原理圖加PCB封裝
- 11.75 MB | 76次下載 | 1 積分
- 2錦銳科技CA51F2 SDK開發(fā)包
- 24.06 MB | 29次下載 | 1 積分
- 3錦銳CA51F005 SDK開發(fā)包
- 19.47 MB | 3次下載 | 1 積分
- 4蘋果iphone 11電路原理圖
- 4.98 MB | 3次下載 | 2 積分
- 5基礎(chǔ)模擬電子電路
- 3.80 MB | 3次下載 | 1 積分
- 6RA-Eco-RA6M4-100PIN-V1.0開發(fā)板資料
- 34.89 MB | 1次下載 | 免費
- 7STM32F3系列、STM32F4系列、STM32L4系列和STM32L4+系列Cortex-M4編程手冊
- 3.32 MB | 1次下載 | 免費
- 8聯(lián)想A820t手機維修圖紙包括主板原理圖 尾板原理圖 點位圖
- 0.62 MB | 次下載 | 5 積分
本月
- 1AI智能眼鏡產(chǎn)業(yè)鏈分析
- 4.43 MB | 383次下載 | 免費
- 2蘇泊爾電磁爐線路的電路原理圖資料合集
- 2.02 MB | 296次下載 | 5 積分
- 3貼片三極管上的印字與真實名稱的對照表詳細說明
- 0.50 MB | 94次下載 | 1 積分
- 4長虹液晶電視R-HS310B-5HF01的電源板電路原理圖
- 0.46 MB | 91次下載 | 5 積分
- 5涂鴉各WiFi模塊原理圖加PCB封裝
- 11.75 MB | 76次下載 | 1 積分
- 6錦銳科技CA51F2 SDK開發(fā)包
- 24.06 MB | 29次下載 | 1 積分
- 7AO4803A雙P通道增強型場效應晶體管的數(shù)據(jù)手冊
- 0.11 MB | 28次下載 | 2 積分
- 8長虹液晶彩電LS29機芯的技術(shù)資料說明
- 3.42 MB | 16次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935127次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191388次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183342次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81588次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73815次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論