基于北京迅為iTOP-RK3588大語言模型部署測試

人工智能（AI）領(lǐng)域中的大模型（Large Model）逐漸成為研究的熱點(diǎn)。大模型，顧名思義，是指擁有海量參數(shù)和高度復(fù)雜結(jié)構(gòu)的深度學(xué)習(xí)模型。它的出現(xiàn)，不僅推動了AI技術(shù)的突破，更為各行各業(yè)帶來了革命性的變化。

RK3588是瑞芯微推出的新一代旗艦級高端處理器，采用8nm工藝設(shè)計(jì)，搭載四核A76+四核A55的八核CPU和Arm高性能GPU，內(nèi)置6T算力的NPU。能夠高效地處理AI算法和模型，為大模型的運(yùn)行提供了強(qiáng)大的硬件支持。

在北京迅為推出的搭載了RK3588處理器的iTOP-RK3588開發(fā)板上，使用RKLLM 工具套件支持在iTOP-RK3588平臺上進(jìn)行LLM（大型語言模型）模型的轉(zhuǎn)換和部署。它與Hugging Face模型架構(gòu)兼容（Hugging Face是廣泛用于自然語言處理任務(wù)的模型架構(gòu)。

目前，該系統(tǒng)支持以下模型：LLaMA、Qwen、Qwen2和Phi-2。支持量化技術(shù)，即使用w8a8（8位權(quán)重，8位激活）和w4a16（4位權(quán)重，16位激活）精度進(jìn)行模型量化。這可以在目標(biāo)平臺上更高效地存儲和計(jì)算模型，減小內(nèi)存占用。

iTOP-RK3588開發(fā)板體驗(yàn)大模型

為了讓用戶更快速的體驗(yàn)RKLLM ，北京迅為已經(jīng)對Linux內(nèi)核源碼中的NPU版本進(jìn)行了升級，升級到了最新的0.9.6版本，具體如下所示：

默認(rèn)以將RKLLM動態(tài)庫集成在了Ubuntu和Debian系統(tǒng)中，用戶可以直接拷貝轉(zhuǎn)換完成的RKLLM大預(yù)言模型和推理程序進(jìn)行測試。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

處理器

處理器

+關(guān)注

關(guān)注
68

文章
19842

瀏覽量
234057
人工智能

人工智能

+關(guān)注

關(guān)注
1805

文章
48887

瀏覽量
247749
GPU芯片

GPU芯片

+關(guān)注

關(guān)注
1

文章
305

瀏覽量
6155
RK3588

RK3588

+關(guān)注

關(guān)注
7

文章
412

瀏覽量
5702
大模型

大模型

+關(guān)注

關(guān)注
2

文章
3083

瀏覽量
3955

原文標(biāo)題：更新 | 基于北京迅為iTOP-RK3588大語言模型部署測試

文章出處：【微信號：迅為電子，微信公眾號：迅為電子】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

迅為電子
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁

Hot 基于IMX8MM處理器Cortex-A核和Cortex-M核的RPMsg通信方案
Hot RK3568開發(fā)板GPIO擴(kuò)展——竟如此豐富

New 如何在2K0300開發(fā)板上搭建Qt環(huán)境
New RK3568開發(fā)板教程：以iTOP-RK3568開發(fā)板為例 Android13通過CIFS協(xié)議掛載Windows共享目錄

精選推薦
更多

文章

資料

帖子

園區(qū)智變時(shí)刻，網(wǎng)絡(luò)該如何為企業(yè)撐腰？

腦極體
2小時(shí)前

142 閱讀

不是8萬也不是13萬，高速風(fēng)筒為什么偏偏是11萬轉(zhuǎn)速呢？--【其利天下】

其利天下技術(shù)
4小時(shí)前

149 閱讀

基于瑞薩64位MPU RZ/G2L進(jìn)行32位應(yīng)用軟件開發(fā)

瑞薩MCU小百科
4小時(shí)前

167 閱讀

移動AI一周年，5G-A和AI究竟把世界變成什么樣？

腦極體
4小時(shí)前

254 閱讀

芯對話|CBM53D系列?4路同步+12位高精度DAC小能手

芯佰微電子
8小時(shí)前

265 閱讀

磁盤陣列技術(shù)原理

陶瓷肥貓
1.79 MB

免費(fèi)

0下載

成為Xilinx FPGA設(shè)計(jì)專家(基礎(chǔ)篇)

Kelly Yang
1.25 MB

免費(fèi)

3759下載

Plik可擴(kuò)展的臨時(shí)文件上傳系統(tǒng)

h1654155275.5697
9.38 MB

2積分

1下載

Broadcast-Development-Kit適用于Microsoft Teams的廣播開發(fā)套件

王飛
32.29 MB

2積分

1下載

SeriesGuide在Android管理和觀看電視節(jié)目

劉艷
2.68 MB

2積分

1下載

【飛凌T527N開發(fā)板試用】開箱曬圖查看配置設(shè)置屏參

jf_69121293
19小時(shí)前

69 閱讀

【微五科技CF5010RBT60開發(fā)板試用體驗(yàn)】打印串口無輸出問題解決(更正，原理圖中使用的是USART1不是UART4)

jf_1137202360
19小時(shí)前

84 閱讀

初級工程師PCB設(shè)計(jì)技巧（PPT版）

yuu_cool
19小時(shí)前

82 閱讀

【微五科技CF5010RBT60開發(fā)板試用體驗(yàn)】開發(fā)環(huán)境搭建之——使用J-Link調(diào)試

jf_69121293
19小時(shí)前

156 閱讀

【微五科技CF5010RBT60開發(fā)板試用體驗(yàn)】開發(fā)板介紹與開發(fā)環(huán)境搭建

jf_1137202360
19小時(shí)前

169 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

基于北京迅為iTOP-RK3588大語言模型部署測試

評論