這是RISC-V跑大模型系列的第三篇文章,前面我們為大家介紹了如何在RISC-V下運行LLaMA,本篇我們將會介紹如何為LLaMA提供中文支持。
1.模型擴充
以下步驟在X86下進行:
1.1準備工作
pip install protobuf==3.20.0 | 結構化數據存儲格式 |
pip install transformers | 把原版模型轉換為HF格式 |
pip install sentencepiece | 無監督的文本標記器和去標記器 |
pip install peft | 使用LoRA的工具 |
1.2模型下載
下載LLaMA原版模型和中文擴充
LLaMA原版模型:
https://ipfs.io/ipfs/Qmb9y5GCkTG7ZzbBWMu2BXwMkzyCKcUjtEKPpgdZ7GEFKm/
中文擴充:
下載后的目錄如下:
![wKgaomS1AoiAbJSYAACUfmvct_s083.png](https://file1.elecfans.com/web2/M00/8C/F0/wKgaomS1AoiAbJSYAACUfmvct_s083.png)
![wKgZomS1Ao6ACv0GAABF7DbXaIQ678.png](https://file1.elecfans.com/web2/M00/8C/F0/wKgZomS1Ao6ACv0GAABF7DbXaIQ678.png)
1.3合并模型
(1) 將LLaMA原版模型轉換為Huggingface格式。這一步需要借助transformers提供的腳本convert_llama_weights_to_hf.py。
下載鏈接:https://github.com/huggingface/transformers/blob/main/src/transformers/models/llama/convert_llama_weights_to_hf.py
請執行以下命令:
python convert_llama_weights_to_hf.py --input_dir path_to_original_llama_root_dir --model_size 7B --output_dir path_to_original_llama_hf_dir
命令解釋:將原版LLaMA的tokenizer.model放在--input_dir指定的目錄,其余文件放在${input_dir}/${model_size}下。執行以下命令后,--output_dir中將存放轉換好的Huggingface版權重。
(2) 合并LoRA權重,生成Huggingface全量模型,這一步需要借助:merge_llama_with_chinese_lora.py。
下載鏈接:
https://github.com/ymcui/Chinese-LLaMA-Alpaca/blob/main/scripts/merge_llama_with_chinese_lora.py
執行命令:
python merge_llama_with_chinese_lora.py --base_model path_to_original_llama_hf_dir --lora_model chinese-alpaca-lora-7b --output_dir path_to_output_dir
命令解釋:這一步的參數可以參照上一步。
2.移植模型
在完成前面的步驟后會得到一個path_to_output_dir的目錄,目錄內容如下:
![wKgZomS1BGiAcPf6AAC6mGVvrpk862.png](https://file1.elecfans.com/web2/M00/8C/F0/wKgZomS1BGiAcPf6AAC6mGVvrpk862.png)
將目錄下的consolidate.00.path和params.json上傳到RISC-V中的llama.cpp/models目錄下,這一步可以借助scp來實現:scp “源文件路徑” 賬戶@地址:目的路徑。之后的步驟可以參考本系列的第二篇文章。鏈接如下:RISC-V 跑大模型(二):LLaMA零基礎移植教程
最后的運行效果:
![wKgZomS1BNiAJHVQAAIxHb8elDk082.png](https://file1.elecfans.com/web2/M00/8C/F0/wKgZomS1BNiAJHVQAAIxHb8elDk082.png)
3.結語
我們也為大家準備好已經擴展了中文的LLaMA供大家使用,只要掃描下面的二維碼,進群即可獲得下載地址。之后我們還會對LLaMA進行優化加速,敬請期待。
另外,RISC -V跑大模型系列文章計劃分為四期:
3.RISC-V跑大模型(三):LLaMA中文擴充(本篇)
4.更多性能優化策略。(計劃)
審核編輯 黃宇
-
處理器
+關注
關注
68文章
19420瀏覽量
231216 -
RISC-V
+關注
關注
45文章
2324瀏覽量
46618 -
大模型
+關注
關注
2文章
2560瀏覽量
3178 -
LLM
+關注
關注
0文章
299瀏覽量
403
發布評論請先 登錄
相關推薦
關于RISC-V芯片的應用學習總結
新的一年 RISC-V前景如何呢?
RISC-V指令集概述
關于RISC-V學習路線圖推薦
什么是RISC-V?以及RISC-V和ARM、X86的區別
RISC-V,即將進入應用的爆發期
RISC-V近期市場情況調研
加入全球 RISC-V Advocate 行列,共筑 RISC-V 的未來 !
![加入全球 <b class='flag-5'>RISC-V</b> Advocate 行列,共筑 <b class='flag-5'>RISC-V</b> 的未來 !](https://file1.elecfans.com/web2/M00/E5/D3/wKgaomZBeIyADEqiAACsZ19UYWk044.png)
RISC-V Summit China 2024 青稞RISC-V+接口PHY,賦能RISC-V高效落地
![<b class='flag-5'>RISC-V</b> Summit China 2024 青稞<b class='flag-5'>RISC-V</b>+接口PHY,賦能<b class='flag-5'>RISC-V</b>高效落地](https://file1.elecfans.com/web2/M00/04/BB/wKgZombRkPCAbb8HAAecyiE4_tA967.png)
RISC-V Summit China 2024 | 青稞RISC-V+接口PHY,賦能RISC-V高效落地
為什么要有RISC-V
RISC-V的MCU與ARM對比
解鎖RISC-V技術力量丨曹英杰:RISC-V與大模型探索
![解鎖<b class='flag-5'>RISC-V</b>技術力量丨曹英杰:<b class='flag-5'>RISC-V</b>與大<b class='flag-5'>模型</b>探索](https://file.elecfans.com/web2/M00/37/4D/poYBAGI62smAAPRDAAAzYJ7Ib6o943.png)
評論