在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

RISC-V 跑大模型(三):LLaMA中文擴展

澎峰科技PerfXLab ? 來源:澎峰科技PerfXLab ? 作者:澎峰科技PerfXLab ? 2023-07-17 17:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這是RISC-V跑大模型系列的第三篇文章,前面我們為大家介紹了如何在RISC-V下運行LLaMA,本篇我們將會介紹如何為LLaMA提供中文支持。

1.模型擴充

以下步驟在X86下進行:

1.1準備工作

安裝最新版本的python和以下依賴庫。

pip install protobuf==3.20.0 結構化數據存儲格式
pip install transformers 把原版模型轉換為HF格式
pip install sentencepiece 無監督的文本標記器和去標記器
pip install peft 使用LoRA的工具

1.2模型下載

下載LLaMA原版模型和中文擴充

LLaMA原版模型:

https://ipfs.io/ipfs/Qmb9y5GCkTG7ZzbBWMu2BXwMkzyCKcUjtEKPpgdZ7GEFKm/

中文擴充:

https://huggingface.co/ziqingyang/chinese-alpaca-lora-7b

下載后的目錄如下:

wKgaomS1AoiAbJSYAACUfmvct_s083.pngwKgZomS1Ao6ACv0GAABF7DbXaIQ678.png

1.3合并模型

(1) 將LLaMA原版模型轉換為Huggingface格式。這一步需要借助transformers提供的腳本convert_llama_weights_to_hf.py。

下載鏈接:https://github.com/huggingface/transformers/blob/main/src/transformers/models/llama/convert_llama_weights_to_hf.py

請執行以下命令:

python convert_llama_weights_to_hf.py --input_dir path_to_original_llama_root_dir --model_size 7B --output_dir path_to_original_llama_hf_dir

命令解釋:將原版LLaMA的tokenizer.model放在--input_dir指定的目錄,其余文件放在${input_dir}/${model_size}下。執行以下命令后,--output_dir中將存放轉換好的Huggingface版權重。

(2) 合并LoRA權重,生成Huggingface全量模型,這一步需要借助:merge_llama_with_chinese_lora.py。

下載鏈接:

https://github.com/ymcui/Chinese-LLaMA-Alpaca/blob/main/scripts/merge_llama_with_chinese_lora.py

執行命令:

python merge_llama_with_chinese_lora.py --base_model path_to_original_llama_hf_dir --lora_model chinese-alpaca-lora-7b --output_dir path_to_output_dir

命令解釋:這一步的參數可以參照上一步。

2.移植模型

在完成前面的步驟后會得到一個path_to_output_dir的目錄,目錄內容如下:

wKgZomS1BGiAcPf6AAC6mGVvrpk862.png

將目錄下的consolidate.00.path和params.json上傳到RISC-V中的llama.cpp/models目錄下,這一步可以借助scp來實現:scp “源文件路徑” 賬戶@地址:目的路徑。之后的步驟可以參考本系列的第二篇文章。鏈接如下:RISC-V 跑大模型(二):LLaMA零基礎移植教程

最后的運行效果:

wKgZomS1BNiAJHVQAAIxHb8elDk082.png

3.結語

我們也為大家準備好已經擴展了中文的LLaMA供大家使用,只要掃描下面的二維碼,進群即可獲得下載地址。之后我們還會對LLaMA進行優化加速,敬請期待。

另外,RISC -V跑大模型系列文章計劃分為四期:

1.RISC -V跑大模型(一)

2.RISC-V 跑大模型(二):LLaMA零基礎移植教程

3.RISC-V跑大模型(三):LLaMA中文擴充(本篇)

4.更多性能優化策略。(計劃)

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19837

    瀏覽量

    234009
  • RISC-V
    +關注

    關注

    46

    文章

    2518

    瀏覽量

    48448
  • 大模型
    +關注

    關注

    2

    文章

    3072

    瀏覽量

    3940
  • LLM
    LLM
    +關注

    關注

    1

    文章

    322

    瀏覽量

    741
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    關于RISC-V芯片的應用學習總結

    的核心優勢在于其開源性、模塊化、低功耗、高性能以及可擴展性。這些特性使得RISC-V芯片在物聯網(IoT)、嵌入式系統、邊緣計算以及高性能計算等領域具有獨特競爭力。 在物聯網領域,RISC-V芯片的低功耗
    發表于 01-29 08:38

    新的一年 RISC-V前景如何呢?

    1 月 7 日消息,RISC-V 領軍企業 SiFive 成立中國分公司,中文名稱定為“芯伍科技”。 1 月 14 日消息,專注傳統與 AI 業務,Imagination 放棄 RISC-V CPU 開發。 新的一年,
    發表于 01-24 16:19

    RISC-V指令集概述

    RISC-V就是RISC的第五代指令集架構。而RISC-V目標就是“成為一種完全開放的指令集架構,可被任何學術機構或商業組織自由使用”。 RISC-V指令集由“基本指令集 +
    發表于 11-30 23:30

    關于RISC-V學習路線圖推薦

    )、密碼指令集(C)等。 RISC-V架構特性 : 掌握RISC-V的精簡、模塊化、可擴展性和可裁剪性等特性。 、RISC-V開發工具與環
    發表于 11-30 15:21

    什么是RISC-V?以及RISC-V和ARM、X86的區別

    是開放的,任何人都可以使用它來開發處理器芯片和其他硬件,而無需支付任何許可或使用費用。RISC-V的設計簡單,易于擴展和自定義,可以在各種應用場景和市場中使用。 什么是指令集架構? 指令集架構
    發表于 11-16 16:14

    RISC-V,即將進入應用的爆發期

    計算機由控制整體的CPU(中央處理器)和加速器兩部分構成。在AI計算中,功耗和效率是兩個關鍵因素。RISC-V架構通過其簡潔的設計和定制化的擴展,可以實現高效的能量使用。該架構能夠通過小型且高效的處理單元
    發表于 10-31 16:06

    RISC-V近期市場情況調研

    RISC-V芯片的發展情況 全球趨勢 :RISC-V架構因其開源、免費、模塊化和可擴展的特點,獲得了業界的廣泛支持。包括蘋果、Intel、高通等國際巨頭都在積極布局RISC-V生態
    的頭像 發表于 10-23 15:10 ?1602次閱讀

    加入全球 RISC-V Advocate 行列,共筑 RISC-V 的未來 !

    加入RISC-VAdvocate行列!我們正在尋找來自世界各地的RISC-V愛好者,通過全球推廣和參與,成為支持RISC-V進步的關鍵參與者。作為一名RISC-VAdvocate,您將
    的頭像 發表于 09-10 08:08 ?821次閱讀
    加入全球 <b class='flag-5'>RISC-V</b> Advocate 行列,共筑 <b class='flag-5'>RISC-V</b> 的未來 !

    RISC-V Summit China 2024 青稞RISC-V+接口PHY,賦能RISC-V高效落地

    第二屆RISC-V中國峰會的南京會場;青稞RISC-V的單雙線調試技術,在第屆峰會上入選RISC-V新技術與新成果。
    的頭像 發表于 08-30 18:18 ?2241次閱讀
    <b class='flag-5'>RISC-V</b> Summit China 2024  青稞<b class='flag-5'>RISC-V</b>+接口PHY,賦能<b class='flag-5'>RISC-V</b>高效落地

    RISC-V Summit China 2024 | 青稞RISC-V+接口PHY,賦能RISC-V高效落地

    量產芯片的關鍵技術;公司籌備了第二屆RISC-V中國峰會的南京會場;青稞RISC-V的單雙線調試技術,在第屆峰會上入選RISC-V新技術與新成果。 02 連接聯網連世界 有核有根有
    發表于 08-30 17:37

    2024 RISC-V 中國峰會:華秋電子助力RISC-V生態!

    第四屆RISC-V中國峰會(RISC-V Summit China 2024)于8月21日至23日在杭州盛大召開,成為RISC-V領域的一次重要盛會
    的頭像 發表于 08-26 18:33 ?1446次閱讀
    2024 <b class='flag-5'>RISC-V</b> 中國峰會:華秋電子助力<b class='flag-5'>RISC-V</b>生態!

    2024 RISC-V 中國峰會:華秋電子助力RISC-V生態!

    160+,生態技術文章8000+,策劃了70多場RISC-V系列公開課,號召更多合作伙伴一起加入,參與RISC-V開發者生態共建。 不僅如此,電子發燒友聯合RISC-V生態平臺伙伴發起2024第
    發表于 08-26 16:46

    risc-v的發展歷史

    本的RISC-V指令集架構,即RISC-V v2.0。這個版本為32位和64位的RISC-V架構定義了基本的指令集,并概述了未來的擴展指令集
    發表于 07-29 17:20

    rIsc-v的缺的是什么?

    RISC-V作為一種開源的指令集架構(ISA),自其誕生以來就受到廣泛關注和應用,但它也存在一些不足之處。以下是RISC-V架構目前存在的主要缺點: 1. 性能問題 相對于專用ISA的性能差距:盡管
    發表于 07-29 17:18

    為什么要有RISC-V

    的,永遠不會改變。這為編譯器編寫者,操作系統開發人員和匯 編語言程序員提供了穩定的目標。模塊化來源于可選的標準擴展,根據應用程序的需要,硬件可以包含或不包含這些擴展。這種模塊化特性使得RISC-V具有了
    發表于 07-27 15:05
    主站蜘蛛池模板: 久久亚洲aⅴ精品网站婷婷 久久亚洲成人 | 毛片三级在线观看 | 男人天堂网在线视频 | 久久夜夜操妹子 | 免费我看视频在线观看 | 亚洲二区在线观看 | 100000免费啪啪18免进 | 老师我好爽再深一点好大 | 久久久久久免费观看 | 亚洲毛片免费在线观看 | 中文字幕一区二区三区四区 | 美女张开大腿让男人捅 | 一级欧美一级日韩 | 五月亭亭激情五月 | 色老头一区二区三区在线观看 | 色视频网站人成免费 | 色噜噜狠狠成人中文小说 | 午夜逼逼| 好黄好硬好爽好刺激 | 激情综合网五月婷婷 | 视频一区 中文字幕 | 天天爱添天天爱添天天爱添 | 日日夜操 | www.97色| 26uuu另类欧美亚洲曰本 | 天堂精品在线 | 亚洲第一色图 | 在线看片福利 | 免费日韩一级片 | 7777在线| 美女扒开尿口给男人桶爽视频 | 国产一区二区三区在线观看影院 | 六月婷婷导航福利在线 | 萌白酱一线天粉嫩喷水在线观看 | 天天在线影院 | 国模吧 | 在线播放免费视频 | 四虎影院一级片 | 91福利视频网 | 手机在线视频观看 | 在线观看中文字幕第一页 |