在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

8G顯存一鍵訓練,解鎖Llama2隱藏能力!XTuner帶你玩轉大模型

jf_pmFSk4VX ? 來源:GiantPandaCV ? 2023-09-04 16:12 ? 次閱讀

自 ChatGPT 發布以來,大模型的強大讓人們看見了通用人工智能的曙光,各個科技大廠也紛紛開源自家的大語言模型。然而,大模型也意味著高昂的硬件成本,讓不少平民玩家望而卻步。

為了讓大模型走入千家萬戶,賦能百業,上海人工智能實驗室開發了低成本大模型訓練工具箱 XTuner,旨在讓大模型訓練不再有門檻。通過 XTuner,最低只需 8GB 顯存,就可以打造專屬于你的 AI 助手。

X 種選擇

a60b02ea-49aa-11ee-97a6-92fbcf53809c.png

XTuner 提供了豐富的功能,上圖中的各項功能都可以隨意組合搭配。

除單點功能外,XTuner 還有以下三個黑科技,讓開發者可以做到真正的“面向數據”工作。

高效的數據引擎

XTuner 適配了多個熱門開源數據集格式,開發者如已有對應格式的數據集,可以直接使用,并支持多種格式數據源的混合使用:

Alpaca 格式,斯坦福大學開源數據集的格式,也是社區開源項目使用較多的一種格式

MOSS 格式,復旦大學開源指令微調數據集的格式,包含多輪對話和工具調用

Gunacao 格式,QLoRA 項目中所使用數據集的格式

OpenAI 格式,GPT-3.5-Turbo Finetune 接口要求的數據集格式

更多數據集格式正在持續添加中......

pip install xtuner # 訓練混合了 Alpaca 格式和 Gunacao 格式的數據 xtuner train internlm_7b_qlora_alpaca_enzh_oasst1_e3

除了支持多種數據集格式外,XTuner 還針對大語言模型數據的特點,對各種數據集格式做了充分的解耦,相較于其他的 Finetune 開源項目,可以在不破壞 Chat 模型對話模版的情況下,對 Chat 模型進行 Finetune。

pip install xtuner # 不破壞 Chat 模型對話模版,繼續增量指令微調 xtuner train internlm_chat_7b_qlora_oasst1_e3

針對 GPU 計算特點,在顯存允許的情況下,XTuner 支持將多條短數據拼接至模型最大輸入長度,以此最大化 GPU 計算核心的利用率,可以顯著提升訓練速度。例如,在使用 oasst1 數據集微調 Llama2-7B 時,數據拼接后的訓練時長僅為普通訓練的 50%。

多種訓練引擎

XTuner 首次嘗試將 HuggingFace 與 OpenMMLab 進行結合,兼顧易用性和可配置性。支持使用 MMEngine Runner 和 HuggingFace Trainer 兩種訓練引擎,開發者如有深度定制化需求,可根據使用習慣靈活配置。

pip install xtuner # 使用 MMEngine Runner 訓練 xtuner train internlm_7b_qlora_oasst1_e3 # 使用 HugingFace Trainer 訓練 xtuner train internlm_7b_qlora_oasst1_e3_hf

一鍵啟動訓練

XTuner 內置了增量預訓練、單輪&多輪對話指令微調、工具類指令微調的標準化流程,讓開發者只需聚焦于數據本身。

同時, XTuner 集成了 QLoRA、DeepSpeed 和 FSDP 等技術,提供各種尺寸模型在各種規格硬件下的訓練解決方案,通過 XTuner 一鍵式啟動訓練,僅需 8GB 顯存即可微調 7B 模型。

pip install 'xtuner[deepspeed]' # 8G 顯存微調 Llama2-7B xtuner train llama2_7b_qlora_oasst1_512_e3 --deepspeed deepspeed_zero2

基于此,開發者可以專注于數據,其他環節放心交給 XTuner,抽出更多精力去奔向大模型的星辰大海!

X 種玩法

通過 XTuner,開發者可以給大模型添加插件,補足大模型欠缺的能力,甚至獲得某些 ChatGPT 才有的技能。

XTuner 在 HuggingFace Hub 上提供了豐富的大模型插件,以下示例都可以在 Hub 中找到,歡迎大家下載體驗!

ColoristLlama -- 你的專屬調色師

通過在少量顏色注釋數據集上對 Llama2-7B 進行指令微調訓練,XTuner 成功解鎖了其調色能力。最終得到的模型甚至可以像“你的甲方”一樣反復修訂!

a65a773a-49aa-11ee-97a6-92fbcf53809c.gif

a6751fd6-49aa-11ee-97a6-92fbcf53809c.gif

pip install xtuner xtuner chat hf meta-llama/Llama-2-7b-hf --adapter xtuner/Llama-2-7b-qlora-colorist --prompt-template colorist

Llama "聯網" -- 更可靠及時的回答

借助 XTuner 及插件開源數據集,我們還解鎖了 Llama 2、QWen 等開源模型的隱藏能力, 使其可以像 ChatGPT 一樣聯網搜索、調用工具,獲得更可靠的回復。

a68d9408-49aa-11ee-97a6-92fbcf53809c.gif

a6cac03a-49aa-11ee-97a6-92fbcf53809c.gif

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4889

    瀏覽量

    130459
  • 顯存
    +關注

    關注

    0

    文章

    111

    瀏覽量

    13834
  • 大模型
    +關注

    關注

    2

    文章

    2959

    瀏覽量

    3704

原文標題:8G顯存一鍵訓練,解鎖Llama2隱藏能力!XTuner帶你玩轉大模型

文章出處:【微信號:GiantPandaCV,微信公眾號:GiantPandaCV】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    U盤一鍵制作

    在電腦維修中啟動盤很重要,靠譜的u盤一鍵啟動制作方法
    發表于 05-06 16:10 ?3次下載

    企業級Claude API應用方案!完整調用攻略來襲:帶你解鎖Claude 3.5/3.7大模型

    企業級Claude API大模型應用開發,完整調用攻略來襲,帶你解鎖Claude 3.5/3.7大模型,滿足企業級生產!無需魔法,無需外幣充值,無需擔心封號問題
    的頭像 發表于 03-19 19:55 ?524次閱讀
    企業級Claude API應用方案!完整調用攻略來襲:<b class='flag-5'>帶你</b><b class='flag-5'>解鎖</b>Claude 3.5/3.7大<b class='flag-5'>模型</b>

    無法在OVMS上運行來自Meta的大型語言模型 (LLM),為什么?

    無法在 OVMS 上運行來自 Meta 的大型語言模型 (LLM),例如 LLaMa2。 從 OVMS GitHub* 存儲庫運行 llama_chat Python* Demo 時遇到錯誤。
    發表于 03-05 08:07

    開關柜一鍵順控在一鍵停電、一鍵送電中的作用

    蜀瑞創新為大家科普,開關柜一鍵順控技術在一鍵停電和一鍵送電中發揮了快速響應、減少人為錯誤、提高安全性、簡化操作流程、降低操作風險、提高送電成功率等綜合優勢,對于提升電力系統的運行效率、安全性以及自動化水平具有重要意義。
    的頭像 發表于 02-27 09:13 ?379次閱讀

    訓練AI大模型需要什么樣的gpu

    訓練AI大模型需要選擇具有強大計算能力、足夠顯存、高效帶寬、良好散熱和能效比以及良好兼容性和擴展性的GPU。在選擇時,需要根據具體需求進行權衡和選擇。
    的頭像 發表于 12-03 10:10 ?471次閱讀

    用Ollama輕松搞定Llama 3.2 Vision模型本地部署

    Ollama的安裝。 Llama3.2 Vision簡介 Llama 3.2 Vision是個多模態大型語言模型(LLMs)的集合,它
    的頭像 發表于 11-23 17:22 ?3311次閱讀
    用Ollama輕松搞定<b class='flag-5'>Llama</b> 3.2 Vision<b class='flag-5'>模型</b>本地部署

    Llama 3 模型訓練技巧

    Llama 3 模型,假設是指個先進的人工智能模型,可能是個虛構的或者是個特定領域的術語。
    的頭像 發表于 10-27 14:24 ?725次閱讀

    Llama 3 語言模型應用

    在人工智能領域,語言模型的發展直是研究的熱點。隨著技術的不斷進步,我們見證了從簡單的關鍵詞匹配到復雜的上下文理解的轉變。 、Llama 3 語言
    的頭像 發表于 10-27 14:15 ?610次閱讀

    一鍵斷電開關的種類有哪些

    內部的小電流控制大電流,達到弱電控制強電的目的。 特點 :快速、安全,能夠切斷所有連接的電源,適合需要快速切斷電源的場景。 應用場景 :家庭、辦公室、工廠等需要一鍵控制多個電源的場景。 2. 智能開關式一鍵斷電 定義 :隨著智能
    的頭像 發表于 09-13 16:45 ?2386次閱讀

    一鍵斷電開關的控制原理是什么

    一鍵斷電開關,也被稱為緊急斷電開關或緊急停止開關,是種安全裝置,用于在緊急情況下迅速切斷電源,以防止事故的發生或擴大。這種開關的設計和應用在工業、實驗室、醫療設備以及任何需要快速斷電的場合都
    的頭像 發表于 09-13 16:28 ?2725次閱讀

    源2.0-M32大模型發布量化版 運行顯存僅需23GB 性能可媲美LLaMA3

    北京2024年8月23日?/美通社/ -- 近日,浪潮信息發布源2.0-M32大模型4bit和8bit量化版,性能比肩700億參數的LLaMA3開源大
    的頭像 發表于 08-25 22:06 ?555次閱讀
    源2.0-M32大<b class='flag-5'>模型</b>發布量化版 運行<b class='flag-5'>顯存</b>僅需23GB 性能可媲美<b class='flag-5'>LLaMA</b>3

    變電站一鍵順控系統和開關柜一鍵順控有區別嗎?

    變電站一鍵順控系統和開關柜一鍵順控技術雖然都涉及到“一鍵順控”的概念,但它們在應用范圍和具體實現上有所不同,因此變電站一鍵順控系統和開關柜一鍵
    的頭像 發表于 07-31 13:34 ?981次閱讀
    變電站<b class='flag-5'>一鍵</b>順控系統和開關柜<b class='flag-5'>一鍵</b>順控有區別嗎?

    云天勵飛推出IPU-X6000加速卡,針對大模型推理任務設計

    卡的互聯;可應用于語言、視覺、多模態等各類大模型的推理加速,目前已適配云天天書、通義千問、百川智能、Llama2/3等近10個主流大模型。
    的頭像 發表于 07-24 11:03 ?1134次閱讀

    摩爾線程和滴普科技完成大模型訓練與推理適配

    近日,摩爾線程與滴普科技宣布了項重要合作成果。摩爾線程的夸娥(KUAE)千卡智算集群與滴普科技的企業大模型Deepexi已完成訓練及推理適配,共同實現了700億參數LLaMA2大語言
    的頭像 發表于 05-30 10:14 ?730次閱讀

    Meta Llama 3基礎模型現已在亞馬遜云科技正式可用

    亞馬遜云科技近日宣布,Meta公司最新發布的兩款Llama 3基礎模型——Llama 3 8B和Llama 3 70B,現已正式上線并集成至
    的頭像 發表于 05-09 10:39 ?559次閱讀
    主站蜘蛛池模板: www五月天 | 伊人久久综合网站 | 免费看大美女大黄大色 | 国产亚洲精品aa在线观看 | 国产精品青草久久久久福利99 | 傲视影院午夜毛片 | 久久草在线视频播放 | 欧美成人精品一区二三区在线观看 | 手机在线黄色网址 | 黄色顶级视频 | 日韩毛片高清在线看 | 欧美色欧美亚洲高清在线观看 | 国内精品99 | 精品一区二区在线观看 | 久久婷婷午色综合夜啪 | 免费观看黄网站 | 干干干操操操 | 亚洲成人免费观看 | 成人五级毛片免费播放 | 毛片基地在线 | 狠狠色噜噜狠狠狠狠色综合久 | 国产午夜精品视频 | 色天天干 | 久久成人免费网站 | 欧美黑人巨大xxxx猛交 | 欧美三级免费网站 | 四虎永久网址在线观看 | 人人干人人艹 | 久久久久综合 | 欧美在线成人午夜影视 | 午夜福利国产一级毛片 | 欧美三级不卡在线观线看高清 | 国产三级黄色录像 | 四虎影院在线免费观看 | 特黄aa级毛片免费视频播放 | 二区久久国产乱子伦免费精品 | 亚洲天堂资源 | 亚洲bbbbbxxxxx精品三十七 | 爱爱帝国亚洲一区二区三区 | 乱小说录目伦200篇将曲勒 | 美脚连裤袜老师正在播放 |