在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

智能開源大模型baichuan-7B技術改進

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 2023-06-17 14:14 ? 次閱讀

baichuan-7B 主要是參考LLaMA進行的改進,且模型架構與LLaMA一致。而在開源大模型中,LLaMA無疑是其中最閃亮的星,但LLaMA存在如下問題:

LLaMA 原生僅支持 Latin 或 Cyrillic 語系,只使用了少量中文數據集進行訓練,因此,對于中文支持不是特別理想。

原版LLaMA模型的詞表大小是32K,僅有少量中文詞,對于中文的解碼效率較低。

baichuan-7B的改進如下:

效果改進:用于提升模型的效果以及解碼效率。

分詞改進:詞表大小為64K(使用2000萬條以中英為主的多語言語料訓練分詞模型,顯著提升對于中文的壓縮率),而LLaMA詞表大小為32K。

數據集改進:使用了大約 1.2T 中英 tokens 進行訓練(基于開源的中英文數據和自行抓取的中文互聯網數據以及部分高質量知識性數據進行的數據清洗),而 LLaMA 7B 使用 1T 英文 tokens 進行訓練。

技術改進:用于提升訓練穩定性和吞吐量。

算子優化技術:采用更高效算子,如 Flash-attention,NVIDIA apex 的 RMSNorm 等。

算子切分技術:將部分計算算子進行切分,減小內存峰值。

混合精度技術:降低在不損失模型精度的情況下加速計算過程。

訓練容災技術:訓練平臺和訓練框架聯合優化,IaaS + PaaS 實現分鐘級的故障定位和任務恢復。

通信優化技術,具體包括:

采用拓撲感知的集合通信算法,避免網絡擁塞問題,提高通信效率。

根據卡數自適應設置 bucket size,提高帶寬利用率。

根據模型和集群環境,調優通信原語的觸發時機,從而將計算和通信重疊。

此外,該模型開源可商用,也算是一個優勢吧。

可以看到,現在的大模型,從算法層面改進的空間似乎很小了,更多的是從工程和數據層面上進行改進從而來提升其性能。

最后,希望國產大模型越來越好~~
責任編輯:彭菁

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 帶寬
    +關注

    關注

    3

    文章

    985

    瀏覽量

    41595
  • 開源
    +關注

    關注

    3

    文章

    3533

    瀏覽量

    43286
  • 模型
    +關注

    關注

    1

    文章

    3464

    瀏覽量

    49812

原文標題:百川智能開源大模型baichuan-7B剖析

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    中國人工智能開源軟件前生今生到底如何?

    為推動人工智能開源軟件快速而健康的發展,中國人工智能開源軟件發展聯盟召集中國電子技術標準化研究院、上海軟件中心、北京大學、微眾銀行、螞蟻金服、京東等企事業單位,研究梳理人工智能開源軟件
    的頭像 發表于 07-11 16:27 ?5854次閱讀

    汽車智能開源分享

    電子發燒友網站提供《汽車智能開源分享.zip》資料免費下載
    發表于 12-13 09:56 ?0次下載
    汽車<b class='flag-5'>智能開源</b>分享

    百川智能獲阿里騰訊小米等3億美元投資

    百川智能推出了4款開源baichuan-7b/13bbaichuan 2-7b/13
    的頭像 發表于 10-17 10:15 ?898次閱讀

    寒武紀的思元(MLU)云端智能加速卡與百川智能完成大模型適配,攜手創新生成式AI

    近日,寒武紀思元(MLU)系列云端智能加速卡與百川智能旗下的大模型Baichuan2-53BBaichuan2-13B
    的頭像 發表于 11-06 20:32 ?1785次閱讀
    寒武紀的思元(MLU)云端<b class='flag-5'>智能</b>加速卡與百川<b class='flag-5'>智能</b>完成大<b class='flag-5'>模型</b>適配,攜手創新生成式AI

    百川智能發布超千億大模型Baichuan 3

    百川智能近日發布了超千億參數的大語言模型Baichuan 3,引發了業界的廣泛關注。這款模型在多個權威通用能力評測中表現卓越,展現了其強大的語義理解和生成能力。
    的頭像 發表于 01-31 14:58 ?1077次閱讀

    IBM在watsonx上提供開源的Mistral AI模型

    IBM 提供 Mixtral-8x7B 的優化版本,該版本可將延遲時間最多縮短 75% IBM、第三方和開源模型的目錄不斷增加,為客戶提供更多選擇和靈活性 是 watsonx 人工智能
    的頭像 發表于 03-12 19:10 ?1467次閱讀

    高通推出第三代驍龍7+移動平臺

    高通技術公司重磅推出了全新的第三代驍龍?7+移動平臺,這一創新成果成功將終端側生成式AI技術引入至驍龍7系,開啟了全新的智能時代。這款移動平
    的頭像 發表于 03-22 14:13 ?2591次閱讀

    百川智能發布Baichuan 4大模型及首款AI助手“百小應”

    百川智能近日發布了其新一代基座大模型Baichuan 4,并同步推出了首款AI助手“百小應”。這款AI助手是在Baichuan 4強大能力的基礎上,結合先進的搜索
    的頭像 發表于 05-23 14:15 ?832次閱讀

    亞馬遜云科技接入百川智能和零一萬物基礎模型

    近日,亞馬遜云科技在中國峰會上宣布,兩大中文基礎模型——百川智能Baichuan2-7B和零一萬物的Yi-1.5 6B/9B/34
    的頭像 發表于 06-04 11:53 ?707次閱讀

    高通第三代驍龍7s移動平臺發布,賦能中端智能手機以卓越AI新體驗

    式AI技術,并兼容包括Baichuan-7B及擁有10億參數的Llama 2在內的大型語言模型(LLM),極大地推動了智能手機智能化進程的新高度。
    的頭像 發表于 08-21 15:42 ?2682次閱讀

    阿里通義千問代碼模型全系列開源

    近日,阿里云通義大模型團隊宣布了一項重大決策:將通義千問代碼模型全系列正式開源。此次開源模型系列共包含6款Qwen2.5-Coder
    的頭像 發表于 11-14 15:26 ?783次閱讀

    圖森未來發布“Ruyi”視頻大模型,Ruyi-Mini-7B版本現已開源

    重大獻禮。 尤為值得一提的是,圖森未來已經將Ruyi的Mini-7B版本正式開源,用戶現在可以通過huggingface平臺輕松下載并使用這一強大的工具。這一舉措無疑將極大地推動視頻大模型在更廣泛領域的應用和發展。 “Ruyi”
    的頭像 發表于 12-20 15:19 ?1228次閱讀

    百川智能發布Baichuan4-Finance金融大模型

    近日,百川智能正式推出了其全鏈路領域增強的金融大模型——Baichuan4-Finance。這一創新產品的發布,標志著百川智能在金融智能化領
    的頭像 發表于 12-25 10:11 ?464次閱讀

    百川智能發布全場景深度思考模型Baichuan-M1-preview

    1月24日,百川智能正式發布了全場景深度思考模型Baichuan-M1-preview。 Baichuan-M1-preview同時具備語言、視覺和搜索三大領域推理能力的
    的頭像 發表于 01-24 14:40 ?908次閱讀

    百川智能發布全場景深度思考模型Baichuan-M1-preview

    近日,百川智能正式發布了國內首個全場景深度思考模型——Baichuan-M1-preview。這一創新成果標志著我國在人工智能領域取得了重要突破,特別是在語言、視覺和搜索三大領域的推理
    的頭像 發表于 02-05 13:51 ?489次閱讀
    主站蜘蛛池模板: 日韩a毛片 | 色综合久久综合欧美综合图片 | 在线国产资源 | 国产成人综合日韩精品婷婷九月 | 日韩黄色录像 | 亚洲精品理论 | 一级视频在线免费观看 | 欧美日韩一区不卡 | 免费观看视频网站 | 奇米影视四色7777 | 亚洲高清免费观看 | 欧美夜夜操 | 2021韩国理论片ok电影天堂 | 丁香五月欧美成人 | 伊人久久大香线蕉影院95 | 欧美成人精品福利网站 | 黄a级免费 | 成人免费看毛片 | 国产亚洲片 | 91成人免费 | 天天摸天天操天天爽 | 国产精品久久久久影院色老大 | 亚洲国产欧美精品一区二区三区 | 欧美综合国产精品日韩一 | 一区二区三区免费视频网站 | 毛片免费网 | 77米奇影院 | 中文字幕亚洲一区二区v@在线 | 日韩一区二区在线观看 | 久久婷婷成人综合色 | 女人被狂躁视频网站免费 | 天天操操操操 | 欧美性xxxxxbbbbbb精品 | 一级不卡毛片 | 在线观看永久免费 | 国产精品资源在线 | 91华人在线视频 | 四虎永久在线日韩精品观看 | www爽| 丁香六月激情婷婷 | 成人午夜影院在线观看 |