在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

浪潮信息發布源2.0-M32開源大模型,模算效率大幅提升

浪潮AIHPC ? 來源:浪潮AIHPC ? 2024-05-29 09:34 ? 次閱讀

5月28日,浪潮信息發布“源2.0-M32”開源大模型。“源2.0-M32”在基于”源2.0”系列大模型已有工作基礎上,創新性地提出和采用了“基于注意力機制的門控網絡”技術,構建包含32個專家(Expert)的混合專家模型(MoE),并大幅提升了模型算力效率,模型運行時激活參數為37億,在業界主流基準評測中性能全面對標700億參數的LLaMA3開源大模型。

算法層面源2.0-M32提出并采用了一種新型的算法結構:基于注意力機制的門控網絡(Attention Router),針對MoE模型核心的專家調度策略,這種新的算法結構關注專家模型之間的協同性度量,有效解決傳統門控網絡下,選擇兩個或多個專家參與計算時關聯性缺失的問題,使得專家之間協同處理數據的水平大為提升。源2.0-M32采用源2.0-2B為基礎模型設計,沿用并融合局部過濾增強的注意力機制(LFA, Localized Filtering-based Attention),通過先學習相鄰詞之間的關聯性,然后再計算全局關聯性的方法,能夠更好地學習到自然語言的局部和全局的語言特征,對于自然語言的關聯語義理解更準確,進而提升了模型精度。

9ad71f44-1cea-11ef-b74b-92fbcf53809c.png

Figure1基于注意力機制的門控網絡(Attention Router)

■ 數據層面,源2.0-M32基于2萬億的token進行訓練、覆蓋萬億量級的代碼、中英文書籍、百科、論文及合成數據。大幅擴展代碼數據占比至47.5%,從6類最流行的代碼擴充至619類,并通過對代碼中英文注釋的翻譯,將中文代碼數據量增大至1800億token。結合高效的數據清洗流程,滿足大模型訓練“豐富性、全面性、高質量”的數據集需求。基于這些數據的整合和擴展,源2.0-M32在代碼生成、代碼理解、代碼推理、數學求解等方面有著出色的表現。

■ 算力層面,源2.0-M32采用了非均勻流水并行的方法,綜合運用流水線并行+數據并行的策略,顯著降低了大模型對芯片間P2P帶寬的需求,為硬件差異較大訓練環境提供了一種高性能的訓練方法。針對MoE模型的稀疏專家計算,采用合并矩陣乘法的方法,模算效率得到大幅提升。

基于在算法、數據和算力方面全面創新,源2.0-M32的性能得以大幅提升,在多個業界主流的評測任務中,展示出了較為先進的能力表現,在MATH(數學競賽)、ARC-C(科學推理)榜單上超越了擁有700億參數的LLaMA3大模型

9b0363c4-1cea-11ef-b74b-92fbcf53809c.jpg

Figure2 源2.0-M32業界主流評測任務表現

源2.0-M32大幅提升了模型算力效率,在實現與業界領先開源大模型性能相當的同時,顯著降低了在模型訓練、微調和推理所需的算力開銷。在模型推理運行階段,M32處理每token所需算力為7.4GFLOPs,而LLaMA3-70B所需算力為140GFLOPs。在模型微調訓練階段,對1萬條平均長度為1024 token的樣本進行全量微調,M32消耗算力約0.0026PD(PetaFLOPs/s-day),而LLaMA3消耗算力約為0.05PD。M32憑借特別優化設計的模型架構,在僅激活37億參數的情況下,取得了和700億參數LLaMA3相當的性能水平,而所消耗算力僅為LLaMA3的1/19,從而實現了更高的模算效率。

浪潮信息人工智能首席科學家吳韶華表示:當前業界大模型在性能不斷提升的同時,也面臨著所消耗算力大幅攀升的問題,對企業落地應用大模型帶來了極大的困難和挑戰。源2.0-M32是浪潮信息在大模型領域持續耕耘的最新探索成果,通過在算法、數據、算力等方面的全面創新,M32不僅可以提供與業界領先開源大模型相當的性能,更可以大幅降低大模型所需算力消耗。大幅提升的模算效率將為企業開發應用生成式AI提供模型高性能、算力低門檻的高效路徑。M32開源大模型配合企業大模型開發平臺EPAI(Enterprise Platform of AI),將助力企業實現更快的技術迭代與高效的應用落地,為人工智能產業的發展提供堅實的底座和成長的土壤,加速產業智能化進程。


審核編輯:劉清
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1804

    文章

    48503

    瀏覽量

    245268
  • 大模型
    +關注

    關注

    2

    文章

    2959

    瀏覽量

    3704
  • 生成式AI
    +關注

    關注

    0

    文章

    524

    瀏覽量

    688

原文標題:浪潮信息發布源2.0-M32開源大模型,模算效率大幅提升,37億激活參數性能對標LLaMA3-700億

文章出處:【微信號:浪潮AIHPC,微信公眾號:浪潮AIHPC】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    浪潮信息與智研究院攜手共建大模型多元力生態

    近日,浪潮信息與北京智人工智能研究院正式簽署戰略合作協議,雙方將緊密合作,共同構建大模型多元開源創新生態。 此次合作旨在
    的頭像 發表于 12-31 11:49 ?484次閱讀

    浪潮信息與智研究院達成戰略合作協議

    近日,浪潮信息與智研究院達成戰略合作協議,雙方將緊密協作共建大模型多元開源創新生態,提升
    的頭像 發表于 12-26 10:25 ?437次閱讀

    浪潮信息發布""Yuan-EB,刷新RAG檢索最高成績

    近日,浪潮信息在AI領域取得了重大突破,成功發布了其嵌入模型""Yuan-EB(Yuan-embedding-1.0)。在備受矚目的C-MTEB榜單中,"
    的頭像 發表于 12-25 15:54 ?422次閱讀

    捷通達攜手浪潮信息,ERP系統性能大幅提升

    的共同努力,捷通達成功將原有的SAP HANA系統升級為浪潮信息新一代SAP HANA數據庫一體機解決方案。這一升級不僅大幅提升了系統的運行效率,更使得ERP系統的數據查詢時間
    的頭像 發表于 12-24 14:36 ?470次閱讀

    浪潮信息發布”Yuan-EB助力RAG檢索精度新高

    近日,浪潮信息發布”Yuan-EB(Yuan-embedding-1.0,嵌入模型),在C-MTEB榜單中斬獲檢索任務第一名,以78.41的平均精度刷新大
    的頭像 發表于 11-26 13:54 ?469次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>“<b class='flag-5'>源</b>”Yuan-EB助力RAG檢索精度新高

    浪潮信息發布KOS AI定制版,大幅提升模型訓練效率

    浪潮信息近期推出了“元腦服務器操作系統KOS AI定制版”,為人工智能領域帶來了革命性的變化。這款定制版操作系統通過簡單的兩步操作,即可實現大模型訓練環境的快速部署。
    的頭像 發表于 10-30 17:23 ?817次閱讀

    浪潮信息源2.0模型與百度PaddleNLP全面適配

    近日,浪潮信息宣布其開源模型2.0已全面適配百度PaddleNLP。這一舉措標志著大模型開發
    的頭像 發表于 10-17 18:15 ?829次閱讀

    浪潮信息:元腦企智EPAI助力金融大模型快速落地

    浪潮信息在AI力底座建設、大模型開發領域積累的成熟、成功經驗工具化,助力金融機構又快、又穩地部署生成式AI應用,助力金融數智化跨越式發展。
    的頭像 發表于 09-20 16:07 ?587次閱讀
    <b class='flag-5'>浪潮信息</b>:元腦企智EPAI助力金融大<b class='flag-5'>模型</b>快速落地

    2.0-M32模型發布量化版 運行顯存僅需23GB 性能可媲美LLaMA3

    北京2024年8月23日?/美通社/ -- 近日,浪潮信息發布2.0-M32模型4bit和8bit量化版,性能比肩700億參數的LLaM
    的頭像 發表于 08-25 22:06 ?555次閱讀
    <b class='flag-5'>源</b><b class='flag-5'>2.0-M32</b>大<b class='flag-5'>模型</b><b class='flag-5'>發布</b>量化版 運行顯存僅需23GB 性能可媲美LLaMA3

    浪潮信息發布AIStation V5,全面支持大模型開發流程與高效力調度

    北京2024年7月11日?/美通社/ -- 7月9日,在"元腦中國行"全國巡展濟南站上,浪潮信息發布AIStation 人工智能開發平臺V5升級版,具備全面的大模型流程支持能力,幫助企業用戶降低構建
    的頭像 發表于 07-12 09:37 ?564次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>AIStation V5,全面支持大<b class='flag-5'>模型</b>開發流程與高效<b class='flag-5'>算</b>力調度

    浪潮信息攜全棧智產品和方案亮相WAIC 2024

    7月4日,2024世界人工智能大會(WAIC2024)在上海開幕。大會聚焦大模型力、機器人、自動駕駛等重點領域,吸引眾多國內外知名人工智能企業參會。作為全球領先的IT基礎設施供應商,浪潮信息參加
    的頭像 發表于 07-05 18:04 ?1704次閱讀

    浪潮信息重磅發布2.0-M32開源模型

    浪潮信息近日發布了一款全新的開源模型——“2.0-M32”。這款大
    的頭像 發表于 06-05 14:50 ?961次閱讀

    畢昇大模型應用開發平臺+浪潮信息AIStation,讓大模型定制更簡單

    北京2024年6月5日?/美通社/ -- 近日,畢昇大模型應用開發平臺與浪潮信息AIStation智能業務生產創新平臺完成兼容性互認證。基于畢昇和浪潮信息AIStation,用戶通過預置的畢昇助手
    的頭像 發表于 06-05 11:58 ?800次閱讀
    畢昇大<b class='flag-5'>模型</b>應用開發平臺+<b class='flag-5'>浪潮信息</b>AIStation,讓大<b class='flag-5'>模型</b>定制更簡單

    浪潮信息發布2.0-M32開源模型

    浪潮信息近日推出了革命性的“2.0-M32開源模型。該模型
    的頭像 發表于 05-29 09:08 ?848次閱讀

    為大模型專門優化 浪潮信息發布分布式全閃存儲AS13000G7-N系列

    北京2024年5月10日?/美通社/ -- 近日,浪潮信息發布為大模型專門優化的分布式全閃存儲AS13000G7-N系列。該系列依托浪潮信息自研分布式文件系統,搭載新一代數據加速引擎
    的頭像 發表于 05-10 16:37 ?650次閱讀
    為大<b class='flag-5'>模型</b>專門優化 <b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>分布式全閃存儲AS13000G7-N系列
    主站蜘蛛池模板: 韩国三级理论在线看中文字幕 | 久久99免费 | 一本大道香蕉大vr在线吗视频 | 男人和女人做a免费视频 | 在线天堂网 | 特黄特色的视频免费播放 | 思思99re66在线精品免费观看 | 日本亚洲欧美国产日韩ay高清 | 九九99久久精品午夜剧场免费 | 久久精品系列 | 黄色大片在线免费观看 | 永久免费观看视频 | 日本不卡免费新一区二区三区 | 1000rt人体1000欧美 | 痴女中文字幕在线视频 | 国产成人精品亚洲日本在线 | 99国产精品久久久久久久成人热 | 亚洲免费一区二区 | 一级片免费在线播放 | 亚洲一区二区三区麻豆 | 2021久久精品国产99国产 | 国产免费一级高清淫曰本片 | tube69日本 | 天天爱天天射 | 日本黄色免费看 | 日日干夜夜操视频 | 久久狼人综合 | 老司机狠狠k免费毛片 | 黄网站免费大全 | 人人上人人干 | 国产精品一级毛片不收费 | 四虎网站在线播放 | 黄网站视频在线观看 | 情趣店上班h系列小说 | 乱小说录目伦200篇将曲勒 | 亚洲午夜视频 | 天天操天天摸天天射 | 新版bt天堂资源在线 | 欧美性受xxxx| 欧美精品成人久久网站 | 伊人久久大香线蕉综合bd高清 |