在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

摩爾線程開源高性能線性代數模板庫MUTLASS

摩爾線程 ? 來源:摩爾線程 ? 2024-11-13 11:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,摩爾線程宣布開源高性能線性代數模板庫MUTLASS,以便開發者能夠更高效針對摩爾線程全功能GPU的MUSA Core及Tensor Core等單元進行編程,加速基于國產GPU的算子開發以及算法創新。

在數值計算和深度學習領域,矩陣乘法(GEMM)及其變種(如FlashAttention、Convolution)是構建復雜上層應用的基石。然而,為了追求更高的算子融合效率或者更創新的算法,開發者們往往需要超越標準化計算接口的限制,如標準BLAS接口以及芯片廠商的計算庫接口,以實現高性能的定制化算子。

MUTLASS(MUSA Templates for Linear Algebra Subroutines)正是為滿足這一需求而設計。作為摩爾線程專為MUSA架構優化的高性能計算庫,MUTLASS是基于開源模板庫CUTLASS進行的MUSA適配和定制化開發、優化,針對矩陣乘法及相關變種,MUTLASS提供了一系列高性能的C++模板組件,并采用了與muDNN庫類似的分層分解及數據搬運策略,以確保性能的充分發揮。

在本次開源的版本中,摩爾線程適配了CuTe后端庫,為其增加了第三代MUSA架構的MMA計算原語,支持TF32/FP16/BF16/INT8等多種數據精度,并以此為基礎,初步實現了矩陣乘法、默認實例庫、性能測試器及相關工具包的支持。

借助MUTLASS,開發者們既可以靈活復用不同層級的模板組件,也可以按需修改各種模板組件的實現細節,以較低的開發成本實現定制化的高性能算子,從而在摩爾線程全功能GPU上充分釋放性能,并嘗試更多的算法創新。

摩爾線程將持續優化MUTLASS的性能,并不斷引入新的功能。我們誠邀廣大開發者體驗MUTLASS,并提供寶貴的反饋意見,共同促進MUTLASS在性能和功能上的持續完善,攜手推動基于國產GPU的生態建設。

關于摩爾線程

摩爾線程成立于2020年10月,以全功能GPU為核心,致力于向全球提供加速計算的基礎設施和一站式解決方案,為各行各業的數智化轉型提供強大的AI計算支持。

我們的目標是成為具備國際競爭力的GPU領軍企業,為融合人工智能和數字孿生的數智世界打造先進的加速計算平臺。我們的愿景是為美好世界加速。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4928

    瀏覽量

    130980
  • 開源
    +關注

    關注

    3

    文章

    3652

    瀏覽量

    43699
  • 摩爾線程
    +關注

    關注

    2

    文章

    231

    瀏覽量

    5263

原文標題:開源MUTLASS|摩爾線程加速基于國產GPU的算子開發以及算法創新

文章出處:【微信號:moorethreads,微信公眾號:摩爾線程】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    摩爾線程發布云電腦驅動MT vGPU 2.7.0

    3月18日,摩爾線程正式發布云電腦驅動MT vGPU 2.7.0。新版本在國內首次實現了國產GPU云電腦對DirectX 12的支持,同時顯著提升圖形渲染性能與兼容性。通過全功能GPU四大引擎的深度協同,
    的頭像 發表于 03-19 15:56 ?407次閱讀

    摩爾線程GPU原生FP8計算助力AI訓練

    近日,摩爾線程正式開源MT-MegatronLM與MT-TransformerEngine兩大AI框架。通過深度融合FP8混合訓練策略和高性能算子
    的頭像 發表于 03-17 17:05 ?567次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>GPU原生FP8計算助力AI訓練

    摩爾線程支持阿里云通義千問QwQ-32B開源模型

    近日,阿里云團隊正式開源全新推理模型——通義千問QwQ-32B。摩爾線程在該模型發布后2小時內,迅速且高效完成了對千問QwQ-32B的支持。
    的頭像 發表于 03-07 17:48 ?665次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>支持阿里云通義千問QwQ-32B<b class='flag-5'>開源</b>模型

    摩爾線程全面支持DeepSeek開源周成果

    DeepSeek開源周正式收官,作為國內率先原生支持FP8計算精度的國產GPU企業,摩爾線程迅速響應,并在短時間內,成功實現對DeepSeek各個開源項目的全面支持,涵蓋FlashML
    的頭像 發表于 03-04 10:06 ?477次閱讀

    摩爾線程支持DeepSeek開源通信DeepEP和并行算法DualPipe

    DeepSeek開源周第四日,摩爾線程宣布已成功支持DeepSeek開源通信DeepEP和并行算法DualPipe,并發布相關
    的頭像 發表于 02-28 15:58 ?479次閱讀

    摩爾線程完成DeepSeek開源FlashMLA和DeepGEMM適配

    自DeepSeek啟動“開源周”以來,已陸續開源三個代碼摩爾線程基于全新MUSA Compute Capability 3.1計算架構,
    的頭像 發表于 02-27 14:40 ?539次閱讀

    摩爾線程圖形顯卡MTT S80實現DeepSeek模型部署

    摩爾線程“全功能”圖形顯卡MTT S80,不僅游戲渲染性能強大,能玩《黑神話:悟空》,現在還能本地部署DeepSeek R1蒸餾模型。搭配最新發布的MUSA SDK RC3.1.1版本,開發者直接用
    的頭像 發表于 02-21 15:46 ?2054次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>圖形顯卡MTT S80實現DeepSeek模型部署

    摩爾線程宣布成功部署DeepSeek蒸餾模型推理服務

    。 據悉,DeepSeek開源模型在多語言理解與復雜推理任務中一直表現出卓越的性能,其V3、R1等系列模型更是備受業界關注。而此次摩爾線程所實現的DeepSeek蒸餾模型推理服務部署,
    的頭像 發表于 02-06 13:49 ?773次閱讀

    摩爾線程完成股改,籌備上市

    近日,摩爾線程智能科技(北京)股份有限公司(簡稱“摩爾線程”)宣布已完成股改,并正積極籌備上市。據國家企業信用信息公示系統最新查詢結果顯示,摩爾
    的頭像 發表于 11-12 14:15 ?1125次閱讀

    摩爾線程成立摩爾學院,賦能GPU開發者

    近日,摩爾線程宣布正式成立摩爾學院,為GPU開發者生態建設揭開新篇章。摩爾學院作為一個專業的GPU技術培訓與交流平臺,現已正式對外開放。
    的頭像 發表于 10-28 17:03 ?998次閱讀

    摩爾線程與超圖軟件完成產品兼容認證

    。 據悉,為了確保產品間的兼容性,摩爾線程與超圖軟件進行了嚴格的測試工作。經過雙方的努力,適配調優后的軟件在摩爾線程GPU上展現出了卓越的性能
    的頭像 發表于 10-24 10:25 ?952次閱讀

    摩爾線程與羽人科技完成大語言模型訓練測試

    近日,摩爾線程與羽人科技攜手宣布,雙方已成功實現夸娥(KUAE)千卡智算集群與羽人系列模型解決方案的訓練兼容適配。在本次測試中,羽人科技通過摩爾線程夸娥千卡智算集群,高效完成了70億參
    的頭像 發表于 08-27 16:19 ?805次閱讀

    摩爾線程正式開源音頻理解大模型MooER

    近日,國內領先的GPU創新企業摩爾線程宣布了一項重大技術突破——正式開源其自主研發的音頻理解大模型MooER(摩耳)。這一舉動標志著我國在音頻處理與理解領域邁出了堅實的一步,特別是在基于國產硬件的AI模型研發上取得了顯著成就。
    的頭像 發表于 08-27 15:24 ?883次閱讀

    摩爾線程攜手智源研究院完成基于Triton的大模型算子適配

    近日,摩爾線程與北京智源人工智能研究院(簡稱:智源研究院)已順利完成基于Triton語言的高性能算子FlagGems的適配工作。得益于摩爾
    的頭像 發表于 08-02 11:06 ?1372次閱讀

    摩爾線程和樂創能源簽署戰略合作協議

    近日,摩爾線程和樂創能源簽署了戰略合作協議,雙方將聚焦能源大模型的創新與應用,圍繞新能源領域的電池、新能源發電、負荷管理、需求側響應等產品技術方向,共同研發能源大模型。依托摩爾線程全功
    的頭像 發表于 07-11 14:35 ?1080次閱讀
    主站蜘蛛池模板: 亚洲伊人色一综合网 | 久热福利视频 | 亚洲日本免费 | 久久精品国产免费观看99 | 欧美色图 亚洲 | 亚洲女同一区二区 | 午夜在线看片 | 她也啪97在线视频 | 色婷婷综合激情视频免费看 | 噜噜噜狠狠夜夜躁 | 97影院理伦在线观看 | 欧美淫| 久久久午夜精品 | 丁香婷婷综合五月六月 | 久久国产精品免费专区 | 五月国产综合视频在线观看 | www.亚洲.com | 男人j进入女人j视频大全 | 亚洲久优优色优在线播放 | 欧美一二三区在线 | 日韩午夜免费 | 好硬好湿好爽再深一点h | 精品视频免费看 | 色综合美国色农夫网 | 色噜噜狠狠狠狠色综合久一 | 免费看18污黄 | 国产精品久久免费观看 | 中文字幕卡二和卡三的视频 | 欧美精品一二区 | www欧美在线观看 | 国产乱人视频在线看 | 在线欧美视频免费观看国产 | 九九人人 | 精品色图 | 97人人爱| 九九免费久久这里有精品23 | 四虎影视4hu4虎成人 | 亚洲第成色999久久网站 | 性午夜影院 | 欧美性猛交xxxxbbbb | 日本黄色录像视频 |