近期,英偉達與Hugging Face及ServiceNow攜手推出新品StarCoder2系列LLMs模型,致力于在代碼生成領域建立新的行業標桿,憑借諸多優勢凸顯性能、透明度以及經濟性。
此系列共包含三款模型,其中ServiceNow負責訓練的30億參數模型、Hugging Face訓練的70億參數模型以及英偉達訓練的150億參數模型。
新一代模型得以實現,借助Stack v2代碼集,該數據集容量是上一代Stack v1的7倍之多。此外,創新性的訓練技術使其能夠更精準地解析低資源編程語言、數學和程序源代碼討論等內容。
經過619門編程語言的訓練后,StarCoder2支持多種專業任務,例如源代碼生成、工作流創建以及文本摘要等。英偉達承諾,開發者可借此進行代碼填充、高層次代碼摘要以及代碼片段搜索等操作,以提升工作效率。
相比初版StarCoder LLM,這款30億參數的最新模型對優質參數進行了更為精確的篩選,性能相當于初版150億參數模型的StarCoder。
特別值得關注的是,StarCoder2特許使用BigCode Open RAIL-M許可證,無需支付任何版權費用即可享受使用權。IT之家建議有需用戶前往BigCode項目GitHub頁面下載源代碼,同時亦可在Hugging Face獲取模型信息。
-
編程語言
+關注
關注
10文章
1951瀏覽量
35022 -
數據集
+關注
關注
4文章
1209瀏覽量
24850 -
英偉達
+關注
關注
22文章
3854瀏覽量
92080
發布評論請先 登錄
相關推薦
NaVILA:加州大學與英偉達聯合發布新型視覺語言模型
微軟攜手英偉達與GitHub推出生成式AI加速器
英偉達推出歸一化Transformer,革命性提升LLM訓練速度
大模型LLM與ChatGPT的技術原理
llm模型和chatGPT的區別
LLM模型的應用領域
英偉達開源Nemotron-4 340B系列模型,助力大型語言模型訓練
英偉達推出AI模型推理服務NVIDIA NIM
進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片
了解大型語言模型 (LLM) 領域中的25個關鍵術語
![了解大型語言<b class='flag-5'>模型</b> (<b class='flag-5'>LLM</b>) <b class='flag-5'>領域</b>中的25個關鍵術語](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
英偉達將推出生成式AI專業認證
Anthropic發布Claude3系列模型
ServiceNow、Hugging Face和NVIDIA發布StarCoder2助力生成式AI構建企業應用
ServiceNow、Hugging Face 和 NVIDIA 發布全新開放獲取 LLM,助力開發者運用生成式 AI 構建企業應用
![ServiceNow、Hugging Face 和 NVIDIA 發布全新開放獲取 <b class='flag-5'>LLM</b>,助力開發者運用<b class='flag-5'>生成</b>式 AI 構建企業應用](https://file1.elecfans.com/web2/M00/C2/0B/wKgZomXf9qGAW44zAAB3CO-K2X8824.jpg)
評論