AI初創企業推MoE混合專家模型架構新品abab 6.5

4 月 17 日，國內人工智能初創公司 MiniMax 稀宇科技宣布推出采用混合專家模型架構的 losoev 6.5 系列模型，其核心性能已接近 GPT-4、Claude-3 和 Gemini-1.5。

losoev 6.5 系列包含兩款模型：

losoev 6.5：擁有萬億級別的參數，可處理 200k tokens 的上下文長度；

losoev 6.5s：與 losoev 6.5 共享相同的訓練技術和數據，但效率更高，同樣支持 200k tokens 的上下文長度，且能夠在 1 秒鐘內處理近 3 萬字的文本。

自今年 1 月份推出國內首款基于 MoE 架構的 losoev 6 模型以來，MiniMax 通過優化模型架構、重建數據管道、改進訓練算法以及實施并行訓練策略等手段，在加速模型擴展方面取得了顯著進展。

在 200k token 的范圍內，官方對 losoev 6.5 進行了業內常見的“大海撈針”測試，即將一句與原文無關的句子插入長文本中，然后通過自然語言詢問模型，觀察其能否準確識別出這句話。經過 891 次測試，losoev 6.5 均能準確回答問題。

losoev 6.5 和 losoev 6.5s 模型將逐步應用于 MiniMax 旗下的產品，如海螺 AI 和 MiniMax 開放平臺。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

算法

算法

+關注

關注
23

文章
4710

瀏覽量
95395
人工智能

人工智能

+關注

關注
1806

文章
49028

瀏覽量
249529
模型

模型

+關注

關注
1

文章
3521

瀏覽量
50427

微云疏影
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 對比各家主流MCU指標，國產MCU真的品質不佳？
Hot 模擬信號和數字信號的區別和特點

New 方正電機成為小鵬汽車驅動電機供應商，總需求量預計達35萬臺
New 雷諾-吉利動力總成合資企業HORSE在倫敦成立

精選推薦
更多

文章

資料

帖子

AI通話的N種新玩法，讓科幻照進現實

腦極體
11小時前

330 閱讀

三菱電機SiC DIPIPM在變頻家電中的應用（2）

三菱電機半導體
3分鐘前

24 閱讀

三菱電機SiC DIPIPM在變頻家電中的應用（1）

三菱電機半導體
6分鐘前

27 閱讀

英飛凌TLD7002-16 OTP PRG的常見問題解析

駿龍電子
10分鐘前

35 閱讀

DC/DC轉換器電路板安裝過程中的焊接技巧與導通檢查要點

駿龍電子
13分鐘前

45 閱讀

角度傳感器簡單應用系統免費下載

o_dream
1.28 MB

免費

17下載

LXGW WenKai開源中文字體

可口可甜
10.62 MB

2積分

1下載

Gokrazy樹莓派上小型Linux系統

王尚岱
27.69 MB

2積分

8下載

Web API Manager阻止網站調用瀏覽器不必要的API

張鑫
0.48 MB

免費

0下載

帶555 ic的升壓轉換器

goodmbby
0.06 MB

2積分

6下載

省錢+環保+個性：打造一臺永不“過時”的自定義電腦！

早知
1天前

243 閱讀

【BPI-CanMV-K230D-Zero開發板體驗】+溫度大氣壓檢測及顯示

jinglixixi
1天前

476 閱讀

【RA-Eco-RA6M4開發板評測】+01+開箱測評+UART+PWM+LED

jf_18702540
2天前

443 閱讀

【VisionFive 2單板計算機試用體驗】2、打造復古游戲機（Batocera鏡像+FBNeo虛擬機，多款游戲ROM分享）

左岸cpx
2天前

465 閱讀

【BPI-CanMV-K230D-Zero開發板體驗】+兩種開發板間的比較

jinglixixi
2天前

413 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

搜索歷史

AI初創企業推MoE混合專家模型架構新品abab 6.5

評論