近日,據報道,臉書母公司Meta為了提升其大模型Llama的性能,專門成立了四個研究小組,深入探索量化巨頭幻方量化旗下的國產大模型DeepSeek的工作原理。
據悉,Meta組建的這四個小組各有側重。其中,兩個小組致力于解析幻方量化如何降低DeepSeek模型的訓練和運行成本,以期從中汲取經驗,優化Meta自身的成本結構。第三個研究小組則聚焦于幻方量化訓練DeepSeek模型所使用的數據,試圖揭示其數據選擇的獨特之處,為Meta的模型訓練提供新的思路。
而第四個小組的任務更為前沿,他們正在考慮如何基于DeepSeek模型的屬性,重構Meta的Llama模型,以期實現性能上的飛躍。這一舉措不僅展現了Meta對DeepSeek模型的高度重視,也體現了其在人工智能領域不斷探索、勇于創新的精神。
Meta此次組建的四大專研小組,無疑將為其在人工智能領域的發展注入新的動力。通過深入探索DeepSeek模型的工作原理,Meta有望在大模型研發方面取得更加顯著的進展,為用戶提供更加智能、高效的服務。
-
人工智能
+關注
關注
1804文章
48503瀏覽量
245261 -
模型
+關注
關注
1文章
3471瀏覽量
49864 -
Meta
+關注
關注
0文章
299瀏覽量
11675 -
DeepSeek
+關注
關注
1文章
759瀏覽量
1116
發布評論請先 登錄
四川農商聯合銀行攜手中科曙光推動金融服務智能化升級
HarmonyOS NEXT開發實戰:DevEco Studio中DeepSeek的使用
RK3588開發板上部署DeepSeek-R1大模型的完整指南
鴻蒙原生應用開發也可以使用DeepSeek了
研華發布昇騰AI Box及Deepseek R1模型部署流程
添越智創基于 RK3588 開發板部署測試 DeepSeek 模型全攻略
研華邊緣AI Box MIC-ATL3S部署Deepseek R1模型

評論