前天,智算領域迎來一則令人振奮的消息:Meta 正式發布了備受期待的開源大模型——Llama 3。
Llama 3 的卓越性能
Meta 表示,Llama 3 在多個關鍵基準測試中展現出卓越性能,超越了業內先進的同類模型。無論是在代碼生成、復雜推理,還是在遵循指令和可視化想法方面,Llama 3 都實現了全面領先。該模型在以下五個基準測試中均表現出色:
MMLU(學科知識理解)
GPQA(一般問題解答)
HumanEval(代碼能力)
GSM-8K(數學能力)
MATH(高難度數學問題)
無論是 8B 規格的 Llama3 還是 70B 規格,它們都較市場上其他優秀大模型表現更佳。
縱向對比顯示,Llama 3 的性能大幅領先于前代產品 Llama 2,尤其是在 8B 規格上,遠超過 Llama 2 時代的 13B 和 70B 規格;新的 70B 規格更是展現出與 GPT-4 早期版本相媲美的能力。
指令調優模型
Benchmark | Llama 3 8B | Llama 2 7B | Llama 2 13B | Llama 3 70B | Llama 2 70B |
MMLU (5-shot) | 68.4 | 34.1 | 47.8 | 82 | 52.9 |
GPQA (0-shot) | 34.2 | 21.7 | 22.3 | 39.5 | 21 |
HumanEval (0-shot) | 62.2 | 7.9 | 14 | 81.7 | 25.6 |
GSM-8K (8-shot, CoT) | 79.6 | 25.7 | 77.4 | 93 | 57.5 |
MATH (4-shot, CoT) | 30 | 3.8 | 6.7 | 50.4 | 11.6 |
瑞莎 Airbox 快速支持 Llama 3
面對 Llama 3 如此激動人心的性能,Airbox 團隊積極響應,快速將 Llama 8B 移植并成功在 Airbox 上運行。以下視頻展示了 Llama 8B 在 Airbox 上的運行情況:
(注:Llama 3 8B 知識更新到 2023 年 3 月)
可以看到,Llama 3 8B 在 Airbox 上的運行表現極為流暢,達到了 9.6 token/s 的處理速度,已充分展現出其實用價值。與其他應用結合使用時,更開辟了廣闊的應用前景和創新可能性。Airbox 團隊后續會對 Llama 3 8B 做更多測試并公布結果。
關于瑞莎 Fogwise Airbox
瑞莎智算盒子 Fogwise Airbox 是一款面向側端生成式智算的邊緣計算微型服務器,基于算能最新專為生成式智算打造的 SG2300X 處理器設計,具有開箱即用,本地離線部署,注重數據隱私,多精度支持,高能效比,高性價比,系統/文檔/工具鏈開源等特點,是當前為數不多甚至是唯一的低成本在邊緣側部署生成式智算的方案。
瑞莎 Fogwise Airbox 現已準備就緒,即將在近期發售,敬請期待。
-
基準測試
+關注
關注
0文章
21瀏覽量
7634 -
開源
+關注
關注
3文章
3472瀏覽量
42944 -
大模型
+關注
關注
2文章
2793瀏覽量
3438
發布評論請先 登錄
相關推薦
用Ollama輕松搞定Llama 3.2 Vision模型本地部署

Llama 3 的未來發展趨勢
Llama 3 性能評測與分析
Llama 3 適合的行業應用
Llama 3 與 GPT-4 比較
Llama 3 語言模型應用
使用OpenVINO 2024.4在算力魔方上部署Llama-3.2-1B-Instruct模型

評論