前天,智算領(lǐng)域迎來一則令人振奮的消息:Meta 正式發(fā)布了備受期待的開源大模型——Llama 3。
Llama 3 的卓越性能
Meta 表示,Llama 3 在多個(gè)關(guān)鍵基準(zhǔn)測(cè)試中展現(xiàn)出卓越性能,超越了業(yè)內(nèi)先進(jìn)的同類模型。無論是在代碼生成、復(fù)雜推理,還是在遵循指令和可視化想法方面,Llama 3 都實(shí)現(xiàn)了全面領(lǐng)先。該模型在以下五個(gè)基準(zhǔn)測(cè)試中均表現(xiàn)出色:
MMLU(學(xué)科知識(shí)理解)
GPQA(一般問題解答)
HumanEval(代碼能力)
GSM-8K(數(shù)學(xué)能力)
MATH(高難度數(shù)學(xué)問題)
無論是 8B 規(guī)格的 Llama3 還是 70B 規(guī)格,它們都較市場(chǎng)上其他優(yōu)秀大模型表現(xiàn)更佳。
縱向?qū)Ρ蕊@示,Llama 3 的性能大幅領(lǐng)先于前代產(chǎn)品 Llama 2,尤其是在 8B 規(guī)格上,遠(yuǎn)超過 Llama 2 時(shí)代的 13B 和 70B 規(guī)格;新的 70B 規(guī)格更是展現(xiàn)出與 GPT-4 早期版本相媲美的能力。
指令調(diào)優(yōu)模型
Benchmark | Llama 3 8B | Llama 2 7B | Llama 2 13B | Llama 3 70B | Llama 2 70B |
MMLU (5-shot) | 68.4 | 34.1 | 47.8 | 82 | 52.9 |
GPQA (0-shot) | 34.2 | 21.7 | 22.3 | 39.5 | 21 |
HumanEval (0-shot) | 62.2 | 7.9 | 14 | 81.7 | 25.6 |
GSM-8K (8-shot, CoT) | 79.6 | 25.7 | 77.4 | 93 | 57.5 |
MATH (4-shot, CoT) | 30 | 3.8 | 6.7 | 50.4 | 11.6 |
瑞莎 Airbox 快速支持 Llama 3
面對(duì) Llama 3 如此激動(dòng)人心的性能,Airbox 團(tuán)隊(duì)積極響應(yīng),快速將 Llama 8B 移植并成功在 Airbox 上運(yùn)行。以下視頻展示了 Llama 8B 在 Airbox 上的運(yùn)行情況:
(注:Llama 3 8B 知識(shí)更新到 2023 年 3 月)
可以看到,Llama 3 8B 在 Airbox 上的運(yùn)行表現(xiàn)極為流暢,達(dá)到了 9.6 token/s 的處理速度,已充分展現(xiàn)出其實(shí)用價(jià)值。與其他應(yīng)用結(jié)合使用時(shí),更開辟了廣闊的應(yīng)用前景和創(chuàng)新可能性。Airbox 團(tuán)隊(duì)后續(xù)會(huì)對(duì) Llama 3 8B 做更多測(cè)試并公布結(jié)果。
關(guān)于瑞莎 Fogwise Airbox
瑞莎智算盒子 Fogwise Airbox 是一款面向側(cè)端生成式智算的邊緣計(jì)算微型服務(wù)器,基于算能最新專為生成式智算打造的 SG2300X 處理器設(shè)計(jì),具有開箱即用,本地離線部署,注重?cái)?shù)據(jù)隱私,多精度支持,高能效比,高性價(jià)比,系統(tǒng)/文檔/工具鏈開源等特點(diǎn),是當(dāng)前為數(shù)不多甚至是唯一的低成本在邊緣側(cè)部署生成式智算的方案。
瑞莎 Fogwise Airbox 現(xiàn)已準(zhǔn)備就緒,即將在近期發(fā)售,敬請(qǐng)期待。
-
基準(zhǔn)測(cè)試
+關(guān)注
關(guān)注
0文章
21瀏覽量
7666 -
開源
+關(guān)注
關(guān)注
3文章
3533瀏覽量
43292 -
大模型
+關(guān)注
關(guān)注
2文章
2941瀏覽量
3683
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
用Ollama輕松搞定Llama 3.2 Vision模型本地部署

使用NVIDIA TensorRT提升Llama 3.2性能
Llama 3 的未來發(fā)展趨勢(shì)
Llama 3 模型與其他AI工具對(duì)比
Llama 3 性能評(píng)測(cè)與分析
Llama 3 適合的行業(yè)應(yīng)用
Llama 3 與 GPT-4 比較
Llama 3 語言模型應(yīng)用
使用OpenVINO 2024.4在算力魔方上部署Llama-3.2-1B-Instruct模型

[技術(shù)] 【飛凌嵌入式OK3576-C開發(fā)板體驗(yàn)】llama2.c部署
NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

【AIBOX上手指南】快速部署Llama3

Optimum Intel三步完成Llama3在算力魔方的本地量化和部署

評(píng)論