NVIDIA 為部分大型亞馬遜 Titan 基礎(chǔ)模型提供訓(xùn)練支持

本文將介紹亞馬遜如何使用 NVIDIA NeMo 框架、GPU

以及亞馬遜云科技的 EFA 來訓(xùn)練其

最大的新一代大語言模型（LLM）。

大語言模型的一切都很龐大——巨型模型是在數(shù)千顆 NVIDIA GPU 和海量的數(shù)據(jù)集上所訓(xùn)練而成。

不過這可能會給想要使用生成式 AI 的企業(yè)帶來很多巨大的挑戰(zhàn)。NVIDIA NeMo（一個用于構(gòu)建、自定義和運行 LLM 的框架）能夠幫助企業(yè)克服上述挑戰(zhàn)。

亞馬遜云科技（AWS）有一支由資深科學(xué)家和開發(fā)者組成的團隊，致力于為 Amazon Bedrock（一項用于基礎(chǔ)模型的生成式 AI 服務(wù)）創(chuàng)建 Amazon Titan 基礎(chǔ)模型。該團隊在過去幾個月中一直在使用 NVIDIA NeMo。

亞馬遜云科技高級應(yīng)用科學(xué)家 Leonard Lausen 表示：“我們使用 NeMo 的一大原因是它具有可擴展性，其優(yōu)化功能使我們能夠以較高的 GPU 利用率運行，同時能夠擴展到更大的集群，進而能夠更快地訓(xùn)練出模型，并向客戶交付。”

實現(xiàn)真正的大規(guī)模訓(xùn)練

NeMo 的并行技術(shù)可實現(xiàn)高效的大規(guī)模 LLM 訓(xùn)練。當與亞馬遜云科技的 Elastic Fabric Adapter（EFA）配合使用時，團隊可以將 LLM 擴展到多顆 GPU 上，從而加快訓(xùn)練速度。

EFA 為亞馬遜云科技客戶提供了一個 UltraCluster 聯(lián)網(wǎng)基礎(chǔ)設(shè)施，可直接連接 1 萬多顆 GPU，并使用 NVIDIA GPUDirect 繞過操作系統(tǒng)和 CPU。

這一結(jié)合使亞馬遜云科技的科學(xué)家們能夠提供出色的模型質(zhì)量，這是只依靠其他數(shù)據(jù)并行方法無法大規(guī)模實現(xiàn)的。

通用框架

Lausen 表示：“NeMo 的靈活性支持亞馬遜云科技根據(jù)新的 Titan 模型、數(shù)據(jù)集和基礎(chǔ)設(shè)施的具體情況來定制訓(xùn)練軟件。

亞馬遜云科技的創(chuàng)新成果包括從 Amazon Simple Storage Service（Amazon S3）到 GPU 集群的高效流式傳輸。Lausen 表示：“由于 NeMo 本身就是基于標準化 LLM 訓(xùn)練管線組件的常用程序庫（如 PyTorch Lightning）所構(gòu)建的，因此整合這些改進很容易。”

亞馬遜云科技和 NVIDIA 的共同目標是將雙方的合作經(jīng)驗融入到 NVIDIA NeMo 等產(chǎn)品和 Amazon Titan 等服務(wù)中，最終造福客戶。

GTC 2024 將于 2024 年 3 月 18 至 21 日在美國加州圣何塞會議中心舉行，線上大會也將同期開放。掃描下方海報二維碼，立即注冊 GTC 大會。

原文標題：NVIDIA 為部分大型亞馬遜 Titan 基礎(chǔ)模型提供訓(xùn)練支持

文章出處：【微信公眾號：NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

英偉達

英偉達

+關(guān)注

關(guān)注
22

文章
3937

瀏覽量
93468

原文標題：NVIDIA 為部分大型亞馬遜 Titan 基礎(chǔ)模型提供訓(xùn)練支持

文章出處：【微信號：NVIDIA-Enterprise，微信公眾號：NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

NVIDIA英偉達企業(yè)解決方案
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot NVIDIA將深度學(xué)習(xí)引入計算機圖形領(lǐng)域以推動行業(yè)發(fā)展
Hot 一文講述Quadro RTX 5000帶來的性能提升

New NVIDIA recsys-examples在生成式推薦系統(tǒng)中的高效實踐
New 如何在魔搭社區(qū)使用TensorRT-LLM加速優(yōu)化Qwen3系列模型推理部署

精選推薦
更多

文章

資料

帖子

德州儀器方案 | 使用熱插拔控制器應(yīng)對48V AI服務(wù)器的保護挑戰(zhàn)

德州儀器
2小時前

172 閱讀

同步整流IC U7613的工作原理

開關(guān)電源芯片
18小時前

390 閱讀

小安派BW21-CBV-Kit入門教程之MPU6050 IMU零點檢測

安信可科技
19小時前

369 閱讀

樹莓派默認密碼指南：新設(shè)置、更改方法及安全建議！

上海晶珩電子科技有限公司
21小時前

415 閱讀

使用MG24開發(fā)板測試天線分集

Silicon Labs
19小時前

355 閱讀

UTP布線系統(tǒng)的基本測試方法

youyoulan
886 KB

5積分

22下載

Verilog中SRL16E的使用方法與接口詳細說明

0.10 MB

免費

20下載

deer-wms立體倉庫管理系統(tǒng)

劉剛
5.28 MB

2積分

3下載

Tomahawk音樂播放器

wufan931111
10.50 MB

免費

0下載

ebcms-framework PHP開發(fā)框架

李萍
0.01 MB

2積分

1下載

【沁恒CH585開發(fā)板免費試用體驗】+點陣板的顯示驅(qū)動

jinglixixi
1天前

435 閱讀

【BPI-CanMV-K230D-Zero開發(fā)板體驗】無線網(wǎng)絡(luò)攝像頭（RTSP 推流 1080P 60fps）

gtbestom
1天前

482 閱讀

【匯思博SEEK100開發(fā)板試用體驗】01 SEEK100開發(fā)板開箱&簡介

jf_83922529
2天前

501 閱讀

【正點原子STM32MP257開發(fā)板試用】STM32MP257開發(fā)板內(nèi)核及外設(shè)性能測試

jf_43382582
2天前

469 閱讀

【沁恒CH585開發(fā)板免費試用體驗】+PWM呼吸燈

yinwuqing
2天前

464 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

NVIDIA 為部分大型亞馬遜 Titan 基礎(chǔ)模型提供訓(xùn)練支持

評論