小说阅读网站,玄幻小说排行榜,小说阅读网免费小说

在利用 OpenAI 的 GPT-4 為 Bing Chat、 Bing Image Creator、Microsoft 365 Copilot、Azure OpenAI Service 和 GitHub Copilot X 引入了類似 ChatGPT 的功能后。微軟現(xiàn)又宣布推出 DeepSpeed-Chat，一種用于 RLHF 訓(xùn)練的低成本開源解決方案，基于微軟開源的深度學(xué)習(xí)優(yōu)化庫 DeepSpeed；聲稱即使是使用單個(gè) GPU，任何人也都可以創(chuàng)建高質(zhì)量的 ChatGPT 式模型。

該公司表示，盡管開源社區(qū)付出了巨大的努力，但目前仍缺乏一個(gè)支持端到端的基于人工反饋機(jī)制的強(qiáng)化學(xué)習(xí)（RLHF）的規(guī)模化系統(tǒng)，這使得訓(xùn)練強(qiáng)大的類 ChatGPT 模型十分困難。ChatGPT 模型的訓(xùn)練是基于 InstructGPT 論文中的 RLHF 方式，與常見的大語言模型的預(yù)訓(xùn)練和微調(diào)截然不同，使得現(xiàn)有深度學(xué)習(xí)系統(tǒng)在訓(xùn)練類 ChatGPT 模型時(shí)存在種種局限。因此，為了讓 ChatGPT 類型的模型更容易被普通數(shù)據(jù)科學(xué)家和研究者使用，并使 RLHF 訓(xùn)練真正普及到 AI 社區(qū)，他們發(fā)布了 DeepSpeed-Chat。

DeepSpeed-Chat 具有以下三大核心功能：

簡化 ChatGPT 類型模型的訓(xùn)練和強(qiáng)化推理體驗(yàn)：只需一個(gè)腳本即可實(shí)現(xiàn)多個(gè)訓(xùn)練步驟，包括使用 Huggingface 預(yù)訓(xùn)練的模型、使用 DeepSpeed-RLHF 系統(tǒng)運(yùn)行 InstructGPT 訓(xùn)練的所有三個(gè)步驟、甚至生成你自己的類 ChatGPT 模型。此外，還提供了一個(gè)易于使用的推理 API，用于用戶在模型訓(xùn)練后測試對(duì)話式交互。

DeepSpeed-RLHF 模塊：DeepSpeed-RLHF 復(fù)刻了 InstructGPT 論文中的訓(xùn)練模式，并確保包括 a）監(jiān)督微調(diào)（SFT），b）獎(jiǎng)勵(lì)模型微調(diào)和 c）基于人類反饋的強(qiáng)化學(xué)習(xí)（RLHF）在內(nèi)的三個(gè)步驟與其一一對(duì)應(yīng)。此外，還提供了數(shù)據(jù)抽象和混合功能，以支持用戶使用多個(gè)不同來源的數(shù)據(jù)源進(jìn)行訓(xùn)練。

DeepSpeed-RLHF 系統(tǒng)：其將 DeepSpeed 的訓(xùn)練（training engine）和推理能力（inference engine）整合到一個(gè)統(tǒng)一的混合引擎（DeepSpeed Hybrid Engine or DeepSpeed-HE）中用于 RLHF 訓(xùn)練。DeepSpeed-HE 能夠在 RLHF 中無縫地在推理和訓(xùn)練模式之間切換，使其能夠利用來自 DeepSpeed-Inference 的各種優(yōu)化，如張量并行計(jì)算和高性能 CUDA 算子進(jìn)行語言生成，同時(shí)對(duì)訓(xùn)練部分還能從 ZeRO- 和 LoRA-based 內(nèi)存優(yōu)化策略中受益。DeepSpeed-HE 還能夠自動(dòng)在 RLHF 的不同階段進(jìn)行智能的內(nèi)存管理和數(shù)據(jù)緩存。

文檔內(nèi)容指出，DeepSpeed Chat 與其他先進(jìn)方案相比的優(yōu)勢在于：效率和經(jīng)濟(jì)性方面比現(xiàn)有系統(tǒng)快 15 倍以上，在 Azure 云上只需 9 小時(shí)即可訓(xùn)練一個(gè) OPT-13B 模型，只需 18 小時(shí)既可訓(xùn)練 OPT-30B 模型，分別花費(fèi)不到 300 美元和 600 美元。

在速度和可擴(kuò)展性方面，即使是 13B 的模型也可以在 1.25 小時(shí)內(nèi)訓(xùn)練，龐大的 175B 模型可以在不到一天的時(shí)間內(nèi)使用 64 個(gè) GPU 集群進(jìn)行訓(xùn)練。在 RLHF 的可訪問性和普及化方面，則可以在單個(gè) GPU 上訓(xùn)練超過 130 億參數(shù)的模型。此外還支持在相同的硬件上分別運(yùn)行 6.5B 和 50B 的模型，實(shí)現(xiàn)高達(dá) 7.5 倍的提升。

盡管近期關(guān)于對(duì) ChatGPT 類大語言模型發(fā)展的反對(duì)和擔(dān)憂之聲不斷，但微軟似乎仍在全力推進(jìn)其 AI 開發(fā)。對(duì)于微軟的此次發(fā)布，前 Meta AI 專家 Elvis 也激動(dòng)地表示，DeepSpeed Chat 提供了 Alpaca 和 Vicuna 等所缺少的、一個(gè)端到端的 RLHF 管道來訓(xùn)練類似 ChatGPT 的模型，解決的是成本和效率方面的挑戰(zhàn)。這是 “微軟令人印象深刻的開源努力。..。.. 是一件大事”。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

微軟

微軟

+關(guān)注

關(guān)注
4

文章
6630

瀏覽量
104469
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5515

瀏覽量
121552
ChatGPT

ChatGPT

+關(guān)注

關(guān)注
29

文章
1568

瀏覽量
8061

原文標(biāo)題：微軟開源“傻瓜式”類ChatGPT模型訓(xùn)練工具，提速省錢15倍

文章出處：【微信號(hào)：OSC開源社區(qū)，微信公眾號(hào)：OSC開源社區(qū)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

【「大模型啟示錄」閱讀體驗(yàn)】+開啟智能時(shí)代的新鑰匙

，NVDIA與微軟的競爭。計(jì)算能力的飛速提升是大模型得以興起的重要基石。GPU/TPU 等高性能計(jì)算設(shè)備的迅猛發(fā)展，宛如為大模型的訓(xùn)練打造了一臺(tái)強(qiáng)大的引擎。它們能夠以極高的速度處理海

發(fā)表于 12-24 13:10

微軟否認(rèn)使用用戶數(shù)據(jù)訓(xùn)練AI模型

近日，微軟公司正式否認(rèn)了一項(xiàng)關(guān)于其使用Microsoft 365應(yīng)用程序中客戶數(shù)據(jù)來訓(xùn)練人工智能模型的指控。這一聲明旨在澄清近期在社交媒體上流傳的某些用戶的疑慮和誤解。此前，部分用戶在社交媒體平臺(tái)

發(fā)表于 12-02 10:33 ?186次閱讀

什么是大模型、大模型是怎么訓(xùn)練出來的及大模型作用

，基礎(chǔ)模型。 ? 大模型是一個(gè)簡稱，完整的叫法，應(yīng)該是“人工智能預(yù)訓(xùn)練大模型”。預(yù)訓(xùn)練，是一項(xiàng)技術(shù)，我們后面再解釋。 ? 我們現(xiàn)在口頭上常說

發(fā)表于 11-25 09:29 ?3288次閱讀

什么是大<b class='flag-5'>模型</b>、大<b class='flag-5'>模型</b>是怎么<b class='flag-5'>訓(xùn)練</b>出來的及大<b class='flag-5'>模型</b>作用

ChatGPT：怎樣打造智能客服體驗(yàn)的重要工具？

ChatGPT作為智能對(duì)話生成模型，可以幫助打造智能客服體驗(yàn)的重要工具。以下是一些方法和步驟：1.數(shù)據(jù)收集和準(zhǔn)備：收集和整理與客服相關(guān)的數(shù)據(jù)，包括常見問題、回答示例、客戶對(duì)話記錄等。這將用于訓(xùn)

發(fā)表于 11-01 11:12 ?221次閱讀

llm模型和chatGPT的區(qū)別

基于Transformer架構(gòu)的預(yù)訓(xùn)練語言模型，它可以生成連貫、自然的文本。ChatGPT使用GPT模型作為基礎(chǔ)，通過微調(diào)和訓(xùn)練來實(shí)現(xiàn)對(duì)話生

發(fā)表于 07-09 09:55 ?1329次閱讀

名單公布！【書籍評(píng)測活動(dòng)NO.34】大語言模型應(yīng)用指南：以ChatGPT為起點(diǎn)，從入門到精通的AI實(shí)踐教程

，包括開源和閉源兩類。閉源模型的代表有OpenAI 的 GPT 系列和 Anthropic 的 Claude 系列。毫無疑問，目前 OpenAI 的 GPT 系列模型在整個(gè)行業(yè)中處于領(lǐng)

發(fā)表于 06-03 11:39

微軟將推出自研AI大模型

微軟正在緊鑼密鼓地訓(xùn)練一款全新的自研人工智能大模型——“MAI-1”。據(jù)悉，這款模型規(guī)模龐大，足以與谷歌的Gemini和OpenAI的ChatGPT

發(fā)表于 05-13 11:30 ?700次閱讀

【大語言模型：原理與工程實(shí)踐】大語言模型的預(yù)訓(xùn)練

大語言模型的核心特點(diǎn)在于其龐大的參數(shù)量，這賦予了模型強(qiáng)大的學(xué)習(xí)容量，使其無需依賴微調(diào)即可適應(yīng)各種下游任務(wù)，而更傾向于培養(yǎng)通用的處理能力。然而，隨著學(xué)習(xí)容量的增加，對(duì)預(yù)訓(xùn)練數(shù)據(jù)的需求也相應(yīng)

發(fā)表于 05-07 17:10

微軟自研AI大模型即將問世

微軟正悄然醞釀一項(xiàng)重大技術(shù)突破，據(jù)內(nèi)部消息人士透露，公司正全力訓(xùn)練一款名為“MAI-1”的自研人工智能大模型。這款模型備受期待，其規(guī)模龐大，足以與谷歌的Gemini和OpenAI的

發(fā)表于 05-07 14:46 ?523次閱讀

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個(gè)開源庫，用于優(yōu)化從 PC 到云端的

發(fā)表于 04-28 10:36 ?637次閱讀

探索ChatGPT模型的人工智能語言模型

最大的區(qū)別ChatGPT是通過對(duì)話數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練，而不僅僅是通過單一的句子進(jìn)行預(yù)訓(xùn)練，這使得ChatGPT能夠更好地理解對(duì)話的上下文，并進(jìn)行連貫的回復(fù)。

發(fā)表于 04-24 10:19 ?747次閱讀

李彥宏：開源模型將逐漸滯后，文心大模型提升訓(xùn)練與推理效率

李彥宏解釋道，百度自研的基礎(chǔ)模型——文心 4.0，能夠根據(jù)需求塑造出適應(yīng)各類場景的微型版模型，并支持精細(xì)調(diào)整以及后預(yù)訓(xùn)練。相較于直接使用開源模型

發(fā)表于 04-16 14:37 ?477次閱讀

名單公布！【書籍評(píng)測活動(dòng)NO.30】大規(guī)模語言模型：從理論到實(shí)踐

為目的。國內(nèi)的文心一言就屬于這一類。垂直大模型，聚焦解決垂直領(lǐng)域問題，是在通用大模型的基礎(chǔ)上訓(xùn)練行業(yè)專用模型，應(yīng)用到金融、醫(yī)療、教育、養(yǎng)老

發(fā)表于 03-11 15:16

谷歌模型訓(xùn)練軟件有哪些？谷歌模型訓(xùn)練軟件哪個(gè)好？

谷歌在模型訓(xùn)練方面提供了一些強(qiáng)大的軟件工具和平臺(tái)。以下是幾個(gè)常用的谷歌模型訓(xùn)練軟件及其特點(diǎn)。

發(fā)表于 03-01 16:24 ?979次閱讀

微軟和OpenAI面臨關(guān)于ChatGPT和Copilot的更多訴訟指控

這三家媒體指責(zé) OpenAI 聊天機(jī)器人 ChatGPT（微軟Copilot也使用此項(xiàng)技術(shù)）在訓(xùn)練過程中，未經(jīng)授權(quán)便擅自拷貝了發(fā)布于自家網(wǎng)站的文章。他們宣稱，若用戶知曉 ChatGPT

發(fā)表于 02-29 11:28 ?608次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

微軟開源“傻瓜式”類ChatGPT模型訓(xùn)練工具

評(píng)論

【「大模型啟示錄」閱讀體驗(yàn)】+開啟智能時(shí)代的新鑰匙

微軟否認(rèn)使用用戶數(shù)據(jù)訓(xùn)練AI模型

什么是大模型、大模型是怎么訓(xùn)練出來的及大模型作用

ChatGPT：怎樣打造智能客服體驗(yàn)的重要工具？

llm模型和chatGPT的區(qū)別

名單公布！【書籍評(píng)測活動(dòng)NO.34】大語言模型應(yīng)用指南：以ChatGPT為起點(diǎn)，從入門到精通的AI實(shí)踐教程

微軟將推出自研AI大模型

【大語言模型：原理與工程實(shí)踐】大語言模型的預(yù)訓(xùn)練

微軟自研AI大模型即將問世

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

探索ChatGPT模型的人工智能語言模型

李彥宏：開源模型將逐漸滯后，文心大模型提升訓(xùn)練與推理效率

名單公布！【書籍評(píng)測活動(dòng)NO.30】大規(guī)模語言模型：從理論到實(shí)踐

谷歌模型訓(xùn)練軟件有哪些？谷歌模型訓(xùn)練軟件哪個(gè)好？

微軟和OpenAI面臨關(guān)于ChatGPT和Copilot的更多訴訟指控