在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

“中國的ChatGPT”真的要來了嗎?

中科曙光 ? 來源:量子位 ? 2023-03-21 10:41 ? 次閱讀

席卷全球的新風口

OpenAI去年發(fā)布了聊天機器人模型ChatGPT,它能夠理解和生成人類語言,并在許多自然語言處理任務中表現(xiàn)非常出色。據(jù)統(tǒng)計,上線僅兩個月,ChatGPT活躍用戶已經(jīng)超億,打破了由TikTok創(chuàng)造的9個月實現(xiàn)億級用戶注冊的紀錄,引起了各行各業(yè)人們的強烈關注。就連埃隆·馬斯克也忍不住發(fā)推表示,ChatGPT厲害得嚇人,我們距離危險而強大的AI不遠了。當然,在一頓痛批ChatGPT之后,馬斯克也準備親自下場,成立研究實驗室,開發(fā)ChatGPT的競品。

類ChatGPT模型的開發(fā)與應用,在國內(nèi)也迅速成為資本市場關注、創(chuàng)業(yè)者紛紛入場的賽道。阿里、百度等互聯(lián)網(wǎng)大廠,科大訊飛等語音類AI企業(yè),以及眾多創(chuàng)業(yè)者都希望乘著最新的風口迅速“起飛”。創(chuàng)業(yè)者大軍中不乏像前美團聯(lián)合創(chuàng)始人王慧文、出門問問CEO李志飛、搜狗前CEO王小川、前京東技術掌門人周伯文等行業(yè)大佬。開發(fā)出“中國的ChatGPT”儼然成了國內(nèi)科技圈“All in”的方向。

然而,我們真的能迅速見到一個“中國的ChatGPT”嗎?誰又能拔下頭籌,成為這個細分賽道的領頭羊呢?

這個眾多大佬都擠進來“淘金”的賽道,一定不是簡簡單單就能搞定的。

OpenAI的GPT“家族”

在深入了解開發(fā)出比肩ChatGPT的模型需要面臨哪些挑戰(zhàn)之前,讓我們先看下ChatGPT所屬的GPT模型家族都有哪些成員。

GPT-1發(fā)布于2018年6月,包含117M個參數(shù)。這是第一個采用基于Transformer的模型架構進行預訓練的模型。它在語言模型和單詞類比任務上表現(xiàn)出色。

GPT-2發(fā)布于2019年2月,包含1.5B個參數(shù)。這個模型在自然語言生成任務上表現(xiàn)出色,可以生成高質(zhì)量的文章、新聞報道和詩歌等文本。

GPT-3發(fā)布于2020年6月,包含175B個參數(shù)。具有出色的通用性和創(chuàng)造性,可以在各種 NLP任務上表現(xiàn)出色,包括文本生成、問答、機器翻譯等任務。

到這就結束了?完全不是。

在GPT-3系列模型(注意,是一系列模型哦)發(fā)布之后,OpenAI繼續(xù)基于原始的GPT-3進行了不斷地完善。我們熟知的InstructGPT和ChatGPT實際的內(nèi)部代號是text-davinci-003 175B和text-chat-davinci-002-20221122,是基于GPT-3.5的改良版。

d3ec54e6-c4c8-11ed-bfe3-dac502259ad0.png

圖:GPT-3模型家族,圖片來源:https://lifearchitect.ai/chatgpt/

在InstructGPT的訓練中,OpenAI的研究員引入了RLHF(Reinforcement Learning from Human Feedback,人類反饋強化學習)機制。這一訓練范式增強了人類對模型輸出結果的調(diào)節(jié),并且對結果進行了更具理解性的排序。在此基礎上,ChatGPT還引入了“無害化”機制,防止模型生成不符合規(guī)范或倫理的答案。

d4059762-c4c8-11ed-bfe3-dac502259ad0.png

圖:GPT-3、InstructGPT、ChatGPT的“進化路線”

圖片來源:https://lifearchitect.ai/chatgpt/

不難看出,ChatGPT的出圈,與OpenAI多年的技術積累是分不開的。國內(nèi)廠商想要開發(fā)出像ChatGPT一樣優(yōu)秀的模型,也絕不是簡單依靠拉一波投資,雇一批算法研究員就能馬上實現(xiàn)的。

“中國的ChatGPT”面臨的挑戰(zhàn)

首先,在資金投入方面,在當前的技術水平下,訓練一個與ChatGPT這樣的大型語言模型相當?shù)哪P托枰獢?shù)百萬美元的投入。在發(fā)布ChatGPT之前,OpenAI可查的融資額已超過20億美元,也是如此龐大的投資才使OpenAI擁有了多年技術積累。反觀絕大多數(shù)近期入局的國內(nèi)企業(yè),即便擁有足夠的資金與人員,也大都很難在短期追上OpenAI的步伐。

我們不禁想問,如果要在國內(nèi)開發(fā)出一個類ChatGPT模型,到底會面臨哪些技術挑戰(zhàn)呢?

為了能了解到最最準確的答案,我們請教了ChatGPT“本人”

d457fc82-c4c8-11ed-bfe3-dac502259ad0.png

1、數(shù)據(jù)量:需要大量的數(shù)據(jù)集來進行訓練。這些數(shù)據(jù)集需要是大規(guī)模的、多樣化的、真實的,并且要涵蓋各種不同的語言和語境。這需要花費大量的時間和資源來收集、整理和標注。

2、計算能力:需要非常強大的計算資源。這些模型需要在大規(guī)模的數(shù)據(jù)集上進行訓練,并且需要進行大量的參數(shù)優(yōu)化和調(diào)整。這些計算需要高性能的計算機和高效的分布式計算框架。

3、 算法優(yōu)化:需要對算法進行不斷的優(yōu)化和改進。這包括優(yōu)化網(wǎng)絡結構、調(diào)整超參數(shù)、使用更好的優(yōu)化算法等。這需要對深度學習算法有深入的了解和經(jīng)驗。

可以發(fā)現(xiàn),這是一個涉及到多個領域和技術的復雜系統(tǒng)工程。只有同時在底層的基礎設施、針對性優(yōu)化和大模型技術積淀都達到一定水平的情況下,才能夠研發(fā)出高質(zhì)量的模型,并應用于各種場景中。

讓我們詳細看看這三類技術挑戰(zhàn)具體都意味著什么。

數(shù)據(jù)量

我們經(jīng)常聽到“有多少數(shù)據(jù),就有多少智能”,數(shù)據(jù)對于模型訓練的重要性不言而喻。類ChatGPT模型的訓練,更需要超大規(guī)模的,經(jīng)過清洗的數(shù)據(jù)。以GPT-3的訓練為例,需要300B tokens的數(shù)據(jù)。大家如果對這個數(shù)字不敏感的話,可以參考整個英文的維基百科的數(shù)據(jù)量,只有“相對可憐”的3B tokens,是訓練GPT-3所需的百分之一。并且,要訓練出類ChatGPT模型,勢必需要數(shù)倍于當年訓練GPT-3的數(shù)據(jù)量的中文語料數(shù)據(jù),這對于大部分企業(yè)或科研機構來說都是難以翻越的大山。有效的中文數(shù)據(jù)量,一定程度上決定了模型性能的上限。

計算能力

類ChatGPT模型的訓練,除了需要非常多的訓練數(shù)據(jù)外,也離不開龐大的算力支撐。根據(jù)北京智源人工智能研究院公布的數(shù)據(jù),使用300B tokens的數(shù)據(jù)訓練175B參數(shù)規(guī)模(與GPT-3規(guī)模相同)的模型,如果使用96臺通過200Gb IB網(wǎng)卡互聯(lián)的DGX-A100節(jié)點,需要約50天。要是使用更大規(guī)模的訓練數(shù)據(jù)集,訓練時長還會進一步增加。

對于計算集群來說,不僅需要能夠提供海量的算力資源,還需要具備高速網(wǎng)絡和高容量存儲,以便支持大規(guī)模的數(shù)據(jù)訪問和模型傳輸。整套基礎設施,連同軟件平臺,還需要結合集群的拓撲結構針對分布式訓練進行優(yōu)化,通過調(diào)整并行策略等方式,提升硬件利用率與通訊效率,縮短整體訓練時間。

算法優(yōu)化

算法優(yōu)化和模型的訓練效率和效果息息相關。每一個算法研究員,都希望模型在訓練過程中快速收斂,這恰恰也是算法研究人員經(jīng)驗與企業(yè)長年技術積累的體現(xiàn)。通常情況下,在訓練的過程中需要不斷調(diào)整學習率、批量大小、層數(shù)等超參數(shù),或使用自動調(diào)參的技巧和經(jīng)驗,才能快速、穩(wěn)定的實現(xiàn)模型收斂。就像中餐大廚們用“少許、適量”的調(diào)料制作美味佳肴一樣,里面包含著的是大廚們幾十年的手藝,不是一朝一夕就能被批量復制的。

前途是光明的,道路是曲折的

想必,這是最適合送給現(xiàn)在想要開發(fā)出“中國的ChatGPT”的各路大佬們的一句話了。為規(guī)避未來的技術風險,不少廠商、科研機構也開始探索在自研算力服務平臺上訓練的可行性。北京智源人工智能研究院作為國內(nèi)頂尖的人工智能領域研究機構,早早就探索了使用自研算力服務平臺的可能性。同樣是使用300B tokens的數(shù)據(jù)訓練175B參數(shù)規(guī)模的模型,通過曙光提供的算力服務,訓練周期只需29.10天,在節(jié)點規(guī)模接近的情況下,訓練效率是其他算力平臺的300%。

基于自研算力服務平臺進行訓練,不可避免的會帶來更多的移植與調(diào)優(yōu)工作。曙光智算強大的硬件與算法優(yōu)化團隊,在集群、并行策略、算子、工具包等方面的優(yōu)化上與智源開展了深入的合作。首先,為保證程序能夠正常運行,需要完成包括DeepSpeed/Megatron/Colossal-AI/apex等必要組件的適配工作。其次,程序系統(tǒng)順利調(diào)度通常也需要調(diào)整調(diào)整操作系統(tǒng)配置及tcp協(xié)議參數(shù)等。訓練的優(yōu)化工作則主要包含以下三個方面:

算子層面:使用算子融合/算子優(yōu)化等技術,深度挖掘硬件性能,提升硬件使用率;

策略層面:采用模型并行、數(shù)據(jù)并行、流水線并行、Zero等多級并行策略,實現(xiàn)超大規(guī)模訓練;

集群層面:針對硬件的拓撲結構,對分布式訓練通信、并行分組配比等進行定制優(yōu)化,提升訓練擴展比。

通過一系列的優(yōu)化方法,最終也證明了我們可以在自研算力服務平臺上,以能夠?qū)藝H水平的效率實現(xiàn)大模型的開發(fā)工作,這無疑為“中國的ChatGPT”的開發(fā)工作喂了一顆定心丸。希望在不久的將來,我們可以看到真正在自研算力平臺上訓練的,能與ChatGPT比肩的中文模型。

前途一定是光明的。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3500

    瀏覽量

    50113
  • ChatGPT
    +關注

    關注

    29

    文章

    1588

    瀏覽量

    8855

原文標題:“中國的ChatGPT”真的要來了嗎?

文章出處:【微信號:sugoncn,微信公眾號:中科曙光】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    養(yǎng)老機器人要來了?兩部門宣布開展試點

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)養(yǎng)老機器人真的要來了?最近,工信部、民政部發(fā)布開展智能養(yǎng)老服務機器人結對攻關與場景應用試點工作的通知,試點期為2025—2027年。 ? 試點的具體內(nèi)容包括: ? 1.
    的頭像 發(fā)表于 06-16 09:08 ?3842次閱讀

    所以你做出來了嗎

    所以你做出來了嗎,求
    發(fā)表于 06-16 01:43

    和安信可Ai-M61模組對話?手搓一個ChatGPT 語音助手 #人工智能 #

    ChatGPT
    jf_31745078
    發(fā)布于 :2025年03月12日 15:56:59

    ChatGPT深度融入蘋果Mac軟件生態(tài)

    近日,科技界迎來了一項重要更新。當?shù)貢r間12月19日,OpenAI宣布了一項重大進展,其研發(fā)的ChatGPT已深度集成于蘋果Mac電腦的操作系統(tǒng)軟件中,為用戶帶來了全新的使用體驗。 此次更新中
    的頭像 發(fā)表于 12-23 10:50 ?710次閱讀

    ChatGPT新增實時搜索與高級語音功能

    在OpenAI的第八天技術分享直播中,ChatGPT的搜索功能迎來了重大更新。此次更新不僅豐富了ChatGPT的功能體系,更提升了其實用性和競爭力。 新增的實時搜索功能,是此次更新的亮點之一
    的頭像 發(fā)表于 12-17 14:08 ?602次閱讀

    大聯(lián)大推出基于MediaTek Genio 130與ChatGPT的AI語音助理方案

    ,為市場帶來了全新的智能交互體驗。 該AI語音助理方案充分利用了MediaTek Genio 130芯片的強大性能與ChatGPT的先進人工智能技術。MediaTek Genio 130芯片作為聯(lián)發(fā)
    的頭像 發(fā)表于 12-11 11:07 ?790次閱讀

    OpenAI推出Windows桌面版ChatGPT應用

    近日,OpenAI正式為微軟Windows 10和Windows 11用戶帶來了桌面版ChatGPT應用程序,這一創(chuàng)新之舉為用戶提供了更加便捷和高效的交互體驗。 據(jù)OpenAI產(chǎn)品開發(fā)人員Alex
    的頭像 發(fā)表于 11-18 14:04 ?650次閱讀

    蘋果iOS 18.2公測版發(fā)布,Siri與ChatGPT深度融合

    11月7日,蘋果公司正式推出了iOS 18.2的公測版,這款新版本為用戶帶來了諸多備受期待的新功能,其中Siri與ChatGPT的深度融合成為了最為引人注目的亮點。   在iOS 18.2中
    的頭像 發(fā)表于 11-07 15:22 ?964次閱讀

    ChatGPT 在游戲開發(fā)中的創(chuàng)新應用

    在游戲開發(fā)領域,人工智能技術的應用正變得越來越廣泛。ChatGPT,作為一種先進的自然語言處理(NLP)模型,為游戲開發(fā)帶來了許多創(chuàng)新的應用。 1. 動態(tài)對話系統(tǒng) ChatGPT的強項之一是生成自然
    的頭像 發(fā)表于 10-25 18:05 ?1026次閱讀

    怎樣搭建基于 ChatGPT 的聊天系統(tǒng)

    搭建一個基于ChatGPT的聊天系統(tǒng)是一個涉及多個步驟的過程,包括理解ChatGPT的API、設計用戶界面、處理數(shù)據(jù)和集成ChatGPT模型。以下是一個簡化的指南,用于創(chuàng)建一個基本的聊天系統(tǒng)。 1.
    的頭像 發(fā)表于 10-25 16:23 ?964次閱讀

    ChatGPT 適合哪些行業(yè)

    ChatGPT 是一種基于人工智能的自然語言處理技術,它能夠理解和生成人類語言。這種技術在多個行業(yè)中都有廣泛的應用潛力。以下是一些ChatGPT特別適合的行業(yè),以及它在這些行業(yè)中可能的應用方式
    的頭像 發(fā)表于 10-25 16:11 ?940次閱讀

    如何使用 ChatGPT 進行內(nèi)容創(chuàng)作

    使用ChatGPT進行內(nèi)容創(chuàng)作是一個高效且富有創(chuàng)意的過程。以下是一些關鍵步驟和建議,幫助您充分利用ChatGPT進行內(nèi)容創(chuàng)作: 一、準備階段 注冊與登錄 : 確保您已注冊ChatGPT賬號,并登錄
    的頭像 發(fā)表于 10-25 16:08 ?947次閱讀

    華納云:ChatGPT 登陸 Windows

    ChatGPT 桌面應用,您可以聊聊文件和照片。這款應用為您帶來了 OpenAI 最新的模型改進,包括訪問我們最新、最智能的模型OpenAI o1-preview ?!?Windows 版 ChatGPT 應用可以在大多數(shù) W
    的頭像 發(fā)表于 10-18 15:50 ?505次閱讀

    ChatGPT背后的AI背景、技術門道和商業(yè)應用

    ,但是當一篇篇文章/報告不斷推送到我的眼前,我后知后覺地發(fā)現(xiàn)這次真的不一樣。 很直接的一點是,ChatGPT已經(jīng)影響到非AI、非互聯(lián)網(wǎng)、非計算機的每一個人了。 你會看到,眾多科技界大佬,馬斯克、納德拉、李開復、李彥宏、周鴻祎等,都在發(fā)聲稱
    的頭像 發(fā)表于 10-18 15:42 ?3102次閱讀
    <b class='flag-5'>ChatGPT</b>背后的AI背景、技術門道和商業(yè)應用

    用launch pad燒錄chatgpt_demo項目會有api key報錯的原因?

    我用launch pad燒錄chatgpt_demo項目問題會有api key報錯;請問用launch pad要如何設置api key和調(diào)試?還是只能通過idf?
    發(fā)表于 06-27 07:59
    主站蜘蛛池模板: 天天鲁天天爽精品视频 | 亚洲国产成人久久三区 | a天堂中文在线官网 | 亚洲日本一区二区三区 | 国产在线啪 | 一级毛片a | 三级黄色短视频 | 成人久久精品 | 手机午夜视频 | 国产小视频免费在线观看 | 婷婷资源 | 国产黄大片在线观看 | 加勒比日本在线 | 亚洲视频你懂的 | 亚洲午夜免费 | 手机在线一区二区三区 | 久久夜色精品国产亚洲 | 国产三级网 | 91大神在线看 | a黄网站 | 精品福利在线观看 | 波多野结衣在线视频观看 | 综合网视频 | 四虎在线影院 | 噜噜噜噜噜久久久久久91 | 婷婷开心激情网 | 日本人亚洲人成人 | 久久狠狠第一麻豆婷婷天天 | 国产91丝袜在线播放九色 | 日韩dv| 欧美高清免费一级在线 | 狠狠插狠狠操 | 亚洲一区在线视频 | 天天摸天天操天天干 | 天天在线天天看成人免费视频 | 日本在线不卡一区二区 | 欧美日韩高清一本大道免费 | 天堂资源网 | 一级日本大片免费观看视频 | 国产精品夜夜春夜夜爽久久 | 插白浆|