在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI訓練算力需求昂貴,機器學習成本成問題

如意 ? 來源:澎湃新聞 ? 作者:澎湃新聞 ? 2020-07-03 12:54 ? 次閱讀

對于計算工業,其最基本的一個假設是:數字處理會變得越來越便宜。并且根據著名的摩爾定律,可以預測在給定尺寸的芯片其上面能集成的電路個數(差不多相當于算力)通常每兩年會翻一番。

斯坦福人工智能研究所副所長克里斯托弗·曼寧表示,對于許多相對簡單的AI應用來言,上述假設意味著訓練成本的降低。但對于有些應用現在卻不是這樣的,特別是因為不斷增加的研究復雜性和競爭性,使得最前沿模型的訓練成本還在不斷上升。

曼寧用BERT模型來舉例,BERT是谷歌在18年提出的AI語言模型,已被用在谷歌搜索中。該模型有超過3.5億個內部參數,而且要大量數據來進行訓練,大概用了33億個大部分來自維基百科的單詞來訓練。接著曼寧說,現在看來維基百科都不是個多大的數據集了?!叭绻苡?00億個單詞訓練一個系統,那它的性能肯定比用30億個單詞訓練的系統要好?!钡嗟臄祿惨馕吨酶嗨懔M行支持。

總部位于加州的OpenAI表示,隨著對機器學習興趣的不斷增加,對算力的需求從12年開始也急劇增加了。到18年,用于訓練大型模型的計算機算力相比之前已增長了30萬倍,并且還每三個半月翻一番(見圖)。比如,為訓練能在DOTA 2中擊敗人類的“OpenAI Five”系統,就幾乎將機器學習訓練擴展到了“前所未有的水平”,差不多用數千塊芯片訓練了十多個月。

關于所有這些訓練成本的確切數字,馬薩諸塞州阿默斯特大學的研究人員在19年發表的一篇論文中進行了估計,例如訓練某個版本的Transformer模型可能就要花費300萬美金。同時Facebook的AI負責人杰羅姆·佩森蒂表示,針對當前最大的模型進行一輪訓練光是電費可能就好幾百萬美金。

云計算輔助

然而,對于Facebook這樣19年利潤就達185億美元的公司,這點錢不算什么。但對于那些現金并不充足的公司就有點壓力山大了。著名風險投資公司Andreessen Horowitz (a16z)指出,許多AI初創公司都是從云計算公司(如亞馬遜和微軟)來租用訓練所需的算力。而因此帶來的費用(有時占收入的25%或更多)也是AI初創公司投資吸引力低于老式軟件公司的原因之一。3月,曼寧博士在斯坦福大學的同事們,包括著名的李飛飛,一起呼吁創建美國國家研究云計算計劃,旨在幫助美國AI研究人員應對不斷增長的訓練費用。

對算力日益增長的需求同時也推動了芯片設計和AI專用計算設備的蓬勃發展。專用芯片的第一波浪潮是GPU的出現,其在90年代設計出來就是為了用于增強視頻游戲圖形處理。而非常巧的是,GPU也非常適合現在AI應用中的數學計算。

相比起GPU現在還有更專業的芯片,各個公司也正在致力于研究這些芯片。去年12月,英特爾就以20億美元的價格收購了以色列公司Habana Labs;而成立于16年的英國公司Graphcore在2019年的估值為20億美元;最大的GPU制造商Nvidia等公司已對其芯片進行了重新設計來適應AI的計算需求;Google內部設計了自己的“張量處理單元”(TPU)芯片;而中國科技巨頭百度也已用上了自己的“昆侖”芯片。畢馬威的阿方索·馬龍認為,專用AI芯片的市場價值已達約100億美元的規模,而到2025年預估能達到800億美元。

Graphcore的創始人之一奈杰爾·圖恩表示:“計算機體系結構需要適應現在訓練處理數據的方式?!?對于AI運算其最基礎的特征可以說就是“并行”,即將運算切分為很多小塊同時進行運算。例如,Graphcore的芯片有1,200多個單獨的數字運算核,能連接在一起提供更多的算力。而加州的創業公司Cerebras采取了更極端的方法,每個芯片占用了整張硅片,每張硅片上能放置40萬左右個核。

除了并行,其他優化也很重要。Cerebras的創始人之一安德魯·費爾德曼指出,AI模型花費了大量時間來進行乘零操作。而因為這些計算結果總時零,所以其實很多都是不必要的,所以Cerebras的芯片就盡量避免執行這些運算。同時,Graphcore的Toon先生說,與許多任務不同,現在AI并不需要超精確的計算。這也意味著芯片設計人員能通過減少運算所需的精度來節省能耗。(而計算精度到底能降到什么程度仍是個開放性問題。)

之后所有這些因素都能綜合起來獲得更大提升。Toon就認為Graphcore當前的芯片效率是GPU的10到50倍。

現在類似的創新變得越來越重要,因為對算力需求激增正趕上摩爾定律逐漸失效的時候?,F在縮小芯片變得越來越困難,而且帶來的收益也越來越小。去年,Nvidia的創始人黃仁勛直言不諱地說:“摩爾定律失效了”。

量子解決方案和神經形態方案

因此,現在研究人員還在尋找更多的解決方法。其中一種是量子計算,利用量子力學的反直覺特性為某些類型的計算進行大幅提速。關于機器學習的一種思考角度是將它看作是一個優化問題,而計算機試圖在數百萬個變量中進行權衡從而求出盡可能最小值。微軟量子系統部門負責人Krysta Svore說,一種稱為格羅弗算法的量子計算技術具有巨大的提速潛力。

另一種想法是從生物學中獲得啟發,認為當前的蠻力方法并不是唯一的方法。當Cerebras的芯片運行起來,功耗大約為15kw,足以為數十座房屋供電(相同數量GPU能耗更多)。而相比起來,人腦消耗能量就只有大概20w,只有前者的千分之一,而人腦在許多方面都比硅芯片更聰明。因此,英特爾和IBM等公司正在研究“神經形態”芯片,希望設計出更能模仿生物大腦神經元電行為的組件。

但到目前為止,這兩條路都還很遙遠。量子計算機在理論上相對容易理解些,但盡管有谷歌,微軟和IBM等技術巨頭投入數十億美元,實際搭建卻仍是個巨大挑戰。而神經形態芯片雖然是用現有技術構建的,但讓設計人員很氣餒的是,就連神經科學家都還不怎么了解大腦究竟在做什么以及怎么做到的。

這意味著,在可預見的未來,AI研究人員將不得不繼續盡可能地壓榨現有計算技術性能。而Toon先生對此還是很樂觀的,他認為通過更專業硬件以及調整現有軟件讓訓練更快,也還是能帶來很大收益。為了說明這個新領域的發展,他用電子游戲打了個比方:“現在我們已超越了乓(Pong),可能到了吃豆人?!?/p>

沒有錢來進行訓練的窮煉丹師們理所當然地希望他說的是對的。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31844

    瀏覽量

    270639
  • 機器學習
    +關注

    關注

    66

    文章

    8453

    瀏覽量

    133152
  • 算力
    +關注

    關注

    1

    文章

    1026

    瀏覽量

    14996
收藏 人收藏

    評論

    相關推薦

    中心的如何衡量?

    作為當下科技發展的重要基礎設施,其的衡量關乎其能否高效支撐人工智能、大數據分析等智能應用的運行。以下是對智中心算衡量的詳細闡述:一、
    的頭像 發表于 01-16 14:03 ?604次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    企業AI租賃模式的好處

    構建和維護一個高效、可擴展的AI基礎設施,不僅需要巨額的初期投資,還涉及復雜的運維管理和持續的技術升級。而AI
    的頭像 發表于 12-24 10:49 ?327次閱讀

    企業AI租賃是什么

    企業AI租賃是指企業通過互聯網向專業的提供商租用所需的計算資源,以滿足其AI應用的
    的頭像 發表于 11-14 09:30 ?1286次閱讀

    AI時代的重要性及現狀:平衡發展與優化配置的挑戰

    AI時代,扮演著至關重要的角色。如果說數據是AI大模型的“燃料”,那么則是其強大的“動
    的頭像 發表于 11-04 11:45 ?665次閱讀

    GPU開發平臺是什么

    隨著AI技術的廣泛應用,需求呈現出爆發式增長。AI
    的頭像 發表于 10-31 10:31 ?287次閱讀

    AI大模型與傳統機器學習的區別

    多個神經網絡層組成,每個層都包含大量的神經元和權重參數。 傳統機器學習 :模型規模相對較小,參數數量通常只有幾千到幾百萬個,模型結構相對簡單。 二、訓練數據需求
    的頭像 發表于 10-23 15:01 ?1242次閱讀

    青云科技強化AI架構,升級產品與服務體系

    10月9日,青云科技正式揭曉了其升級版的產品與服務陣容、行業及場景定制化解決方案,以及全新的生態戰略。該公司旨在通過AI平臺、AI
    的頭像 發表于 10-10 16:42 ?581次閱讀

    淺談AI力主板

    AI 力主板是一種專門為人工智能計算任務設計的主板,具有強大的計算能力和專門的硬件加速模塊,以滿足人工智能應用對大量數據處理和復雜算法的需求。 近年來,人工智能算法,尤其是深度學習
    的頭像 發表于 09-13 10:55 ?568次閱讀

    大模型時代的需求

    現在AI已進入大模型時代,各企業都爭相部署大模型,但如何保證大模型的,以及相關的穩定性和性能,是一個極為重要的問題,帶著這個極為重要的問題,我需要在此書中找到答案。
    發表于 08-20 09:04

    名單公布!【書籍評測活動NO.41】大模型時代的基礎架構:大模型中心建設指南

    基于TOGAF方法論,剖析業界知名案例的設計方案。 全書總計13章。第1章講解AI與大模型時代對基礎架構的需求;第2章講解軟件程序與專用硬件的結合,涉及GPU并行運算庫、機器學習程序
    發表于 08-16 18:33

    摩爾線程張建中:以國產助力數智世界,滿足大模型需求

    摩爾線程創始人兼CEO張建中在會上透露,為了滿足國內對AI的迫切需求,他們正在積極尋求與國內頂尖科研機構的深度合作,共同推動更大規模的AI
    的頭像 發表于 05-10 16:36 ?1053次閱讀

    risc-v多核芯片在AI方面的應用

    得RISC-V多核芯片能夠更好地適應AI算法的不同需求,包括深度學習、神經網絡等,從而提高芯片的性能和效率,降低成本,使AI邊緣計算晶片更具
    發表于 04-28 09:20

    AI訓練,為什么需要GPU?

    隨著由ChatGPT引發的人工智能熱潮,GPU成為了AI大模型訓練平臺的基石,甚至是決定性的底座。為什么GPU能力壓CPU,成為炙手可熱的主角呢?要回答這個問題,首先需要了解當前人
    的頭像 發表于 04-24 08:05 ?1075次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>訓練</b>,為什么需要GPU?

    為什么租賃能省錢?如何正確、快速抓住“人工智能+”新機遇

    ABSTRACT摘要通過租賃模式,企業可以根據實際需求靈活調整租用資源規模,無需承擔昂貴
    的頭像 發表于 03-13 08:24 ?713次閱讀
    為什么<b class='flag-5'>算</b><b class='flag-5'>力</b>租賃能省錢?如何正確、快速抓住“人工智能+”新機遇
    主站蜘蛛池模板: 国产稀缺精品盗摄盗拍 | 四虎影院在线播放 | 久久伊人操 | 亚洲aⅴ久久久噜噜噜噜 | 日日干日日爽 | 亚洲人成网站在线 | 极品吹潮视频大喷潮tv | 国产精品免费一级在线观看 | 天天做天天爱夜夜爽女人爽宅 | 欧美三级在线视频 | 黄 色 大 片 网站 | 米奇777四色精品人人爽 | 黄a级免费| 视频免费在线观看 | 人人干狠狠操 | 日韩欧美中文字幕在线播放 | 久久精品国产99久久72 | 日韩特级片 | 亚洲人的天堂男人爽爽爽 | 久久精品高清视频 | 757一本到午夜宫 | 性夜黄a爽爽免费视频国产 羞羞答答xxdd影院欧美 | 成人看的一级毛片 | 色就是色欧美色图 | 久久精品综合网 | 日本在线不卡一区二区 | 亚洲欧美在线视频免费 | 欧日韩视频777888 | 国产一区二区三区在线观看视频 | 国产日日操| 色综合社区| 手机看片久久 | 欧美视频图片 | 国产yw855.c免费视频 | 日韩a毛片免费全部播放完整 | 国产香蕉视频在线 | 亚洲精品成人久久久影院 | 四虎影院成人在线观看 | 天天干夜夜操视频 | 日本不卡视频在线播放 | 天天操狠狠干 |