光電混合技術是催生下一個大模型發展的底層技術之一。
——沈亦晨博士
我們認為需要從物理底層機制入手,尋求一種不同的解決方案來突破現有的(算力)限制。這就是我們提出光子計算概念的原因。
——孟懷宇博士
2023年7月6日至8日,世界人工智能大會(WAIC)在上海召開。曦智科技創始人、首席執行官沈亦晨博士受邀出席“從‘端’到‘云’,勇攀‘芯’高峰”——WAIC芯片主題論壇,在圓桌論壇環節以“圍繞新應用,打造新生態”為主題,分享了曦智科技的見解和實踐。曦智科技聯合創始人、首席技術官孟懷宇博士則受邀出席WAIC AI開發者領袖論壇,以2022年WAIC云帆獎得主身份參與圓桌對話,就大模型時代范式轉變中的機遇和挑戰分享了他的洞見。
隨著ChatGPT橫空出世,以大模型為代表的新應用不斷涌現,對AI芯片以及產業鏈產生了諸多影響。
在WAIC 芯片主題論壇上,沈亦晨博士就此發表了他的觀點。他認為,產業應用會驅動底層技術的創新,在大模型出現之前,AI的發展已然推動了許多底層技術的發展。然而,從傳統計算到大模型等AI計算產生,該級別的AI對算力、存儲、帶寬的需求激增,對現有的數據中心和邊緣設備提出了更高挑戰。
沈亦晨博士說:“從曦智科技的角度來看,光電混合技術是催生下一個大模型發展的底層技術之一,光子技術與電混合在一起形成新的異構計算方式,可以提供更高效的算力解決方案。一方面,光電混合技術具備高帶寬、低功耗的特點,讓更多的計算節點之間高效傳輸,完成更大規模的計算;另一方面,光電混合技術也將改變產業鏈和供應鏈,如何讓不同廠商、不同技術共享一種語言,遵循一個通用協議,將是提升算力必須探討的重要議題。”
面對大模型熱潮,行業該如何通過應用創新去適應當前的市場情況,同樣是各界關注的焦點問題之一。
在這一方面,曦智科技基于大規模光電集成技術的計算新范式,發展出縱向單節點算力提升與橫向多節點算力提升的解決方案,形成光子矩陣計算(oMAC)、片上光網絡(oNOC)、片間光網絡(oNET)三大核心技術。同時,曦智科技還成立了曦智研究院,并且已對外發布《大規模光電集成賦能智能算力網絡白皮書》。“期待能夠與大家有更多合作,共同建立光電混合計算的大生態,助推技術發展。”沈亦晨博士說。
曦智科技三大核心技術
在WAIC AI開發者領袖論壇上,針對“大模型熱”,孟懷宇博士表示,隨著摩爾定律的放緩,算力提升已遭遇瓶頸。在這樣的背景下,從業者更需要思考能做些什么,該如何應對。
“我們認為需要從物理底層機制入手,尋求一種不同的解決方案來突破現有的限制。這就是我們提出光子計算概念的原因。光信號也是電磁波,但其頻率約為200THz,因此幾乎沒有串擾,在計算過程中幾乎不受頻率影響,也沒有歐姆發熱等問題。當然,光子計算也存在一些局限性,但只有通過改變,才有可能突破現有的限制。”孟懷宇博士說。
孟懷宇博士在AI開發者論壇圓桌會話環節發表他對于大模型熱潮的看法
在當天的論壇上,其他與會嘉賓指出,當前的深度計算變慢,變成寬度計算。對此,孟懷宇博士進一步闡釋說:“這是因為從邏輯上講,從電芯片的層面來看,目前,單個芯片計算能力的提升無法跟上模型規模的增長速度,所以必須使用越來越多的計算資源。然而,我們知道對于電來說,并行計算的規模是有限的,1加1小于2,2加2小于4,4加4遠遠小于8。”
在有限的計算資源情況下,又該如何更好地利用資源,使計算能力盡量接近線性增長?孟懷宇博士給出了他的解決方案:“這就需要更好地優化整個互連狀態。從理論上講,如果在一個大規模計算中,比如萬卡的情況下,每個芯片都能在任何時刻立即獲得所需的數據,那么我們就可以實現線性增長。然而,目前的互連架構還無法達到這個水平,我們需要盡量通過技術手段接近這個目標,光互連具有高帶寬、低延遲、低功耗等特性,同時對于傳播距離不敏感,我們認為,光可以成為一種更好的解決方案,我認為這一點可能比GPU本身的性能提升更為關鍵。”
與此同時,目前已經投入商用的,GPU之間的大帶寬、低延遲互連解決方案依然數量有限。“世界應該是多樣的,解決方案也應該是多樣的,曦智科技也希望我們的光電混合計算成為其中的一個解決方案。”孟懷宇博士在分享時,也表達了他的期望。
-
計算
+關注
關注
2文章
451瀏覽量
38878 -
曦智科技
+關注
關注
0文章
23瀏覽量
6139 -
大模型
+關注
關注
2文章
2603瀏覽量
3215
原文標題:曦智科技@WAIC|期待共建光電混合計算大生態
文章出處:【微信號:曦智科技,微信公眾號:曦智科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論