電子發燒友網報道(文/李彎彎)日前,知乎在北京召開“2023知乎發現大會”,首次公開旗下與面壁智能共建的大模型產品“知海圖AI”。官方表示,在熱榜上抽取、聚合知乎用戶回答的41條內容,“知海圖AI”的表現基本接近ChatGPT-4。
在OpenAI推出ChatGPT之后,近幾個月,國內外科技企業陸續推出自己的大模型,包括百度的文心一言,商湯科技的商量SenseChat,阿里云的通義千問,昆侖萬維的“天工”3.5,以及亞馬遜的Titan,還有360、騰訊、搜狐,王慧文的光年之外等都傳出相關消息。
目前都發布了哪些大型語言模型
OpenAI在2022年11月30日發布的ChatGPT,在短短幾個月時間風靡全球。今年3月14日,OpenAI再次發布更強大的多模態大模型GPT-4。其最大股東微軟公司不僅宣布推出由ChatGPT支持的搜索引擎Bing和Edge瀏覽器。還宣布將GPT-4全面接入所有辦公軟件。
?
在ChatGPT的帶動下,全球科技公司掀起研究大型語言模型的熱潮。國內最新跟上的要數百度了,3月16日,百度正式發布新一代大語言模型、生成式AI產品文心一言。在發布會上,李彥宏還展示了文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成等使用場景中的綜合能力。
除了百度,最近還有多個大型語言模型密集發布。4月10日,昆侖萬維宣布,其和奇點智源合作自研、中國第一個真正實現智能涌現的國產大語言模型——“天工”3.5發布在即,并將于4月17日啟動邀請測試。該公司表示,“天工”大模型已經非常接近OpenAI ChatGPT的智能水平。
4月11日,在2023阿里云峰會上,阿里云也正式發布了旗下的類ChatGPT大模型——通義千問。阿里巴巴集團董事會主席兼CEO、阿里云智能集團CEO張勇表示,阿里巴巴所有產品未來將接入“通義千問”大模型,進行全面改造,釘釘、天貓精靈已率先接入通義千問測試,并會在評估認證后正式發布新功能。
4月12日,商湯科技發布“日日新SenseNova”大模型體系,推出語言大模型“商量SenseChat”、內容生成、自動化數據標注、自定義模型訓練等多種大模型及能力。據悉,作為千億級參數的自然語言處理模型,“商量SenseChat”使用大量數據訓練,并充分考慮了中文語境,能夠更好地理解和處理中文文本。
4月13日,亞馬遜推出一項名為“Bedrock”的云服務,允許開發者使用類似于ChatGPT聊天機器人的人工智能系統。通過Bedrock生成式人工智能服務,亞馬遜旗下云服務AWS將向開發者提供自家的語言模型“Titan”,以及來自初創公司AI21和谷歌支持的Anthropic的語言模型。這其中,一個Titan模型可以為博客帖子、電子郵件或其他文檔生成文本,而另一個可以幫助搜索和實現個性化。
此外,華為、騰訊也在大模型方面有所積累,華為最早于2021年便發布了華為云盤古基礎大模型,包括NLP、CV和科學計算大模型。最近有消息稱,華為云官網即將上線盤古系列AI大模型,分別為NLP大模型、CV等。不過華為云方面,并沒有對此做出回應。
騰訊很早就已經進行AI大模型的研究——混元AI大模型覆蓋NLP(自然語言處理)、CV(計算機視覺)、多模態等基礎模型和眾多行業/領域模型。騰訊不久前表示,近期混元AI大模型團隊也推出了萬億中文NLP預訓練模型HunYuan-NLP-1T,實現在中文語言理解能力上的新突破,而且得益其低成本、普惠等特點,目前HunYuan-NLP-1T大模型已成功落地于騰訊廣告、搜索、對話等內部產品并通過騰訊云服務外部客戶。
除了科技大廠,也有創業團隊宣布加入大模型研究大軍。4月10日,搜狗創始人王小川正式宣布入場大模型創業,和前搜狗COO茹立云聯合創立人工智能公司——百川智能,要做的事情是打造中國版的Open AI基礎大模型及顛覆性上層應用。王小川表示,有信心在年底發布國內最好的語言大模型。
另外,還有之前很受關注的創業項目,美團聯合創始人王慧文設立的光年之外科技公司。以及前商湯科技副總裁、通用智能技術負責人閆俊杰創辦的Minimax。
大模型的訓練和運行,離不開算力支持
然而,大模型的訓練和運行,需要強大的算力基礎。阿里云、商湯科技、騰訊等,在研究推進大模型研究的同時,也在構建算力基礎設施,供公司自身或其他公司使用。
大模型背后的算力基礎,包括高性能計算硬件、分布式計算框架、高效的算法和優化技術以及大量的訓練數據和存儲資源。這些因素共同支撐著大模型的成功運行。
阿里云在這方面做了充足準備,張勇表示,十多年來,阿里云已經累積了從飛天云操作系統、芯片到智算平臺的“AI+云計算”的全棧技術實力,并在IaaS(基礎設施即服務)和PaaS(平臺即服務)的基礎上,建立了第三層MaaS(模型即服務)的體系。
具體而言,“飛天智算基礎設施”智算IaaS服務涵蓋了一系列卓越特性,包括能夠支持高達十萬卡GPU的單集群規模、可讓多個萬億參數大模型同時在線訓練的強大智算集群,以及為萬卡規模AI集群提供無擁塞通訊的自主研發RDMA網絡架構等;
智算PaaS服務則以機器學習平臺PAI為核心,可支持萬卡的單任務分布式訓練規模,AI訓練效率提升可達10倍,推理效率提升可達6倍,覆蓋全鏈路AI開發工具與大數據服務,深度支持了通義大模型的研發。
智算MaaS服務包括通義大模型系列和以之為基礎的企業定制大模型。
憑借這些能力,阿里云不僅可以為自家大模型“通義千問”提供支持,還能夠把豐富的算力資源和大模型能力分享給更多企業和社會各界,共同推動AI技術的發展。
商湯科技在這方面也有積累,當前業界訓練大模型對大算力的需求非常旺盛,并且真正好用的基礎設施十分稀缺。商湯歷時五年,建設了業界領先的AI大裝置,大裝置上總共有27000塊的GPU芯片卡,可以輸出5.0 exaFLOPS的總算力,是亞洲目前最大的智能計算平臺之一。
基于大裝置的能力,商湯目前已構建了計算機視覺、自然語言處理、AI內容生成、多模態、決策智能等多個領域的大模型,持續演進能力并廣泛支持各種應用。
面向大模型訓練,4月14日,騰訊云正式發布了新一代HCC(High-Performance Computing Cluster)高性能計算集群。該集群采用騰訊云星星海自研服務器,國內首發搭載英偉達最新代次H800 GPU,能夠提供高性能、高帶寬、低延遲的算力支撐。根據官方數據,新的HCC計算集群能夠將大模型的訓練時間從上一代的11天壓縮至4天,可以有效節省大量時間。
全民AIGC時代要來了
從目前的情況來看,國內外科技企業巨頭都已經加入到大模型的研究大軍中,在過去短短幾個月時間,各種大模型產品密集發布。與此同時,作為大模型訓練和部署重要的支撐,算力基礎設施的構建也在加速推進。
另外,日前消息,微軟宣布開源了Deep Speed Chat,可以幫助用戶輕松訓練類ChatGPT等大語言模型,使得人人都能擁有自己的ChatGPT。也就是說,用戶通過Deep Speed Chat提供的“傻瓜式”操作,能以最短的時間、最高效的成本訓練類ChatGPT大語言模型,這標志著人手一個ChatGPT的時代要來了。
當然,當前ChatGPT等大模型還處于初期發展階段,人們不免對安全隱患、數據隱私、道德問題存在擔心。不過,最近多個國家已經開始著手制定AI相關的規則和政策。這意味著,大模型在經歷了過去幾個月的野蠻生長之后,將會逐步向規范化發展。
-
AI
+關注
關注
87文章
33239瀏覽量
273515 -
AIGC
+關注
關注
1文章
378瀏覽量
1976
發布評論請先 登錄
相關推薦
首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手
#新年新氣象,大家新年快樂!#AIGC入門及鴻蒙入門
AIGC入門及鴻蒙入門
云知聲榮登2024全球AIGC先鋒者系列榜單
云知聲入選創業邦《2024 AIGC創新應用洞察報告》
云知學院開展AIGC專題授課
aigc和chatGPT區別和聯系
知乎全新AI產品"知乎直答"亮相第十屆鹽Club新知青年大會
AIGC遇上ChatGPT,互聯網公司的創意設計師,還能做什么?
名單公布!【書籍評測活動NO.34】大語言模型應用指南:以ChatGPT為起點,從入門到精通的AI實踐教程
ChatGPT-4 API 密鑰:官方申請指南及國內直連使用攻略

OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來了
OpenAI的AI搜索也要來了,但我們需要這么多AI搜索么

評論