欢乐颂第三季,旷世神医,盗墓笔记同人小说

電子發燒友網報道（文/李彎彎）日前，知乎在北京召開“2023知乎發現大會”，首次公開旗下與面壁智能共建的大模型產品“知海圖AI”。官方表示，在熱榜上抽取、聚合知乎用戶回答的41條內容，“知海圖AI”的表現基本接近ChatGPT-4。

在OpenAI推出ChatGPT之后，近幾個月，國內外科技企業陸續推出自己的大模型，包括百度的文心一言，商湯科技的商量SenseChat，阿里云的通義千問，昆侖萬維的“天工”3.5，以及亞馬遜的Titan，還有360、騰訊、搜狐，王慧文的光年之外等都傳出相關消息。

目前都發布了哪些大型語言模型

OpenAI在2022年11月30日發布的ChatGPT，在短短幾個月時間風靡全球。今年3月14日，OpenAI再次發布更強大的多模態大模型GPT-4。其最大股東微軟公司不僅宣布推出由ChatGPT支持的搜索引擎Bing和Edge瀏覽器。還宣布將GPT-4全面接入所有辦公軟件。

?
在ChatGPT的帶動下，全球科技公司掀起研究大型語言模型的熱潮。國內最新跟上的要數百度了，3月16日，百度正式發布新一代大語言模型、生成式AI產品文心一言。在發布會上，李彥宏還展示了文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成等使用場景中的綜合能力。

除了百度，最近還有多個大型語言模型密集發布。4月10日，昆侖萬維宣布，其和奇點智源合作自研、中國第一個真正實現智能涌現的國產大語言模型——“天工”3.5發布在即，并將于4月17日啟動邀請測試。該公司表示，“天工”大模型已經非常接近OpenAI ChatGPT的智能水平。

4月11日，在2023阿里云峰會上，阿里云也正式發布了旗下的類ChatGPT大模型——通義千問。阿里巴巴集團董事會主席兼CEO、阿里云智能集團CEO張勇表示，阿里巴巴所有產品未來將接入“通義千問”大模型，進行全面改造，釘釘、天貓精靈已率先接入通義千問測試，并會在評估認證后正式發布新功能。

4月12日，商湯科技發布“日日新SenseNova”大模型體系，推出語言大模型“商量SenseChat”、內容生成、自動化數據標注、自定義模型訓練等多種大模型及能力。據悉，作為千億級參數的自然語言處理模型，“商量SenseChat”使用大量數據訓練，并充分考慮了中文語境，能夠更好地理解和處理中文文本。

4月13日，亞馬遜推出一項名為“Bedrock”的云服務，允許開發者使用類似于ChatGPT聊天機器人的人工智能系統。通過Bedrock生成式人工智能服務，亞馬遜旗下云服務AWS將向開發者提供自家的語言模型“Titan”，以及來自初創公司AI21和谷歌支持的Anthropic的語言模型。這其中，一個Titan模型可以為博客帖子、電子郵件或其他文檔生成文本，而另一個可以幫助搜索和實現個性化。

此外，華為、騰訊也在大模型方面有所積累，華為最早于2021年便發布了華為云盤古基礎大模型，包括NLP、CV和科學計算大模型。最近有消息稱，華為云官網即將上線盤古系列AI大模型，分別為NLP大模型、CV等。不過華為云方面，并沒有對此做出回應。

騰訊很早就已經進行AI大模型的研究——混元AI大模型覆蓋NLP（自然語言處理）、CV（計算機視覺）、多模態等基礎模型和眾多行業/領域模型。騰訊不久前表示，近期混元AI大模型團隊也推出了萬億中文NLP預訓練模型HunYuan-NLP-1T，實現在中文語言理解能力上的新突破，而且得益其低成本、普惠等特點，目前HunYuan-NLP-1T大模型已成功落地于騰訊廣告、搜索、對話等內部產品并通過騰訊云服務外部客戶。

除了科技大廠，也有創業團隊宣布加入大模型研究大軍。4月10日，搜狗創始人王小川正式宣布入場大模型創業，和前搜狗COO茹立云聯合創立人工智能公司——百川智能，要做的事情是打造中國版的Open AI基礎大模型及顛覆性上層應用。王小川表示，有信心在年底發布國內最好的語言大模型。

另外，還有之前很受關注的創業項目，美團聯合創始人王慧文設立的光年之外科技公司。以及前商湯科技副總裁、通用智能技術負責人閆俊杰創辦的Minimax。

大模型的訓練和運行，離不開算力支持

然而，大模型的訓練和運行，需要強大的算力基礎。阿里云、商湯科技、騰訊等，在研究推進大模型研究的同時，也在構建算力基礎設施，供公司自身或其他公司使用。

大模型背后的算力基礎，包括高性能計算硬件、分布式計算框架、高效的算法和優化技術以及大量的訓練數據和存儲資源。這些因素共同支撐著大模型的成功運行。

阿里云在這方面做了充足準備，張勇表示，十多年來，阿里云已經累積了從飛天云操作系統、芯片到智算平臺的“AI+云計算”的全棧技術實力，并在IaaS（基礎設施即服務）和PaaS（平臺即服務）的基礎上，建立了第三層MaaS（模型即服務）的體系。

具體而言，“飛天智算基礎設施”智算IaaS服務涵蓋了一系列卓越特性，包括能夠支持高達十萬卡GPU的單集群規模、可讓多個萬億參數大模型同時在線訓練的強大智算集群，以及為萬卡規模AI集群提供無擁塞通訊的自主研發RDMA網絡架構等；

智算PaaS服務則以機器學習平臺PAI為核心，可支持萬卡的單任務分布式訓練規模，AI訓練效率提升可達10倍，推理效率提升可達6倍，覆蓋全鏈路AI開發工具與大數據服務，深度支持了通義大模型的研發。

智算MaaS服務包括通義大模型系列和以之為基礎的企業定制大模型。

憑借這些能力，阿里云不僅可以為自家大模型“通義千問”提供支持，還能夠把豐富的算力資源和大模型能力分享給更多企業和社會各界，共同推動AI技術的發展。

商湯科技在這方面也有積累，當前業界訓練大模型對大算力的需求非常旺盛，并且真正好用的基礎設施十分稀缺。商湯歷時五年，建設了業界領先的AI大裝置，大裝置上總共有27000塊的GPU芯片卡，可以輸出5.0 exaFLOPS的總算力，是亞洲目前最大的智能計算平臺之一。

基于大裝置的能力，商湯目前已構建了計算機視覺、自然語言處理、AI內容生成、多模態、決策智能等多個領域的大模型，持續演進能力并廣泛支持各種應用。

面向大模型訓練，4月14日，騰訊云正式發布了新一代HCC(High-Performance Computing Cluster)高性能計算集群。該集群采用騰訊云星星海自研服務器，國內首發搭載英偉達最新代次H800 GPU，能夠提供高性能、高帶寬、低延遲的算力支撐。根據官方數據，新的HCC計算集群能夠將大模型的訓練時間從上一代的11天壓縮至4天，可以有效節省大量時間。

全民AIGC時代要來了

從目前的情況來看，國內外科技企業巨頭都已經加入到大模型的研究大軍中，在過去短短幾個月時間，各種大模型產品密集發布。與此同時，作為大模型訓練和部署重要的支撐，算力基礎設施的構建也在加速推進。

另外，日前消息，微軟宣布開源了Deep Speed Chat，可以幫助用戶輕松訓練類ChatGPT等大語言模型，使得人人都能擁有自己的ChatGPT。也就是說，用戶通過Deep Speed Chat提供的“傻瓜式”操作，能以最短的時間、最高效的成本訓練類ChatGPT大語言模型，這標志著人手一個ChatGPT的時代要來了。

當然，當前ChatGPT等大模型還處于初期發展階段，人們不免對安全隱患、數據隱私、道德問題存在擔心。不過，最近多個國家已經開始著手制定AI相關的規則和政策。這意味著，大模型在經歷了過去幾個月的野蠻生長之后，將會逐步向規范化發展。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
88

文章
34623

瀏覽量
276444
AIGC

AIGC

+關注

關注
1

文章
385

瀏覽量
2337

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

知乎發布AI大模型！特定條件下水平接近ChatGPT-4，全面AIGC時代要來了？

評論