落地方能檢驗技術(shù)真章。
9月7日,在一年一度的騰訊全球數(shù)字生態(tài)大會上,騰訊自研的通用大語言模型混元大模型正式亮相,并宣布正式通過騰訊云對外開放。企業(yè)用戶可以直接在騰訊云上調(diào)用混元API,或者將混元作為基底模型構(gòu)建上層應用。
與市場上很多廠商都在爭先恐后的優(yōu)先推進對話式大語言模型不同,騰訊在大模型落地探索上有著明顯不一樣的節(jié)奏和堅持。
最直接的節(jié)奏體感是騰訊的“不著急”——在廠商紛紛搶占今年三、四月份的第一波大模型時間卡位時,馬化騰直言“騰訊不急于做半成品”。所以直到6月,大眾才第一次正式看到騰訊的行業(yè)大模型,彼時,市場上已經(jīng)在風風火火的上演著“百模大戰(zhàn)”。
細究這種“不著急”背后,也許并非是因為騰訊在戰(zhàn)略上“輕視”大模型的機會,而是他們認為大模型的價值核心不在時間窗口上,而在落地實踐中。畢竟,在馬化騰看來“大模型是互聯(lián)網(wǎng)百年不遇的機會,是類似發(fā)明電的工業(yè)革命一樣的機遇。”
這種更倡導落地的價值觀在當下正逐步成為行業(yè)共識——隨著更多大語言模型對外開放,科技公司除了在不斷打磨模型能力之外,也相繼走進了各行各業(yè),踏上了場景落地探索的新征程。目前,云廠商在大模型的產(chǎn)業(yè)落地思路上基本已達成共識:MaaS(Model-as-a-Service)模式,落地行業(yè),走在場景中,和客戶一起合作做垂類大模型。
如果大模型的價值核心在場景落地上,騰訊的解題思路是什么?
1.騰訊的選擇:實用主義
不同公司在發(fā)展大模型技術(shù)上思路不同,選擇的優(yōu)先級也不同。有的公司更關(guān)心技術(shù)、參數(shù),把追趕ChatGPT定為首要目標。有的公司更關(guān)心場景閉環(huán),在早期階段就選擇把場景驗證納入技術(shù)探索的必經(jīng)之路上。
騰訊的答案明顯是后者。從6月19日發(fā)布行業(yè)大模型之初,騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生就強調(diào)了騰訊的大模型價值觀:“通用大模型不一定是滿足行業(yè)場景需求的最優(yōu)解。企業(yè)需要有針對性的行業(yè)大模型,結(jié)合自己的數(shù)據(jù)做訓練或精調(diào),在合理的成本下,打造實用性更高的智能服務。”
騰訊的這種價值可以用四個字來概括——實用主義。這也是騰訊做大模型貫穿始終的一條暗藏的主線。
一方面,實用主義意味著,騰訊云更關(guān)注大模型如何解決場景問題而不僅僅是參數(shù)大小。騰訊云副總裁、騰訊云智能負責人吳運聲曾直言:“幾億、幾十億、幾百億還是一千多億,我們并不關(guān)心模型參數(shù)的那個數(shù)字,我們更關(guān)注的怎么解決客戶的問題,希望用最有效,最低成本的手段去解決客戶的問題。”
另一方面,實用主義意味著,要更關(guān)心應該用什么技術(shù)組合?如何更有效率的解決問題?吳運聲提到:“就像舉重運動員要舉200斤的杠鈴,但作為游泳運動員舉100斤就夠了,作為體育室,我們提供200斤的杠鈴,但對于不同類型的運動員或者更多普通人,他們沒有必要都要用200斤的杠鈴練習。”
在他看來,在一些行業(yè)和具體的領(lǐng)域,數(shù)據(jù)量本身就沒那么大,用小參數(shù)成本低,效果也會更好。“我們希望以最低的成本,最合適的模型,最好的服務去讓客戶真正把技術(shù)用起來,解決它在場景中的問題。”吳運聲說。
他認為這是騰訊云一直在貫徹的技術(shù)實用主義:“從大模型整體思路來看,我們并不特別關(guān)注形式,而是注重技術(shù)產(chǎn)生的實際價值,以及在客戶業(yè)務中的價值體現(xiàn)。我們的核心出發(fā)點都是基于此。”
這種經(jīng)驗和判斷來源于騰訊云在to B領(lǐng)域的多年深耕——大模型技術(shù)需要基于產(chǎn)業(yè)場景,與企業(yè)數(shù)據(jù)融合,才能釋放出最大的價值,“智能化的后半場,騰訊云智能在堅持投入AI技術(shù)研發(fā)的同時,一直專注于產(chǎn)業(yè)實踐,強調(diào)技術(shù)的務實可行和產(chǎn)品的安全可靠。”吳運聲提到。
對外,所有的技術(shù)最終都要面對場景的發(fā)問。深度學習之后,上一波AI熱潮的歸向也是如此。過去幾年中,更多AI公司在已經(jīng)放下“標榜自身有多牛”的身段,轉(zhuǎn)而走向更落地的方向,尋找真正可規(guī)模化的場景。
對內(nèi),騰訊云也一直在踐行落實這種技術(shù)實用主義。作為騰訊云承擔大量前沿探索工作的關(guān)鍵部門,騰訊優(yōu)圖實驗室也一直在堅持“研究和落地并重”的方針:一方面需要站在科技前沿探索更多的可能性,另一方面需要考慮技術(shù)能解決的實際問題,而非純粹的技術(shù)至上和論文至上。“研究、落地兩條腿走路,這是優(yōu)圖從成立的第一天開始就在強調(diào)的重點方向。”吳運聲說道。
他認為,關(guān)心落地并不意味著不關(guān)注前沿研究。“我們的研究恰恰是以解決在落地中遇到的實際問題為前提,每年我們也會發(fā)布很多論文,但和其他家不同的地方在于,優(yōu)圖幾乎70%、80%論文原點都是我們在實際場景中遇到的問題。基于問題,我們進行探索研究,最終抽象成學術(shù)層面的東西。”
技術(shù)要更實用也能顯現(xiàn)出價值,并不是一句空話。
2.實用主義的源頭:一線用戶的需求
實用主義并非是騰訊云的一家之言,騰訊依靠的是來自一線企業(yè)需求的真實反饋。正如湯道生所言:“企業(yè)需要的是在實際場景中真正解決了某個問題,而不是在100個場景中解決了70%-80%的問題。”
今年以來,騰訊云一直泡在一線和用戶溝通具體的需求。騰訊云副總裁、騰訊云智能研發(fā)負責人吳永堅告訴「甲子光年」,當前,企業(yè)客戶對于大模型的技術(shù)需求正在逐步變得更理性。“客戶在張開懷抱擁抱技術(shù)的同時提出了更多實用性的需求:有人關(guān)心大模型技術(shù)能夠結(jié)合產(chǎn)品上做更定制化;有人希望拓寬大模型更多元的知識來源,也有人希望生成精準的行業(yè)知識,準確率要有保障。”他認為,技術(shù)需要結(jié)合多種因素組合考量:“安全性、部署、成本等多重因素交織下,再去考慮技術(shù)的可達性。”
這些多樣化的需求意味著,單一模型很難滿足所有需求。“我們不會去強調(diào)技術(shù)有多強,而更側(cè)重于產(chǎn)品如何去解決客戶的實際問題。”
基于此,騰訊云打造了支撐實用主義落地的全套MaaS服務體系,并持續(xù)根據(jù)用戶需求進行迭代:基于自研的騰訊混元大模型,同時支持業(yè)內(nèi)主流的開源模型應用,從技術(shù)底座、平臺能力和智能應用三個維度,助力客戶構(gòu)建專屬大模型和智能應用,推動大模型在產(chǎn)業(yè)中的落地應用。
騰訊云MaaS解決方案,圖片來自騰訊
技術(shù)底座層包含算力工具和行業(yè)模型。算力方面,包含騰訊云今年4月發(fā)布的專為大模型訓練設(shè)計的新一代HCC高性能計算集群;依托自用的向量引擎(OLAMA)騰訊云也已經(jīng)推出向量數(shù)據(jù)庫(Tencent Cloud VectorDB);以及自研的星脈計算網(wǎng)絡架構(gòu)。“通過存儲、計算、網(wǎng)絡整體的升級,我們今天實現(xiàn)了訓練一輪萬億參數(shù)的模型在4天之內(nèi)就可以完成,并讓訓練效率得到大幅提升,訓練時間得到保障,訓練成本下降很多。”騰訊云副總裁、騰訊云智能負責人、優(yōu)圖實驗室負責人吳運聲提到。
平臺方面,騰訊云TI平臺是騰訊云大模型能力在行業(yè)落地的技術(shù)“殺手锏”:不僅包含此前就有的數(shù)據(jù)標注、訓練、評估、測試和部署等工具,還有可以進行更優(yōu)訓練和推理加速“太極Angel”,以及從“業(yè)務分析、數(shù)據(jù)處理、大模型選擇”到“模型評測”的一體化完整方法論。吳運聲稱:“我們對企業(yè)在做模型精調(diào)過程中的精調(diào)、部署等方面的工具做了全棧式打造,可以讓每個想做自己模型的企業(yè),基于TI平臺,用騰訊云的加速框架、基礎(chǔ)算力、開源工具,讓構(gòu)筑行業(yè)模型變得更簡單。”
在2023年騰訊全球數(shù)字生態(tài)大會上,騰訊云對這套技術(shù)底座進行了新的升級:
平臺層,一方面,TI平臺也全面接入了Llama 2、Falcon、Dolly等主流開源模型,支持系列模型的直接部署調(diào)用、應用流程簡單。
工具鏈層,騰訊云為客戶提供了多款即插即用的產(chǎn)品,客戶只需加入自己獨有的場景數(shù)據(jù)進行精調(diào)訓練,就可快速嘗試多種大模型,并根據(jù)自身業(yè)務場景需求,就可以在短時間內(nèi)精調(diào)出專屬的模型方案。
加速方面,升級后太極Angel大模型加速框架,通過異步調(diào)度優(yōu)化、顯存優(yōu)化、計算優(yōu)化等方式,相比行業(yè)常用方案性能提升30%以上。
應用層,騰訊企點繼續(xù)升級了全新一代智能客服,提升了管理端配置能力、知識構(gòu)建效率,優(yōu)化C端用戶體驗;同時騰訊企點分析AI助手,覆蓋對話式分析,輔助數(shù)據(jù)配置、提取智能結(jié)論、一鍵生成報告四大場景,該功能正式在9月向大客戶開放內(nèi)測申請。
這些多樣的技術(shù)組合支撐著騰訊云將大模型落實到千行百業(yè)。
3.踐行實用主義,把大模型落地實體經(jīng)濟
對于眼下的騰訊云而言,究竟如何真正將實用主義落地真實的場景中?
從戰(zhàn)略優(yōu)先級上來看,當前騰訊云已經(jīng)有一套清晰的思考:第一步,錨定標桿客戶。第二步,輻射整個上下游產(chǎn)業(yè)鏈的腰部企業(yè)。“眼下,我們會挑選若干個關(guān)鍵場景,結(jié)合客戶需求做深做透,形成標桿,之后就能夠往腰部覆蓋,開展規(guī)模化。”騰訊云副總裁、騰訊云智能研發(fā)負責人吳永堅告訴「甲子光年」。
其次是重要行業(yè)和領(lǐng)域。這個答案從騰訊云此前的大戰(zhàn)略就可以得出——實體經(jīng)濟。
實體經(jīng)濟是大模型必爭之地。工信部提出,到2025年,70%的規(guī)模以上制造業(yè)企業(yè)基本實現(xiàn)數(shù)字化網(wǎng)絡化。騰訊云也在2021年進行了全面的調(diào)整來持續(xù)開拓實體經(jīng)濟市場。騰訊對自己的角色定位一直是——實體經(jīng)濟的數(shù)字化助手。工業(yè)、制造、能源、零售等都是騰訊云的核心陣地,目前三一重工、富馳高科、國家電網(wǎng)都是其客戶。
騰訊集團副總裁、政企業(yè)務總裁李強在分享中稱:“騰訊會堅定的推動大模型走入產(chǎn)業(yè)全鏈條。比起聊天、答題、內(nèi)容生產(chǎn)等,大模型在產(chǎn)業(yè)的具體場景應用,對實體經(jīng)濟將帶來更大價值。”在他看來,機會巨大:“中國擁有智能化落地的豐沃土壤和場景,我國的制造業(yè)規(guī)模已經(jīng)連續(xù)13年居世界首位。中國信通院預測,到2030年,中國產(chǎn)業(yè)智能化的規(guī)模會超過10萬億元,智能化還將推動勞動生產(chǎn)率提升20%。”
目前,騰訊云已經(jīng)攜手政務等行業(yè)的頭部企業(yè),在二十余個行業(yè)探索了超50個行業(yè)大模型的應用解決方案。以騰訊云數(shù)智人工廠為例,騰訊云MaaS能力可以讓數(shù)智人分身復刻縮短至24小時,大幅降低成本。在文旅領(lǐng)域推出的文旅大模型,金融領(lǐng)域打造的OCR大模型都是已經(jīng)在落地的案例。
比如,騰訊云OCR大模型可以提升非結(jié)構(gòu)化內(nèi)容識別、理解能力,企業(yè)可以通過TI平臺對OCR大模型進行精調(diào)。這是一種極大的能力躍遷。此前傳統(tǒng)的OCR深度學習模型需要經(jīng)過檢測、識別、結(jié)構(gòu)化等多個階段,很難突破監(jiān)測識別難點,且不具備閱讀理解和推理能力,更難以進行標準化,企業(yè)的定制成本高昂。新的大模型技術(shù)讓這些難題不再是障礙,能夠讓圖像到文字直接生成,使得任務間能力互補,泛化性更強,場景更豐富。
OCR大模型提升了很多場景的工作效率,比如工業(yè)質(zhì)檢場景下,工廠可以讓大模型識別電線規(guī)格、零部件規(guī)格說明書,物流快遞場景下,物流公司可以讓大模型識別集裝箱規(guī)格、電子顯示屏讀數(shù),這種端到端理解圖片的能力,極大的提高了流程效率。
這只是騰訊云推動大模型在實體經(jīng)濟的一小步。
更多關(guān)于實用主義的探索正在路上。騰訊正持續(xù)推動大模型走入產(chǎn)業(yè)全鏈條。隨著技術(shù)在千行百業(yè)的扎根,從田間到產(chǎn)線,從實驗室到便利店,大模型將無處不在。
-
智能化
+關(guān)注
關(guān)注
15文章
5109瀏覽量
57029 -
騰訊
+關(guān)注
關(guān)注
7文章
1678瀏覽量
50185 -
大模型
+關(guān)注
關(guān)注
2文章
3062瀏覽量
3907
原文標題:騰訊的大模型價值觀:實用主義|甲子光年
文章出處:【微信號:jazzyear,微信公眾號:甲子光年】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
如何使用SX3將并行圖像傳感器切換到USB?
海康威視綜合安防管理平臺融合DeepSeek與海康觀瀾大模型
PCBA板的顏色密碼:選美大賽還是實用主義?
騰訊元寶升級:深度思考模型“騰訊混元T1”全量上線
騰訊AI助手“騰訊元寶”重大更新:支持深度思考功能
騰訊元寶AI產(chǎn)品更新,正式接入DeepSeek R1模型
騰訊云率先上線DeepSeek模型API接口,支持聯(lián)網(wǎng)搜索
騰訊公布大語言模型訓練新專利
騰訊云TI平臺推出DeepSeek系列模型
胡瀚接棒騰訊多模態(tài)大模型研發(fā)
騰訊混元大模型開源成績斐然,GitHub Star數(shù)近1.4萬
騰訊混元大模型上線并開源文生視頻能力
將性價比做到極致,阿爾達高能效便攜王系列恒溫烙鐵

評論