在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

后發而先至的騰訊混元大模型,到底有哪些技術亮點?

鮮棗課堂 ? 來源:鮮棗課堂 ? 2023-09-12 17:25 ? 次閱讀

2023年的夏天已經結束了,但是,圍繞AIGC大模型的關注熱度,卻絲毫沒有衰退的意思。

在過去的大半年里,我們親眼見證了大模型浪潮的崛起,甚至可以說是瘋狂。截止7月,國內的大模型數量,已經超過130個。

這些大模型的創造者,既有國有及民營企業,也有大學、科研院所等研究機構。從某種意義上來說,發布大模型,已經成為宣示自身實力的一種方式。

不知道大家有沒有注意到,國內互聯網大廠百度和阿里,都早早推出了自家的大模型。而身為BAT“三巨頭”之一的騰訊,卻一直很低調。

幾天前,9月7日,在2023騰訊全球數字生態大會上,騰訊自家的通用大語言模型——騰訊混元大模型終于亮相了。

為什么騰訊的大模型“不著急”?是他們不重視這場科技浪潮嗎?還是說,他們的AI技術不足,在競爭中落后于人?

很顯然,這些說法都不對。

ChatGPT是AIGC大模型浪潮的導火線,但是,它并不是大模型的最早開端。

業界對大模型的研究,其實早幾年就已經開始了。當時,AIGC并沒有這么高的熱度。2022年底,ChatGPT橫空出世,展現出驚人的自然語言能力,才徹底激發了整個社會對大模型的關注。

正如前面所說,很多企業之所以不惜一切代價搞大模型,完全是為了追逐“風口”。

騰訊集團副總裁蔣杰在采訪中介紹:“在騰訊內部,混元已經內測很久了,不是現在第一天才有。”騰訊是國內最早研究大模型的企業之一。2021年,騰訊推出了千億規模的NLP大模型。2022年,騰訊推出萬億參數的 NLP 稀疏大模型。換言之,他們的大模型研究,是國內領先的。

ChatGPT火了之后,騰訊更加理性地思考了自己的大模型戰略,提出了四大靈魂拷問:

1、自己為什么要搞大模型?

2、自己的大模型,要怎么搞?

3、自己的大模型,要搞成什么樣?

4、搞出大模型之后,到底怎么用?

在經過審慎思考和激烈討論之后,他們終于理清了自己的答案,按照自己的節奏,穩步向前推進。

騰訊混元大模型,就是在這樣的背景下誕生的。

接下來,我們不妨仔細看看,騰訊混元大模型,究竟是如何解答這四個靈魂之問的。

█問題1:為什么要搞大模型?

今年3月,騰訊總裁兼投資委員會主席劉熾平,在財報電話會議上曾經表示:“AI將成為公司未來業務增長的放大器。生成式AI和基礎模型技術可以補充優化騰訊的業務。…… (大模型)將在未來對每個業務線都起到正向補充作用。同時,這也有助于推出新業務。”

他還表示,“我們希望沿著正確的路線踏實前進,不急于求成,先打好基礎,再追求新進展,我們的第一款產品將會是多次迭代之后的產品,整個過程將是長期的。”

他的表態,其實已經說明了騰訊對大模型的戰略基調——緊密結合自身業務線,穩步推進,長期迭代。

在發布會上,騰訊集團高級執行副總裁、云與智慧產業事業群 CEO 湯道生也提到:“大模型需要基于產業場景,與企業數據融合,才能釋放出最大的價值。”

也就是說,騰訊不會為了搞大模型而搞大模型。既然要搞,就是沖著實用性去的。

基于這個目標搞出來的混元大模型,是“從實踐中來,到實踐中去”的實用級大模型。它關注的不是推出速度和評測跑分,而是如何真正與實際場景結合,滿足用戶的真實需求。

█問題2:大模型,到底該怎么搞?

大模型是一場技術博弈。既然決定要做,就必須做出差異化的競爭優勢,找準技術路線。

騰訊混元大模型,最大的特點,就是——全鏈路自研。

行業里現有的很多大模型,都是開源大模型。東西拿來就用,依葫蘆畫瓢,當然推出速度會快。

蔣杰表示,騰訊是一個海量高并發的業務,開源的架構并不適應騰訊,一定要走出一套基于自主體系的研發之路。唯有自研,才能完全掌握技術內核,將大模型更好地融入到自身的技術棧中。所以,他們走上了更加具有挑戰性的自研之路。

騰訊混元大模型從第一個token開始從零訓練,掌握了從模型算法機器學習框架,再到AI基礎設施的全鏈路自研技術。

算法方面,騰訊在預訓練上從零啟動訓練,優化預訓練算法及策略,精調及強化學習,改進注意力機制,并開發了思維鏈新算法。

機器學習框架方面,騰訊采用的是自主研發的機器學習框架Angel,訓練速度相比業界主流框架提升1倍,推理速度比業界主流框架提升1.3倍。

基礎設施方面,采用基于云星星海自研服務器的新一代HCC高性能算力集群,搭載了超強算力GPU,性能提升了3倍。

算力集群所基于的網絡底座——星脈,具備業界最高的3.2T通信帶寬,可以為AI大模型帶來10倍通信性能提升。通過自研TiTa協議和自研TCCL通信庫,星脈網絡可將網絡利用率從普通以太網的60%提升到90%以上,極大提高整體集群的算力利用率。

根據驗證,騰訊新一代計算集群可以幫助混元NLP大模型訓練在同等數據集下,將訓練時間由50天縮短到4天。

█問題3:大模型,要搞成什么樣?

全鏈路自研,投入雖然大,但回報也是顯著的。

騰訊混元大模型,擁有超千億參數規模,預訓練語料超2萬億tokens,具備強大的中文創作能力,復雜語境下的邏輯推理能力,以及可靠的任務執行能力。

相比于業界已有的大模型,騰訊混元大模型在可靠性和成熟度方面,有巨大的提升。

首先,它可以降低大語言模型的幻覺比例。

使用過大模型的讀者都知道,大模型很容易出現“一本正經胡說八道”的問題。也就是說,AI模型生成了不屬于現實世界的內容。這就是“幻覺”。“幻覺”是大語言模型每一個廠家都應該面臨的重要問題,無論技術做到什么程度,在當前的模型架構下,都無法回避“幻覺”。

針對“幻覺”問題,當前業界普遍的解決方式是采用外掛插件,即給大模型“外掛”一個知識庫,使其在推理時進行檢索,基于檢索結果再進行輸出,提高正確率。

這個方式,在遇到復雜任務時,效果有限。

騰訊混元大模型所采取的方式,是在預訓練階段,就通過“探真”算法,進行事實修正。它擺脫了對外掛的依賴,有效降低了復雜任務中的幻覺。

根據測試,經過預訓練算法及策略的整體優化后,混元大模型相比其他主流開源大模型,幻覺比例降低了30%-50%。

48a4265c-514a-11ee-a25d-92fbcf53809c.png

更多的理性,更少的“胡說八道”

其次,混元大模型的“陷阱”識別能力大幅提升,可以更好地抗拒“誘導”。

人們在使用大模型時,經常會對它進行“調戲”。也就是說,問一些刁鉆問題,給大模型設置“陷阱”,得到令人啼笑皆非的答案。

騰訊通過強化學習的方法,讓混元大模型學會識別“陷阱”,對“調戲”說不,提升應用的安全性和智能感。根據數據顯示,面對安全誘導類問題,混元大模型的拒答率提升了20%。

48d0ab5a-514a-11ee-a25d-92fbcf53809c.png

拒絕“挖坑”

除了上面提到的可靠性改進之外,混元也大幅提升了成熟性。

混元大模型覆蓋了短文本和千字級別長文本生成能力。

當前市面上大模型在超長任務處理上很難實現。騰訊通過位置編碼優化,提升長文的處理效果和性能,結合指令跟隨優化,讓產出內容更符合字數要求,從而提升超長文本的生成和續寫能力。

在邏輯思考能力上,混元大模型持結合實際場景推理決策。

在大模型訓練中,一些團隊會讓大模型通過“死記硬背”的方式學會中小學的數學題。但是在現實生活中,靠“背題”是不夠的,還需要讓大模型具備理解上下文的能力。騰訊推出思維鏈新策略,有效強化模型對問題拆解和分步思考的傾向。

以上這些特性,使得混元大模型在使用體驗上和傳統大模型有明顯區別。它的智能化程度更好,表現更加穩定,更像是一個真正的專家和助手。

在中國信通院《大規模預訓練模型技術和應用的評估方法》的標準符合性測試中,混元大模型共測評了66個能力項。在“模型開發(共測試29個能力項)”和“模型能力(共測試37個能力項)”這兩個重要領域的綜合評價中,均獲得了當前的最高分。

█問題4:混元大模型,到底怎么用?

前面我提到,混元大模型是“從實踐中來,到實踐中去”的實用級大模型。為了充分發揮混元的實用價值,騰訊率先將自己的眾多互聯網業務與混元進行結合、落地。

目前,騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ瀏覽器等50多個騰訊內部業務和產品,已經接入騰訊混元大模型測試并取得初步效果。

騰訊機器學習平臺部副總經理王迪提到,騰訊混元大模型和各個產品的結合,并不是一種強制綁定的關系,而是更關注產品在用戶體驗上的優化,關注哪些地方可以通過AI提效。

例如,基于混元的騰訊會議AI小助手,可以快速實現會中問答、會議摘要、會議待辦項等多種事項。

再例如,基于混元的騰訊文檔智能助手功能(內測中),不僅支持數十種文本創作場景,還能生成上百種專業文書規范,以及用自然語言生成數百種Excel公式等。

王迪表示,在將大模型的能力和業務場景結合的過程中,需要做大量的工作,比如怎么把混元大模型的基礎指令理解能力、文字總結能力與會議APP里AI的能力和會議內容生成能力結合。如果只是單純將大模型直接放進去,短期不一定真的能夠對業務帶來很大的提升。一定是針對業務場景進行專門的優化和提效,才能達到更好的效果。

在混元大模型的研究過程中,其實就已經從騰訊豐富的應用場景中進行了技術積累。場景鍛煉了模型,模型反過來服務場景,形成了良性循環。

蔣杰表示,騰訊混元大模型團隊關注的首先是做好技術本身,回歸本質,做好技術的突破和路徑規劃。在內部,會把混元所有的能力開放給騰訊所有的業務。

內部業務場景的實踐,是為外部服務開放做準備。在發布會上,蔣杰鄭重宣布:騰訊混元大模型已正式通過騰訊云對外開放,助力全行業。

混元大模型將作為騰訊云MaaS服務的底座,用戶不僅可以直接通過API調用混元,也可以將混元作為基底模型,為不同產業場景構建專屬應用。

█結語

騰訊對四大靈魂之問的探索,最終為混元大模型的問世奠定了基礎。

正所謂“方向對了,努力才有意義”。騰訊在喧囂躁動中堅持理性思考,在找準目標后,果斷投入,進行艱苦自研。最終,他們拿出了能經受考驗的產品,也走出了自己的獨特道路。

他們的做法無疑是正確的,也帶給整個行業以啟示。在百模大戰逐漸升級的今天,很多公司都將面對自己的靈魂拷問。

大浪淘沙沙去盡,沙盡之時見真金。唯有那些給出正確答案的大模型,才能笑到最后,成為真正的贏家。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 騰訊
    +關注

    關注

    7

    文章

    1666

    瀏覽量

    49605
  • ChatGPT
    +關注

    關注

    29

    文章

    1570

    瀏覽量

    8067
  • 大模型
    +關注

    關注

    2

    文章

    2551

    瀏覽量

    3172

原文標題:后發而先至的騰訊混元大模型,到底有哪些技術亮點?

文章出處:【微信號:鮮棗課堂,微信公眾號:鮮棗課堂】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    騰訊3D AI創作引擎正式發布

    近日,騰訊公司宣布其自主研發的3D AI創作引擎已正式上線。這一創新性的創作工具將為用戶帶來前所未有的3D內容創作體驗,標志著騰訊在AI技術
    的頭像 發表于 01-23 10:33 ?168次閱讀

    騰訊3D AI創作引擎正式上線

    近日,騰訊公司宣布其自主研發的3D AI創作引擎已正式上線。這一創新性的創作工具,標志著騰訊在3D內容生成領域邁出了重要一步。
    的頭像 發表于 01-22 10:26 ?155次閱讀

    RK3506到底有多香?搶先看核心板詳細參數配置

    RK3506到底有多香?觸覺智能已推出RK3506核心板,搶先了解核心板詳細參數配置!
    的頭像 發表于 01-18 11:33 ?312次閱讀
    RK3506<b class='flag-5'>到底有</b>多香?搶先看核心板詳細參數配置

    胡瀚接棒騰訊多模態大模型研發

    騰訊的杰出科學家和模型技術團隊的核心成員,曾在推動騰訊在人工智能領域的發展中發揮了重要作用
    的頭像 發表于 01-09 15:49 ?419次閱讀

    騰訊模型開源成績斐然,GitHub Star數近1.4萬

    近日,在2024年12月24日舉辦的開放原子開發者大會暨首屆開源技術學術大會上,騰訊云副總裁、騰訊
    的頭像 發表于 12-26 10:30 ?292次閱讀

    騰訊文生圖登頂智源FlagEval評測榜首

    近日,北京智源人工智能研究院(BAAI)發布了最新的FlagEval大模型評測排行榜,其中多模態模型評測榜單的文生圖模型引起了廣泛關注。結果顯示,騰訊
    的頭像 發表于 12-25 10:06 ?315次閱讀

    騰訊模型上線并開源文生視頻能力

    近日,騰訊宣布其模型正式上線,并開源了一項令人矚目的能力——文生視頻。該大模型參數量高達130億,支持中英文雙語輸入,為用戶提供了更為
    的頭像 發表于 12-04 14:06 ?233次閱讀

    騰訊Large模型及云TI平臺全新上線

    近日,騰訊團隊最新推出的MoE模型Large”已正式開源上線。這一里程碑式的進展標志著
    的頭像 發表于 11-08 11:03 ?487次閱讀

    高通與騰訊達成戰略合作

    驍龍峰會期間,高通技術公司宣布與騰訊合作,基于驍龍8至尊版移動平臺,共同推動了騰訊
    的頭像 發表于 11-08 09:52 ?453次閱讀

    RTOS與Linux到底有什么區別

    很多做嵌入式開發的小伙伴都存在這樣的疑惑:RTOS與Linux到底有什么區別?
    的頭像 發表于 10-29 09:53 ?588次閱讀

    CMOS運放的輸入阻抗到底有多高呢?

    都說CMOS運放輸入阻抗高,到底有多高呢?可有一個量化指標?
    發表于 09-06 06:59

    百度萬象大會2024 聚焦智能體生態新進展

    同時,騰訊亦將推出大模型應用程序“元寶”,此乃基于其自研的模型,此前已通過網頁和小程序形式發布了
    的頭像 發表于 05-30 11:08 ?574次閱讀

    騰訊器免費模型資源增至1億tokens,模型全面降價

    騰訊方面獲悉,一站式智能體創作與分發平臺騰訊器即日起全面升級了模型資源扶持方案。
    的頭像 發表于 05-27 14:22 ?948次閱讀

    騰訊云大模型價格調整:-lite、-standard免費,-pro降價

    據了解,騰訊模型騰訊全鏈路自研的萬億參數大模型,采用混合專家
    的頭像 發表于 05-23 17:05 ?1062次閱讀

    模型在端側迅速落地,面臨哪些挑戰

    電子發燒友網報道(文/李彎彎)大模型技術正在快速發展,并在不同領域取得顯著進展。如在設計領域,近日消息,騰訊
    的頭像 發表于 05-15 01:16 ?3041次閱讀
    主站蜘蛛池模板: 女同性进行性行为视频 | bt 电影天堂 | 毛片免费网站 | 欧美一区亚洲二区 | 视频一本大道香蕉久在线播放 | 国产免费高清在线精品一区 | 黄黄视频在线观看 | 免费 视频 1级 | 中文字幕精品一区二区三区视频 | 三级在线看 | 日韩精品午夜 | 美女黄色毛片 | 午夜噜噜噜私人影院在线播放 | 久久精品亚洲精品国产色婷 | 亚洲区 欧美区 | 国产婷婷综合在线精品尤物 | 色多多成视频人在线观看 | 深爱激情五月网 | 久久久久久国产精品免费免 | www激情| 天天噜噜日日噜噜久久综合网 | 最新激情网 | 国产免费一区二区三区最新 | 日本黄在线 | 又黑又长黑人欧美三级 | 天天操天天干天天拍 | 五月天激情开心网 | 亚洲大成色www永久网址 | 日韩在线三级 | 天天亚洲 | 亚洲综合精品成人啪啪 | 国产小视频免费观看 | 国产精品久久久久久久久久影院 | 韩国最新三级网站在线播放 | 在线免费公开视频 | 亚洲成人在线播放 | 手机精品视频在线观看免费 | 欧美视频不卡一区二区三区 | 久草资源免费 | 天天澡天天干 | 国产精品高清久久久久久久 |