在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云知聲千億參數(shù)山海大模型首次亮相

云知聲 ? 來(lái)源:云知聲 ? 2023-08-31 16:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

8月28日,山海大模型迎來(lái)又一次迭代升級(jí),當(dāng)前版本參數(shù)規(guī)模達(dá)到千億,實(shí)現(xiàn)了多學(xué)科能力、醫(yī)療能力雙提升,實(shí)測(cè)性能在C-Eval全球大模型綜合性評(píng)測(cè)中超越GPT-4,以平均分70分的成績(jī)進(jìn)入前三甲。

42be64b4-47b8-11ee-97a6-92fbcf53809c.png


能力突破,持續(xù)領(lǐng)跑行業(yè)

多學(xué)科能力增強(qiáng)

本次山海大模型2.0版參數(shù)規(guī)模達(dá)到千億,增加了更多的學(xué)科類(lèi)的預(yù)訓(xùn)練語(yǔ)料,訓(xùn)練數(shù)據(jù)(Tokens)達(dá)到兩萬(wàn)億(2.0T)。

在本次模型升級(jí)過(guò)程中,山海團(tuán)隊(duì)充分利用了教材、文獻(xiàn)、百科類(lèi)語(yǔ)料的價(jià)值,這些語(yǔ)料包含了人類(lèi)對(duì)客觀世界知識(shí)的豐富理解、詳盡解釋以及在各個(gè)領(lǐng)域的深入研究所得到的科學(xué)結(jié)論。不同的學(xué)科領(lǐng)域的數(shù)據(jù)涵蓋了各自學(xué)科的專(zhuān)業(yè)知識(shí),這在一定程度上彌補(bǔ)了第一版山海大模型在某些專(zhuān)業(yè)領(lǐng)域的知識(shí)盲區(qū)。

為了使模型能更科學(xué)合理地汲取這些不同領(lǐng)域和來(lái)源的數(shù)據(jù)中的知識(shí),山海大模型團(tuán)隊(duì)使用了DoReMi方法對(duì)數(shù)據(jù)進(jìn)行了優(yōu)化權(quán)重采樣。通過(guò)這種策略,可以在較大范圍內(nèi)均勻并深入地提取各類(lèi)信息。這一策略使得山海團(tuán)隊(duì)在本次模型升級(jí)過(guò)程中,能更有效地吸取和運(yùn)用各種知識(shí),使模型的知識(shí)庫(kù)更加全面。

430728c0-47b8-11ee-97a6-92fbcf53809c.png

醫(yī)療能力再升級(jí)

云知聲深耕醫(yī)學(xué)領(lǐng)域多年,山海大模型2.0在預(yù)訓(xùn)練階段使用了海量的醫(yī)學(xué)病歷、醫(yī)學(xué)教材、臨床指南和醫(yī)學(xué)文獻(xiàn)等數(shù)據(jù),并在對(duì)齊階段使用了人機(jī)結(jié)合方法構(gòu)建的近百萬(wàn)級(jí)的病歷理解、醫(yī)學(xué)考試和醫(yī)學(xué)知識(shí)問(wèn)答等指令學(xué)習(xí)數(shù)據(jù)。C-Eval中醫(yī)療學(xué)科的結(jié)果表明,山海大模型2.0在基礎(chǔ)醫(yī)學(xué)、臨床醫(yī)學(xué)和醫(yī)師資格數(shù)據(jù)集上都能獲得接近90分的水平,為業(yè)內(nèi)最高。

431a91ee-47b8-11ee-97a6-92fbcf53809c.png

云知聲山海大模型團(tuán)隊(duì)參加了剛剛在沈陽(yáng)結(jié)束的CCKS2023-PromptCBLUE評(píng)測(cè),該評(píng)測(cè)是當(dāng)前最權(quán)威的中文醫(yī)療大模型的評(píng)測(cè)榜單,我們同樣也取得了第一名的成績(jī),再次證明了山海大模型專(zhuān)業(yè)的醫(yī)學(xué)能力。

技術(shù)升級(jí),性能加速提升

窗口長(zhǎng)度大幅度擴(kuò)展

山海團(tuán)隊(duì)發(fā)現(xiàn),在運(yùn)用位置插值(PositionInterpolation)方法進(jìn)行大幅度擴(kuò)展時(shí)——比如將窗口從4k擴(kuò)展到32k——其性能會(huì)顯著受到影響。這種影響主要體現(xiàn)在短距離情況下的使用。為了更好地解釋這一點(diǎn),假設(shè)原始數(shù)據(jù)中距離為1的兩個(gè)token,當(dāng)我們將數(shù)據(jù)從4k擴(kuò)展到32k時(shí),這兩個(gè)token之間的距離實(shí)際上變成了1/8。這就意味著,在進(jìn)行位置插值的過(guò)程中,原本距離很近的兩個(gè)token之間的距離被大比例地拉遠(yuǎn)了。這種場(chǎng)景下,衰減規(guī)律在短距離的使用會(huì)受到較大的影響,這是因?yàn)樗p規(guī)律在短距離時(shí)可能具有非常突出的變化率,意味著原本應(yīng)該很近的兩個(gè)token在大規(guī)模擴(kuò)展之后,它們之間的關(guān)聯(lián)性會(huì)大幅度減小。因此,直接進(jìn)行位置插值的方法會(huì)使得窗口大幅度擴(kuò)展后的性能較大程度地降低。發(fā)現(xiàn)RoPE位置編碼短距離之間的差異,主要體現(xiàn)在高頻分量上,長(zhǎng)距離之間的差異,主要體現(xiàn)在低頻分量上。山海大模型2.0版根據(jù)神經(jīng)正切核的思想,采用Neural Tangent Kernel (NTK)的非線(xiàn)性差值方法,實(shí)現(xiàn)高頻外推、低頻內(nèi)插的大規(guī)模長(zhǎng)度擴(kuò)展。采用NTK擴(kuò)展后模型能夠更好的支持文本窗口擴(kuò)展,當(dāng)前山海大模型2.0版本已經(jīng)支持32K的窗口長(zhǎng)度。

受限解碼支持業(yè)務(wù)落地

在大多數(shù)行業(yè)中,對(duì)大模型的并發(fā)使用和響應(yīng)時(shí)間有很高的要求。這要求我們?cè)诒WC大模型算法效果的基礎(chǔ)上,更需要深思其推理速度。本次山海大模型2.0基于落地場(chǎng)景需要,設(shè)計(jì)了受限解碼方法,在解碼過(guò)程中不需要計(jì)算整個(gè)詞表的概率,只需關(guān)注落地場(chǎng)景下關(guān)注的token,極大地提高了解碼效率。如圖所示,利用受限解碼方法,生成token“今”后面只需考慮token“夕”和“天”的概率,而不需要完成整個(gè)詞表概率分布的計(jì)算。

43713cba-47b8-11ee-97a6-92fbcf53809c.png

作為中國(guó)AGI技術(shù)產(chǎn)業(yè)化的先驅(qū)之一,云知聲于2016年開(kāi)始打造Atlas人工智能基礎(chǔ)設(shè)施,并以此為基礎(chǔ),構(gòu)建云知大腦(UniBrain)技術(shù)中臺(tái)——以山海(UniGPT)通用認(rèn)知大模型為核心,結(jié)合多模態(tài)感知與生成、知識(shí)圖譜、物聯(lián)平臺(tái)等智能組件,為云知聲智慧物聯(lián)、智慧醫(yī)療等業(yè)務(wù)提供高效的產(chǎn)品化支撐,持續(xù)推動(dòng)“U(云知大腦)+X(應(yīng)用場(chǎng)景)”戰(zhàn)略布局,踐行“通過(guò)通用人工智能(AGI)創(chuàng)建互聯(lián)直覺(jué)的世界”的公司使命。

云知聲:通過(guò)通用人工智能(AGI)創(chuàng)建互聯(lián)直覺(jué)的世界

43b6d34c-47b8-11ee-97a6-92fbcf53809c.png

云知聲AI技術(shù)體系及U+X戰(zhàn)略

山海大模型作為云知大腦的核心,能力體系涵蓋語(yǔ)言生成、語(yǔ)言理解、知識(shí)問(wèn)答、 邏輯推理、代碼能力、數(shù)學(xué)能力等。此外,為提高大模型在具體場(chǎng)景的應(yīng)用落地水平,山海大模型在通用能力基礎(chǔ)上,增強(qiáng)物聯(lián)、醫(yī)療等行業(yè)能力,致力為客戶(hù)提供更智能、更靈活的解決方案,加速千行百業(yè)的智慧化升級(jí)。

自5月24日發(fā)布以來(lái),山海大模型始終保持高速演進(jìn),不斷拓展大模型場(chǎng)景應(yīng)用邊界——

6月25日

山海大模型通過(guò)迭代實(shí)現(xiàn)了在特定領(lǐng)域內(nèi)的專(zhuān)業(yè)知識(shí)積累,詩(shī)詞創(chuàng)作能力、數(shù)學(xué)計(jì)算能力實(shí)現(xiàn)突破。其中,醫(yī)療能力在6月的MedQA任務(wù)上提升到了87.1%,超越Med-PaLM 2,臨床執(zhí)業(yè)醫(yī)師資格考試提升至523(總分600分),超過(guò)了99%的考生水平。

6月27日

北京市首批10個(gè)人工智能行業(yè)大模型應(yīng)用案例公布,由云知聲和北京友誼醫(yī)院共同開(kāi)發(fā)的基于山海大模型的門(mén)診病歷生成系統(tǒng)示范應(yīng)用成功入選。

7月2日

憑借山海大模型卓越的研發(fā)和應(yīng)用成果,云知聲同時(shí)入選2023北京人工智能行業(yè)賦能典型案例、“北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計(jì)劃”第二批成員名單。

7月6日-8日

云知聲攜山海大模型及最新場(chǎng)景應(yīng)用——基于山海大模型打造的智慧車(chē)載解決方案、智慧交通解決方案亮相2023 WAIC。

7月28日

山海大模型迎來(lái)新一輪迭代升級(jí),并在本月的C-Eval全球大模型綜合性考試評(píng)測(cè)中取得了60分以上的優(yōu)異成績(jī),成功躋身榜單前十。

8月27日

CCKS 2023現(xiàn)場(chǎng)公布系列評(píng)測(cè)任務(wù)結(jié)果,云知聲憑借基于山海大模型孵化的UNIGPT-MED 模型,在PromptCBLUE醫(yī)療大模型評(píng)測(cè)中奪得A、B榜雙榜冠軍。

云知聲希望,通過(guò)山海大模型的持續(xù)升級(jí),不僅打造基礎(chǔ)能力更加強(qiáng)大的通用大模型,也進(jìn)一步融合不同垂直領(lǐng)域的專(zhuān)業(yè)知識(shí),讓大模型更懂行業(yè)、更具專(zhuān)長(zhǎng),實(shí)現(xiàn)大模型應(yīng)用場(chǎng)景的加速拓展,讓大模型的產(chǎn)業(yè)價(jià)值在千行百業(yè)中綻放。

此次云知聲躋身C-Eval全球大模型綜合性考試評(píng)測(cè)前三甲,再一次印證了山海大模型的突出實(shí)力,也將持續(xù)推動(dòng)云知聲AGI基礎(chǔ)設(shè)施能力的躍進(jìn)提升,加速人工智能技術(shù)的創(chuàng)新與應(yīng)用。未來(lái),云知聲將以其強(qiáng)大的技術(shù)實(shí)力、不斷創(chuàng)新的科研能力以及對(duì)人工智能發(fā)展的深刻理解,不斷構(gòu)建長(zhǎng)期競(jìng)爭(zhēng)力和創(chuàng)新基石,持續(xù)探索AGI的無(wú)限可能。

附:C-Eval是由清華大學(xué)、上海交通大學(xué)和愛(ài)丁堡大學(xué)合作構(gòu)建的面向中文語(yǔ)言模型的綜合性考試評(píng)測(cè)集,包含13948道多項(xiàng)選擇題,涵蓋數(shù)學(xué)、物理、化學(xué)、生物、歷史、政治、計(jì)算機(jī)等52個(gè)不同學(xué)科和四個(gè)難度級(jí)別,是全球最具影響力的綜合性考試評(píng)測(cè)集之一。作為第三方發(fā)起的測(cè)試基準(zhǔn), C-Eval以其客觀性、公正性備受業(yè)內(nèi)關(guān)注,也吸引了多家企業(yè)、機(jī)構(gòu)和高校的參與。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34793

    瀏覽量

    277188
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    368

    瀏覽量

    16013
  • 云知聲
    +關(guān)注

    關(guān)注

    0

    文章

    224

    瀏覽量

    8716
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3087

    瀏覽量

    3976

原文標(biāo)題:云知聲千億參數(shù)山海大模型首次亮相,C-Eval 評(píng)測(cè)達(dá)70分,超越GPT-4

文章出處:【微信號(hào):云知聲,微信公眾號(hào):云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    與商湯科技達(dá)成戰(zhàn)略合作

    近日,智能科技股份有限公司(以下簡(jiǎn)稱(chēng)“”)與上海商湯智能科技有限公司(以下簡(jiǎn)稱(chēng)“商湯
    的頭像 發(fā)表于 06-20 14:52 ?336次閱讀

    榮登甲子光年2025中國(guó)AI產(chǎn)業(yè)逐浪者榜單

    近日,由甲子光年主辦的「AI共潮生·2025甲子引力X科技產(chǎn)業(yè)新風(fēng)向」在上海工業(yè)智能中心成功舉辦。憑借山海模型的領(lǐng)先技術(shù)實(shí)力與多領(lǐng)域
    的頭像 發(fā)表于 05-26 14:13 ?329次閱讀

    再度登頂MedBench榜單

    近日,中文醫(yī)療大模型權(quán)威評(píng)測(cè)平臺(tái)MedBench公布最新自測(cè)榜單結(jié)果,基于山海模型打造的
    的頭像 發(fā)表于 05-20 10:12 ?269次閱讀

    陳吉?jiǎng)伲捍?b class='flag-5'>模型應(yīng)用分析與案例介紹

    近日,上海師范大學(xué)信息與機(jī)電工程學(xué)院第四屆人工智能競(jìng)賽挑戰(zhàn)周系列活動(dòng)正式開(kāi)幕。作為國(guó)內(nèi)AI領(lǐng)域的頭部獨(dú)角獸企業(yè),受到特別邀請(qǐng)。
    的頭像 發(fā)表于 12-13 14:20 ?736次閱讀

    斬獲2024高工智能汽車(chē)金球獎(jiǎng)

    獎(jiǎng)”。 ? 端側(cè)大模型解決方案通過(guò)離線(xiàn)語(yǔ)義大模型的突破性落地,實(shí)現(xiàn)了業(yè)界首次
    的頭像 發(fā)表于 12-12 18:30 ?792次閱讀

    與英內(nèi)物聯(lián)簽署戰(zhàn)略合作協(xié)議 探索基于山海模型的多元智慧場(chǎng)景

    ?? 12月6日,(上海)智能科技有限公司(以下簡(jiǎn)稱(chēng)““)與上海英內(nèi)物聯(lián)網(wǎng)科技股份有
    的頭像 發(fā)表于 12-06 20:05 ?1249次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>與英內(nèi)物聯(lián)簽署戰(zhàn)略合作協(xié)議 探索基于<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>的多元智慧場(chǎng)景

    榮登2024大模型企業(yè)TOP50榜單

    近日,智領(lǐng)未來(lái)·向新而行—2024人工智能大模型產(chǎn)業(yè)大會(huì)在京召開(kāi),會(huì)上揭曉2024大模型企業(yè)TOP50榜單,榮登榜單,
    的頭像 發(fā)表于 11-29 17:52 ?878次閱讀

    山海模型多項(xiàng)能力全球領(lǐng)跑

    國(guó)內(nèi)人工智能權(quán)威機(jī)構(gòu)清華大學(xué)基礎(chǔ)模型研究中心發(fā)布SuperBench九月綜合榜單。本次評(píng)測(cè)選取海內(nèi)外24個(gè)具有代表性的大模型,結(jié)果顯示,山海模型對(duì)齊、智能體、安全等多項(xiàng)能力全球領(lǐng)跑。
    的頭像 發(fā)表于 10-12 14:30 ?790次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>多項(xiàng)能力全球領(lǐng)跑

    與國(guó)信領(lǐng)英簽署戰(zhàn)略合作協(xié)議

    智能科技股份有限公司(以下簡(jiǎn)稱(chēng)“”)與蘇州國(guó)信領(lǐng)英教育科技有限公司(以下簡(jiǎn)稱(chēng)“國(guó)信領(lǐng)
    的頭像 發(fā)表于 10-12 14:16 ?713次閱讀

    山海模型的訓(xùn)練優(yōu)化方法及應(yīng)用實(shí)踐

    由AI大模型工場(chǎng)主辦的AI大模型生態(tài)暨算力大會(huì)在京舉行。作為國(guó)內(nèi)最具影響力與最懂大模型的AI生態(tài)大會(huì),此次大會(huì)以「AI NATIVE,生成未來(lái)」為主題,圍繞大模型、算力、數(shù)據(jù)產(chǎn)業(yè)、基礎(chǔ)
    的頭像 發(fā)表于 10-12 14:12 ?623次閱讀

    山海多模態(tài)大模型UniGPT-mMed登頂MMMU測(cè)評(píng)榜首

    近日,多模態(tài)人工智能模型基準(zhǔn)評(píng)測(cè)集MMMU更新榜單,山海多模態(tài)大模型UniGPT-mMed
    的頭像 發(fā)表于 10-12 14:09 ?645次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>多模態(tài)大<b class='flag-5'>模型</b>UniGPT-mMed登頂MMMU測(cè)評(píng)榜首

    山海模型亮相WAIC 2024

    從模擬思維,到學(xué)習(xí)進(jìn)化,再到創(chuàng)新突破;從降本增效,到推動(dòng)技術(shù)革新,再到引領(lǐng)社會(huì)進(jìn)步……人工智能從未停止對(duì)智慧未來(lái)的探索與追求。
    的頭像 發(fā)表于 09-30 11:01 ?547次閱讀

    山海模型醫(yī)療專(zhuān)業(yè)能力全球第一

    近日,由上海AI實(shí)驗(yàn)室和上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合推出的MedBench評(píng)測(cè)更新榜單,繼4月份奪冠后,山海模型醫(yī)療行業(yè)版(UniGP
    的頭像 發(fā)表于 09-19 15:47 ?718次閱讀

    山海模型助力司法領(lǐng)域智慧化升級(jí)

    近期,成功助力上海市徐匯區(qū)虹梅街道司法所打造基于山海模型的司法領(lǐng)域應(yīng)用,極大提升了司法服務(wù)的可及性與便利性。這不僅是
    的頭像 發(fā)表于 09-12 14:44 ?876次閱讀

    推出山海多模態(tài)大模型

    在人工智能技術(shù)的浩瀚星海中,多模態(tài)交互技術(shù)正成為引領(lǐng)未來(lái)的新航標(biāo)。繼OpenAI的GPT-4o掀起滔天巨浪后,以創(chuàng)新之姿,推出了其匠心獨(dú)運(yùn)的山海多模態(tài)大
    的頭像 發(fā)表于 08-27 15:20 ?613次閱讀
    主站蜘蛛池模板: 在线看片一区 | 亚洲欧美日韩色图 | 日本黄色高清视频 | 色综合成人 | 精品欧美| 日本最新免费网站 | 日韩激情淫片免费看 | 黄页在线播放网址 | 青楼社区51在线视频视频 | 手机看片1024久久 | 黄页网站在线播放 | 成人午夜啪啪免费网站 | 人人草人人插 | 不卡无毒免费毛片视频观看 | 狠狠色丁香婷婷综合视频 | 日韩孕交 | 一个综合色 | 女人特黄大aaaaaa大片 | 午夜性视频播放免费视频 | 色多多视频在线 | 91极品反差婊在线观看 | 色94色欧美一区 | 欧美日本一区二区三区 | 国产免费久久精品 | 完整日本特级毛片 | 色色色爱 | 亚洲一区视频 | 日日噜噜夜夜狠狠tv视频免费 | 2018天天弄 | 免费在线观看的网站 | 日韩一级黄色录像 | 午夜小视频在线观看 | 五月天综合在线 | 欧美成人26uuu欧美毛片 | 日本最新免费网站 | 天堂在线bt | 欧美a在线播放 | www.天堂.com| 四虎永久免费影院在线 | 一女被多男玩很肉很黄文 | 亚洲黄色成人 |