在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

單日獲客成本超20萬,國產(chǎn)大模型開卷200萬字以上的長文本處理

E4Life ? 來源:電子發(fā)燒友 ? 作者:周凱揚(yáng) ? 2024-03-27 00:53 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))隨著AGI生態(tài)的蓬勃發(fā)展,各種支持多模態(tài)的大模型推陳出新,比如最近比較火的音樂大模型Suno和文生視頻大模型Sora等等。然而在傳統(tǒng)基于文本的大語言模型上,除了追求更快更精準(zhǔn)的推理和高并發(fā)流量以外,似乎已經(jīng)沒有太多值得廠商大肆宣傳的特性了,直到最近超長文本處理的爆火。

國產(chǎn)大模型的新卷法,長文本處理

當(dāng)下將大模型長文本處理炒熱的,無疑是來自月之暗面的Kimi。作為去年發(fā)布的大模型,Kimi的主要賣點(diǎn)就是長文本,當(dāng)時(shí)發(fā)布的初版Kimi,就已經(jīng)支持到最多20萬漢字的輸入處理。

然而僅僅20萬字的文本處理,還不至于給用戶帶來質(zhì)變的交互體驗(yàn),畢竟GPT-4 Turbo-128k已經(jīng)支持到約合10萬漢字的長文本處理,谷歌的Gemini pro也支持到最多70萬個(gè)單詞的上下文,但不少長篇小說、專業(yè)書籍的字?jǐn)?shù)要遠(yuǎn)超這一數(shù)字。

wKgZomYCneCAMb8qAAM8v3nPbSs784.jpg
Kimi支持200萬字上下文 / 月之暗面

Kimi在最近爆火源于一項(xiàng)重大迭代升級(jí),月之暗面將長文本處理的字?jǐn)?shù)限制擴(kuò)展到200萬字,遠(yuǎn)超Claude3、GPT-4 Turbo和Gemini Pro模型。在新功能推出和有效推廣下,Kimi很快涌入了一大批用戶,其app甚至短暫地沖進(jìn)了蘋果App Store前五的位置。然而這樣也對Kimi的運(yùn)營造成了不小的壓力,Kimi在上周經(jīng)歷了多次宕機(jī),這還是在月之暗面對服務(wù)器連續(xù)擴(kuò)容的前提下。

面對競爭對手Kimi的用戶量激增,阿里巴巴和360很快就坐不住了。3月22日,阿里巴巴宣布通義千問將向所有用戶免費(fèi)開放1000萬字的長文檔處理功能;3月23日,360智腦宣布正式內(nèi)測500萬字長文本處理功能,且該功能即將入駐360 AI瀏覽器。

除了阿里巴巴和360外,目前國內(nèi)訪問量第一的百度文心一言據(jù)傳也會(huì)在下月開放長文本處理功能,并計(jì)劃把字?jǐn)?shù)上限提高至200萬甚至500萬字。

超長文本實(shí)現(xiàn)的技術(shù)難點(diǎn)和商業(yè)桎梏

盡管在用戶看來,阿里巴巴、360等廠商宣布支持超長文本處理好像是一件無需多少時(shí)間的易事,但實(shí)際上超長文本處理的實(shí)現(xiàn)存在不少技術(shù)痛點(diǎn)和商業(yè)成本問題。要知道在2022年,絕大多數(shù)的LLM上下文長度最多也只有2K,比如GPT-3。

直到GPT-4和Claude 2等,這些大模型才從架構(gòu)上對文本長度進(jìn)行了優(yōu)化,可即便如此,主流的文本輸入長度依然不會(huì)超過100K。這也是因?yàn)閷Σ糠执竽P投裕L文本不一定代表著更好的使用體驗(yàn),尤其是在查全率和準(zhǔn)確率上。

wKgaomYCne6ABP4QAADkljohAv4132.png
Claude的上下文長度和召回率關(guān)聯(lián)圖 / Anthropic


以Anthropic給出的數(shù)據(jù)為例,從上圖可以看出,隨著文本長度的增加,召回率是在逐步降低的,即便是最新的Claude3也是如此,而召回率代表了檢索出相關(guān)信息量占總量的比率。至于精確度,則與上下文中的事實(shí)位置存在很大的關(guān)系,如果用戶問題的事實(shí)存在于文本開頭或后半部分的位置,那么更容易得到精確的結(jié)果,而位于10%到50%之間位置的文本,則精確度急劇下降。

除此之外,長文本對于GPU和內(nèi)存的資源消耗太大了,即便是小規(guī)模地?cái)U(kuò)展文本長度,動(dòng)輒也要消耗100塊以上的GPU或TPU,這里指代的GPU還是A100這種單卡顯存容量高達(dá)40GB或80GB的設(shè)備。

這也是Kimi在經(jīng)歷大量用戶訪問后,需要緊急擴(kuò)容的原因。而阿里巴巴之所以能這么快開放長文本能力,也是憑借著手握龐大的服務(wù)器資源。至于Anthropic,我們從Claude3 Opus高昂的Tokens價(jià)格,也可以猜到其硬件成本絕對不低。

另外,在持續(xù)火爆一年之后,目前的大模型應(yīng)用也難以單純靠技術(shù)立足市場吸引用戶了,商業(yè)推廣也已經(jīng)成了必行之路。就以Kimi為例,在社交媒體上有關(guān)該應(yīng)用的推廣可謂鋪天蓋地,很明顯對于新興的大模型應(yīng)用而言,收獲第一批用戶才是至關(guān)重要的。

據(jù)傳Kimi在廣告投放上,吸引每位新用戶的花費(fèi)在10元左右,而新用戶參與到使用中帶來的額外算力開銷在12元至13元左右。如果單單只是根據(jù)手機(jī)平臺(tái)app的下載量計(jì)算,那么Kimi的每日獲客成本至少為20萬人民幣,而這還未計(jì)算來自網(wǎng)頁端和小程序端的用戶。

wKgZomYCnf2AOjdbAADS5hsoY5M413.png
AI產(chǎn)品國內(nèi)總榜 / AI產(chǎn)品榜


而且Kimi的推廣也不是從200萬長文本功能的推出才開始的,早在二月份Kimi就開始以長文本這一特性加強(qiáng)商業(yè)推廣了。從AI產(chǎn)品榜中可以看出,Kimi在2月的訪問量飆升,在國內(nèi)總榜中僅次于百度文心一言和阿里通義千問,足見其在商業(yè)推廣和產(chǎn)品運(yùn)營上都下了血本。但相對ChatGPT和New Bing之類的應(yīng)用而言,其訪問量還是存在很大的差距。

這也充分說明了為何國外的大模型應(yīng)用沒有去卷200K以上文本長度的原因,目前算力、準(zhǔn)確度和長文本之間的沖突限制了他們?nèi)グl(fā)展長文本。但這對于中國的大模型應(yīng)用來說,反而是一個(gè)彎道超車的機(jī)會(huì),因?yàn)榇竽P蜕系拈L文本能力確實(shí)帶來了用戶體驗(yàn)上的改變。

長文本對于用戶體驗(yàn)的改變

國產(chǎn)大模型為什么要去卷長文本,這是一個(gè)與大模型應(yīng)用落地息息相關(guān)的問題。在過去,正是由于長文本能力不足,絕大多數(shù)大模型應(yīng)用才會(huì)給人不堪大用的感覺,比如虛擬助手由于長文本能力不足,會(huì)遺忘重要信息;基于大模型來設(shè)計(jì)劇本殺等游戲規(guī)則時(shí),上下文長度不夠只能在規(guī)則和設(shè)定上縮水,從而簡化游戲難度;在論文分析和法律法規(guī)解讀這樣的關(guān)鍵領(lǐng)域,更是因?yàn)槿狈﹂L文本的支持,無法給到用戶精準(zhǔn)的答案。

這與大模型卷參數(shù)規(guī)模不同,因?yàn)橛脩粢呀?jīng)發(fā)現(xiàn)了即便是70B這個(gè)量級(jí)的大模型,在面對用戶的問題時(shí),也會(huì)出現(xiàn)胡編亂造的問題。反倒是長文本提供了更多的上下文信息,大模型在對語義進(jìn)行分析判斷后,會(huì)提供更加精確的答案,所以不少用戶才會(huì)借助Kimi來分解長篇小說、總結(jié)論文等。

不過在享受長文本處理帶來便利的同時(shí),我們也應(yīng)該注意下長文本處理背后潛在的信息安全和版權(quán)問題。對于過去短文本的處理,就已經(jīng)存在一些可能暴露用戶真實(shí)身份和隱私信息的問題,隨著長文本支持對于更大文件和更長文本的處理,有的人可能會(huì)選擇將合同、條例或標(biāo)準(zhǔn)等包含敏感信息的專業(yè)文件上傳到大模型上,又或是引入一些盜版文檔資源。

所以國家層面也開始出臺(tái)各種管理辦法,對于大模型語言模型在內(nèi)的生成式人工智能進(jìn)行規(guī)范,不能侵犯知識(shí)產(chǎn)權(quán)并保護(hù)個(gè)人隱私。如此一來,對于大模型應(yīng)用本身的信息脫敏也提出了更高的要求。

寫在最后

相信經(jīng)過一年的大模型應(yīng)用轟炸后,不少用戶對于基本的AGI玩法已經(jīng)玩膩了,所以長文本、文生視頻這種新的交互方式才會(huì)讓人趨之若鶩。但我們也很少看到成功的長文本大模型商業(yè)化落地項(xiàng)目,畢竟在高額的獲客成本下,RAG這種外掛知識(shí)庫的方式可能更適合手中資金有限的初創(chuàng)AGI應(yīng)用開發(fā)商。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • Agi
    Agi
    +關(guān)注

    關(guān)注

    0

    文章

    91

    瀏覽量

    10440
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3046

    瀏覽量

    3870
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    321

    瀏覽量

    701
收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Linux中文本處理命令的用法

    Linux 三劍是(grep,sed,awk)三者的簡稱,熟練使用這三個(gè)工具可以提升運(yùn)維效率。Linux 三劍以正則表達(dá)式作為基礎(chǔ),而在Linux系統(tǒng)中,支持兩種正則表達(dá)式,分別為“標(biāo)準(zhǔn)正則表達(dá)式”和“擴(kuò)展正則表達(dá)式”。在掌握好正則表達(dá)式后,將具體講解三劍
    的頭像 發(fā)表于 04-15 10:22 ?239次閱讀
    Linux中<b class='flag-5'>文本處理</b>命令的用法

    國產(chǎn)首款量產(chǎn)型七位半用表!青島漢泰開啟國產(chǎn)高精度測量新篇章。

    國產(chǎn)首款量產(chǎn)型七位半用表!青島漢泰開啟國產(chǎn)高精度測量新篇章。 2025年3月18日,青島漢泰推出全新HDM3075系列7位半數(shù)字用表。HDM3075系列是
    發(fā)表于 04-01 13:15

    RK3588開發(fā)板上部署DeepSeek-R1大模型的完整指南

    DeepSeek作為國產(chǎn)AI大數(shù)據(jù)模型的代表,憑借其卓越的推理能力和高效的文本生成技術(shù),在全球人工智能領(lǐng)域引發(fā)廣泛關(guān)注。DeepSeek-R1作為該系列最新迭代版本,實(shí)現(xiàn)了長文本處理
    發(fā)表于 02-27 16:45

    飛凌RK3588開發(fā)板上部署DeepSeek-R1大模型的完整指南(一)

    DeepSeek作為國產(chǎn)AI大數(shù)據(jù)模型的代表,憑借其卓越的推理能力和高效的文本生成技術(shù),在全球人工智能領(lǐng)域引發(fā)廣泛關(guān)注。DeepSeek-R1作為該系列最新迭代版本,實(shí)現(xiàn)了長文本處理
    的頭像 發(fā)表于 02-21 14:55 ?2416次閱讀
    飛凌RK3588開發(fā)板上部署DeepSeek-R1大<b class='flag-5'>模型</b>的完整指南(一)

    了解DeepSeek-V3 和 DeepSeek-R1兩個(gè)大模型的不同定位和應(yīng)用選擇

    生成 支持常規(guī)代碼生成 優(yōu)化邏輯嚴(yán)謹(jǐn)性(長代碼鏈、算法實(shí)現(xiàn)) 多語言支持 多語言均衡能力(中/英/小語種) 側(cè)重中英文,尤其在技術(shù)術(shù)語上更精準(zhǔn) 長文本處理 標(biāo)準(zhǔn)上下文窗口(約32K tokens
    發(fā)表于 02-14 02:08

    BQ3588/BQ3576系列開發(fā)板深度融合DeepSeek-R1大模型

    DeepSeek 作為國產(chǎn) AI 大數(shù)據(jù)模型的杰出典范,以出色的推理能力和高效的文本生成技術(shù),在全球人工智能領(lǐng)域中備受矚目。DeepSeek-R1-distill-Qwen-7B 作為該系列的最新迭代版本,在
    的頭像 發(fā)表于 02-12 11:20 ?765次閱讀

    BQ3588/BQ3576系列開發(fā)板成功部署 DeepSeek-R1開發(fā)板

    ,在長文本處理效能、多模態(tài)擴(kuò)展規(guī)劃以及嵌入式適配等技術(shù)維度上實(shí)現(xiàn)了重大突破。BQ3576系列開發(fā)板依托瑞芯微RK3576平臺(tái)處理器,具備四個(gè)A72核心與四個(gè)A53核
    的頭像 發(fā)表于 02-12 09:26 ?969次閱讀
    BQ3588/BQ3576系列開發(fā)板成功部署 DeepSeek-R1開發(fā)板

    阿里云通義開源長文本模型Qwen2.5-1M

    近日,阿里云通義宣布了一項(xiàng)重大開源舉措,推出了支持100Tokens上下文的Qwen2.5-1M模型。這一新模型處理長文本任務(wù)中展現(xiàn)出了
    的頭像 發(fā)表于 02-05 14:01 ?485次閱讀

    萬字長文,看懂激光基礎(chǔ)知識(shí)!

    深入介紹激光基礎(chǔ)知識(shí),幫助您輕松理解激光領(lǐng)域的關(guān)鍵概念和原理。
    的頭像 發(fā)表于 12-20 09:49 ?964次閱讀
    <b class='flag-5'>萬字長文</b>,看懂激光基礎(chǔ)知識(shí)!

    Linux三劍之Sed:文本處理神器

    關(guān)于linux三劍 grep,過濾關(guān)鍵信息數(shù)據(jù)。主要是用于查文本內(nèi)的數(shù)據(jù) sed ,對文本數(shù)據(jù)進(jìn)行編輯,修改原文件內(nèi)容 awk,對文件數(shù)據(jù)過濾,提取,并且能實(shí)現(xiàn),格式化輸出 awk
    的頭像 發(fā)表于 12-16 15:58 ?643次閱讀
    Linux三劍<b class='flag-5'>客</b>之Sed:<b class='flag-5'>文本處理</b>神器

    如何掌握Linux文本處理

    /from/sed_script: 從指定的文本中讀取處理腳本 -r: 使用擴(kuò)展正則表達(dá)式 sed命令選項(xiàng) 替換標(biāo)記 g:表示行內(nèi)全面替換 w:表示把行寫入一個(gè)文件 x:表示互換模式
    的頭像 發(fā)表于 11-10 13:40 ?466次閱讀

    Llama 3 模型與其他AI工具對比

    、技術(shù)架構(gòu) Llama 3模型 采用了最新的Transformer架構(gòu),并結(jié)合了自注意力機(jī)制和分組查詢關(guān)注(GQA)機(jī)制。 引入了高效的tokenizer和RoPE位置編碼,提高了語言編碼和長文本處理
    的頭像 發(fā)表于 10-27 14:37 ?980次閱讀

    中國電信人工智能研究院完成首個(gè)全國產(chǎn)參大模型訓(xùn)練

    近日,中國電信人工智能研究院宣布了一項(xiàng)重大技術(shù)突破:成功完成國內(nèi)首個(gè)基于全國產(chǎn)卡集群訓(xùn)練的萬億參數(shù)大模型
    的頭像 發(fā)表于 09-30 16:41 ?1989次閱讀

    Linux中cut命令的實(shí)用示例

    Linux command cut 用于文本處理。您可以使用此命令通過選擇列從文件中提取部分文本
    的頭像 發(fā)表于 08-05 15:14 ?594次閱讀

    萬字長文淺談系統(tǒng)穩(wěn)定性建設(shè)

    流程:需求階段,研發(fā)階段,測試階段,上線階段,運(yùn)維階段;整個(gè)流程中的所有參與人員:產(chǎn)品,研發(fā),測試,運(yùn)維人員都應(yīng)關(guān)注系統(tǒng)的穩(wěn)定性。業(yè)務(wù)的發(fā)展及系統(tǒng)建設(shè)過程中,穩(wěn)定性就是那個(gè)1,其他的是1后面的0,沒有穩(wěn)定性,就好比將
    的頭像 發(fā)表于 07-02 10:31 ?659次閱讀
    <b class='flag-5'>萬字長文</b>淺談系統(tǒng)穩(wěn)定性建設(shè)
    主站蜘蛛池模板: 国产免费亚洲 | 国语自产自拍秒拍在线视频 | 一级特黄高清完整大片 | 操久在线 | 成人a毛片在线看免费全部播放 | 天天操天天舔天天射 | 日日舔夜夜操 | a天堂资源 | 极品美女写真菠萝蜜视频 | 色婷婷综合久久久久中文一区二区 | 四虎海外在线永久免费看 | 午夜亚洲| 福利片午夜 | 一级特黄视频 | 国产叼嘿网站免费观看不用充会员 | 精品欧美一区二区三区 | 国产精品久久永久免费 | 手机在线看福利 | 手机看片1024免费视频 | 日韩免费精品一级毛片 | 日本精品三级 | 全国男人的天堂天堂网 | 欧美日韩一区二区三区视视频 | 亚洲最大成人在线 | 夜色sese| 2021最新久久久视精品爱 | 女人张开双腿让男人桶完整 | 午夜视频免费国产在线 | 99久久精品免费观看国产 | 国产欧美在线一区二区三区 | 91精品久久国产青草 | 一区二区三区中文国产亚洲 | 老汉色视频 | 日韩黄色录像 | 黄 色 免费网 站 成 人 | 成人国产亚洲欧美成人综合网 | 27pao强力打造高清免费高 | 手机视频在线播放 | 日本免费网站 | 中日韩在线视频 | 狠狠干网|