近日,RWKV社區(qū)在上海漕河涇舉辦了主題為《RWKV-7與未來(lái)趨勢(shì)》的開(kāi)發(fā)者大會(huì),來(lái)自全國(guó)各地的開(kāi)發(fā)者、行業(yè)專(zhuān)家和技術(shù)創(chuàng)新者齊聚一堂,共同交流和探討后Transformer時(shí)代的AI新架構(gòu)和新的發(fā)展方向。格靈深瞳算法工程師楊鎧成受邀參會(huì)并發(fā)表了《RWKV-CLIP:一個(gè)魯棒的視覺(jué)-語(yǔ)言表征學(xué)習(xí)器》的主題演講。
據(jù)悉,RWKV是國(guó)產(chǎn)開(kāi)源的首個(gè)非Transformer架構(gòu)的大語(yǔ)言模型,結(jié)合了RNN和Transformer的相關(guān)特性:出色的性能、快速的推理、快速的訓(xùn)練、節(jié)省VRAM、“無(wú)限” 的ctxlen和免費(fèi)的句嵌入,而且100% 不含自注意力機(jī)制。
楊鎧成談到,在大模型時(shí)代背景下,RWKV架構(gòu)得益于其在長(zhǎng)上下文背景下的高效訓(xùn)練和推理能力,得到了廣泛的關(guān)注。伴隨著RWKV、Mamba等架構(gòu)的爆火,格靈深瞳第一時(shí)間將這類(lèi)架構(gòu)應(yīng)用到圖文表征學(xué)習(xí)任務(wù)中,并構(gòu)建了RWKV-CLIP模型,在相同的預(yù)訓(xùn)練數(shù)據(jù)以及預(yù)訓(xùn)練參數(shù)設(shè)置下,RWKV-CLIP相較于基于Transformer架構(gòu)的CLIP模型,在線性探測(cè)、零樣本分類(lèi)、零樣本檢索等任務(wù)中展示出了顯著的性能提升。相關(guān)論文目前已被EMNLP 2024主會(huì)錄用,相關(guān)訓(xùn)練代碼、數(shù)據(jù)均已開(kāi)源。
作為行業(yè)領(lǐng)先的人工智能公司,格靈深瞳高度重視與社區(qū)和學(xué)術(shù)領(lǐng)域的交流合作。近日,格靈深瞳還發(fā)布了億級(jí)規(guī)模的圖文預(yù)訓(xùn)練RealSyn數(shù)據(jù)集,通過(guò)構(gòu)建一種高效的數(shù)據(jù)清洗和轉(zhuǎn)換范式,將圖文交錯(cuò)文檔轉(zhuǎn)換為圖文對(duì)比學(xué)習(xí)可高效使用的圖文對(duì)數(shù)據(jù)。目前相關(guān)論文與數(shù)據(jù)集均已開(kāi)源。
-
AI
+關(guān)注
關(guān)注
88文章
34421瀏覽量
275800 -
開(kāi)發(fā)者
+關(guān)注
關(guān)注
1文章
629瀏覽量
17398 -
格靈深瞳
+關(guān)注
關(guān)注
1文章
57瀏覽量
5684
原文標(biāo)題:格靈深瞳受邀參加RWKV開(kāi)發(fā)者大會(huì),分享RWKV結(jié)構(gòu)在跨模態(tài)表征學(xué)習(xí)上的應(yīng)用實(shí)踐
文章出處:【微信號(hào):shentongzhineng,微信公眾號(hào):格靈深瞳】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
格靈深瞳AI技術(shù)助力體育教育事業(yè)高質(zhì)量發(fā)展
格靈深瞳亮相Create2025百度AI開(kāi)發(fā)者大會(huì)
格靈深瞳與百度智能云達(dá)成戰(zhàn)略合作,共筑AI算力新基建
格靈深瞳入選量子位2025年AIGC雙榜單
格靈深瞳亮相第三屆北京人工智能產(chǎn)業(yè)創(chuàng)新發(fā)展大會(huì)
格靈深瞳發(fā)布全國(guó)產(chǎn)超融合大模型一體機(jī)
格靈深瞳近期接連斬獲8項(xiàng)大獎(jiǎng)
深瞳列車(chē)巡檢機(jī)器人順利通過(guò)科創(chuàng)課題結(jié)題評(píng)審
普華基礎(chǔ)軟件亮相2024開(kāi)放原子開(kāi)發(fā)者大會(huì)
2024開(kāi)放原子開(kāi)發(fā)者大會(huì)暨首屆開(kāi)源技術(shù)學(xué)術(shù)大會(huì)成功舉辦
2024開(kāi)放原子開(kāi)發(fā)者大會(huì)啟幕,深開(kāi)鴻助力開(kāi)源產(chǎn)業(yè)創(chuàng)新發(fā)展

評(píng)論