在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

深度學習自然語言處理

文章:837 被閱讀:215w 粉絲數(shù):43 關注數(shù):0 點贊數(shù):5

廣告

LLM大模型訓練Trick系列之拒絕采樣

這個方法之所以有效,是因為均勻分布幫助我們將Mq(x)提供的“封包”縮放到p(x)的概率密度函數(shù)。另....
的頭像 深度學習自然語言處理 發(fā)表于 08-21 15:07 ?2863次閱讀
LLM大模型訓練Trick系列之拒絕采樣

一種針對LLMs簡單有效的思維鏈解毒方法

考慮到強化學習[10]訓練大語言模型的困難性,我們從語言建模的角度對大語言模型進行解毒。已有工作將解....
的頭像 深度學習自然語言處理 發(fā)表于 08-21 15:02 ?579次閱讀
一種針對LLMs簡單有效的思維鏈解毒方法

檢索增強的語言模型方法的詳細剖析

? 本篇內(nèi)容是對于ACL‘23會議上陳丹琦團隊帶來的Tutorial所進行的學習記錄,以此從問題設置....
的頭像 深度學習自然語言處理 發(fā)表于 08-21 09:58 ?1727次閱讀
檢索增強的語言模型方法的詳細剖析

基于Transformer多模態(tài)先導性工作

多模態(tài)(Multimodality)是指在信息處理、傳遞和表達中涉及多種不同的感知模態(tài)或信息來源。這....
的頭像 深度學習自然語言處理 發(fā)表于 08-21 09:49 ?908次閱讀
基于Transformer多模態(tài)先導性工作

大型語言模型在關鍵任務和實際應用中的挑戰(zhàn)

大型語言模型的出現(xiàn)極大地推動了自然語言處理領域的進步,但同時也存在一些局限性,比如模型可能會產(chǎn)生看似....
的頭像 深度學習自然語言處理 發(fā)表于 08-15 09:33 ?1595次閱讀
大型語言模型在關鍵任務和實際應用中的挑戰(zhàn)

GPT時代醫(yī)學AI新賽道:16萬張圖片、70萬問答對的臨床問答數(shù)據(jù)集MIMIC-Diff-VQA發(fā)布

該研究同時提出了一個全新任務,圖像對比 VQA (difference VQA):給定兩張圖片,回答....
的頭像 深度學習自然語言處理 發(fā)表于 08-09 15:36 ?546次閱讀
GPT時代醫(yī)學AI新賽道:16萬張圖片、70萬問答對的臨床問答數(shù)據(jù)集MIMIC-Diff-VQA發(fā)布

關于領域大模型-訓練Trick&落地的一點思考

現(xiàn)有大模型在預訓練過程中都會加入書籍、論文等數(shù)據(jù),那么在領域預訓練時這兩種數(shù)據(jù)其實也是必不可少的,主....
的頭像 深度學習自然語言處理 發(fā)表于 08-09 11:43 ?1891次閱讀
關于領域大模型-訓練Trick&落地的一點思考

ToolLLM:促進大型語言模型掌握16000+真實世界的APIs

盡管開源大語言模型 (LLM) 及其變體(例如 LLaMA 和 Vicuna)取得了進步,但它們在執(zhí)....
的頭像 深度學習自然語言處理 發(fā)表于 08-02 16:27 ?787次閱讀
ToolLLM:促進大型語言模型掌握16000+真實世界的APIs

爆火Llama 2一周請求下載超15萬,有人開源了Rust實現(xiàn)版本

隨著 Llama 2 的逐漸走紅,大家對它的二次開發(fā)開始流行起來。前幾天,OpenAI 科學家 Ka....
的頭像 深度學習自然語言處理 發(fā)表于 08-02 16:25 ?701次閱讀
爆火Llama 2一周請求下載超15萬,有人開源了Rust實現(xiàn)版本

Focus-DETR:30%Token就能實現(xiàn)SOTA性能,效率倍增

目前 DETR 類模型已經(jīng)成為了目標檢測的一個主流范式。但 DETR 算法模型復雜度高,推理速度低,....
的頭像 深度學習自然語言處理 發(fā)表于 08-02 15:12 ?884次閱讀
Focus-DETR:30%Token就能實現(xiàn)SOTA性能,效率倍增

LLM的長度外推淺談

蘇神最早提出的擴展LLM的context方法,基于bayes啟發(fā)得到的公式
的頭像 深度學習自然語言處理 發(fā)表于 07-28 17:37 ?1977次閱讀
LLM的長度外推淺談

大模型訓練中RM分數(shù)越來越高,那訓出來LLM的效果一定好嗎?

如果你動手跑幾次ppo的過程就發(fā)現(xiàn)了,大模型的強化學習非常難以訓練,難以訓練不僅僅指的是費卡,還是指....
的頭像 深度學習自然語言處理 發(fā)表于 07-26 15:45 ?1900次閱讀
大模型訓練中RM分數(shù)越來越高,那訓出來LLM的效果一定好嗎?

HaluEval數(shù)據(jù)集的構(gòu)建過程分析

最近,大語言模型(Large Language Models, LLMs)的快速發(fā)展帶來了自然語言處....
的頭像 深度學習自然語言處理 發(fā)表于 07-24 09:08 ?929次閱讀
HaluEval數(shù)據(jù)集的構(gòu)建過程分析

適用于各種NLP任務的開源LLM的finetune教程~

ChatGLM2-6b是清華開源的小尺寸LLM,只需要一塊普通的顯卡(32G較穩(wěn)妥)即可推理和微調(diào),....
的頭像 深度學習自然語言處理 發(fā)表于 07-24 09:04 ?1773次閱讀
適用于各種NLP任務的開源LLM的finetune教程~

張俊林:大語言模型帶來的交互方式變革

在大模型出來之前,人和數(shù)據(jù)怎么發(fā)生關系?人不能直接與數(shù)據(jù)發(fā)生關系,需要通過一個中介,這個中介就是應用....
的頭像 深度學習自然語言處理 發(fā)表于 07-18 14:47 ?993次閱讀
張俊林:大語言模型帶來的交互方式變革

單樣本微調(diào)給ChatGLM2注入知識

LoRA微調(diào)是一種高效的融入學習算法。類似人類把新知識融入現(xiàn)有知識體系的學習過程。學習時無需新知識特....
的頭像 深度學習自然語言處理 發(fā)表于 07-18 14:44 ?3115次閱讀
單樣本微調(diào)給ChatGLM2注入知識

RoPE可能是LLM時代的Resnet

通過線性插值RoPE擴張LLAMA context長度最早其實是在llamacpp項目中被人發(fā)現(xiàn),有....
的頭像 深度學習自然語言處理 發(fā)表于 07-14 16:58 ?617次閱讀

最新綜述!當大型語言模型(LLM)遇上知識圖譜:兩大技術優(yōu)勢互補

LLM 是黑箱模型,缺乏可解釋性,因此備受批評。LLM 通過參數(shù)隱含地表示知識。因此,我們難以解釋和....
的頭像 深度學習自然語言處理 發(fā)表于 07-10 11:35 ?2113次閱讀
最新綜述!當大型語言模型(LLM)遇上知識圖譜:兩大技術優(yōu)勢互補

大模型微調(diào)樣本構(gòu)造的trick

現(xiàn)在chatglm2的代碼針對這兩個問題已經(jīng)進行了改善,可以認為他就是典型的decoder-only....
的頭像 深度學習自然語言處理 發(fā)表于 07-10 11:32 ?904次閱讀
大模型微調(diào)樣本構(gòu)造的trick

X-RiSAWOZ: 高質(zhì)量端到端多語言任務型對話數(shù)據(jù)集

對齊:我們提出了一種混合對齊策略,以確保實體在話語和信念狀態(tài)中都能被替換為所需的翻譯。具體而言,我們....
的頭像 深度學習自然語言處理 發(fā)表于 07-06 16:44 ?848次閱讀
X-RiSAWOZ: 高質(zhì)量端到端多語言任務型對話數(shù)據(jù)集

武大+上交提出BatGPT:創(chuàng)新性采用雙向自回歸架構(gòu),可預測前后token

此外,BATGPT還采用了強化學習方法,從AI和人類反饋中學習,以進一步提高模型的對齊性能。這些方法....
的頭像 深度學習自然語言處理 發(fā)表于 07-06 16:40 ?1488次閱讀
武大+上交提出BatGPT:創(chuàng)新性采用雙向自回歸架構(gòu),可預測前后token

人大發(fā)表迄今為止最大最全的大模型綜述

大語言模型目前已經(jīng)成為學界研究的熱點。我們統(tǒng)計了arXiv論文庫中自2018年6月以來包含關鍵詞"語....
的頭像 深度學習自然語言處理 發(fā)表于 07-06 16:36 ?2632次閱讀
人大發(fā)表迄今為止最大最全的大模型綜述

Multi-CLS BERT:傳統(tǒng)集成的有效替代方案

在 GLUE 和 SuperGLUE 數(shù)據(jù)集上進行了實驗,證明了 Multi-CLS BERT 在提....
的頭像 深度學習自然語言處理 發(fā)表于 07-04 15:47 ?825次閱讀
Multi-CLS BERT:傳統(tǒng)集成的有效替代方案

我們能否擴展現(xiàn)有的預訓練 LLM 的上下文窗口

? ? 在大家不斷升級迭代自家大模型的時候,LLM(大語言模型)對上下文窗口的處理能力,也成為一個重....
的頭像 深度學習自然語言處理 發(fā)表于 06-30 11:09 ?710次閱讀
我們能否擴展現(xiàn)有的預訓練 LLM 的上下文窗口

單張消費級顯卡微調(diào)多模態(tài)大模型

把大模型的訓練門檻打下來!我們在單張消費級顯卡上實現(xiàn)了多模態(tài)大模型(LaVIN-7B, LaVIN-....
的頭像 深度學習自然語言處理 發(fā)表于 06-30 10:43 ?2566次閱讀
單張消費級顯卡微調(diào)多模態(tài)大模型

基于一個完整的 LLM 訓練流程

? ? 在這篇文章中,我們將盡可能詳細地梳理一個完整的 LLM 訓練流程。包括模型預訓練(Pretr....
的頭像 深度學習自然語言處理 發(fā)表于 06-29 10:08 ?2114次閱讀
基于一個完整的 LLM 訓練流程

一種完全由LLM + 啟發(fā)式搜索算法結(jié)合的TOT算法

今天分享一篇普林斯頓大學的一篇文章,Tree of Thoughts: Deliberate Pro....
的頭像 深度學習自然語言處理 發(fā)表于 06-29 10:06 ?1717次閱讀
一種完全由LLM + 啟發(fā)式搜索算法結(jié)合的TOT算法

利用生成式AI進行法律研究

為了解決這一問題,本文提出了三個LLM模型——理解、經(jīng)驗和事實,將它們合成為一個組合模型。還引入了多....
的頭像 深度學習自然語言處理 發(fā)表于 06-27 16:58 ?544次閱讀
利用生成式AI進行法律研究

大模型如何快速構(gòu)建指令遵循數(shù)據(jù)集

一、概述 1 Motivation 構(gòu)造instruction data非常耗時耗力,常受限于質(zhì)量,....
的頭像 深度學習自然語言處理 發(fā)表于 06-27 16:56 ?3061次閱讀
大模型如何快速構(gòu)建指令遵循數(shù)據(jù)集

GLoRA:一種廣義參數(shù)高效的微調(diào)方法

近年來,大規(guī)模深度神經(jīng)網(wǎng)絡的顯著成就徹底改變了人工智能領域,在各種任務和領域展示了前所未有的性能。這....
的頭像 深度學習自然語言處理 發(fā)表于 06-27 16:53 ?847次閱讀
GLoRA:一種廣義參數(shù)高效的微調(diào)方法
主站蜘蛛池模板: 色偷偷91久久综合噜噜噜 | 国产性老妇女做爰在线 | 一级国产特黄aa大片 | 亚洲免费视频播放 | 深爱激情小说网 | 免费看特级淫片日本 | 激情五月综合婷婷 | 在线 你懂的| 国产女乱淫真高清免费视频 | 中韩日欧美电影免费看 | 欧美hhh | 国产精品国产午夜免费福利看 | www婷婷 | 久久久久国产精品免费网站 | 夜夜爽影院 | 天天躁夜夜 | 91视频看看 | 色妇视频| 天天免费看片 | 亚洲性夜| 日剧天堂 | 中文天堂最新版资源新版天堂资源 | 亚洲欧洲第一页 | 久久婷婷色综合老司机 | 一级片免费观看视频 | 不卡一级毛片免费高清 | 夜夜偷影视 | 免费黄色福利视频 | 久久人人网 | 久久狼人综合 | 69xxxx女人 | 又黄又湿又爽吸乳视频 | 99久久精品99999久久 | 四虎在线成人免费网站 | 国产美女视频爽爽爽 | 一区在线视频 | 日日干天天草 | 午夜视频在线 | 色视频免费观看高清完整 | 手机在线免费视频 | 国产黄色a三级三级三级 |