天域苍穹,欢乐颂第一季免费阅读,殿上欢

1 簡介?????????

有的工作嘗試引出中間推理步驟，通過將復雜問題顯示分解為多個子問題，從而以分而治之的方式來解決。考慮到組合泛化對于語言模型有一定的挑戰，這種遞歸方法的對于復雜任務特定有用。根據解決子問題的方式可以分為串行跟并行兩種，串行的方式每個子問題相互依賴，前面子問題的答案會加入到后續子問題的prompt中，生成后續子問題的答案，而并行的方式則各個子問題的答案生成是獨立的，最后再將多個子問題的答案融合到一起。

2 并行式?????????

DECOMPRC

在閱讀理解場景下，多跳閱讀理解要求從眾多段落中進行推理跟歸納。于是出現了新的方案DECOMPRC，將多跳閱讀理解問題分解成多個相對簡單的子問題（現有閱讀理解模型可以回復），從而提高閱讀理解準確性。

圖1:DECOMPRC示例

整個方案分為三個部分

a)將原始的多跳閱讀理解問題分解為多個單跳子問題。可以根據多個不同的推理類型得到多種分解方式，這里需要根據不同推理類型分別訓練多個用于問題分解的模型，對于每個分解模型，采用Point的方式，利用BERT對原問題進行預測，得到幾個關鍵位置，利用關鍵位置原文本進行劃分，再加上一些規則手段，就可以得到對應的子問題了。例如預測出一個中間位置，就可以將原問題分割成兩部分，第一部分作為第一個子問題，第二部分作為第二個子問題，考慮到第二部分可能都是陳述句，就將前面的詞轉換成which。這里將分解模型簡化為一個span prediction問題，只需要400個訓練數據就得到很不錯的效果了。

b)在第一步會產生多種問題分解方式，對于每一種分解方式，利用單跳閱讀理解模型回復每個子問題，然后根據不同分分解類型的特性得到最終的答案。

c)對于每一種分解方式，將原問題，分解類型，該分解方式下的問題跟對應答案一同作為模型輸入，預測哪種分解方式對應的結果最合理，將該分解方式下的答案作為多跳閱讀理解問題的答案。

整個流程可以簡單理解為，系統提供了幾種將多跳問題分解為子問題的方式，分別計算每個分解方式的合理性，再選擇其中最優的分解方式對應的答案作為原問題最終答案。

在QA場景下，通過將復雜問題分解為相對簡單的子問題（QA模型可以回復），從而提高問答的效果。具體到多跳QA問題上，現將復雜問題分解為多個子問題，利用單跳QA模型生成全部子問題的答案并融合到一起作為復雜問題的答案。

圖2: QA場景下的recursive prompting方案示例?

整個系統分為三個部分

a)無監督問題分解，將原問題分解為多個相對簡單的子問題。這里需要訓練一個分解模型，用于將復雜問題分解成多個子問題。由于這個任務下的監督訓練數據構造成本高昂，于是提出了一種無監督的訓練數據構造方式，對于每一個復雜問題q，從語料集Q中檢索召回得到N個對應的簡單問題s作為q的子問題，N的取值可以依賴于具體任務或者具體問題。我們希望這些簡單問題在某些方面跟q足夠相似，同時這些簡單問題s之間有明顯差異。從而構造出復雜問題跟子問題序列之間的偽pair對（q, [s1,…sN]）,用于訓練分解模型。

b)生成子問題回復，利用現有的QA模型，去生成各個子問題的回復。這里不對QA模型有太多限制，只要它能正確回復語料庫S中的簡單問題即可，所以盡量采用在S中效果優異的QA模型。

c)生成復雜問題回復，將復雜問題，各個子問題跟對應回復一同作為QA模型的輸入，生成復雜問題的回復。這里的QA模型可以采用跟第二步一樣的模型，只要將輸入做對應調整即可。

圖3: QA場景下的recursive prompting方案示例

圖4: 實驗結果對比

從實驗效果上可以明顯看出這些問題分解的方式能夠顯著提升模型效果。

串行式

SEQZERO

如何利用大規模語言模型將自然語言問題轉化為SQL語句？SEQZERO就是一種解法。由于SQL這種規范語言的復合結構，SQL語句很多情況下會顯得復雜且冗長，要讓語言模型學會生草本跟SQL語言需要大量訓練數據，于是出現了一種基于few-shot的方法SEQZERO。

一個SQL語句包括多個部分，例如From **，SELCT **， WHERE **，只要能從自然語言問題中提出這幾個部分對應的元素，然后通過規則可以轉化為對應的SQL語句。于是SEQZERO的做法就是先利用語言模型預測得到其中一個元素，將該元素加入到原問題中生成下個元素，重復此操作直到生成全部元素，然后通過規則將所有結果組合起來的就得到對應的SQL語句。在預測每個元素的過程中，為了得到更加強大的泛化能力，采用了few-shot跟zero-shot的集成策略。

圖5: SEQZERO示例

Least-to-most

雖然chain-of-thought prompting在很多自然語言推理任務有顯著效果，但是當問題比prompt里的示例更難時，它的表現會很糟糕。舉個例子，比如任務抽取文本每個單詞最后一個字母，prompt的示例輸入是3個單詞，輸入相對較短，但是問題的長度卻是10個單詞，這種情況下chain-of-thought prompting的策略就會失效。于是提出了Least-to-most，通過兩階段的prompting來解決這種問題，第一階段通過prompting將原問題分解為一系列子問題，第二階段則是通過prompting依次解決子問題，前面子問題的問題跟答案會加入到候選子問題的模型輸入中去，方便語言模型更好地回復候選子問題。由于這兩個階段任務有所區別，對應的prompt內容也不同。

圖6: Least-to-most示例

4 其他

Successive prompting

前面幾種方法都是一開始就將問題分解為多個子問題，然后在通過串行或者并行的方式回復所有子問題，而successive prompting則是每次分解出一個子問題，讓語言模型去回復該子問題，再將該子問題以及對應答案加入到模型輸入種，進而分解出下一個子問題，重復這個過程直到沒有新的子問題生成，那么最后一個子問題的答案就是原問題的答案。

圖7: successive prompting示例

5 總結???????????????

Recursive prompting這種思路其實蠻好理解的，目前大規模語言模型處理這些簡單任務效果是很不錯的，但是復雜問題就比較糟糕了，一方面構造這些復雜問題相關數據的工作很艱巨，另一方面直接讓語言模型在這些復雜問題數據上訓練效果也很一般（想想為什么有些數據集上sota指標也很低）。但是讓語言模型學會根據具體問題進行拆解，通過將復雜問題分解為相對簡單的子問題，采用分而治之的方式，再將子問題答案匯總，不就得到原問題的答案了嘛。這也跟我們人類的行為模式更加接近，對于復雜任務，我們會通過合理規劃將其劃分為具體多個子任務，然后再去一一解決這些子任務。想想中華民族偉大復興的道路，不也是通過一個又一個的五年計劃逐步向前推進的嘛。

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

SQL

SQL

+關注

關注
1

文章
777

瀏覽量
44427
語言模型

語言模型

+關注

關注
0

文章
550

瀏覽量
10432
SQL語句

SQL語句

+關注

關注
0

文章
19

瀏覽量
7096

原文標題：增強語言模型之Recursive prompting

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

名單公布！【書籍評測活動NO.30】大規模語言模型：從理論到實踐

評測資格！ 2022年11月，ChatGPT的問世展示了大模型的強大潛能，對人工智能領域有重大意義，并對自然語言處理研究產生了深遠影響，引發了大模型研究的熱潮。距ChatGPT問世不到一年，截至

發表于 03-11 15:16

【大語言模型：原理與工程實踐】揭開大語言模型的面紗

大語言模型（LLM）是人工智能領域的尖端技術，憑借龐大的參數量和卓越的語言理解能力贏得了廣泛關注。它基于深度學習，利用神經網絡框架來理解和生成自然語

發表于 05-04 23:55

【大語言模型：原理與工程實踐】大語言模型的基礎技術

處理各種自然語言任務時都表現出了驚人的能力。這促使一個新的研究方向誕生——基于Transformer 的預訓練語言模型。這類模型的核心思想是先利用

發表于 05-05 12:17

python自然語言

最近，python自然語言是越來越火了，那么什么是自然語言。自然語言（Natural Language ）廣納了眾多技術，對自然或人類語言進

發表于 05-02 13:50

自然語言處理怎么最快入門？

問答等等。我們日常場景中比較常見到的類似Siri、微軟小冰之類的，這些的基礎都是自然語言處理，另外還有一些語音處理，這就暫且不表了。總之，你看到的機器與人利用語言交互，用機器模擬人腦閱讀，對話，評論等等這些

發表于 11-28 10:02

關于自然語言處理之54 語言模型(自適應)

自然語言處理——54 語言模型(自適應)

發表于 04-09 08:20

自然語言處理的語言模型

自然語言處理——53 語言模型（數據平滑）

發表于 04-16 11:11

什么是自然語言處理

什么是自然語言處理？自然語言處理任務有哪些？自然語言處理的方法是什么？

發表于 09-08 06:51

嵌入式SQL語句與主語言之間的通信

把SQL嵌入到高級語言中混合編程，程序中會含有兩種不同計算模型的語句SQL語句高級

發表于 12-22 07:44

自然語言處理常用模型解析

自然語言處理常用模型使用方法一、N元模型二、馬爾可夫模型以及隱馬爾可夫模型及目前常用的自然語言處

發表于 12-28 15:42 ?6010次閱讀

自然語言處理怎么最快入門_自然語言處理知識了解

自然語言處理就是實現人機間自然語言通信，實現自然語言理解和自然語言生成是十分困難的，造成困難的根本原因是自然語言文本和對話的各個層次上廣泛存

發表于 12-28 17:10 ?5354次閱讀

基于自然語言生成多表SQL語句模板填充的方法

自然語言生成SαL查詢不僅是構建智能數據庫查詢系統的一個重要鉏成部分，亦是新型供電軌道交通系統混合時態大數據個性化運維的難點之一。目前利用深度學習模型的方法專注于數據庫中單表SQL查詢

發表于 04-09 16:32 ?40次下載

自然語言和ChatGPT的大模型調教攻略

指令調整（Instruction Tuning）將多種任務轉化成自然語言表述的形式，再通過seq2seq的監督學習+多任務學習的方式調整大規模語言模

發表于 04-24 10:28 ?1013次閱讀

自然語言處理的概念和應用 自然語言處理屬于人工智能嗎

　　自然語言處理(Natural Language Processing)是一種人工智能技術，它是研究自然語言與計算機之間的交互和通信的一門學科。自然語言處理旨在研究機器如何理解人類語言

發表于 08-23 17:31 ?1862次閱讀

大規模語言模型的基本概念、發展歷程和構建流程

大規模語言模型（Large Language Models，LLM），也稱大規模語言模型或大型

發表于 12-07 11:40 ?4834次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

如何利用大規模語言模型將自然語言問題轉化為SQL語句？

評論

名單公布！【書籍評測活動NO.30】大規模語言模型：從理論到實踐

【大語言模型：原理與工程實踐】揭開大語言模型的面紗

【大語言模型：原理與工程實踐】大語言模型的基礎技術

python自然語言

自然語言處理怎么最快入門？

關于自然語言處理之54 語言模型(自適應)

自然語言處理的語言模型

什么是自然語言處理

嵌入式SQL語句與主語言之間的通信

自然語言處理常用模型解析

自然語言處理怎么最快入門_自然語言處理知識了解

基于自然語言生成多表SQL語句模板填充的方法

自然語言和ChatGPT的大模型調教攻略

自然語言處理的概念和應用自然語言處理屬于人工智能嗎

大規模語言模型的基本概念、發展歷程和構建流程