1. 前言
在日常開發(fā)中,為了保證技術(shù)方案的質(zhì)量,一般會在撰寫前進行調(diào)研。如果先前沒有相關(guān)領(lǐng)域的知識儲備,筆者的調(diào)研方式一般是先通過搜索引擎進行關(guān)鍵字查詢,然后再基于搜索的結(jié)果進行發(fā)散。這樣調(diào)研的結(jié)果受關(guān)鍵字抽象程度和搜索引擎排名影響較大,可能會存在偏差導致調(diào)研不充分。剛好大模型風靡有一段時間了,就想如果AI能自動檢索資料并進行內(nèi)容總結(jié),豈不美哉。避免重復造輪子,先在網(wǎng)上檢索了一下,發(fā)現(xiàn)剛好有一個工具“STORM”滿足訴求。
2. 什么是STORM?
?STORM是一個由斯坦福大學開發(fā)的基于大型語言模型(LLM)的知識管理系統(tǒng),它能夠針對特定主題進行研究,并生成帶有引用的完整報告。系統(tǒng)分為預寫階段和寫作階段,通過互聯(lián)網(wǎng)研究收集參考資料并生成大綱,然后利用這些信息生成帶引用的全文。STORM通過視角引導提問和模擬對話來提高生成內(nèi)容的質(zhì)量,支持自定義檢索器和語言模型,以適應不同的使用場景。基本的執(zhí)行流程如下圖:
??
3. 怎么使用STORM?
可以自己將倉庫Clone到本地編譯運行(需要設(shè)置openai_api_key)或者直接訪問STORM試用,下面使用直接訪問網(wǎng)頁的方式進行說明。
① 設(shè)置內(nèi)容主題并描述撰寫的目的
主題設(shè)置為“代碼可視化”,并將撰寫目的設(shè)置為“介紹技術(shù)的核心概念和前沿應用”。
??
② 自動檢索互聯(lián)網(wǎng)相關(guān)資料
??
③ 使用LLM生成文章內(nèi)容
??
④ 通過模擬對話優(yōu)化生成內(nèi)容
??
⑤ 展示生成內(nèi)容
得到生成文章,可以下載為PDF格式。
??
4. 原理淺析
STORM通過兩個主要階段來生成帶有引用的長篇文章:
?預寫階段(Pre-writing stage):這個階段系統(tǒng)基于互聯(lián)網(wǎng)收集參考資料,并生成一個文章大綱。這是文章寫作的準備階段,幫助確定文章的結(jié)構(gòu)和將要包含的關(guān)鍵點;
?寫作階段(Writing stage):有了大綱和參考資料,系統(tǒng)會利用這些資料生成完整的文章,并在文章中加入適當?shù)囊谩?/p>
??
STORM的優(yōu)勢在于過程的自動化,特別是自動的提出好問題。但直接提示語言模型提出的問題效果并不理想,為了提高問題提問的深度和廣度,STORM采用了兩種策略:
?視角引導的問題提問(Perspective-Guided Question Asking):通過調(diào)查類似主題相關(guān)文章來發(fā)現(xiàn)不同的視角,并利用這些視角來控制提問的過程;
?模擬對話(Simulated Conversation):模擬了一個維基百科作者和一個互聯(lián)網(wǎng)主題專家之間的對話,使語言模型能夠更新對主題的理解并提出后續(xù)問題。
??
整個生成的執(zhí)行流程如下,可以看到生成一篇文章會進行多趟的處理:
??
更多關(guān)于功能和原理的介紹可以閱讀論文:Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models。
5. 總結(jié)
使用STORM做技術(shù)調(diào)研相當?shù)氖娣恍枰玫剿傻奈恼逻M行閱讀并對內(nèi)容進行甄別(大模型存在幻覺問題),這極大的提升了工作效率。在大模型時代如果有人說他不知道怎么學習和查找資料,那么估計99.9999999...%的概率只是懶而已
審核編輯 黃宇
-
AI
+關(guān)注
關(guān)注
87文章
31536瀏覽量
270352 -
大模型
+關(guān)注
關(guān)注
2文章
2551瀏覽量
3172
發(fā)布評論請先 登錄
相關(guān)推薦
AI助力,機構(gòu)近一個月扎堆調(diào)研半導體行業(yè)
技術(shù)升級:探索華為云 EulerOS 與 Flexus X 實例如何完美融合快速部署 Django
![<b class='flag-5'>技術(shù)</b>升級:探索華為云 EulerOS 與 Flexus X 實例如何完美融合快速部署 Django](https://file1.elecfans.com//web3/M00/03/C0/wKgZPGdr1X-AbmY3AAD0oFhITPA399.png)
“毛孩子”時代來襲!螢石 AI 如何助力行業(yè)解鎖養(yǎng)寵新姿勢?
![“毛孩子”時代來襲!螢石 <b class='flag-5'>AI</b> 如何助力行業(yè)<b class='flag-5'>解鎖</b>養(yǎng)寵<b class='flag-5'>新姿勢</b>?](https://file.elecfans.com/web2/M00/8B/B8/poYBAGPYgIWAUKq9AABGM_G9-TY983.png)
AI項目管理平臺怎么用
《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第二章AI for Science的技術(shù)支撐學習心得
Pixel 9系列遭Root與解鎖限制,AI功能受阻
IBM陳旭東:攜手IBM加速 AI 規(guī)模化應用,解鎖企業(yè)新質(zhì)生產(chǎn)力
![IBM陳旭東:攜手IBM加速 <b class='flag-5'>AI</b> 規(guī)模化應用,<b class='flag-5'>解鎖</b>企業(yè)新質(zhì)生產(chǎn)力](https://file1.elecfans.com//web2/M00/FC/97/wKgZomaU2hGAMF5TAADCYXzgaYg545.jpg)
解鎖5G工業(yè)應用新姿勢:SR830MINI使用指南
![<b class='flag-5'>解鎖</b>5G工業(yè)應用<b class='flag-5'>新姿勢</b>:SR830MINI使用指南](https://file1.elecfans.com/web2/M00/FC/7D/wKgZomaUnQOAZRYZAAcE5sk80h4649.png)
用AI解鎖創(chuàng)意設(shè)計新思路
![<b class='flag-5'>用</b><b class='flag-5'>AI</b><b class='flag-5'>解鎖</b>創(chuàng)意設(shè)計新思路](https://file1.elecfans.com/web2/M00/F3/E7/wKgaomZ7gEKAB51XAALBT6RkEUM006.png)
TE Connectivity《行業(yè)技術(shù)指數(shù)》年度報告:中國市場對AI技術(shù)的樂觀度和對可持續(xù)發(fā)展的承諾位居全球前列
解鎖AI時代的利器——訊飛AI鼠標AM30助你在AI時代脫穎
![<b class='flag-5'>解鎖</b><b class='flag-5'>AI</b>時代的利器——訊飛<b class='flag-5'>AI</b>鼠標AM30助你在<b class='flag-5'>AI</b>時代脫穎](https://file1.elecfans.com//web2/M00/C5/A4/wKgZomYBDYCASEwKAADDaUZSWlY05.jpeg)
評論