近期,谷歌公布新版ASPIRE訓練架構,該架構主要用于改進大型語言模型的選擇性預測情況。谷歌表示,盡管大語言模型在自然語言理解與生成領域發展迅速,應用廣泛,然而在涉及到高風險決策時,其預測能力仍待加強。為此,谷歌推出ASPIRE訓練框架,通過向模型引入“可信度”機制,提升預測準確率。
該框架分為三步驟:“特定任務調整”、“答案采樣”以及“自我評估學習”。首先,“特定任務調整”階段針對基本訓練的大型語言模型進一步深化訓練,重點提高預測能力。其次,“答案采樣”階段模型會根據調整的參數,生成多個答案,同時建立自我評估學習數據集,產生較高信度的選項。最后,“自我評估學習”階段則設定參數以提升機模自我評估能力,使之能檢測答案準確性,以便在回答問題時附加可信度評分。
據悉該架構取得顯著成效。在CoQA、TriviaQA和SQuAD三個問答數據集測試中,經由ASPIRE調整的OPT-2.7B小模型表現全面優于更大規模的OPT-30B模型。此成果證實,經適配調整,小型語言模型亦有潛力超越大型語言模型。
研究人員總結指出,ASPIRE訓練框架有效改善了大型語言模型的輸出精度,使小型模型經微調后可以實現“恰當且自信”的預測。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
相關推薦
華林科納半導體高選擇性蝕刻是指在半導體制造等精密加工中,通過化學或物理手段實現目標材料與非目標材料刻蝕速率的顯著差異,從而精準去除指定材料并保護其他結構的工藝技術?。其核心在于通過工藝優化控制
發表于 03-12 17:02
?71次閱讀
成形時延縮短至3μs......
4) 工業4.0神經中樞:機器視覺系統響應速度突破120fps;預測性維護準確率提升至99.2%......
未來展望:當FPGA遇見生成式AI,D
發表于 03-03 11:21
關系,這種表示方法使得代理能夠更好地理解和預測環境變化。項目的評估結果表明,具備記憶和反思能力的代理在長期交互任務中表現出了更好的適應性和學習能力,這對未來
發表于 02-25 21:59
自然語言描述任務,隨后由AI智能體代替用戶執行并最終完成任務,極大地提升工作效率和便捷性。 為了推進這一技術的實現,谷歌正在積極開發兩個相關項目。其中備受矚目的是名為“Mariner”
發表于 02-17 14:39
?299次閱讀
選擇性沉積技術可以分為按需沉積與按需材料工藝兩種形式。 隨著芯片制造技術的不斷進步,制造更小、更快且能效更高的芯片具很大的挑戰,尤其是全環繞柵極(Gate-All-Around, GAA)晶體管和更
發表于 12-07 09:45
?530次閱讀
訓練AI大模型需要選擇具有強大計算能力、足夠顯存、高效帶寬、良好散熱和能效比以及良好兼容性和擴展性的GPU。在
發表于 12-03 10:10
?321次閱讀
過電流保護的選擇性是指在電力系統中,當發生短路或過載時,保護裝置能夠按照預定的順序和時間,優先切斷故障部分,而不影響其他正常運行的部分。選擇性是電力系統保護設計的重要原則之一,它能夠確保系統的穩定性
發表于 09-26 14:38
?953次閱讀
電子發燒友網站提供《選擇性喚醒如何實現局部聯網.pdf》資料免費下載
發表于 09-12 10:29
?0次下載
谷歌近期震撼推出全球首款完全由人工智能驅動的游戲引擎——GameNGen,這一創新技術標志著游戲開發領域的新紀元。GameNGen憑借其強大的計算能力,能夠在單個TPU上實現每秒20幀的實時游戲生成,每一幀畫面均源自精密的擴散模型預測
發表于 08-29 18:07
?964次閱讀
近日,蘋果公司發布的最新研究報告揭示了其在人工智能領域的又一重要戰略選擇——采用谷歌設計的芯片來訓練其AI模型,而非行業巨頭英偉達的產品。這
發表于 08-01 18:11
?1000次閱讀
蘋果公司最近在一篇技術論文中披露,其先進的人工智能系統Apple Intelligence背后的兩個關鍵AI模型,是在谷歌設計的云端芯片上完成預訓練的。這一消息標志著在尖端AI
發表于 07-30 17:03
?817次閱讀
在科技與自然科學的交匯點上,谷歌公司于7月23日宣布了一項重大突破——全新的人工智能天氣預測模型NeuralGCM。這一創新成果不僅融合了機器學習的前沿技術,還巧妙結合了傳統氣象學的精髓,其研究成果已在國際權威科學期刊《Nature》上
發表于 07-23 14:24
?617次閱讀
在探討AI大模型與AI框架的關系時,我們首先需要明確兩者的基本概念及其在人工智能領域中的角色。AI大模型通常指的是具有極大規模、高度復雜性和
發表于 07-15 11:42
?1444次閱讀
7月12日,國際科技界傳來新動態,谷歌正借助其先進的Gemini AI系統,深化對旗下機器人的訓練,旨在顯著提升它們的導航能力和任務執行
發表于 07-12 16:29
?725次閱讀
在這篇文章中,我們將詳細探討交流二元繼電器的相位選擇性和頻率選擇性。我們將從繼電器的基本原理開始,然后探討這兩種選擇性的原理和實現方法。 1. 繼電器的基本原理 繼電器是一種電子開關,它可以根據輸入
發表于 06-29 09:42
?1064次閱讀
評論