騰訊公布大語言模型訓練新專利

近日，騰訊科技(深圳)有限公司公布了一項名為“大語言模型的訓練方法、裝置、計算機設備及存儲介質”的新專利。該專利的公布，標志著騰訊在大語言模型訓練領域取得了新的突破。

據專利摘要顯示，該方法通過在大語言模型的訓練過程中引入第一摘要文本和第二摘要文本，為模型提供了更為豐富的學習信息。這兩個摘要文本在信息量上存在差異，且第一摘要文本中既包含正確語句也包含錯誤語句。這一設計使得模型在訓練過程中，能夠通過對比學習兩個不同摘要文本的內容，同時區分并學習第一摘要文本中的正確語句和錯誤語句。

這一創新性的訓練方法，有效避免了由于摘要文本單一而導致的模型過擬合和生成不準確等問題。通過引入更多樣化的學習信息，模型能夠更好地泛化到新的數據上，從而提高其泛化性能。同時，對正確語句和錯誤語句的區分學習，也進一步提升了模型的準確性。

騰訊此次公布的新專利，不僅展示了其在人工智能領域的深厚技術積累，也為大語言模型的訓練提供了新的思路和方法。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

人工智能

人工智能

+關注

關注
1806

文章
49028

瀏覽量
249520
騰訊

騰訊

+關注

關注
7

文章
1678

瀏覽量
50303
語言模型

語言模型

+關注

關注
0

文章
561

瀏覽量
10790

科技綠洲
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 羅氏線圈電流傳感器的工作原理、結構特點及應用
Hot javascript的成熟分類

New TL2575HV-12 1A 簡單降壓開關穩壓器數據手冊
New TL2575HV-15 1A 簡單降壓開關穩壓器數據手冊

精選推薦
更多

文章

資料

帖子

AI通話的N種新玩法，讓科幻照進現實

腦極體
7小時前

236 閱讀

RKDC2025 | 視美泰亮相瑞芯微2025開發者大會，共探AIoT新藍海

視美泰
12小時前

294 閱讀

老化測試效率提升，高壓干簧繼電器究竟做對了什么？

斯丹麥德電子
13小時前

328 閱讀

光儲邊緣智能的核心演進方向:MCU + AFE + 通信 + AI 一體化設計

eeDesigner
14小時前

470 閱讀

線性穩壓器和開關穩壓器、串聯穩壓器的區別

東芝半導體
15小時前

407 閱讀

基于SC4216H_Typical Application直流到直流單輸出電源的參考設計

張磊
939.53KB

2積分

9下載

基于openharmony適配移植的中國地圖視圖教程

姚小熊27
3.74 MB

免費

4下載

Amo-validator安全監控工具

呂鋼格
28.76 MB

免費

0下載

vscode-theme-generator VS Code主題生成工具庫

王飛
0.12 MB

免費

0下載

基于物聯網的智慧養殖集散系統

juying
3.58 MB

免費

25下載

省錢+環保+個性：打造一臺永不“過時”的自定義電腦！

早知
1天前

182 閱讀

【BPI-CanMV-K230D-Zero開發板體驗】+溫度大氣壓檢測及顯示

jinglixixi
1天前

417 閱讀

【RA-Eco-RA6M4開發板評測】+01+開箱測評+UART+PWM+LED

jf_18702540
2天前

385 閱讀

【VisionFive 2單板計算機試用體驗】2、打造復古游戲機（Batocera鏡像+FBNeo虛擬機，多款游戲ROM分享）

左岸cpx
2天前

402 閱讀

【BPI-CanMV-K230D-Zero開發板體驗】+兩種開發板間的比較

jinglixixi
2天前

357 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

搜索歷史

騰訊公布大語言模型訓練新專利

評論