近日,據月之暗面報道,OpenAI發布了一項令人矚目的研究報告。報告指出,DeepSeek和Kimi兩個研究團隊通過獨立研究,成功利用思維鏈學習方法,在數學解題與編程挑戰中顯著提升了模型的綜合表現。
Kimi團隊的研究員Flood Sung在社交媒體上發文,分享了團隊的研究心得。他提到,長思維鏈的有效性在團隊內部已經得到了驗證。在實際訓練過程中,研究人員發現模型的表現會隨著訓練的深入而不斷提升,并且token數也在不斷增加。這一發現證明了在強化訓練過程中,模型具備自我涌現的能力,能夠不斷挖掘和發揮自身的潛力。
值得一提的是,就在1月20日,DeepSeek和Kimi兩個團隊在同一天發布了各自的推理模型R1和k1.5。這一巧合不僅展示了兩個團隊在研究領域的默契,也進一步凸顯了思維鏈學習方法在提升模型性能方面的巨大潛力。
OpenAI的這一研究報告,不僅揭示了DeepSeek和Kimi兩個團隊在思維鏈學習方法上的突破,也為人工智能領域的研究提供了新的思路和啟示。
-
人工智能
+關注
關注
1799文章
47960瀏覽量
241193 -
模型
+關注
關注
1文章
3393瀏覽量
49367 -
OpenAI
+關注
關注
9文章
1181瀏覽量
6825 -
DeepSeek
+關注
關注
1文章
452瀏覽量
191
發布評論請先 登錄
相關推薦
OpenAI發布o1大模型,數理化水平比肩人類博士,國產云端推理芯片的新藍海?

DeepSeek與Kimi揭示o1秘密,思維鏈學習方法顯成效
OpenAI O3與DeepSeek R1:推理模型性能深度分析
了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應用選擇
PerfXCloud上線DeepSeek系列模型
AI模型思維鏈功能升級,提升透明度與可信度
芯動力神速適配DeepSeek-R1大模型,AI芯片設計邁入“快車道”!

對標OpenAI o1,DeepSeek-R1發布

評論