據(jù)消息,OpenAI近日發(fā)布了一項(xiàng)重要研究報(bào)告。報(bào)告指出,DeepSeek和Kimi兩家機(jī)構(gòu)通過獨(dú)立研究,成功利用思維鏈學(xué)習(xí)方法,在數(shù)學(xué)解題與編程挑戰(zhàn)中顯著提升了模型的綜合表現(xiàn)。
Kimi的研究員Flood Sung在隨后的發(fā)文中詳細(xì)闡述了這一發(fā)現(xiàn)。他提到,長(zhǎng)思維鏈的有效性在內(nèi)部實(shí)驗(yàn)中已經(jīng)得到了驗(yàn)證。在實(shí)際訓(xùn)練過程中,研究人員發(fā)現(xiàn)模型的表現(xiàn)會(huì)隨著訓(xùn)練的深入而不斷提升,并且token數(shù)也在不斷增加。這一現(xiàn)象表明,在強(qiáng)化訓(xùn)練的過程中,模型能夠自我涌現(xiàn),進(jìn)一步提升其解題能力。
值得注意的是,就在1月20日,DeepSeek和Kimi在同一天發(fā)布了各自的推理模型R1和k1.5。這兩款模型的發(fā)布,無疑是對(duì)其研究成果的進(jìn)一步驗(yàn)證和展示。
此次DeepSeek與Kimi的研究不僅揭示了o1的秘密,更為人工智能領(lǐng)域的發(fā)展帶來了新的啟示。思維鏈學(xué)習(xí)方法的成功應(yīng)用,為提升AI模型的解題能力和編程能力提供了新的思路和方法。
-
人工智能
+關(guān)注
關(guān)注
1806文章
48980瀏覽量
248846 -
模型
+關(guān)注
關(guān)注
1文章
3516瀏覽量
50342 -
Kimi
+關(guān)注
關(guān)注
0文章
12瀏覽量
141 -
DeepSeek
+關(guān)注
關(guān)注
1文章
794瀏覽量
1674
發(fā)布評(píng)論請(qǐng)先 登錄
OpenAI發(fā)布o1大模型,數(shù)理化水平比肩人類博士,國(guó)產(chǎn)云端推理芯片的新藍(lán)海?

雷軍:小米玄戒O1已開始大規(guī)模量產(chǎn)
小米自研芯片玄戒O1跑分出爐 單核2709多核8125 小米聯(lián)想加速“造芯”
雷軍官宣小米造芯 雷軍宣布小米芯片進(jìn)展 手機(jī)SoC芯片玄戒O1于5月下旬發(fā)布
用對(duì)軟件,DeepSeek + Kimi,PPT一鍵生成秘籍!

OpenAI:DeepSeek與Kimi揭秘o1,長(zhǎng)思維鏈提升模型表現(xiàn)
了解DeepSeek-V3 和 DeepSeek-R1兩個(gè)大模型的不同定位和應(yīng)用選擇
PerfXCloud上線DeepSeek系列模型
芯動(dòng)力神速適配DeepSeek-R1大模型,AI芯片設(shè)計(jì)邁入“快車道”!

對(duì)標(biāo)OpenAI o1,DeepSeek-R1發(fā)布

評(píng)論