在人工智能的快速發展浪潮中,Kneron 始終緊跟最前沿的技術,并不斷優化自身的 AI 方案,以更強大的能力和更優的性價比賦能各行各業。
如今,Kneron 取得了一個令人興奮的突破——借助 DeepSeek-R1 論文中提到的前沿訓練技巧,Kneron 成功讓自研的 LLM 模型掌握了“思維鏈推理(Chain-of-Thought Reasoning)”和“自我反思(Reflection)”的能力,并已部署在 Kneo300 和 Kneo330 AI 一體機上,為企業提供更智能、更精準的 AI 解決方案,Kneron智能決策系統已落地醫療金融等多個場景。
這意味著,Kneron 的 AI 不再僅僅是回答問題或執行任務,而是能夠“思考”和“推理”,讓 AI 具備更強的邏輯推導能力,從而更好地理解復雜問題,給出更可靠、更專業的答案。
Kneron 已經在醫療、金融、企業客服等多個行業場景中成功應用了這一創新技術,幫助客戶實現更高效的 AI 賦能。
什么是“思維鏈推理”和“自我反思”?
在傳統的 AI 對話系統中,模型往往直接給出答案,但很多時候,這些答案缺乏邏輯推導,容易出現前后矛盾或不夠嚴謹的情況。而 “思維鏈推理” 讓 AI 學會像人類一樣,逐步拆解問題,形成清晰的推理步驟,避免“拍腦袋”式的回答。
更重要的是,Kneron 的 AI 還具備了“自我反思(Reflection)”能力--在回答復雜問題時,它可以回顧自己的推理過程,檢查是否有邏輯錯誤,并在發現問題后主動調整答案。這種能力在數學計算、金融分析、醫學診斷等領域尤其重要,因為這些場景需要 AI 不僅提供答案,還要保證答案的正確性和推理過程的嚴謹性。
經訓練提升后, KneronLLM-R1 可以有一個推理思考的過程,可以通過思考輸出更正確的答案。
突破創新:Kneron 如何做到的?
這次突破的核心在于 Kneron 采用了 DeepSeek-R1 論文中提出的強化學習(Reinforcement Learning, RL)和蒸餾(Distillation)等技術,使 AI 在訓練過程中逐步學會推理和反思。其關鍵步驟包括:
1.高質量數據整理與冷啟動訓練
參考 DeepSeek-R1 的方法,Kneron 通過構建高質量的思維鏈(Chain-of-Thought, CoT)數據,精心篩選多輪推理示例,進行冷啟動訓練。這一階段提高了模型的可讀性和穩定性,使 AI 具備基本推理能力。
2.拒絕采樣 + 蒸餾
Kneron 采用拒絕采樣(Rejection Sampling),篩選出最優推理路徑,并結合知識蒸餾(Knowledge Distillation),將Deepseek-r1及o1等大模型的推理能力遷移到輕量級模型,使 Kneron AI 既具備強大的推理能力,又能在 Kneo300 和 Kneo330 上高效運行。
3.強化學習優化推理能力
訓練后期,Kneron 采用類似于 DeepSeek-R1 的強化學習策略,在訓練過程中讓 AI 通過自對比和獎勵機制學習最佳推理路徑。模型會生成多個不同的推理鏈,并根據準確性和邏輯一致性進行優化。
4.語言一致性與長文本優化
由于 AI 需要適應不同場景,Kneron 還借鑒 DeepSeek-R1 在語言優化方面的方法,引入語言一致性獎勵,確保模型在復雜推理過程中保持邏輯清晰,避免回答混亂或前后矛盾。
最終,耐能成功將這一增強版 AI 部署在 Kneo300 和 Kneo330 AI 一體機 上,讓更多企業和開發者可以直接使用具備推理能力的 AI,為他們的業務賦能。
更智能的 AI,如何助力行業升級?
這項技術的突破,正在幫助多個行業實現 AI 賦能,耐能已經在以下場景中實現落地應用:
1. 醫療問卷 AI 助手
在醫療行業,醫生和醫院需要收集大量的患者信息,進行健康評估。Kneron 的 AI 可在問卷填寫過程中進行推理,根據患者的回答動態調整問題,并分析可能的健康風險,提高診斷效率。
2.金融衍生品定價 AI
金融衍生品定價涉及復雜數學計算和市場分析。Kneron AI 結合“思維鏈推理”技術,精準解析結構與條款,融合金融數學模型,智能推導定價策略,為金融機構提供高效、精準的投資優化與風險管控方案。
3. 金融數據分析助手
金融行業的數據繁多且復雜,傳統的 AI 只能提供簡單的報表分析,而 Kneron 的 AI 能夠基于數據推理找出數據中的異常,幫助財務人員和分析師做出更高維度的分析。
4. 企業資料智能客服
許多企業客服需要處理大量的內部文檔和客戶問題,Kneron AI 可自動讀取、理解企業文檔,并提供準確的回答,降低企業客服成本,同時提升客戶體驗。
5. 會議紀要 AI 助手
Kneron AI 可幫助企業自動生成高質量的會議紀要,不僅記錄內容,還能分析會議重點,提煉核心觀點,幫助企業提升會議效率。
為什么選擇耐能?
這次技術升級,充分展現了耐能在AI領域的創新能力和技術實力。耐能不僅能緊跟前沿技術趨勢,還能將這些技術快速落地,為客戶提供極具性價比的軟硬一體 AI 解決方案。
Kneron AI 的核心優勢:
軟硬一體,性能更優:AI 直接運行在 Kneo300 和 Kneo330 上,速度更快,成本更低,無需依賴云端計算,實現軟硬件深度協同優化,顯著優化部署成本與提高隱私安全指標。
推理更強,結果更精準:認知推理能力突破,具備“思維鏈推理”和“自我反思”能力,在自然語言處理、復雜決策支持等場景提供更具邏輯性答案。
應用靈活,行業適配廣:已落地醫療、金融、企業客服等多個場景,助力各行業智能升級。
在 AI 時代,擁有強大的推理能力意味著 AI 不僅能“回答問題”,還能“思考問題”。Kneron 的這一突破,為行業提供了一種全新的 AI 解決方案,幫助企業更高效地利用 AI,創造更大的價值。
-
AI
+關注
關注
87文章
33264瀏覽量
273559 -
模型
+關注
關注
1文章
3448瀏覽量
49710 -
耐能
+關注
關注
0文章
32瀏覽量
10809 -
DeepSeek
+關注
關注
1文章
730瀏覽量
837
原文標題:突破性融合DeepSeek-R1訓練框架!Kneron AI實現行業芯片級思維鏈推理
文章出處:【微信號:KneronChina,微信公眾號:Kneron耐能】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
如何使用OpenVINO運行DeepSeek-R1蒸餾模型

RK3588開發板上部署DeepSeek-R1大模型的完整指南
行芯完成DeepSeek-R1大模型本地化部署
案例分享 ▏【瑞芯微RK3588】HZHY-AI300G智能盒部署DeepSeek-R1模型實戰指南

添越智創基于 RK3588 開發板部署測試 DeepSeek 模型全攻略
了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應用選擇
超星未來驚蟄R1芯片適配DeepSeek-R1模型
廣和通支持DeepSeek-R1蒸餾模型
deepin UOS AI接入DeepSeek-R1模型
芯動力神速適配DeepSeek-R1大模型,AI芯片設計邁入“快車道”!

評論