DeepSeek的橫空出圈,仿佛重現了兩年前ChatGPT風靡全球的盛況。其開源策略和低成本的模式,正推動人工智能迎來一波新的發展浪潮。卓越模型能力的背后,DeepSeek在技術上有哪些創新?它又將如何改變我們的生活和產業?
2月15日,訊飛開放平臺攜手Datawhale、城西大走廊高聯會在位于杭州的浙江大學校友企業總部經濟園舉辦了2025年開發者TALK首站活動。來自訊飛開放平臺以及行業、研究機構的技術專家們,揭秘DeepSeek核心技術、分享DeepSeek精調方法和應用構建,為線上線下4000+開發者帶來了一場干貨滿滿的分享。
全方位模型服務,助力開發者應用創新
自2022年大模型發布以來,大模型應用呈現爆發式增長,逐步邁入“深水區”,與場景的結合也愈發緊密,行業內逐步形成共識:通用模型+專有云模型才能更好地解決場景問題。
目前,大模型應用主要是模型能力+數據,能力有通用能力與定制能力,數據有通用數據與個性化數據。例如,AI+代碼是典型的“通用能力+通用數據能力”簡單組合;AI+會議是“通用能力+個性化數據”簡單組合。未來大模型更好地進入企業一定是定制能力+個性化數據的多能力復雜組合。而未來大模型開發的機會在:模型能力定制化、產品能力復雜化、數據能力個性化。訊飛星辰MaaS平臺總監張林芳在《訊飛星辰MaaS平臺模型定制到智能體構建》主題分享中表示。
應對模型能力定制化需求,訊飛發布的星辰MaaS平臺,提供包含數據構建、模型選型、精調訓練、效果評估、大模型云+端托管以及數據回流的成熟精調流水線,助力開發者高效完成效果定制,構建數據飛輪,持續推進大模型迭代。其中,在模型選型上,星辰MaaS平臺秉承開放理念,支持星火+主流開源的36個模型精調,開放人設、醫療等場景模型精調。近期,已經業界首發了DeepSeek全系模型精調,推理API限時免費,支持獨享部署,即銷即用。
應對產品能力組合復雜化需要,訊飛發布了星辰智能體應用開發平臺。星辰智能體應用開發平臺以MoM混合應用架構為核心,提供從應用開發到測試、優化一整套大模型應用開發工具鏈。支持訊飛1+N模型,開源優質DeepSeek模型,和所有微調模型組合構建應用。面對硬件產品接入大模型遇到的業務需求、開發技術棧、軟硬環境等問題,星辰智能體應用開放平臺提供了專門的SDK開發框架,讓開發者專注于硬件產品創新,用最短路徑實現產品成功。
應對數據能力個性化需求,訊飛則首發了混域搜索技術,支持個人私域知識,企業知識庫以及IT系統私域知識,和互聯網信息進行統一的搜集分析,形成大模型外掛知識。通過這套技術,知識召回準確率提升30%,長文本知識融合準確率提升40%,句子級知識溯源準確率達90%。
從R1-Zero到R1,揭秘DeepSeek核心技術
DeepSeek展現出的強大推理能力,讓人震驚的同時,也讓許多開發者對其背后的技術細節充滿興趣。它在技術上有哪些突破?哪些是站在前人的肩膀上優化的?哪些是自己的原創創新?在現場,Datawhale Hugging LLM開源項目負責人長琴深度剖析了DeepSeek的核心技術點,期望能為開發者研究大模型帶來啟發。
首先是基于純規則強化學習的DeepSeek-R1-Zero,不僅在訓練過程中展現出的思考和自我反思能力,使語言模型更接近人類的思維方式,而且效果還不錯。當然,瑕疵是語言混合和可讀性不友好。緊跟著就是兩個問題:少量高質量數據SFT后能否讓后續的RL效果進一步變好?模型能否同時兼容推理和通用模式?R1通過先用少量高質量數據SFT模型作為R1-Zero的起點(冷啟動),然后使用R1-Zero的RL方法(增加了語言一致性,讓結果更可讀)訓練得到的模型來生成高質量數據,然后再做SFT和對齊,使得模型不僅在推理任務上表現出色,在非推理的常規任務上也取得了優異的效果。
DeepSeek-R1的相關技術研究也給開發者帶來諸多啟示。比如Oat-Zero的相關研究發現強化學習(RL)能將Base的表面自我反思轉化為有效自我反思,但是長度并不一定增加,而且Base模型也會Aha Moment;再比如DeepScaleR的相關研究中發現強化學習(RL) 縮放也可以表現在小模型 (1.5B) 中,高質量的SFT+RL結合能達到更好效果;再比如LIMO、s1等相關研究中發現 少量SFT(1000條)同樣可以激活推理能力;以及模型越大越新越好、無論Instruct還是Base模型都可以驗證R1-Zero等。長琴在分享中提到。
AI驅動科研范式變革,開啟新的大航海時代
從藥物研發到農業育種,從氣象預測到海洋智能預報,AI正在改變人類進行科學研究的方式。2024年的諾貝爾物理學獎、化學獎都頒給AI領域,再次將AI推到了科學舞臺的中央,標志著AI在科學研究中的重要地位得到了認可。
AI For Science的典型案例就是蛋白質折疊模型AlphaFold。傳統方法每年只能解析少量蛋白質結構,Alphafold已經預測了超過2億種蛋白質結構,推動了生命科學的巨大進步,已擁有來自190個國家的200多萬用戶。以此模型為基礎,對于科研設備、科學人員、科學數據和科學流程都有很大的幫助。之江實驗室助理研究員張驥在分享中舉例說。
AI正在開啟人類科學發展新的大航海時代。張驥認為,在AI驅動科學范式變革方面,模型、數據、算力是關鍵因素。
在科研領域,中國科學院文獻情報中心與科大訊飛股份有限公司共同研發的基于科技文獻大模型的智能知識服務平臺——星火科研助手,幫助研究人員對文獻進行深度解讀、提煉,提升科研效率。累計服務科研用戶9.3萬人,功能調用次數240萬次+,用戶覆蓋全國1300多所高校。用戶可在訊飛星火APP/網頁端搜索“星火科研助手”體驗。
融合行業場景,生成式AI驅動機器人行業變革
陸地、隧道、天上、水里,各類形態的智能機器人正在不同行業應用,尤其是在工業領域,機器人不僅能保障人員安全,還可大大提高工作的效率和準確性。生成式AI技術的出現也為機器人行業帶來了根本性變化。
從ANI(狹義人工智能)和AGI(通用人工智能)的區別出發,申昊科技算法工程師鄭程睿介紹了公司在故障檢測、數字孿生、醫院查房機器人和人形機器人四款應用上,進行的大模型技術探索。以檢測輸電塔是否有鳥巢為例,因為物理場景數據很稀少,運用無人機逐個進行拍照成本過高,而利用少量圖片訓練Stable Diffusion和LoRA模型生成多樣化的圖像,則可以做到降本增效。
對于具身智能未來的發展,鄭程睿認為,當前具身智能的發展仍處于初級階段,未來具身智能應該是兩種大模型:視覺語言動作模型和視覺語言導航模型,也可以與深度思考推理模型結合。
除了精彩的演講之外,本次活動還設置了AI面對面交流環節。與會開發者以分組的形式圍繞“DeepSeek的應用創新、大模型未來發展趨勢”等問題,與分享嘉賓進行了討論。
DeepSeek的爆火不僅從技術到產業帶來了一場前所未有的技術變革,也為開發者帶來了前所未有的機遇。現在,進入訊飛星辰MaaS平臺官網,通過DeepSeek精調服務,開發者即可在極短時間內(最快15分鐘)以超低成本(最低僅需數元)打造專屬定制模型,創建新的AI應用。
致力于通過前沿技術分享、優秀項目分享推介、面對面討論,為來自企業、高校、科研院所的開發者提供沉浸式學習與交流平臺。自2023年11月22日開啟第一站以來,開發者TALK在深圳、武漢、南京、成都等地留下足跡,鏈接了上千名開發者,幫助他們將想法變成了更多的創意和落地案例,推動人工智能產業繁榮。
AI技術的發展日新月異,2025年,開發者TALK將繼續舉辦多形式活動,聆聽開發者需求,幫助開發者便捷地將大模型技術應用在實際業務中。
-
訊飛開放平臺
+關注
關注
0文章
16瀏覽量
11574 -
大模型
+關注
關注
2文章
2697瀏覽量
3309 -
DeepSeek
+關注
關注
1文章
427瀏覽量
172
原文標題:揭秘DeepSeek核心技術與應用構建 | 開發者TALK開年首站落地杭州
文章出處:【微信號:訊飛開放平臺,微信公眾號:訊飛開放平臺】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
敏捷合成器的技術原理和應用場景
直接數字式頻譜分析儀的技術原理和應用場景
了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應用選擇
時域反射計的技術原理和應用場景
深入探討DeepSeek大模型的核心技術

評論