引言
大模型應用的春天來了。在人工智能的浪潮中,大模型正成為推動技術變革的核心力量。春節前,DeepSeek R1 的發布在全球范圍內引發了巨大轟動,它不僅在性能上與 OpenAI 的模型不相上下,更憑借其基于 CoT(Chain of Thought)的推理過程,展現出強大的邏輯能力,同時,開源和低成本的優勢,讓眾多企業迅速接入。DeepSeek 已然成為各行業關注的焦點,今年無疑是大模型應用爆發的關鍵一年。
一、大模型應用的爆發:為什么是2025?
技術的發展并非一蹴而就,而是經歷從萌芽到成熟,再到廣泛應用的過程。20多年前的PC互聯網和10多年前的移動互聯網的興起,都經歷了這樣的階段,如今,從周期和技術成熟度來看,AI大模型也正站在爆發的前夜。
DeepSeek R1 的出現,不僅展示了大模型的強大能力,更以開源和低成本的姿態,為更多企業和開發者提供了平等的機會。短短一個多月,國內眾多公司紛紛接入,甚至包括騰訊、阿里等行業巨頭。這種現象表明,大模型的應用已經具備了廣泛落地的基礎,從金融風控到投資決策,從智能家居到醫療輔助,大模型的應用場景正在不斷拓展。2025年,或許就是這場技術變革的“臨界點”。
二、大模型的應用價值:不只是“通用聊天”
很多人可能會問:既然 DeepSeek、ChatGPT 等聊天類App已經如此強大,為什么還要開發基于大模型的應用呢?原因主要有兩個方面:一是通用聊天應用雖然靈活,但在很多專業領域,普通用戶并不具備問正確問題的能力;二是大模型推理需要基于場景的相關數據,通用聊天工具從互聯網搜索到的數據,可能不全或者不準確,在醫療、投資等大部分專業領域需要準確數據的場景,并不可靠。
在當下的技術發展階段,大模型尚未真正具備智能,其核心價值在于卓越的數據處理能力。這種能力在眾多專業領域中展現出巨大的潛力,能夠顯著提升工作效率。以醫療領域為例,大模型能夠基于患者的病歷、檢查報告、生理數據等多維度信息,快速進行病情分析和輔助診斷,為醫生提供精準的決策支持。在投資領域,它也能迅速獲取市場動態數據,完成基本面與技術面的深度分析,為投資者提供科學的決策參考。這些應用場景充分證明,大模型的價值遠不止于簡單的“聊天”。
三、做好大模型應用的關鍵:四大要素
過去兩年,我們在積極探索大模型的應用過程中:從營銷運營領域的熱搜機器人、到 Coding 領域的 JoyCoder,金融科技領域從社區的熱點話題生成、到基金/保險產品解讀。DeepSeek R1 的出現,讓我們更加意識到,目前的應用還非常初級,只是有,離好還有很大的差距和空間。基于過往的這些場景探索,大模型應用要取得更好的效果,我們認為需要綜合考慮以下4大要素:好的效果 = 大模型 + 專業知識 + 知識庫 + 工程架構。
(1)專業知識和交互設計:讓大模型“容易使用”
DeepSeek 等通用聊天類App雖然簡單,但要用好的話往往需要用戶具備專業知識,看似普惠,事實上門檻比較高,交互體驗也不夠便捷。例如在投資領域,普通用戶可能并不知道該問什么問題,如果只是問“今天的市場行情怎么樣,這只股票是買入還是賣出”,大模型并不能給出能賺到錢的答案。而稍有一些投資經驗的人,可以問“分析一下滬深300指數的技術面,時間從2021年到現在,從形態、均線、趨勢等看走勢是反彈還是反轉,并用MACD、背離、量能等交叉確認”等更復雜的問題。如果涉及到更具體買賣決策和調倉建議,可能需要更加深入和專業的問題。
此外,交互不夠便捷也是一大問題。用戶需要組織語言、打字輸入,還要在聊天工具和具體的如券商的App之間來回切換,體驗較差。今日頭條等之所以能取代門戶網站,正是因為其在交互上體驗更好。因此,交互設計和專業知識的結合是大模型應用成功的關鍵,場景化的AI是探索的一個方向。
(2)領域知識庫和搜索能力:讓大模型“有據可依”
問準確的問題還不夠,還需要有充分的上下文信息以及準確獲取的能力。首先,信息的及時、準確和豐富至關重要。大模型是神經網絡,仿照大腦的原理構建,可以看作一個看完了互聯網上所有數據的超級專家。就像讓醫生看病或操盤手交易,需要告知其“病情”或“行情”才能開展工作,信息越及時和全面,專家的決策就越準確、可靠。
DeepSeek App 雖然具有聯網能力,能在回答問題前搜索相關信息,但搜索回來的數據可能存在問題,如數據過期或數據較少,導致推理結果不夠準確。比如下圖案例,做出推理結論而引用的數據4和6是過期的,導致看起來完美的推理邏輯也是無法用的。企業要想用好大模型,必須建立本地知識庫,確保數據的數量和質量。在 DeepSeek 這類大模型開源后,算法已經平權,企業之間的競爭又回到了數據這個生產力要素。
?
其次,高效準確地獲取數據也極為關鍵。即使知識庫建的很大、很豐富,搜索能力也至關重要,這是百度、谷歌等深耕多年的能力,技術門檻比較高,要做好并不容易。知識庫本身的架構,訪問權限設計,以及各種RAG技術,都極為關鍵。(圖片來自于網絡)
?
(3)Agent架構與工程能力:讓大模型“激發潛能”
對于簡單問題,大模型可以通過一輪對話給出答案;而對于復雜問題,如買一張去西藏的便宜機票,或判斷中證A500指數基金什么時候買,則需要更加復雜的設計,如果能更好地組織和引導,類似于人類的頭腦風暴和專家討論,把多個專家的智力都激發出來,就有可能找到更好的解決方案。
大模型是一個待機的超級專家,提供簡單的API供應用隨時調用,如何面向大模型編程,激發其潛力需要研發人員的精心設計,目標是大模型成為真的“大腦”,取代原來預設的業務流程,策略引擎和流程編排工具,讓應用具備自主智能。通過Agent架構,甚至多Agent(智能體)交互,可以引導大模型進行多輪交互和邏輯推理,從而獲得更準確的結果,工具/MCP,記憶,規劃、思維鏈、反思等架構和設計模式,需要持續探索應用。(圖片來自于網絡)
?
(4)大模型自身:“選擇比擁有更重要”
大模型是整個應用的核心部件,當然是最重要的。但從應用開發的角度來看,選擇合適的大模型并靈活切換更為關鍵,應用系統的架構,需要更加靈活的支持多個大模型。DeepSeek R1的成功表明,大模型在持續的競爭和迭代,另外,不同大模型在不同領域的潛質也不一樣,就像有些人擅長科學,有些擅長經商,有些擅長音樂,多Agent系統中,每個Agent可以使用不同的大模型。未來,大模型的市場競爭將更加激烈,選擇比擁有更重要。
四、大模型的未來:探索與展望
DeepSeek R1 是終點嗎?當然不是。Transformer 是實現 AGI(通用人工智能)的終極算法架構嗎?估計也不是。吳軍、楊立琨、王興興等專家都曾提出過類似的觀點:盡管Transformer架構在自然語言處理等領域取得了巨大突破,但它并非萬能。未來仍有可能出現更強大的算法,推動人工智能邁向新的高度。
數據真的已經用完了嗎?應該也不是。人類在學習和沉淀規律時,從來不僅僅是依賴過往的書本知識。從開普勒三大定律到牛頓力學,這些偉大的科學發現,都是通過對現實世界中的數據進行獲取、分析和總結得出的。無論是日月星辰的運行軌跡,還是潮起潮落風云變幻,亦或是粒子撞擊的微觀過程,甚至是人類自身的脈搏跳動,只要通過攝像機、傳感器等工具進行捕捉,就能從這些更廣泛、更豐富的自然界獲取數據。這些數據,或許將成為未來人工智能發展的重要“養料”,為模型的訓練和優化提供新的思路和方向。
除了算法和數據,大模型的未來發展還需要強大的算力。量子計算或許是解決這一問題的關鍵方案。哦,還有能源問題,小時候看《變形金剛》,一直不理解他們為什么整天爭奪“終極能源”,未來當硅基生命充滿大地和天空的時候,能源問題或許將成為制約技術發展的關鍵瓶頸。
這一天,或許終將會到來。
審核編輯 黃宇
-
人工智能
+關注
關注
1804文章
48717瀏覽量
246540 -
大模型
+關注
關注
2文章
3029瀏覽量
3830 -
DeepSeek
+關注
關注
1文章
775瀏覽量
1346
發布評論請先 登錄
一文匯總大數據四大方面十五大關鍵技術
了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應用選擇
添越智創基于 RK3588 開發板部署測試 DeepSeek 模型全攻略
健身俱樂部管理:會員滿意度提升四大關鍵
健身俱樂部管理:會員滿意度提升四大關鍵
LED四大關鍵詞與四大疑問
傳感器遍布全球的四大關鍵需求
Gartner: 2010年及未來四大關鍵趨勢及預測
芯海科技亮相CCHF,闡述智慧健康產業四大關鍵詞
工業4.0四大關鍵決定未來20年制造業的趨勢

哈曼國際:物聯網服務四大關鍵領域的領導者
動力電池四大關鍵材料市場形勢分析
信息分類編碼系統 四大關鍵點進行詳細介紹

富士通發布最新全球調查,闡述可持續轉型成功的四大關鍵要素

評論