金融行業被廣泛認為是AI大模型技術落地的前哨站,也是“人工智能+”行動的焦點所在。面向金融場景廣泛、多樣化的大模型需求,度小滿軒轅系列全新發布了12款金融大模型。其中包括6B、13B、70B參數的基座模型、對話模型、int4/int8量化模型,并且實現了完全開源,供廣大開發者下載使用。
總體來看,12款金融大模型包括3種參數。2023年5月,度小滿開源了國內首個千億級中文金融大模型“XuanYuan-176B”。2023年9月,“XuanYuan-70B”大模型在C-Eval和CMMLU兩大權威榜單上位列所有開源模型榜首。本次度小滿“軒轅”模型矩陣再次升級,十億-百億-千億參數全覆蓋,實現多場景任務適配。
而從效果上看,度小滿軒轅達成了18大維度金融實戰能力遙遙領先,多場景6B模型與72B模型表現相當;通用能力同樣達到開源模型TOP水平,看齊GPT-4,并且采用了獨創的數據處理流水線,生產更豐富、更安全、更符合中文場景的數據。通過首次將人類偏好對齊引入金融垂域大模型訓練,相關模型實現了安全性顯著提升、有用性突破瓶頸、金融任務表現明顯增強 。
讓我們來走進度小滿軒轅,透視金融領域的大模型變革。
度小滿「軒轅」大模型:全參數矩陣
![wKgZomXvBWmAIjL5AAC0QbbZoC4267.jpg](https://file1.elecfans.com//web2/M00/C3/DF/wKgZomXvBWmAIjL5AAC0QbbZoC4267.jpg)
(度小滿軒轅大模型發布時間軸)
度小滿軒轅系列已經有17款開源大模型,適配廣泛場景任務,滿足不同開發者需要。
![wKgaomXvBWqAODvoAADv-8gMgUg452.jpg](https://file1.elecfans.com//web2/M00/C4/CC/wKgaomXvBWqAODvoAADv-8gMgUg452.jpg)
(度小滿軒轅大模型矩陣)
模型矩陣的設計考慮了不同的應用場景和性能要求:70B及以上的模型專門針對需要深度分析、復雜指令執行以及全方位Agent調用的場景,而6B、13B的模型則更加適用于對響應速度有高要求、面向小規模場景和單任務的應用,它們也同樣能夠處理計算、編程、創作等一系列通用需求。特別地,最小化的XuanYuan-6B-4-bit量化Chat模型以其低推理部署成本,進一步降低了大模型的應用門檻。
模型效果:18大維度金融實戰能力遙遙領先
01金融能力
將軒轅系列大模型在金融自動評測集FinanceIQ測試集上進行測試,FinanceIQ涵蓋了注冊會計師(CPA)、稅務師、經濟師、銀行從業資格、基金從業資格、證券從業資格、期貨從業資格、保險從業資格(CICE)、理財規劃師等十大權威金融領域考試。結果如下表,XuanYuan-70B-V2在該項評測任務上擁有超過GPT-4的水平,在知識層面展示出金融領域專家的水平。
同時,為了考察軒轅大模型在金融實際任務上的能力,軒轅團隊還特別組織了金融專家為對話大模型進行人工評測。任務的設計均是從金融行業實際應用場景出發,去判斷軒轅是否在各項金融任務上具備“實戰能力”。
![wKgZomXvBWuAJ-jYAADz_UHwVVU390.jpg](https://file1.elecfans.com//web2/M00/C3/DF/wKgZomXvBWuAJ-jYAADz_UHwVVU390.jpg)
(人工金融評測集任務構成)
最終結果顯示,軒轅大模型各個參數上均具有“以小搏大”的實力,達到自己2倍甚至5倍參數量的模型水平。在各項金融評測任務上,XuanYuan-6B表現超越市面最新13B中文開源模型(左圖),XuanYuan-13B表現超越市面最新72B中文開源模型(中圖),XuanYuan-72B-V2表現可以媲美GPT4(右圖),并且在金融法規、金融產品信息等中文場景上超越。
![wKgaomXvBWuATqMFAAFiRP5fBts125.jpg](https://file1.elecfans.com//web2/M00/C4/CC/wKgaomXvBWuATqMFAAFiRP5fBts125.jpg)
(軒轅擁有遠超同參數水平的金融能力)
02通用能力
將軒轅大模型在MMLU、CEVAL、CMMLU、GSM8K、HumanEval等中外主流評測集上進行評測,觀察大模型在知識、邏輯、代碼等通用能力上的表現。同時加入類似參數矩陣的LLaMA2系列進行比較,結果顯示軒轅不同參數大模型在各項榜單成績上均有優異表現,在CMMLU、C-Eval等多個中文評測榜單上,更是有超越GPT-4的水準。
進一步分析發現,經過專門優化以增強考試能力的XuanYuan-6B和XuanYuan-13B模型,在C-Eval和CMMLU這兩個中文考試評測指標上有了顯著提升。然而,需要注意的是,“高分”并不意味著“高能力”。評測集成績可通過優化模型考試能力來提升,不直接等同于模型在實際應用中的優勢。因此,盡管小參數模型在某些評測中表現出色,這并不意味著它們的各方面真實能力均超越了同系列大參數模型。
![wKgZomXvBW6AQMu9AADp6ysui6k450.jpg](https://file1.elecfans.com//web2/M00/C3/DF/wKgZomXvBW6AQMu9AADp6ysui6k450.jpg)
(軒轅大模型在各個評測集上的分數)
「軒轅」技術解析:對齊技術突破能力瓶頸,面向公眾開放自動化訓練框架
度小滿軒轅大模型團隊在過去一年,對大模型訓練的各個環節積累了豐富的經驗。這包括建立了一套完整的數據處理流水線、采用更適配領域模型的高效訓練方法等,以及本次突破性的利用人類偏好對齊技術,極大地提升了6B、13B、70B模型的對話能力,顯著增強了模型的場景適應性。
軒轅系列大模型使用DeepSpeed分布式訓練框架,引入動態評估與調整機制以優化訓練過程。在微調階段,軒轅特別的采用了Self-QA策略來收集指令微調數據。該方法能夠在沒有人工標注的情況下生成大量高質量的問答數據,為模型提供有監督的訓練樣本,有效提升模型的學習效率和質量。
![wKgaomXvBW6ADi9lAABpQJ7EIVY781.jpg](https://file1.elecfans.com//web2/M00/C4/CC/wKgaomXvBW6ADi9lAABpQJ7EIVY781.jpg)
(軒轅大模型Self-QA數據構造方法)
針對金融領域的特定需求,軒轅大模型還開發了一種混合微調訓練框架,旨在通過融合通用與特定領域數據來增強模型性能及適應性。這種混合微調方法不僅顯著提高了模型在特定任務的表現,也增強了其整體的泛化能力和適應性,為金融領域任務的性能提升開辟了新途徑。
度小滿創新地在金融領域大模型中引入了人類偏好對齊技術,開創了領域內強化對齊訓練的先河。通常,領域大模型僅在微調階段引入特定領域數據,但這種方法在實際應用中常常顯示出局限性。金融行業的復雜性要求模型能夠更深入地理解并適應行業特定的需求,而強化對齊訓練有助于突破僅依靠微調所能達到的性能瓶頸。
軒轅團隊精心構建了涵蓋通用性、安全性和金融特性的Prompt數據集,并組織了專業的標注團隊對成對的回答進行偏好標注。接下來,團隊通過一系列實踐、分析和改進,成功完成了獎勵模型(Reward Model)和后續的強化(采用近端策略優化算法)訓練。下圖以XuanYuan-6B為例展示了模型在通用性和金融能力的綜合評估結果。從圖中可以看出,在兩個領域,經過人類偏好對齊后,模型的能力都有了極大的提升,證明了強化對齊訓練的有效性。
![wKgZomXvBW6AAQTOAAA-vMIkB-Q331.jpg](https://file1.elecfans.com//web2/M00/C3/DF/wKgZomXvBW6AAQTOAAA-vMIkB-Q331.jpg)
(RLHF-model vs SFT-model)
![wKgaomXvBW-AOn0hAACKEVPWOMg177.jpg](https://file1.elecfans.com//web2/M00/C4/CC/wKgaomXvBW-AOn0hAACKEVPWOMg177.jpg)
(通用能力:RLHF-model vs SFT-model)
![wKgZomXvBW-AXXK9AAB9jXqdbfc509.jpg](https://file1.elecfans.com//web2/M00/C3/DF/wKgZomXvBW-AXXK9AAB9jXqdbfc509.jpg)
(金融能力:RLHF-model vs SFT-model)
度小滿軒轅大模型團隊一向貫徹開源開放的原則。為了讓廣大開發者能夠更容易的上手使用大模型,使用真實數據和真實代碼作為示例,詳細介紹了訓練模型的每個關鍵步驟。現在相關代碼已經上傳開源社區,供廣大用戶實操體驗。
金融行業需要怎樣的大模型?
金融領域對大模型的要求遠超過基本的“判斷”與“生成”能力,更加強調在“分析”與“決策”過程中的高級能力,這些能力是觸及金融企業核心利益的關鍵。大模型的價值體現在其能否在核心業務場景中發揮實際作用,如通過綜合分析用戶信息以支持風險評估、客戶畫像繪制、精準營銷策略,或通過企業數據分析支持財務審查、智能投顧和行業研究。
金融大模型的最終目標是提高企業ROI。這意味著,高效的金融大模型應當能夠在實際應用中,如客服場景,通過提升對話處理、指令遵循和意圖理解能力,不僅短期內提高客服效率,長期還可能實現機器人客服的全面替代,重塑客戶服務流程,推動金融服務向更高智能化水平邁進。
結束語:關于度小滿「軒轅」大模型
度小滿軒轅大模型系列具有以下特色:
· 多尺寸開源,開發者友好。
· 擁抱開源,免費下載使用。
· 版本快速迭代,社區持續更新。
· 持續面向金融行業伙伴交流共建。
在今年的政府工作報告中,提出了“大力發展科技金融、綠色金融、普惠金融、養老金融、數字金融”。在這樣的宏觀背景下,AI大模型落地金融場景,為行業帶來全新的智能化發展機遇,是金融行業本身的發展意愿,也是“新質生產力”的客觀要求。
作為“實戰派”的度小滿軒轅,已經應用在金融領域的各個業務場景,并且初見成效。未來,度小滿軒轅會成為金融行業的一個支點,為更多智能化探索打開大門。
欲知“軒轅”大模型詳情,可移步Github官網。
-
AI
+關注
關注
87文章
31536瀏覽量
270343 -
人工智能
+關注
關注
1796文章
47683瀏覽量
240301 -
大模型
+關注
關注
2文章
2551瀏覽量
3171 -
AI大模型
+關注
關注
0文章
320瀏覽量
349
發布評論請先 登錄
相關推薦
魔視智能受邀參加2024軒轅年度盛典
鯨啟智能機器人入選多項金融銀行機器人行業報告
![鯨啟智能機器人入選多項<b class='flag-5'>金融</b>銀行機器人<b class='flag-5'>行業</b>報告](https://file1.elecfans.com//web3/M00/00/DB/wKgZPGdOpfCAeQFzAAJSh_LEZ-s536.png)
軒轅智駕榮獲硬科技創新先鋒企業獎
國產工控機驅動金融行業發光發大,賦能金融領域的穩定與創新
“小滿”V24.10源代碼在AtomGit開源
百度智能云推出“千帆行業增強版”
商湯科技與海通證券攜手發布金融行業首個多模態全棧式大模型
商湯科技聯合海通證券發布業內首個面向金融行業的多模態全棧式大模型
![商湯科技聯合海通證券發布業內首個面向<b class='flag-5'>金融</b><b class='flag-5'>行業</b>的多模態全棧式大<b class='flag-5'>模型</b>](https://file1.elecfans.com/web2/M00/DA/DA/wKgZomYrCEGAc_VKAABtsmX0TsI712.png)
AI快訊:華為助力金融行業加速擁抱AI 馬斯克xAI 展示首個多模態模型
華為發布金融AICC智能云聯絡中心解決方案2.0,賦能全球金融行業
![華為發布<b class='flag-5'>金融</b>AICC智能云聯絡中心解決方案2.0,賦能全球<b class='flag-5'>金融</b><b class='flag-5'>行業</b>](https://file1.elecfans.com//web2/M00/C3/AC/wKgaomXnG1KAAqKOAAELBMPqjs8431.jpg)
評論