在當前水利行業(yè)中,水利部各業(yè)務處室根據(jù)自身職能需要,保存了大量的歷史業(yè)務數(shù)據(jù)。這些數(shù)據(jù)涵蓋工程規(guī)劃、運行管理、調度方案等,形式包括PDF影印本、Word文檔、Excel表格等,記錄了豐富的專業(yè)知識與實踐經(jīng)驗。然而,由于這些數(shù)據(jù)分散存儲在不同的業(yè)務系統(tǒng)、處室本地存儲設備以及業(yè)務人員的個人電腦中,導致缺乏統(tǒng)一的管理和歸集;同時,現(xiàn)有的存儲方式使得數(shù)據(jù)的獲取和利用較為復雜,難以實現(xiàn)一站式查詢和系統(tǒng)化應用;此外,隨著數(shù)據(jù)規(guī)模的增長和時間的推移,部分數(shù)據(jù)的價值未能被充分挖掘,潛藏的規(guī)律和關聯(lián)信息也未被有效利用。
數(shù)據(jù)存儲分散,難以統(tǒng)一管理
各業(yè)務處室數(shù)據(jù)存儲在獨立的系統(tǒng)或分布于業(yè)務人員的本地設備中,缺乏統(tǒng)一的存儲標準和管理規(guī)范。這種分散化的存儲方式導致數(shù)據(jù)孤島現(xiàn)象嚴重,無法快速整合和調用。
數(shù)據(jù)查詢效率低,耗時費力
在需要系統(tǒng)查詢或調用資料時,通常需要協(xié)調多個處室和業(yè)務人員提供數(shù)據(jù)。各處室和人員需要花費時間定位、整理和分享數(shù)據(jù),不僅耗時,還容易因遺漏或錯誤導致數(shù)據(jù)不完整。
數(shù)據(jù)格式多樣,難以直接利用
由于歷史原因,數(shù)據(jù)主要以PDF影印本、Word文檔和Excel表格等形式存儲,缺乏結構化處理。這種非結構化數(shù)據(jù)無法直接用于高效分析和計算,數(shù)據(jù)應用效率不足。
業(yè)務決策缺乏數(shù)據(jù)支撐
數(shù)據(jù)利用效率低,直接影響到水利業(yè)務的決策和管理,無法及時獲取完整、準確的數(shù)據(jù)資料,導致決策速度和質量受到限制,降低了行業(yè)運轉效率。
華為聯(lián)合中圖科信共同打造安全可信的 “小水庫”智能知識庫
華為聯(lián)合行業(yè)伙伴中圖科信基于水利部歷年來水情年報、洪水預報方案和小水庫調度方案等歷史數(shù)據(jù)資源,共同打造安全可信的 “小水庫”智能知識庫。該知識庫以行業(yè)信息化升級為核心目標,依托鯤鵬服務器和中圖科信研發(fā)的知識庫模型,利用先進的自然語言處理(NLP)、表格解析以及圖形識別等技術手段,逐一解析并提取有價值的信息。在文本數(shù)據(jù)中可提取關鍵術語、專業(yè)定義、操作步驟及相關知識點;在表格數(shù)據(jù)中,可識別關鍵指標、關聯(lián)參數(shù)及其上下文關系;而在圖表中,可分析圖形趨勢、數(shù)據(jù)分布規(guī)律及隱含的專業(yè)知識,使得這些歷史資料迅速發(fā)揮價值,華為提供鯤鵬服務器、集中式存儲、高速網(wǎng)絡等能力。
系統(tǒng)性數(shù)據(jù)采集與處理
借助人工智能技術,整合各業(yè)務處室現(xiàn)有的存量文檔、技術資料和方案文件等數(shù)據(jù),建立統(tǒng)一的數(shù)據(jù)采集與處理機制。通過統(tǒng)一的數(shù)據(jù)導入和解析模塊,實現(xiàn)對分散數(shù)據(jù)的集中化管理,保障數(shù)據(jù)的完整性和高效性,為后續(xù)的數(shù)據(jù)挖掘和利用奠定基礎。
文本數(shù)據(jù)的自然語言處理(NLP)解析
對文本數(shù)據(jù)進行專業(yè)化解析,通過NLP技術提取關鍵術語、水利行業(yè)專有名詞、業(yè)務邏輯和操作步驟等內容,生成結構化知識條目。同時,能夠自動識別文本中的專業(yè)定義、關鍵決策點和技術要點,為知識管理和智能查詢提供有力支持。
表格數(shù)據(jù)智能解析功能
運用表格解析技術,對存量表格文件進行智能識別和分析,提取關鍵指標、關聯(lián)參數(shù)以及上下文關系。例如,從表格中提取水位/流量數(shù)據(jù)、工程指標等,并將其關聯(lián)到相關業(yè)務場景或決策模塊中,提升數(shù)據(jù)的直觀性和使用效率。
圖表數(shù)據(jù)模式分析與知識挖掘
針對圖表數(shù)據(jù),通過圖形識別技術分析其數(shù)據(jù)趨勢、分布規(guī)律以及可能的隱含知識。具體來說,可解讀折線圖的變化趨勢,從中挖掘真實業(yè)務數(shù)據(jù)的潛在規(guī)律和指導性信息。
多模態(tài)數(shù)據(jù)協(xié)同解析
將文本、表格和圖表數(shù)據(jù)聯(lián)動解析,形成多模態(tài)的綜合分析能力。例如,通過解析表格中的數(shù)值數(shù)據(jù),與文本中的描述性內容建立關聯(lián),驗證圖表中展示的規(guī)律是否符合實際業(yè)務背景,從而提高數(shù)據(jù)分析的準確性與全面性。
智能化知識構建與管理
將解析后的有價值信息進行分類、清洗和結構化存儲,構建行業(yè)知識庫和知識圖譜,實現(xiàn)對水利行業(yè)專業(yè)知識的系統(tǒng)性管理。知識庫不僅支持查詢和引用,還能夠為復雜的業(yè)務場景提供關聯(lián)性建議和智能化支持。
提升數(shù)據(jù)利用效率與決策支持能力
借助解析結果,解決分散數(shù)據(jù)難以利用的問題,實現(xiàn)數(shù)據(jù)的高效調取與知識共享。通過深度挖掘隱性知識,生成智能化的分析報告或業(yè)務決策建議,為水利行業(yè)的管理和調度提供強有力的數(shù)據(jù)支撐。
實現(xiàn)數(shù)據(jù)的高效處理和智能分析,助力水利部打通現(xiàn)有業(yè)務場景協(xié)同
歷史業(yè)務數(shù)據(jù)集中管理
實現(xiàn)對各業(yè)務處室分散存儲的歷史數(shù)據(jù)的統(tǒng)一管理,通過集中化、結構化的處理,解決數(shù)據(jù)孤島問題,為數(shù)據(jù)分析和決策提供基礎支撐。數(shù)據(jù)集中覆蓋率達95%以上,數(shù)據(jù)交互效率提升50%以上。
數(shù)據(jù)內容的可查詢和可檢索
整合并規(guī)范不同格式的歷史數(shù)據(jù)后,業(yè)務人員可通過關鍵詞、模糊查詢或條件過濾快速定位目標信息,激活數(shù)據(jù)的潛在價值。單次查詢時間從平均15分鐘縮短至2分鐘以內,數(shù)據(jù)查詢成功率超過90%,單位時間內可支持的查詢任務數(shù)量增加3倍。
激活非結構化數(shù)據(jù)
借助AI技術將PDF影印本、Word文檔等非結構化數(shù)據(jù)轉化為結構化信息,賦予業(yè)務數(shù)據(jù)新的生命力。其中,非結構化數(shù)據(jù)轉化率達到90%以上,數(shù)據(jù)提取準確率超過90%。
跨模態(tài)數(shù)據(jù)檢索能力提升
通過對圖表、表格和文本的多模態(tài)數(shù)據(jù)解析,實現(xiàn)復雜數(shù)據(jù)的高效檢索和發(fā)現(xiàn)。跨模態(tài)檢索技術打破了傳統(tǒng)系統(tǒng)中數(shù)據(jù)分散導致的查找效率低下問題。其中,數(shù)據(jù)檢索響應時間減少50%,數(shù)據(jù)相關性匹配準確率達到85%以上。
業(yè)務處理提質增效
通過AI驅動的智能解析與管理,將以往費時費力的數(shù)據(jù)查找和整理過程轉化為自動化、智能化流程,釋放人力資源,提升工作效率。數(shù)據(jù)處理效率提高70%,人力投入減少30%以上,同時業(yè)務成果質量提升。
激發(fā)數(shù)據(jù)價值,為決策賦能
系統(tǒng)性地挖掘和利用歷史業(yè)務數(shù)據(jù),建立水利行業(yè)知識庫,為關鍵業(yè)務決策提供可靠的依據(jù),從而增強決策的科學性和及時性。決策所需數(shù)據(jù)準備時間減少60%,數(shù)據(jù)支撐的業(yè)務場景覆蓋率提升到85%以上。
未來,華為將依托根技術創(chuàng)新,聯(lián)合伙伴深耕水利行業(yè)場景,助力數(shù)字孿生水利建設,扎實推動水利高質量發(fā)展,提升國家水安全保障能力。
-
華為
+關注
關注
216文章
35200瀏覽量
255808 -
服務器
+關注
關注
13文章
9786瀏覽量
87900 -
鯤鵬
+關注
關注
1文章
142瀏覽量
9219
原文標題:鯤鵬助力水利部構建 “小水庫”智能知識庫
文章出處:【微信號:HWS_yunfuwu,微信公眾號:華為數(shù)字中國】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
【「零基礎開發(fā)AI Agent」閱讀體驗】操作實戰(zhàn),開發(fā)一個編程助手智能體
中汽信科牽頭成立汽車北斗應用聯(lián)合實驗室
AI知識庫的搭建與應用:企業(yè)數(shù)字化轉型的關鍵步驟
科大訊飛攜手西安鐵路局打造人工智能平臺
研華KB Insight智能知識管理工具加速工業(yè)智能化
《AI Agent 應用與項目實戰(zhàn)》閱讀心得3——RAG架構與部署本地知識庫
技術融合實戰(zhàn)!Ollama攜手Deepseek搭建知識庫,Continue入駐VScode

如何從零開始搭建企業(yè)AI知識庫?
用騰訊ima和Deepseek建立個人微信知識庫

DeepSeek從入門到精通(2):0成本用DeepSeek(滿血版)搭建本地知識庫

基于華為云 Flexus 云服務器 X 搭建部署——AI 知識庫問答系統(tǒng)(使用 1panel 面板安裝)

華為云 Flexus 云服務器 X 實例之 openEuler 系統(tǒng)下搭建 MaxKB 開源知識庫問答系統(tǒng)

騰訊ima升級知識庫功能,上線小程序實現(xiàn)共享與便捷問答
華為云、上海鈞達數(shù)科 發(fā)布區(qū)塊鏈數(shù)據(jù)要素聯(lián)合解決方案

評論