頻譜知識圖譜:面向未來頻譜管理的智能引擎
人工智能技術(shù)與咨詢 4天前
本文來自《通信學(xué)報》,作者孫佳琛等
1 引言
頻譜管理是指綜合運用行政、技術(shù)和工程等手段對電磁頻譜使用進(jìn)行籌劃、組織、協(xié)調(diào)和控制,以免用頻設(shè)備、系統(tǒng)及業(yè)務(wù)間的相互干擾[1]。早期的頻譜管理主要依靠人工制定頻譜政策、用頻規(guī)則,通過為用頻設(shè)備、系統(tǒng)和業(yè)務(wù)統(tǒng)一劃分頻段、指配頻率來實現(xiàn),適用于用頻需求有限、電磁環(huán)境相對簡單的情況。這種條塊分割的靜態(tài)管理模式側(cè)重計劃分配、被動響應(yīng),人工成本高,管理效率較低,時效性較差,難以適應(yīng)用頻需求的爆炸式增長及電磁環(huán)境的快速變化,還會導(dǎo)致頻譜使用不平衡、頻譜利用率較低等問題。
為解決上述問題,可以利用頻譜空穴來實現(xiàn)動態(tài)頻譜接入。認(rèn)知無線電是實現(xiàn)動態(tài)頻譜接入的關(guān)鍵技術(shù),它為未授權(quán)用戶或認(rèn)知用戶提供了以機(jī)會的方式與授權(quán)用戶共享無線頻譜資源的能力[2-3]。在部分頻譜已經(jīng)固定地劃分給授權(quán)用戶的情況下,認(rèn)知用戶可以對電磁環(huán)境進(jìn)行感知,檢測未被使用的頻譜(即頻譜空穴),估計信道狀態(tài)信息、預(yù)測信道容量,從中選擇最優(yōu)可用頻率并接入,與授權(quán)用戶實現(xiàn)頻譜共享。在此過程中,認(rèn)知用戶是被賦予了觀察、學(xué)習(xí)、適應(yīng)、決策等能力以及支持在不同頻率上收發(fā)信號的可重構(gòu)性[4]的智能體。這也為頻譜管理的智能化確立了“頻譜感知-頻譜決策-頻譜共享-頻譜移動”的主要框架[5]。
進(jìn)一步地,人工智能技術(shù)的蓬勃發(fā)展為頻譜管理模式的變革帶來了新的機(jī)遇[6],深度學(xué)習(xí)、群體智能、區(qū)塊鏈等新興技術(shù)在頻譜數(shù)據(jù)分析、控制信道分配、防欺騙決策等方面表現(xiàn)出優(yōu)越性,使頻譜機(jī)會發(fā)現(xiàn)和利用的能力不斷提升。具體而言,深度學(xué)習(xí)能夠從原始數(shù)據(jù)中自動解析出更加復(fù)雜的統(tǒng)計模型,如Yu等[7]基于深度學(xué)習(xí)長短期記憶模型挖掘并利用頻譜時間序列數(shù)據(jù)中的中長期頻譜特征,提升了頻譜預(yù)測的性能。群體智能理論與方法則能使分布式個體獨立行動并根據(jù)環(huán)境反饋自適應(yīng)地調(diào)整自身行為,所有個體互相協(xié)調(diào)耦合,最終形成自發(fā)連貫的系統(tǒng)智能[8]。Chen等[9]提出了一種基于群體智能的信道選擇算法,利用鄰居定時廣播消息作為信息素對認(rèn)知用戶常用信道的質(zhì)量進(jìn)行排序,通過僅基于局部信息的節(jié)點協(xié)作解決了認(rèn)知無線網(wǎng)絡(luò)中控制信道資源分配的問題。區(qū)塊鏈的去中心化存儲、分布式共識等關(guān)鍵技術(shù)使私有無線設(shè)備參與貢獻(xiàn)頻譜數(shù)據(jù)、實現(xiàn)頻譜可信安全共享成為可能。楊健等[10]將區(qū)塊鏈技術(shù)應(yīng)用到大規(guī)模超密集移動互聯(lián)網(wǎng)的頻譜共享中,將海量個人無線設(shè)備聯(lián)網(wǎng)構(gòu)成頻譜設(shè)備網(wǎng)絡(luò),定義“頻譜幣”作為設(shè)備采集頻譜數(shù)據(jù)的獎勵,并提出由感知節(jié)點共識融合、驗證節(jié)點共識驗證、簇頭節(jié)點共識確認(rèn)構(gòu)成的分布式共識機(jī)制。
頻譜管理正在經(jīng)歷從人工/手動到機(jī)器自動化/自主智能、從靜態(tài)封閉分配到動態(tài)開放共享、從集中統(tǒng)一指派到分布自主協(xié)同的轉(zhuǎn)變,但在這一過程中仍面臨以下挑戰(zhàn)。
1) 頻譜空間建模表征方式比較單一,難以適應(yīng)錯綜復(fù)雜的電磁環(huán)境。當(dāng)前,頻譜態(tài)勢常用頻譜圖來描繪,建模時主要關(guān)注可用頻譜資源的時-頻-空分布,具體表現(xiàn)為頻譜的忙閑狀態(tài)、輻射功率、接入?yún)f(xié)議、調(diào)制方式等。隨著用頻設(shè)備/系統(tǒng)的類型和數(shù)量不斷增長,電磁頻譜空間日益錯綜復(fù)雜,演變成多主體、多因素、多變量構(gòu)成的互為輸入輸出的復(fù)雜系統(tǒng)。當(dāng)前頻譜建模和表征方式難以厘清頻譜空間內(nèi)各主體間的多元關(guān)系以及主體受因素、變量的深層影響,缺乏系統(tǒng)性頻譜知識的精煉。
2) 頻譜管理方式對于人的經(jīng)驗依賴性較強(qiáng),難以實現(xiàn)自動化、智能化的頻譜管理效果。靜態(tài)劃分的傳統(tǒng)頻譜管理模式依賴于人工操作和人員經(jīng)驗。在動態(tài)協(xié)同的智能頻譜管理模式中,雖然頻譜感知、頻譜預(yù)測、頻譜決策等各個環(huán)節(jié)針對各自不同的優(yōu)化目標(biāo)都有技術(shù)性的解決方法,但各個環(huán)節(jié)間智能算法的輸入輸出仍然依賴人工銜接和監(jiān)督,許多操作技巧和實踐經(jīng)驗只能被頻管人員掌握,用頻設(shè)備既無法理解頻譜認(rèn)知環(huán)路中流動的數(shù)據(jù)的語義,也無法在數(shù)據(jù)計算的基礎(chǔ)上結(jié)合這些技巧經(jīng)驗進(jìn)行思考,并未實現(xiàn)自動化的頻譜共享。
3) 頻譜管理效率較低,難以滿足精準(zhǔn)化、實時性的頻譜管理要求?,F(xiàn)有頻譜管理方法主要是從頻譜數(shù)據(jù)中建立統(tǒng)計模型,挖掘統(tǒng)計規(guī)律來進(jìn)行頻譜預(yù)測、頻譜決策,這些模型驅(qū)動的方法存在模型復(fù)雜度、精準(zhǔn)度、可解析性等難以調(diào)和的內(nèi)在矛盾。并且,針對不同的頻譜管理場景,由于缺乏系統(tǒng)性的頻譜知識,現(xiàn)有模型的泛化能力欠佳。此外,對于頻譜管理中的大量優(yōu)化計算,多樣化頻譜數(shù)據(jù)的格式難以統(tǒng)一,頻譜管理的計算能力受到限制,頻譜預(yù)測、頻譜決策的結(jié)果常常滯后,時效性較差。
綜上所述,為推動頻譜管理從靜態(tài)、低效的以人工為主模式向動態(tài)、精準(zhǔn)的智能模式轉(zhuǎn)變,探索一種新的頻譜管理模式是目前亟待解決的難題。為此,本文將知識圖譜理論與技術(shù)應(yīng)用到頻譜管理中,主要貢獻(xiàn)概括如下。
1) 提出“頻譜知識圖譜”的概念、體系和表示方法。
2) 面向未來頻譜管理場景,構(gòu)建了基于頻譜知識圖譜的智能頻譜管理框架。
3) 探討了基于頻譜知識圖譜的智能用頻推薦案例,展望了基于頻譜知識圖譜的智能頻譜管理交互應(yīng)用。
2 知識圖譜與頻譜管理
2.1 知識圖譜概述
知識圖譜是一種用圖模型來描述知識和建模世界萬物之間關(guān)聯(lián)關(guān)系的技術(shù)方法[11]。它利用圖模型中的節(jié)點和節(jié)點間的邊來表示復(fù)雜的人類知識,其中節(jié)點代表實體,可以是具體的事物或者抽象的概念;邊代表實體間的關(guān)系或者實體的屬性。這種圖模型的表達(dá)通常描述為三元組的形式。知識圖譜中的實體和關(guān)系具有明確的語義,可以由計算機(jī)進(jìn)行形式化解釋、推理和判斷,用自然語言描述的人類知識由此被映射為機(jī)器可以計算和理解的信息。
知識圖譜在 2012 年由谷歌公司提出,用于優(yōu)化搜索引擎服務(wù)[12]。但實際上,它并非一項突然出現(xiàn)的新技術(shù),而是由歷史上很多相關(guān)概念互相影響和繼承發(fā)展而來[11],例如專家系統(tǒng)[13]、語義網(wǎng)絡(luò)、本體、語義網(wǎng)等。表1列出了這些相關(guān)概念與知識圖譜間的聯(lián)系和區(qū)別。知識圖譜常被稱為語義網(wǎng)的知識庫,谷歌公司提出的知識圖譜搜索引擎服務(wù)就是以語義網(wǎng)Freebase作為數(shù)據(jù)基礎(chǔ)改造的,現(xiàn)代知識圖譜通常沿用語義網(wǎng)中的資源描述框架(RDF, resource description framework)進(jìn)行簡單實用的知識表示,從這點來看,知識圖譜與語義網(wǎng)是十分相似的。但語義網(wǎng)中以符號邏輯為基礎(chǔ)的知識表示方法只善于刻畫顯式、離散的知識,難以描述隱性知識、過程知識[13]。知識圖譜則可將每一個實體和關(guān)系都映射到低維向量空間中獲得它們的向量表示,通過數(shù)值計算實現(xiàn)隱含關(guān)系的推理。這種自動化的知識圖譜嵌入技術(shù)[17]也使知識圖譜的規(guī)模得到空前的擴(kuò)展。傳統(tǒng)的專家系統(tǒng)常依賴人工定義語義關(guān)系、獲取知識,知識庫的規(guī)模十分有限,而現(xiàn)代知識圖譜與其最顯著的差別就是知識圖譜的規(guī)模巨大及其構(gòu)建過程自動化。同時,逐漸成熟的自然語言處理技術(shù)更是與知識圖譜互為支撐、互相促進(jìn),自然語言處理的眾多算法已在實體抽取、關(guān)系抽取、知識融合等知識圖譜構(gòu)建環(huán)節(jié)中發(fā)揮關(guān)鍵作用。
表1?? 相關(guān)概念與知識圖譜的聯(lián)系和區(qū)別
概念 | 含義 | 與知識圖譜的聯(lián)系 | 與知識圖譜的區(qū)別 |
---|---|---|---|
專家系統(tǒng)[14] | 一個具有大量的專門知識與經(jīng)驗的程序系統(tǒng),由知識庫和推理機(jī)兩部分組成 | 對領(lǐng)域知識進(jìn)行知識表示并形成知識庫/集合 | 專家系統(tǒng)的知識庫依靠專家手動獲取知識,知識圖譜則支持自動化構(gòu)建 |
語義網(wǎng)絡(luò) | 一個帶標(biāo)識的有向圖。圖中節(jié)點表示各種事物、概念、情況、狀態(tài)等,節(jié)點與節(jié)點間連接線表示各種語義聯(lián)系、動作[15] | 圖結(jié)構(gòu)化的知識表示方法 | 語義網(wǎng)絡(luò)缺乏形式化的語法規(guī)范和形式化的語義標(biāo)準(zhǔn),概念與實體之間沒有明顯的區(qū)分,節(jié)點與邊難以進(jìn)行更加豐富的定義 |
本體 | 定義了某一領(lǐng)域內(nèi)的專業(yè)詞匯以及它們之間的關(guān)系,是對概念化的精確描述 | 提供了一種人、機(jī)器等不同主體間交流的語義基礎(chǔ) | 本體側(cè)重于描述概念類別和通用關(guān)系,較體系化;知識圖譜包含更多具體實例,反映的是本體基礎(chǔ)知識的具體表現(xiàn)結(jié)果 |
語義網(wǎng) | 將Web中數(shù)據(jù)以RDF與互聯(lián)網(wǎng)本體語言(OWL, ontology Web language)來表示,建立網(wǎng)絡(luò)數(shù)據(jù)之間的語義關(guān)系,使處理數(shù)據(jù)的機(jī)器能夠像人一樣理解網(wǎng)絡(luò)上的信息,從而提供更好的網(wǎng)絡(luò)服務(wù)[16] | 常采用基礎(chǔ)數(shù)據(jù)模型RDF | 語義網(wǎng)的表示對象主要是萬維網(wǎng)上的文檔,如超文本標(biāo)記語言(HTML, hypertext markup language)文檔、可擴(kuò)展標(biāo)記語言(XML, extensive markup language)文檔;知識圖譜中實體的含義和類型更豐富 |
新窗口打開|?下載CSV
根據(jù)知識圖譜中包含的知識類型進(jìn)行分類,可以將知識圖譜分為通用知識圖譜和領(lǐng)域知識圖譜。關(guān)于通用知識圖譜,國內(nèi)外已有較成熟的項目。國外的代表性項目包括早期影響范圍較廣的由Cycorp 公司開發(fā)的 Cyc[18]、普林斯頓大學(xué)開發(fā)的WordNet[19]、麻省理工學(xué)院創(chuàng)建的ConceptNet[20]、MetaWeb 公司構(gòu)建的 Freebase、維基構(gòu)建的WikiData等。國內(nèi)的代表性項目如下。復(fù)旦大學(xué)知識工場實驗室研發(fā)并維護(hù)的 CN-DBpedia[21],是國內(nèi)較早推出的也是目前規(guī)模較大的開放百科中文知識圖譜。清華大學(xué)研發(fā)的XLORE通過從異構(gòu)的跨語言在線百科中抽取結(jié)構(gòu)化信息,形成中英文知識規(guī)模較平衡的多語言知識圖譜,為構(gòu)建任意雙語言知識平衡的大規(guī)模知識圖譜提供了新的方式。浙江大學(xué)、東南大學(xué)、同濟(jì)大學(xué)等多個研究團(tuán)隊共同研發(fā)的OpenKG是一個面向中文域開放知識圖譜的社區(qū)項目,旨在促進(jìn)中文領(lǐng)域知識圖譜數(shù)據(jù)的開放互聯(lián),同時還收集整理了重要的知識圖譜開源工具。就領(lǐng)域知識圖譜而言,電商、金融、醫(yī)療、企業(yè)管理等眾多領(lǐng)域的知識圖譜應(yīng)用逐漸落地生根。例如,醫(yī)學(xué)知識圖譜用于表達(dá)、組織、管理及利用海量異構(gòu)動態(tài)的醫(yī)療大數(shù)據(jù),在臨床決策支持系統(tǒng)、醫(yī)療智能語義搜索引擎、醫(yī)療問答系統(tǒng)等系統(tǒng)中得到了廣泛應(yīng)用[22]。金融知識圖譜可對大量金融數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化和可視化,用于監(jiān)管企業(yè)的發(fā)展趨勢,調(diào)查隱藏的財務(wù)關(guān)系等[23]。
此外,在知識圖譜管理方面,以Jena和RDF4J等為代表的關(guān)系數(shù)據(jù)庫系統(tǒng)和以Neo4j為代表的圖數(shù)據(jù)管理系統(tǒng)常用來支持大規(guī)模知識圖譜的存儲、檢索和分析。
知識圖譜在諸多領(lǐng)域的廣泛應(yīng)用得益于其對以二元一階謂詞邏輯為主的簡單知識的成功表示。而對于某些三元關(guān)系甚至多元高階謂詞邏輯的復(fù)雜表達(dá),現(xiàn)有知識圖譜尚無法勝任,且面臨鏈接困難、關(guān)系冗余、組合爆炸等難題[24]。Ding 等[25]針對網(wǎng)絡(luò)文檔的多跳問答推理難題,受雙過程理論啟發(fā),在知識圖譜的基礎(chǔ)上提出了認(rèn)知圖譜。認(rèn)知圖譜被解釋為“基于原始文本數(shù)據(jù),針對特定問題情境,使用強(qiáng)大的機(jī)器學(xué)習(xí)模型動態(tài)構(gòu)建的,節(jié)點帶有上下文語義信息的知識圖譜”,可以減少圖譜構(gòu)建時的信息損失,將信息處理壓力轉(zhuǎn)移給檢索和自然語言理解算法,同時保留圖結(jié)構(gòu)以進(jìn)行可解釋關(guān)系推理[24]。
人工智能的核心難題之一是研究怎樣用計算機(jī)易于處理的方式表示、學(xué)習(xí)和處理各種各樣的知識。不斷發(fā)展和完善的知識圖譜將使機(jī)器能模仿人的思維過程,擁有思考、理解、判斷、分析的能力,成為實現(xiàn)認(rèn)知智能不可或缺的重要技術(shù)之一[11]。
2.2 知識圖譜引入頻譜管理的意義
據(jù)調(diào)研,知識圖譜目前在無線通信、信號檢測、網(wǎng)絡(luò)管理方面的研究剛剛開始。張育瑜等[26]針對無線電監(jiān)測數(shù)據(jù)未規(guī)范化的問題,提出了基于知識圖譜的海量無線電監(jiān)測數(shù)據(jù)的分析思路,利用盲信號識別等方式,構(gòu)建了結(jié)構(gòu)化無線電監(jiān)測數(shù)據(jù)知識庫。胡航宇等[27]提出一種基于流知識圖譜的網(wǎng)絡(luò)流行為分析模型——網(wǎng)絡(luò)流連接圖,網(wǎng)絡(luò)流連接圖能夠充分利用網(wǎng)絡(luò)流行為測量數(shù)據(jù)中的可用信息,刻畫網(wǎng)絡(luò)應(yīng)用流連接關(guān)系的固有特征,檢測與識別網(wǎng)絡(luò)異常行為,適合多種圖挖掘算法的應(yīng)用。Aumayr等[28]針對復(fù)雜動態(tài)電信網(wǎng)絡(luò)系統(tǒng)管理的自動化需求,從網(wǎng)絡(luò)當(dāng)前狀態(tài)中收集上下文信息,并將其與網(wǎng)絡(luò)提供商和運營商領(lǐng)域的現(xiàn)有電信知識文檔中的有用信息相關(guān)聯(lián),構(gòu)建了一個面向網(wǎng)絡(luò)自動管理的知識圖譜。該知識圖譜可針對各種突發(fā)的網(wǎng)絡(luò)事件,自動推薦工作流,輔助網(wǎng)絡(luò)故障診斷和排除,提高網(wǎng)絡(luò)管理的效率,改善客戶體驗。上述研究是將知識圖譜應(yīng)用到通信領(lǐng)域的有益嘗試,但尚沒有系統(tǒng)地涉及無線通信中用頻設(shè)備/系統(tǒng)/業(yè)務(wù)之間,以及與其使用的頻譜資源之間的關(guān)系,尤其是在頻譜管理中,知識圖譜的應(yīng)用目前仍未見報道。
結(jié)合知識圖譜的特點和頻譜管理面臨的嚴(yán)峻挑戰(zhàn),本文考慮在頻譜管理中引入知識圖譜,主要如下。
1) 知識圖譜能夠表征頻譜領(lǐng)域的復(fù)雜語義。知識圖譜將頻譜管理中蘊含的復(fù)雜關(guān)系和事實映射于不同的實體和實體間的關(guān)系上,且這些實體和關(guān)系都具有明確的含義,如用頻設(shè)備、頻譜資源表示通信、干擾或使用資源等關(guān)系,這種映射方式可以表征頻譜領(lǐng)域的語義,使機(jī)器理解頻譜管理中的各種信息。同時,知識圖譜本質(zhì)上是一種圖模型的數(shù)據(jù)庫,實體和關(guān)系對應(yīng)圖中的節(jié)點和邊,還能通過圖數(shù)據(jù)計算進(jìn)一步發(fā)掘隱含的深層關(guān)系和事實。
2) 知識圖譜能夠支撐頻譜管理的自動化。通過為頻譜管理提供多域關(guān)聯(lián)的頻譜知識參考,知識圖譜可以將頻譜管理中各個零散的工作環(huán)節(jié)串聯(lián)起來,自動進(jìn)行多步查詢推理,從而減少頻譜管理對人工操作的依賴。
3) 知識圖譜能夠增強(qiáng)頻譜管理的知識引導(dǎo)。知識圖譜能將人類積累的頻管經(jīng)驗和實踐技巧轉(zhuǎn)化為機(jī)器能夠理解和處理的頻譜知識,并融入頻譜管理中發(fā)揮頻譜知識的引導(dǎo)作用,使頻譜管理從單純的數(shù)據(jù)驅(qū)動轉(zhuǎn)變?yōu)閿?shù)據(jù)與經(jīng)驗知識混合驅(qū)動。
4) 知識圖譜能夠提升頻譜管理的規(guī)模化。頻譜知識圖譜的向量表示將用頻設(shè)備、頻譜資源等實體及其之間的關(guān)系映射到連續(xù)向量空間,向量表示的具體過程采用深度學(xué)習(xí)模型進(jìn)行自動訓(xùn)練,使知識圖譜的規(guī)模得到極大拓展。
5) 知識圖譜能夠提升頻譜管理的可解釋性。知識圖譜相當(dāng)于大腦中的知識庫,使智能算法的輸入、輸出行為以及它們之間的內(nèi)在因果關(guān)系或關(guān)聯(lián)關(guān)系可以被理解,有利于提升頻譜管理的透明度、可信任度、推廣泛化能力。
綜上所述,在頻譜管理中引入知識圖譜有助于高效融合頻譜監(jiān)測數(shù)據(jù)、用頻設(shè)備信息、頻譜管理日志等多源數(shù)據(jù),挖掘頻譜管理中各實體之間在時間/頻率/空間等多元維度上的隱藏關(guān)系,實現(xiàn)頻譜數(shù)據(jù)與模型/專家經(jīng)驗混合驅(qū)動的頻譜智能管理,提升復(fù)雜環(huán)境下頻譜管理的智能化水平,更加接近人類的認(rèn)知思維,便于實現(xiàn)人工智能與人類智能的協(xié)同增效。知識圖譜將成為頻譜智能管理領(lǐng)域強(qiáng)有力的新概念、新工具。
3 頻譜知識圖譜的構(gòu)建
3.1 頻譜知識圖譜的概念
頻譜知識圖譜是表征頻譜管理領(lǐng)域復(fù)雜知識的新概念,本文給出頻譜知識圖譜的初步定義:頻譜知識圖譜是一種領(lǐng)域知識圖譜,它通過整合多源異構(gòu)的頻譜數(shù)據(jù),表示頻譜資源、用頻設(shè)備等頻譜空間內(nèi)概念、實體間的復(fù)雜關(guān)系,實現(xiàn)頻譜知識的表征、提取、存儲、推理,服務(wù)于未來頻譜管理的自動化、智能化、精準(zhǔn)化需求。下面將結(jié)合知識圖譜的生命周期和構(gòu)建過程具體闡釋頻譜知識圖譜的定義。如圖1(a)所示,頻譜知識圖譜的生命周期主要包括知識體系構(gòu)建、知識獲取、知識融合、知識存儲與查詢、知識推理、知識應(yīng)用6個環(huán)節(jié)[29]。其中,知識體系構(gòu)建是頻譜知識圖譜的實現(xiàn)基礎(chǔ),知識建模和本體構(gòu)建明確了頻譜知識圖譜將包含的各種概念、實體以及具有的屬性和它們之間的關(guān)系;知識獲取主要是指從數(shù)據(jù)中抽取頻譜知識;知識融合是對不同來源、不同結(jié)構(gòu)的知識進(jìn)行融合的過程;知識存儲與查詢關(guān)注的是知識圖譜的數(shù)據(jù)模型、存儲方式及查詢語言;知識推理是針對知識圖譜的缺失鏈接進(jìn)行補(bǔ)全,挖掘?qū)嶓w隱含的內(nèi)在關(guān)系,同時將為頻管搜索、頻管問答、用頻推薦等知識圖譜下游應(yīng)用提供支撐。
根據(jù)圖譜生命周期,頻譜知識圖譜構(gòu)建過程如圖1(b)所示。首先,對來源廣泛、類型多樣的非結(jié)構(gòu)化頻譜數(shù)據(jù)進(jìn)行知識獲取,數(shù)據(jù)來源包括專業(yè)頻譜管理人員的實踐經(jīng)驗、文本化的頻譜管理政策和用頻設(shè)備信息、格式化的頻譜管理日志和頻譜監(jiān)測數(shù)據(jù)報表,甚至頻譜態(tài)勢圖像等。在此過程中,頻譜知識體系將為知識獲取提供依據(jù)和參考,即由模式層創(chuàng)建實例層,其中模式層存儲的是精煉的概念或?qū)嶓w以及它們之間的關(guān)系類型,而實例層對應(yīng)的則是從實際數(shù)據(jù)中抽取的具體實例對象及其關(guān)系。然后,抽取得到的頻譜知識將與結(jié)構(gòu)化頻譜數(shù)據(jù)進(jìn)行知識融合,形成統(tǒng)一的頻譜知識表示。對頻譜知識進(jìn)行存儲,即形成可用的頻譜知識圖譜。通過知識推理可以對已構(gòu)建的頻譜知識圖譜中缺失的知識鏈接進(jìn)行補(bǔ)全完善,最后服務(wù)于具體應(yīng)用。
圖1?? 頻譜知識圖譜的概念
由于知識獲取和知識融合都屬于自然語言處理中的重點研究內(nèi)容,目前均有眾多較可行的方法,參考實體識別[30-31]、實體消歧[32-33]、關(guān)系抽取[34-35]、事件抽取[36]、聯(lián)合抽取[37]等,因此本文不再贅述。本文將知識圖譜應(yīng)用于頻譜管理,旨在突出頻譜知識圖譜對頻譜管理自動化、智能化、精準(zhǔn)化水平的提升作用,而知識體系是否合理完備將直接影響頻譜知識圖譜的應(yīng)用效果,因此本文在第3節(jié)詳細(xì)闡述頻譜知識圖譜知識體系的具體內(nèi)容,在第5節(jié)著重探討頻譜知識圖譜的應(yīng)用場景。
3.2 頻譜知識圖譜的知識體系
頻譜知識目前尚未有公認(rèn)的或被廣泛接受的定義。Zhang等[38]將頻譜知識形式化地定義為用于推理或預(yù)測頻譜機(jī)會可用性及占用率的可延伸的可定量的信息,頻譜知識的形式可以是頻譜預(yù)測模型、頻譜管理范式和頻譜接入策略等。結(jié)合知識的定義,本文認(rèn)為在頻譜管理實踐中積累的經(jīng)驗、制定的規(guī)則或頻譜管理中出現(xiàn)的各種事實、信息,都屬于頻譜知識的范疇。而在表征具體的頻譜知識前,首先要建立合理的知識體系,知識體系對領(lǐng)域內(nèi)的知識具有高度概括性和抽象性,確定了描述知識的基本框架,具體包括概念的分類、概念屬性的描述和概念之間相互關(guān)系的定義3個方面的內(nèi)容[29]。面向頻譜管理的應(yīng)用需求,本文采用自頂向下的方式,嘗試構(gòu)建了頻譜知識體系。一方面受篇幅限制,表2中只列出了頻譜知識體系的主要條目。另一方面,本文認(rèn)為頻譜知識圖譜是基于開放世界的設(shè)定,人們所掌握的頻譜知識將隨著技術(shù)發(fā)展和研究深入而逐步豐富,因此頻譜知識體系尚不完備,可根據(jù)具體應(yīng)用情況進(jìn)行調(diào)整和擴(kuò)展。
具體地,從管理對象而言,頻譜管理是圍繞重要稀缺的頻譜資源和類型多樣的用頻設(shè)備展開的;從管理內(nèi)容而言,頻譜管理的場景配置和各場景下具體任務(wù)各不相同;從管理手段而言,頻譜管理涉及眾多面向不同任務(wù)目標(biāo)的智能算法?;诖?,頻譜知識體系中的主要概念分類、實體及其屬性如表2?所示,其中,“類”代表概念類別,縮進(jìn)表示概念、實體間的上下位關(guān)系,實體后的方括號內(nèi)列舉了實體的部分屬性。實體間關(guān)系的類型和關(guān)系的作用范圍如表3所示。
3.3 頻譜知識圖譜的表示
在頻譜知識體系的框架下,頻譜知識圖譜采用三元組的形式描述實例知識,即(頭實體, 關(guān)系, 尾實體),記為(h,r,t)。其中,頭實體h一般為知識體系中的概念或?qū)嶓w;尾實體t既可以是概念或?qū)嶓w,也可以是實體的屬性值字段;相應(yīng)地,關(guān)系r可以為連接頭、尾實體的謂詞或上下位關(guān)系,也可以描述實體對象與其屬性值字段之間的屬性關(guān)系。一個完整的三元組被稱為一個事實,記作F=(h,r,t)。從圖模型的角度,頻譜知識圖譜中的所有實體和字段均對應(yīng)圖中的節(jié)點,實體間的關(guān)系或?qū)嶓w的屬性對應(yīng)圖中的邊,形成網(wǎng)狀的圖數(shù)據(jù)模型,將分散的頻譜知識緊密地組織在一起。
新窗口打開|?下載CSV
表2?? 頻譜知識體系示例
表3?? 實體間關(guān)系的類型和作用范圍
關(guān)系類型 | 頭實體類型 | 尾實體類型 |
---|---|---|
屬于 | — | — |
通信 | 設(shè)備類 | 設(shè)備類 |
干擾 | 設(shè)備類 | 設(shè)備類 |
使用 | 設(shè)備類 | 資源類 |
新窗口打開|?下載CSV
空地頻譜共享的知識圖譜局部示意如圖2?所示。在設(shè)備-資源層面上,每一個橢圓形節(jié)點即為資源或者設(shè)備類別中的概念的一個實例,如頻譜共享管理、空地頻譜共享、頻譜感知、無人機(jī)用戶A、干擾站、信道1等;每一個矩形節(jié)點是描述屬性值的字段,如單維頻譜預(yù)測、直接序列擴(kuò)頻、2.432 GHz等。實體間的關(guān)系或?qū)嶓w的屬性用節(jié)點間的有向邊表示,如表示概念層級間包含或包括關(guān)系的有向邊、設(shè)備與資源間使用關(guān)系的有向邊、表示信道的中心頻率屬性的有向邊等。場景-技術(shù)層面與設(shè)備-資源層面通過場景任務(wù)中包含設(shè)備、資源聯(lián)系起來。此外,將知識圖譜的節(jié)點設(shè)置為實體或字段是可以根據(jù)實際情況靈活調(diào)整的。如圖2中的直接序列擴(kuò)頻節(jié)點,若僅用于描述設(shè)備發(fā)射信號的調(diào)制方式屬性,可將其設(shè)置為字段;若圖譜中還涉及該調(diào)制方式的具體屬性參數(shù),如擴(kuò)頻碼長度、碼速率等,則將其設(shè)置為實體。
有些知識圖譜表示還考慮了事實的其他維度。例如,趙澤亞[39]針對傳統(tǒng)的知識網(wǎng)絡(luò)模型無法充分描述復(fù)雜多元異構(gòu)信息的問題,提出了一種開放知識網(wǎng)絡(luò)八元組模型,網(wǎng)絡(luò)中的節(jié)點和邊都帶有時間、空間等信息,便于信息的深度挖掘。而在頻譜管理中,某些頻譜知識描述的語義實際上也隱含著重要的時空信息,如“某信道在某時段的占空比為57%”,僅描述信道的占空比屬性值就會丟失時間信息,因此在頻譜知識圖譜中也可以根據(jù)實際情況增加關(guān)系的時空描述信息。
4 基于頻譜知識圖譜的智能頻譜管理框架
頻譜知識圖譜將頻譜管理領(lǐng)域內(nèi)各個層面的知識有效緊密地聯(lián)結(jié)在一起,本節(jié)將構(gòu)建基于頻譜知識圖譜的智能頻譜管理框架。
圖3給出了基于頻譜知識圖譜的智能頻譜管理框架,從左至右依次為圖譜層、設(shè)備層和場景層。在此框架中,未來頻譜管理被認(rèn)為是集中控制與分布自主相結(jié)合的模式,頻譜管理中心是具備存儲、計算、理解、思考等能力的智能控制中心,用頻設(shè)備是具備感知、理解、記憶、思考等能力的智能體,頻譜知識圖譜則是頻譜管理中心和用頻設(shè)備“大腦”中的知識庫。在頻譜知識圖譜的引導(dǎo)下,智能頻管中心可以根據(jù)所處的場景,確定頻譜管理目標(biāo),選擇合適的智能方法,并為場景中的智能用頻設(shè)備下發(fā)頻管任務(wù);智能用頻設(shè)備可以根據(jù)接收到的頻管任務(wù)及其在場景中的角色,自動調(diào)用智能算法,實現(xiàn)既定的頻譜管理目標(biāo),同時向智能頻管中心上報信息。智能用頻設(shè)備在完成頻管任務(wù)的過程中將通過頻譜感知、頻譜決策、頻譜行動等對頻譜知識圖譜進(jìn)行查詢、檢索、推理、更新;智能頻管中心也將根據(jù)多樣化的場景和任務(wù),對頻譜知識圖譜進(jìn)行擴(kuò)充和完善。下面將具體闡釋智能頻譜管理框架各個層面的具體內(nèi)容。
圖2?? 空地頻譜共享知識圖譜示意
圖3?? 基于頻譜知識圖譜的智能頻譜管理框架
圖譜層是智能頻譜管理框架的驅(qū)動內(nèi)核,即多域關(guān)聯(lián)的頻譜知識圖譜。構(gòu)建頻譜知識圖譜的原始數(shù)據(jù)來源如第3節(jié)所述,其中頻譜管理政策、專家經(jīng)驗以及部分歷史頻譜管理日志、歷史頻譜監(jiān)測數(shù)據(jù)等用于頻譜知識圖譜的初始構(gòu)建,而用頻設(shè)備后續(xù)通過頻譜感知、決策、行動得到的監(jiān)測數(shù)據(jù)、圖像信息和管理日志將作為新的輸入數(shù)據(jù)用于更新頻譜知識圖譜。頻譜知識圖譜使異構(gòu)頻譜數(shù)據(jù)與模型/專家經(jīng)驗得以有效融合,匯聚成用頻設(shè)備的知識庫。
設(shè)備層是智能頻譜管理框架的執(zhí)行單元,主要是指配置頻譜知識圖譜的智能用頻設(shè)備。除傳統(tǒng)認(rèn)知無線電技術(shù)中用頻設(shè)備的認(rèn)知能力和可重構(gòu)性,智能頻譜管理框架中的用頻設(shè)備還需具備理解、記憶、思考的能力,頻譜知識圖譜則在其中充當(dāng)用頻設(shè)備大腦的角色。借助設(shè)備-資源層面的頻譜知識圖譜,用頻設(shè)備能夠?qū)Χ嘣串悩?gòu)頻譜數(shù)據(jù)中包含的信息進(jìn)行提取、加工和存儲,把握頻譜態(tài)勢演化的規(guī)律和方向,處理自身與其他設(shè)備間的關(guān)系,成為大腦賦能的智能體。智能用頻設(shè)備主要完成三項任務(wù):知識圖譜賦能的頻譜感知、知識圖譜賦能的頻譜決策和知識圖譜賦能的頻譜行動,其中知識圖譜賦能體現(xiàn)在頻譜感知、頻譜決策、頻譜行動中的頻譜知識圖譜應(yīng)用。
1) 知識圖譜賦能的頻譜感知。感知得到的數(shù)據(jù)信息經(jīng)過提取、加工形成新的頻譜知識,將被存儲在頻譜知識圖譜中,而頻譜知識圖譜中已有的知識可以作為先驗信息,輔助用頻設(shè)備進(jìn)行基于注意力機(jī)制的知識抽取。
2) 知識圖譜賦能的頻譜決策。用頻設(shè)備可以查詢頻譜知識圖譜以獲得實體間的關(guān)系事實,頻譜知識圖譜也可以用于實體間關(guān)系或事實的推理以輔助決策。
3) 知識圖譜賦能的頻譜行動。頻譜共享或移動的事實將進(jìn)一步更新頻譜知識圖譜,基于頻譜知識圖譜的推理也可以對頻譜行動的效果進(jìn)行評估。
場景層是智能頻譜管理框架的應(yīng)用呈現(xiàn)。面向頻譜秩序管理、頻譜對抗管理、頻譜共享管理等多樣化應(yīng)用場景,智能頻管中心首先在頻譜知識圖譜中蘊含的場景知識引導(dǎo)下確定頻譜管理的目標(biāo),如圖3中的場景層所示,無人機(jī)網(wǎng)絡(luò)及智能用頻設(shè)備的通信受到干擾站干擾,頻譜管理的目標(biāo)是要實現(xiàn)頻譜安全共享。智能頻管中心將根據(jù)頻譜知識圖譜中的“場景-技術(shù)”知識,選擇合適的技術(shù)方法,并向智能用頻設(shè)備下發(fā)頻管任務(wù)。智能用頻設(shè)備通過分布協(xié)作的方式完成頻管任務(wù),并向智能頻管中心上報信息。
5 頻譜知識圖譜的應(yīng)用
知識圖譜的典型應(yīng)用包括智能問答、智能搜索、智能推薦等。作為一種領(lǐng)域知識圖譜,頻譜知識圖譜的應(yīng)用將以這些典型應(yīng)用為基礎(chǔ),在頻譜管理領(lǐng)域進(jìn)行實踐和創(chuàng)新。本節(jié)將重點討論基于頻譜知識圖譜的智能用頻推薦案例,并進(jìn)一步展望基于頻譜知識圖譜的智能頻譜管理交互應(yīng)用。
5.1 基于頻譜知識圖譜的智能用頻推薦案例
推薦系統(tǒng)的核心目標(biāo)是通過分析用戶行為、興趣、需求等信息,在海量數(shù)據(jù)中挖掘用戶感興趣的信息[40]。推薦方法依賴的數(shù)據(jù)基礎(chǔ)通常是用戶與物品之間的大量交互數(shù)據(jù)。將知識圖譜技術(shù)應(yīng)用到推薦系統(tǒng)可以解決傳統(tǒng)推薦方法難以勝任的用戶-物品行為關(guān)系數(shù)據(jù)稀疏問題、對新用戶或新物品進(jìn)行推薦的冷啟動問題等,提升推薦的可解釋性[40]。本節(jié)展示了頻譜知識圖譜在用頻推薦中的具體應(yīng)用。
頻譜管理中的用頻推薦是將用頻設(shè)備看作用戶,將頻譜資源看作物品,通過挖掘頻譜資源的演化特性,分析用頻設(shè)備的用頻需求、行為模式,從而為用頻設(shè)備推薦可用、好用的頻譜資源。用頻推薦有助于突破感知能力限制、降低感知時間開銷,彌補(bǔ)頻譜可用性模型在復(fù)雜度、精準(zhǔn)性、可解釋性等方面的不足,為頻譜決策提供主動型、預(yù)測型、增強(qiáng)型信息支撐,協(xié)助頻管人員優(yōu)化頻譜管理政策,提高頻譜管理效率。
在通信中,用戶與物品間的交互數(shù)據(jù)可以表現(xiàn)為用頻設(shè)備對頻譜資源傳輸質(zhì)量的評價。例如,在短波通信系統(tǒng)中,由于反射短波信號的電離層是一種典型的時變傳輸媒介,電離層對不同頻率電波的反射和吸收能力不同,其特性還受日夜交替、季節(jié)更替、太陽黑子周期和地理位置等多因素影響變化,且信道受干擾嚴(yán)重,因此通信極不穩(wěn)定。短波用頻設(shè)備通常先對預(yù)置頻率集進(jìn)行鏈路質(zhì)量分析,再根據(jù)鏈路質(zhì)量評價結(jié)果,自適應(yīng)地選擇通信頻率[41]。由此,容易聯(lián)想到利用鏈路質(zhì)量評價等交互數(shù)據(jù)進(jìn)行短波用頻推薦。
然而,一方面,短波用頻設(shè)備通過探測信道獲得鏈路質(zhì)量時,可能受到干擾或噪聲的影響而導(dǎo)致探測失?。涣硪环矫妫妙l設(shè)備的探測能力有限,在實際系統(tǒng)中,用頻設(shè)備主要在其常用頻率附近進(jìn)行探測。因此,鏈路質(zhì)量矩陣是不完整的,上述短波用頻推薦也面臨交互數(shù)據(jù)稀疏的問題。本節(jié)將利用頻譜知識圖譜對鏈路質(zhì)量矩陣進(jìn)行補(bǔ)全,服務(wù)于短波用頻推薦。
對于頻譜管理專業(yè)人員而言,鏈路質(zhì)量受哪些主要因素影響,總體上呈現(xiàn)何種時變趨勢,這些實踐經(jīng)驗都屬于頻譜知識,可以通過頻譜知識圖譜表征,發(fā)揮頻譜知識在智能頻譜管理中的引導(dǎo)作用,實現(xiàn)數(shù)據(jù)與經(jīng)驗知識混合驅(qū)動的用頻推薦。具體地,本節(jié)在第3節(jié)的基礎(chǔ)上進(jìn)一步細(xì)化頻譜知識圖譜中資源類實體,將鏈路質(zhì)量建模為實體。首先,考慮知識 1,鏈路質(zhì)量主要受頻率、時間、傳輸距離等因素影響,則將鏈路質(zhì)量的數(shù)值、所對應(yīng)的時刻、頻率、鏈路起點和鏈路終點等建模為實體的屬性。如圖4所示,對于鏈路質(zhì)量矩陣中任一已知元素,上述圖譜建模方式已形成(qi,j,ValueIs,23)、(qi,j,TimeIs,06/01_08)、(qi,j,FrequencyIs,f?2)、(qi,j,TrLocationIs,A地)等多個三元組;對于鏈路質(zhì)量矩陣中的缺失元素,由于元素在矩陣中的位置是明確的,即時刻、頻率、鏈路起點和鏈路終點等信息已知,此時僅形成 (qm,n,TimeIs,06/01_03)、(qm,n,FrequencyIs,f?5)、(qm,n,TrLocationIs,A地)等部分三元組,鏈路質(zhì)量矩陣補(bǔ)全問題即轉(zhuǎn)化為對表示鏈路質(zhì)量數(shù)值的三元組(qm,n,ValueIs,?)的鏈接預(yù)測問題。在此基礎(chǔ)上,可以進(jìn)一步考慮“知識2”,鏈路質(zhì)量受日夜更替影響較大,對于同一條鏈路,不同天的相同時刻的鏈路質(zhì)量應(yīng)具有相似性,則可以增加(06/01_07,TimeSimilar,06/11_07)等三元組作為已知信息。
圖4?? 鏈路質(zhì)量矩陣與頻譜知識圖譜
由于上述頻譜知識圖譜存在大量多對一關(guān)系(N-to-1),考慮采用TransR模型[42]對頻譜知識圖譜進(jìn)行表示學(xué)習(xí),學(xué)習(xí)圖譜中所有實體、關(guān)系以及相應(yīng)映射矩陣的向量表示。然后,針對鏈接預(yù)測問題(qm,n,ValueIs,?),對每一個待預(yù)測三元組中缺失的尾實體,將知識圖譜中對應(yīng)類別下的所有實體作為候選項計算得分函數(shù),可以得到這些候選尾實體的得分排名,以得分排名最高的實體作為預(yù)測結(jié)果,即鏈路質(zhì)量矩陣中缺失元素的值。
實驗數(shù)據(jù)來自短波中長期預(yù)報軟件 VOACAP的仿真數(shù)據(jù)。數(shù)據(jù)集1模擬由南京至廈門的短波通信鏈路的接收信噪比(假設(shè)鏈路質(zhì)量指標(biāo)以接收信噪比為主),記錄時間為2020年6月至8月的每旬第一天(共9天)的全時段的鏈路質(zhì)量,每小時記錄一次鏈路質(zhì)量,鏈路頻率設(shè)置為短波頻段內(nèi)均勻分布的9個頻點,信噪比數(shù)值經(jīng)預(yù)處理后進(jìn)行5級均勻量化,因此完整的鏈路質(zhì)量矩陣應(yīng)為9×216的數(shù)值矩陣。數(shù)據(jù)集2模擬由南京至??诘亩滩ㄍㄐ沛溌返慕邮招旁氡?,記錄時間為2015年每月15日的全時段的鏈路質(zhì)量,每小時記錄一次鏈路質(zhì)量,鏈路頻率設(shè)置為9個頻點,對信噪比數(shù)值進(jìn)行5級量化,則數(shù)據(jù)集2的完整鏈路質(zhì)量矩陣應(yīng)為9×288的數(shù)值矩陣。對上述2個數(shù)據(jù)集設(shè)置鏈路質(zhì)量矩陣中缺失元素的比例均為 80%。本文采用清華大學(xué)OpenKE toolkits工具包[43]中的TransR模型,對所構(gòu)建的頻譜知識圖譜進(jìn)行向量表示學(xué)習(xí),其中實體向量、關(guān)系向量和映射矩陣的維度分別設(shè)置為100、100 和 100×100,隨機(jī)梯度下降算法的學(xué)習(xí)率設(shè)置為0.02、邊際參數(shù)設(shè)置為4,每一批次訓(xùn)練數(shù)據(jù)的規(guī)模設(shè)置為5 000,訓(xùn)練次數(shù)設(shè)置為5 000。實驗結(jié)果如表4所示,預(yù)測結(jié)果的均方根誤差(RMSE, root mean square error)隨知識的增多而減少,說明頻譜知識圖譜能在用頻推薦中起到知識引導(dǎo)的作用,增加知識能提升鏈路質(zhì)量矩陣補(bǔ)全的性能。
表4?? 鏈路質(zhì)量矩陣補(bǔ)全的準(zhǔn)確性
數(shù)據(jù)集 | RMSE/dB | |
---|---|---|
知識1 | 知識1+知識2 | |
數(shù)據(jù)集1 | -3.944 4 | -4.059 9 |
數(shù)據(jù)集2 | 0.460 4 | 0.447 9 |
新窗口打開|?下載CSV
5.2 基于頻譜知識圖譜的智能頻譜管理交互應(yīng)用
知識圖譜為機(jī)器理解人類語言提供了新的思路。結(jié)合自然語言處理技術(shù),頻譜知識圖譜可以支撐人機(jī)協(xié)作交互的眾多下游應(yīng)用,滿足管理人員直接用人類自然語言進(jìn)行與頻譜管理相關(guān)的智能搜索、人機(jī)問答的需求,減少頻譜管理人力成本和對頻管專家的依賴。
1) 頻譜管理智能搜索系統(tǒng)。頻譜知識圖譜以統(tǒng)一的知識表示形式存儲了大量頻譜知識,可以針對搜索關(guān)鍵詞迅速返回豐富全面的表單式信息,提升了信息檢索的效率。
2) 頻譜管理智能問答系統(tǒng)。支持使用自然語言輸入與頻譜管理相關(guān)的事實型、是非型、原因型等類型的問題進(jìn)行提問,如“某設(shè)備使用的頻段是什么”“某頻段在明天8時是否可用”“某設(shè)備切換頻率的原因是什么”等,系統(tǒng)經(jīng)過自然語言理解、知識圖譜查詢和推理,直接返回問題答案。
6 結(jié)束語
針對頻譜管理面臨的嚴(yán)峻挑戰(zhàn),本文將知識圖譜技術(shù)引入頻譜管理中,提出了頻譜知識圖譜的概念、知識體系和表示,構(gòu)建了基于頻譜知識圖譜的智能頻譜管理框架,重點探討了基于頻譜知識圖譜的智能用頻推薦案例,并對基于頻譜知識圖譜的智能頻譜管理交互應(yīng)用進(jìn)行了展望。下一步將搭建頻譜知識圖譜演示應(yīng)用平臺,繼續(xù)深入探索頻譜知識圖譜應(yīng)用,進(jìn)一步評估驗證頻譜知識圖譜對頻譜管理自動化、智能化、精準(zhǔn)化的提升效果。頻譜管理與知識圖譜技術(shù)的結(jié)合將是一個很有意義的研究領(lǐng)域,未來將產(chǎn)生眾多富有成效的研究成果,為智能頻譜管理領(lǐng)域帶來顛覆性的技術(shù)變革。本文關(guān)于頻譜知識圖譜的研究和討論只觸及了其中的冰山一角,希望能夠激發(fā)更多的研究興趣。
【轉(zhuǎn)載聲明】轉(zhuǎn)載目的在于傳遞更多信息。如涉及作品版權(quán)和其它問題,請在30日內(nèi)與本號聯(lián)系,我們將在第一時間解決!
編輯:fqj
評論
查看更多