在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

知識圖譜基礎知識應用和學術前沿趨勢

新機器視覺 ? 來源:新機器視覺 ? 2024-01-08 10:57 ? 次閱讀

作者簡介

作者:gaojing

針對于知識圖譜基礎知識,領域應用和學術前沿趨勢進行介紹。

知識圖譜介紹

知識圖譜(Knowledge Graph)以結構化的形式描述客觀世界中概念、實體及其關系。是融合了認知計算、知識表示與推理、信息檢索與抽取、自然語言處理、Web技術、機器學習與大數據挖掘等等方向的交叉學科。人工智能是以傳統符號派與目前流行的深度神經網路為主,如下圖所示,知識圖譜發展史。

94609ad4-9a57-11ee-8b88-92fbcf53809c.jpg

知識圖譜發展史

946b0924-9a57-11ee-8b88-92fbcf53809c.jpg

知識表示與深度學習表示

各大公司布局知識圖譜

94730110-9a57-11ee-8b88-92fbcf53809c.jpg

補充其中還包括國內的京東與美團(美團的AI大腦,數十億知識圖譜構建)

知識圖譜應用模式(來之美團的Ai大會報告)

94840992-9a57-11ee-8b88-92fbcf53809c.jpg

知識圖譜技術鏈

9498f6b8-9a57-11ee-8b88-92fbcf53809c.jpg

知識圖譜賦能

知識圖譜應用非常廣泛,目前主要應用到搜索引擎、智能問答、大數據分析、語言翻譯和語言理解及輔助設備互聯(Iot領域),如下圖所示,知識圖譜在搜索引擎的應用。

通用知識圖譜與垂直領域知識圖譜對比

相比較DBpedia、Yago、Wikidata、百度和谷歌等通用知識圖譜,+特定領域內的知識圖譜在知識表示、知識結構、知識質量及知識應用更高的要求(關于領域知識圖譜與通用知識圖譜之間的問題可以查看復旦肖仰華)。

94b206b2-9a57-11ee-8b88-92fbcf53809c.jpg

國內外知識圖譜項目

國外:早期的常識知識庫Cyc、WordNet、ConceptNet等;互聯網知識圖譜,主要有FreeBase、DBpedia、Schema、Wikidata 、BableNet、Microsofot ConceptGraph,醫療領域Linked Life Data等

國內:中文知識圖譜OpenKG,CN-DBpedia,中醫藥知識圖譜,阿里電商知識圖譜、美團知識圖譜、XLore(清華大學)、Belief-Eigen(中科院)、PKUPie(北京大學),開放類的中文百科知識圖譜,zhishi.me

知識圖譜技術模塊

知識表示

如何利用計算符號運算來表示人腦中的知識和推理過程,知識表示主要有兩種,基于離散符號的知識表示法和基于連續向量的知識表示。

基于離散符號的知識表示法

94b5ccf2-9a57-11ee-8b88-92fbcf53809c.jpg

RDF(Triple-based Assertion Model) 三元組模型,構建方式主要是主-謂-賓有向標記圖和RDFS(simple Vocabularty and schema)

94c8feee-9a57-11ee-8b88-92fbcf53809c.jpg

OWL(Web Ontology language):是一種W3C開發的網路本體語言,用于對本體進行語義描述。

94d3741e-9a57-11ee-8b88-92fbcf53809c.jpg

SPARQL(Protocol and RDF Query Language) :RDF的查詢語言,支持主流圖形數據庫。下圖URI/IRI為主要網絡協議,主要數據存儲格式是RDF與XML

94e2a43e-9a57-11ee-8b88-92fbcf53809c.jpg

基于連續向量的知識表示

KG embedding 主要是KG中實體與關系映射到一個低維的向量空間,主要的方法有張量分解、NN、距離模型(現有的詞向量模型基于連續向量空間來表示)(Embedding projector)

94f610b4-9a57-11ee-8b88-92fbcf53809c.jpg

兩種方法對比

950663e2-9a57-11ee-8b88-92fbcf53809c.jpg

知識抽取

KG中知識抽取主要從結構化、半結構化、結構化數據中轉為三元組表示的標準知識形態。

951126ce-9a57-11ee-8b88-92fbcf53809c.jpg

主要處理流程

9521a472-9a57-11ee-8b88-92fbcf53809c.jpg

實體抽?。∟ER命名實體識別)

目的是識別文本中指定類別的實體,主要包括人 名、 地名、 機構名、 專有名詞等的任務“ 姚明(Yao Ming),1980年9月12日出生于上海市徐匯區,祖籍江蘇省蘇州市吳江區震澤鎮,前中國職業籃球運動員,司職中鋒,現任中職聯公司董事長兼總經理“。如下圖所示,命名實體識別主要包含兩個部分:實體邊界識別與實體分類。傳統方法(HMM(隱馬爾科夫模型) CRF(條件隨機場) SVM、最大熵分類模型等方法進行處理。現在能采用深度學習,比如CNNRNNLSTM及LSTM-CRF。采用的工具可以有Jiagu、jieba、Stanford CoreNLP等。

95261c5a-9a57-11ee-8b88-92fbcf53809c.png

實體鏈接

目的是將實體提及與知識庫中對應實體進行鏈接 ,主要解決實體名的歧義性與多樣性問題,是文本中實體名指向真實世界實體的任務。傳統模型是計算實體提及與知識庫中實體的相似度,并選取特定的實體提及的目標實體,比如“蘋果發布新的手機IphoneX11’”,[蘋果(水果)、蘋果(電影)、蘋果(公司)等候選實體],主要使用包括實體統計信息、名字統計信息、上下文詞語分布、實體關聯度、文章主題等信息,同時,考慮到一段文本中實體之間的相互關聯,相關的全局推理算法也被提出來尋找全局最優決策。目前深度學習方法,構建多類型多模態上下文及知識的統一表示,并建模不同信息、不同證據之間的相互交互 通過將不同類型的信息映射到相同的特征空間,并提供高效的端到端訓練算法。包括多源異構證據的向量表示學習、以及不同證據之間相似度的學習等工作[Ganea & Hofmann, 2017] [Gupta et al., 2017] [Sil et al 2018] 。開源工具dexter2

953aa328-9a57-11ee-8b88-92fbcf53809c.jpg

實體關系抽取

實體關系抽取是知識圖譜構建與信息提取的關鍵環節,主要提取兩個或者多個實體之間的某種聯系。格式,三元組(實體1,關系,實體2),"北京是中國的首都、政治中心和文化中心 "中實體關系可以表示為(中國、首都、北京)(中國 政治中心 北京)(中國 文化中心 北京)。

限定關系抽取:采用弱監督/監督機器學習進行預定義的實體關系知識抽取,一般為多分類問題,可以直接抽取三元組關系。一般會采用基于特征向量的方法、基于核函數的方法和基于神經網絡的方法 。

開發域關系抽取:預先不進行預定義,系統本身自動抽取實體之間的關系,一般采用無監督學習方法進行自動提取實體之間的關系(三元組)。缺點是抽取的知識缺乏語義化、很難做歸一化處理,弱監督學習可以自動生成大規模的訓練醫療庫,但是會產生噪音數據。

事件關系抽取

識別文本中關于事件的信息,并以結構化的形式呈現,核心概念包括:事件描述、事件觸發詞(動詞或者名詞)、事件元素(實體、時間和屬性等表達語義的細粒度單位組成)、元素角色(角色在某件事情上面的語義關系)、事件類型(事件元素和觸發詞決定事件的類別),如下圖所示

9547137e-9a57-11ee-8b88-92fbcf53809c.jpg

基于模式匹配的方法:對于某一個事件的識別與抽取是在一些模式的指導下進行的,主要有兩個步驟:模式獲取和模式匹配,有可分為基于人工標注語料和弱監督學習

基于機器學習的方法:把事件建模成多分類問題,可以分為基于特征、基于結構和基于神經網路。

基于特征:該方法多用管道式事件抽取

基于結構預測:將事件結構看做是依存樹結構預測?;诮Y構感知機的聯合模型可同時完成觸發詞與事件元素識別的兩個子任務。

基于神經網路:利用RNN進行事件檢測及聯合模型與RNN相結合進行預測觸發詞和事件元素

基于弱監督:在學術上,[Chen and Ji, 2009] [Liao and Grishman, 2011a; 2011b] [Liu et.al., 2016b] 等,但是由于該方法無法直接映射到結構化數據中,無法直接構建三元組。

中文事件抽取

中文與英文事件抽取區別較大,主要是缺乏統一、公認的事件語料庫及公開評測系統(上海大學CEC(Chinese Event Corpus))

知識融合

知識融合是指合并兩個知識圖譜,本體可以讓用戶非常方便和靈活的根據自己的業務建立或者修改數據模型。通過數據映射技術建立本體中術語和不同數據源抽取知識中詞匯的映射關系,進而將不同數據源的數據融合在一起。同時不同源的實體可能會指向現實世界的同一個客體,這時需要使用實體匹配將不同數據源相同客體的數據進行融合。不同本體間也會存在某些術語描述同一類數據,那么對這些本體間則需要本體融合技術把不同的本體融合。

知識融合-異構問題

語言層不匹配:RDF OWL OWL2等本體語言之間不兼容。

實體對齊問題:由于多源、異構、跨語言知識圖譜差異性較大,比如結構化不可比、實體名稱表述差別較大、外部工具不穩定等,可訓練數據較少。方法:可以基于圖神經網路的實體結構語義表示及匹配(關于知識融合中實體對齊在學術上有很多研究)

95516766-9a57-11ee-8b88-92fbcf53809c.jpg

知識存儲

知識圖譜的知識存儲一般是采用圖形數據庫進行存儲,主要有兩種圖數據模型:RDF圖和屬性圖

查詢語言:RDF圖---SPARQL;屬性圖:Cypher 和 Gremlin

常見知識圖譜存儲方式

基于關系數據庫的存儲方案

主要是三元組表(3store)、水平表(DLDB)、屬性表(JENA)、垂直劃分(SW-Store)、DB2RDF和六重索引(RDFX-3X、Hexastore)

面向RDF的三元組數據庫

Jena RDF4J RDF-3X gStore

原生圖數據庫

Neo4j

分布式圖形數據庫 JanusGraph

OrientDB

Cayley

圖形數據庫對比

95616454-9a57-11ee-8b88-92fbcf53809c.jpg

來之DB-Engiens圖引擎和美團知識圖譜報告,美團采用JanusGraph分布式圖形引擎

95772136-9a57-11ee-8b88-92fbcf53809c.jpg

知識推理

根據已有的知識圖譜中的事實或者關系推斷出新的事實與關系,一般是考察實體、關系和圖譜結構三個方面的信息特征

基于演繹的知識圖譜推理

基于歸納的知識圖譜推理

基于圖結構

基于規則學習

基于表示學習

新的方法

時序法

基于強化學習

基于圖神經網路

開源工具

Jena和Drools

知識圖譜構建流程

主要介紹主流的知識圖譜構建流程,實體圖譜的構建主要有自底向上、自頂向下和二則混合的方法,如下圖所示,分別為自底向上和自頂向下

9580ffda-9a57-11ee-8b88-92fbcf53809c.jpg

自底向上

958f21e6-9a57-11ee-8b88-92fbcf53809c.jpg

自頂向下

95951998-9a57-11ee-8b88-92fbcf53809c.jpg

知識圖譜整體構建流程

審核編輯:黃飛


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 網絡協議
    +關注

    關注

    3

    文章

    273

    瀏覽量

    22023
  • 數據存儲
    +關注

    關注

    5

    文章

    997

    瀏覽量

    51640
  • 人工智能
    +關注

    關注

    1804

    文章

    48820

    瀏覽量

    247274
  • 深度學習
    +關注

    關注

    73

    文章

    5557

    瀏覽量

    122565
  • 知識圖譜
    +關注

    關注

    2

    文章

    132

    瀏覽量

    7949

原文標題:知識圖譜入門系列

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    NLPIR大數據知識圖譜完美展現文本數據內容

    ?,F在,一種有效獲取知識、發現知識和探測知識前沿的新領域與新手段——以知識單元為分析基礎的知識圖譜
    發表于 07-01 11:40

    知識圖譜相關應用

    智慧風控的背后,是知識圖譜的深度應用
    發表于 08-22 14:40

    KGB知識圖譜基于傳統知識工程的突破分析

    知識圖譜本質上是一種大規模的語義網絡。從2012年谷歌提出知識圖譜,知識圖譜一直在快速發展,其應用也不再局限于“語義網絡”范疇。現如今的知識圖譜在實際應用中,主要作為大數據時代的
    發表于 10-22 15:25

    KGB知識圖譜技術能夠解決哪些行業痛點?

    `知識圖譜和行業應用相互結合時,需要充分發揮其技術特色,且要適用于現在的企業應用。那么知識圖譜的應用可以解決那些行業問題呢?知識圖譜在行業應用方面實現的突破具體表現在知識表示、
    發表于 10-30 15:34

    知識圖譜的三種特性評析

    知識圖譜的應用對技術本身也提出了高要求,KGB知識圖譜現在已經在保險行業,為公司分析上市數據等行業得以廣泛應用,知識圖譜能夠在應用中發揮優勢主要體現在哪里呢?(1) 目標的動態性:考察知識圖
    發表于 12-13 13:57

    知識圖譜是什么?與傳統知識表示的區別

    知識圖譜是實現機器認知智能的基礎。機器認知智能的兩個核心能力:“理解”和“解釋”,均與知識圖譜有著密切關系。首先需要給機器“理解與解釋”提出一種解釋。我認為機器理解數據的本質是建立起從數據到知識庫中的
    的頭像 發表于 10-29 10:03 ?2.8w次閱讀

    知識圖譜已經取得了哪些學術與技術成果,產業與應用發生了哪些變化?

    知識圖譜從以前研究與產業界脫鉤,到現在領域知識圖譜成為研究的重點,開始面向解決實際的問題。比如最近司法知識圖譜的構建出現了不少研究成果。另外,知識圖譜用于解決問答、推薦系統、圖像理解方
    的頭像 發表于 05-11 09:38 ?5558次閱讀

    一文帶你讀懂知識圖譜

    1 什么是知識圖譜? 通俗地講,知識圖譜就是把所有不同種類的信息(Heterogeneous Information)連接在一起而得到的一個關系網絡。 知識圖譜這個網絡具備以下3種特性: 1.1 由
    的頭像 發表于 12-26 10:23 ?4082次閱讀

    知識圖譜劃分的相關算法及研究

    知識圖譜是人工智能的重要基石,因其包含豐富的圖結構和屬性信息而受到廣泛關注。知識圖譜可以精確語義描述現實世界中的各種實體及其聯系,其中頂點表示實體,邊表示實體間的聯系。知識圖譜劃分是大規模知識
    發表于 03-18 10:10 ?14次下載
    <b class='flag-5'>知識圖譜</b>劃分的相關算法及研究

    知識圖譜在工程應用中的關鍵技術、應用及案例

    近年來,知識圖譜及其相關技術得到快速發展,并被廣泛應用于工業界各種認知智能場景中。在簡述知識圖譜相關研究的基礎上,介紹知識圖譜在工程應用中的關鍵技術,研究工業級知識圖譜的典型應用場景與
    發表于 03-30 15:12 ?15次下載
    <b class='flag-5'>知識圖譜</b>在工程應用中的關鍵技術、應用及案例

    通用知識圖譜構建技術的應用及發展趨勢

    知識圖譜的概念由谷歌于2012年提出,隨后逐漸成為人工智能領域的一饣研究熱點,已在信息搜索、自動問答、決策分析等應用中發揮作用。雖然知識圖譜在各領域展現出了巨大的潛力,但不難發現目前缺乏成熟的知識圖譜
    發表于 04-14 11:37 ?27次下載
    通用<b class='flag-5'>知識圖譜</b>構建技術的應用及發展<b class='flag-5'>趨勢</b>

    知識圖譜是NLP的未來嗎?

    我的看法:知識圖譜不是NLP的未來,因為知識圖譜是另外一種與NLP有很多交集的技術。在目前所有已知的發展方向中,知識圖譜是最有可能長期和NLP互利共生的技術。
    的頭像 發表于 04-15 14:36 ?3905次閱讀
    <b class='flag-5'>知識圖譜</b>是NLP的未來嗎?

    什么是知識圖譜?人工智能世界知識圖譜的發展

    1.1 什么是知識圖譜 ? 知識圖譜是一種用圖模型來描述知識和建模世界萬物之間的關聯關系的技術方法[1]。知識圖譜由節點和邊組成。節點可以是實體,如一個人、一本書等,或是抽象的概念,如
    的頭像 發表于 06-01 19:54 ?6896次閱讀
    什么是<b class='flag-5'>知識圖譜</b>?人工智能世界<b class='flag-5'>知識圖譜</b>的發展

    知識圖譜Knowledge Graph構建與應用

    一、知識圖譜概論 ? ? ? ? 1.1知識圖譜的起源和歷史 1.2知識圖譜的發展史——從框架、本體論、語義網、鏈接數據到知識圖譜 1.3知識圖譜
    發表于 09-17 10:12 ?837次閱讀

    知識圖譜知識圖譜的典型應用

    作者:?cooldream2009? 我們構建知識圖譜的目的,在于利用知識圖譜來做一些事情。有效利用知識圖譜,就是要考慮知識圖譜的具備的能力,知識圖
    的頭像 發表于 10-18 09:26 ?2585次閱讀
    <b class='flag-5'>知識圖譜</b>:<b class='flag-5'>知識圖譜</b>的典型應用
    主站蜘蛛池模板: 午夜资源在线 | 日本卡一卡2卡3卡4精品卡无人区 | 天堂网2021天堂手机版 | 俺去啦最新官网 | 经典三级第一页 | 国产色视频网站 | 日本在线一级 | 久久天天操 | 丁香花在线影院观看在线播放 | 国产亚洲新品一区二区 | 狠狠干夜夜骑 | h网站在线看 | 久久精品国产精品亚洲精品 | 欧美簧片 | 精品欧美| 欧美日韩国产一区二区 | 欧美色综合高清免费 | 久草福利在线播放 | 污污的网站免费阅读 | 亚洲swag精品自拍一区 | www深夜视频在线观看高清 | 丁香婷婷色综合 | 永久免费视频 | 在线亚洲免费 | 老外一级黄色片 | 午夜激情福利视频 | 午夜性视频播放免费视频 | 国产成人亚洲影视在线 | 黄色大片毛片 | 四虎影视永久地址 | www天天操| 日本黄色免费电影 | 最新理论三级中文在线观看 | avtt亚洲一区中文字幕 | 性孕妇洗澡video国产 | 亚洲国产成人久久精品图片 | 亚洲综合色色图 | 日本不卡专区 | 亚洲高清一区二区三区 | 三级精品在线观看 | 全黄性色大片 |