2020年7月30日,LDBC_SNB官方宣布完成了對費馬科技TuGraph的測試和審計,并公布了測試結果。該結果刷新了世界紀錄,達到原記錄的7.6倍。
近年來,隨著大數據技術的發展,社交網絡、交易網絡、知識圖譜等圖數據也得以大量積累,從而有力的推動了圖數據的應用。目前,圖數據已經被成功應用于包括金融風控、推薦、工業流程控制、設備管理等許多領域。圖數據庫作為管理圖數據的基礎軟件,也吸引了許多廠商的注意。
近年來,包括Oracle、IBM、微軟在內的傳統軟件巨頭及眾多初創企業都大舉進軍圖數據庫領域。 北京費馬科技有限公司是一家以研發圖數據庫和圖計算軟件為目標的初創企業。在此前36氪的報道中,我們注意到這家由多名清華博士創辦的公司對圖計算技術有深厚的積累。今天我們欣喜地看到,費馬科技的圖數據庫TuGraph取得了突破,在國內企業中率先通過了國際基準官方審計測試并取得了國際領先的測試結果。 2020年7月30日,費馬科技宣布,公司成為國內第一家通過圖數據庫國際標準基準測試程序LDBC-SNB官方審計測試的企業,同時打破了LDBC-SNB已經公布的最高紀錄。在中大規模數據集(300GB)上,吞吐率達到之前最高紀錄(由Virtuoso保持)的7.6倍。
圖1. 審計測試成功的聲明頁截圖(含認證審計員,LDBC SNB任務組主任和費馬科技CTO的簽名)
讀者可以通過以下鏈接訪問LDBC官網上的正式公布的測試結果,并下載測試報告、程序、說明文檔以及軟硬件信息等。 LDBC SNB官方網站:http://ldbcouncil.org/benchmarks/snb 測試報告下載:http://ldbcouncil.org/sites/default/files/LDBC_SNB_I_20200726_SF30-100-300_tugraph.pdf 關于LDBC和LDBC-SNB測試:
1.關聯數據基準委員會(LDBC,Linked Data Benchmark Council)是由Oracle、Intel等軟硬件巨頭和主流圖數據庫廠商NeoTechnology和TigerGraph等組成的非贏利機構,是圖(Graph)和RDF數據管理的基準指南制定者與測試結果發布機構。
2.社交網絡基準測試(SNB,Social Network Benchmark)是由關聯數據基準委員會(LDBC)開發的面向圖數據庫的基準測試(Benchmark)之一,分為交互式查詢(Interactive)和商業智能(BI)兩個場景。本次費馬公司測試了其中的交互式查詢場景,主要考察系統在并發情況下的更新和交互式查詢吞吐率。
與很多廠商采用的基于單項測試的評測方式相比,LDBC-SNB(Interactive)更接近真實場景并對數據庫系統的并發執行性能和事務處理能力進行了更具挑戰性的評測。 測試詳情 據公司創始人洪春濤介紹,本次測試采用LDBC SNB的30G(SF30)、100G(SF100)、300G(SF300)三個規模的數據集,其中300G數據集包含8億結點53億邊及相關屬性。查詢操作由7類簡單只讀查詢,14類復雜只讀查詢和8類事務類更新查詢按LDBC SNB Interactive測試規范規定的比例組合并發執行,并以吞吐率為性能指標。可以看到,TuGraph在數據量增大時仍能保持較高的性能,體現了其對大規模數據的良好支撐能力。 下表為不同數據規模下的測試結果,吞吐率(OPS)表示每秒完成的操作次數。
表1. 不同數據規模SF30(30GB),SF100(100GB)和SF300(300GB)的測試結果
CTO朱曉偉表示,公司在測試環境準備、測試數據生成和導入、測試例程序的安裝和執行、結果正確性的驗證方面都嚴格遵守LDBC-SNB的規范。整個測試過程由LDBC認證的評估師在其租用的標準云系統上操作完成,并對測試代碼進行了詳細的評審。
整個測試環境和測試過程均完整披露并可在LDBC網站上公開下載,保證了測試結果的可信性和公正性。 LDBC-SNB Interactive的主要測試要求包括:基準程序會通過多個客戶端并發地發送各類讀寫請求到服務端,每個請求都有相應的計劃時間,數據庫需要盡可能地使得所有操作都按計劃正常進行;一旦某個操作晚于計劃時間超過1秒以上則視作超時,如果超時比例大于5%則無法通過測試,對圖數據庫的更新和查詢性能提出了很高的要求;查詢分為7類簡單查詢和14類復雜查詢,每類復雜查詢在不同數據規模下根據其復雜度以不同的頻率混合在一起,簡單查詢則穿插在這些復雜查詢之間;8類更新操作中不少都涉及多個數據對象的更新,因此需要ACID事務的支持來保證操作的正確性,SNB規范要求隔離級別至少達到提交讀(Read Committed),并在審計過程中對ACID支持進行了特別的測試。 值得注意的是,在本次測試中,TuGraph的超時比例為0%,且SNB實現了最高的隔離級別可串行化(Serializable),說明TuGraph在提供了高級別的事務隔離保證的同時仍然獲得了低延遲和遠遠超過其它數據庫的吞吐率。
CTO朱曉偉表示,相比同類型的圖數據庫產品,TuGraph可以支持更大的數據量,提供更快的響應,支持更多的并發查詢,因此也更適應大數據時代。TuGraph在系統的設計目標上圍繞實時圖數據分析的特點展開:一方面,絕大部分請求是在最新數據上的只讀查詢,因此存儲引擎需要面向讀優化,并需要對其中一些查詢操作采用并行的方式進行處理;另一方面,數據庫需要在快速完成這些只讀查詢的同時處理源源不斷的數據更新,而這些修改請求可能來自多個客戶端,因此需要完善的事務支持,并需要盡可能地避免使用全局鎖導致并發度的降低。
為此,TuGraph實現了多版本的存儲使得只讀事務可以無阻塞地進行,并且提供了樂觀和悲觀兩種模式的讀寫事務,從而針對不同情形提供最優化的事務管理,在并發度和讀寫效率間取得較好的權衡;針對復雜的分析任務,提供了并行遍歷和迭代式圖計算的接口,通過多個線程的協同工作來保障任務不會超時并持續占用系統資源。除此之外,TuGraph提供了豐富的開發接口:不僅支持描述式的查詢語言OpenCypher以方便用戶更快地上手和開發原型,還提供了過程式的核心API讓用戶可以通過存儲過程的方式對一些需要追求極致性能的場景進行加速;存儲過程支持開發效率較高的Python和執行效率較高的C++,未來還將增加受眾較廣的Java作為開發語言;訪問上同時支持RESTful和RPC兩種方式供用戶選擇。這些豐富的選項使得用戶可以在開發和生產環境上根據各自不同的場景和需求靈活地選擇最適合的使用方式,在易用性和高效性兩方面取得更好的平衡。
關于費馬
根據36氪此前報道,費馬科技成立于2016年5月,擁有圖數據平臺(TuGraph,曾用名LightGraph)、圖分析平臺(PandaGraph)兩大產品。TuGraph的定位是高性能單機版圖數據庫,這也是目前市場占有率最高的產品類型。費馬科技基于創始團隊在圖計算領域積累的經驗以及領先的科研成果,研發出的TuGraph具有高性能、大數據量以及穩定易用的特點,因此被廣大客戶所信賴。目前,費馬科技的產品已經被多個領域的頭部客戶所采用,包括京東數科、大型國有銀行及商業銀行等金融業客戶,以及國家電網、中國商飛、西門子等工業部門用戶。
(在此特別感謝 原創作者:李念真 ;本文圖片來自:Pexels 正版圖庫)
-
大數據
+關注
關注
64文章
8948瀏覽量
139334
發布評論請先 登錄
MySQL數據庫是什么
數據庫數據恢復—SQL Server附加數據庫提示“錯誤 823”的數據恢復案例

英偉達發布Nemotron-CC大型AI訓練數據庫
云數據庫是哪種數據庫類型?
數據庫數據恢復—MYSQL數據庫ibdata1文件損壞的數據恢復案例
數據庫數據恢復—通過拼接數據庫碎片恢復SQLserver數據庫

華為云圖引擎服務GES震撼業界,刷新基準測試世界紀錄
企業級數據庫的配置和管理要求匯總
數據庫數據恢復—SQL Server數據庫出現823錯誤的數據恢復案例

一文詳解企業上云數據庫是干嘛的
軟通動力數據庫全棧服務,助力企業數據庫體系全面升級

評論