訂閱
糾錯
加入自媒體

百度ai系列研究之自研圖數據庫BGraph

2021-08-16 10:17
智先聲
關注

每周一篇原創,關注5G、物聯網、人工智能,跟著我堅持利用碎片時間學習

簡介

今天我們進入知識圖譜的學習,知識圖譜是人工智能的一個重要分支,當前場景應用正在不斷豐富。其中最核心的是圖數據庫,百度自研商業圖數據庫 BGraph 支持業界流行 Property Graph 模型和Gremlin語言(并進行擴展),在檢索和實時深度連接分析上具有極高的性能。BGraph 具有高可用性,提供復制和分片技術進行分布式擴展,支持批量加載和實時更新,從而使您能夠輕松構建基于圖數據庫的企業級應用,實時分析關聯數據,挖掘數據價值。

圖來自百度官網

應用場景

欺詐檢測:通過深度關聯分析實時的檢測欺詐模式,從而構建反欺詐應用。例如分析購買和轉賬關系是否有環,判斷是否刷單作弊或惡意套現

企業圖譜:企業圖譜應用將企業的董監高等信息以及企業之間關系存儲在圖數據庫中,然后使用圖查詢全面的分析商業機會和商業風險

公共安全:構建公共安全領域知識圖譜,挖掘人物、事件、地點及其關聯數據,利用專家經驗和機器學習技術,支撐公安機關開展嫌犯追蹤、案件分析和重大事件預警等工作

智能運維:智能運維平臺將網絡設備和服務關聯等信息存儲在圖數據庫中,可以通過圖查詢和圖計算來規劃路由、診斷故障和收斂報警等

技術特點

高性能:自研的圖存儲和計算引擎,針對檢索和深度連接分析做優化,并用C++ 實現,具有毫秒級查詢響應,并能支持數萬的QPS

高擴展:能支持數億級頂點的圖數據,能通過分片和副本分布式可擴展,滿足業務的快速增長

高可用:BGraph 支持多實例副本,具有實時容錯能力,單實例的故障不會影響查詢服務,旨在提供超過 99.99% 的可用性

開放性:支持業界流行的 Property Graph 數據模型和 Gremlin查詢語言,并對Gremlin進行擴展,支持特色的高性能圖算法

常見圖數據庫

Neo4j是一個流行的圖形數據庫,它是開源的。最近,Neo4j的社區版已經由遵循AGPL許可協議轉向了遵循GPL許可協議。盡管如此,Neo4j的企業版依然使用AGPL許可。Neo4j基于Java實現,兼容ACID特性,也支持其他編程語言,如Ruby和Python。

FlockDB是Twitter為進行關系數據分析而構建的。FlockDB迄今為止還沒有穩定的版本,對于它是否是一個真正的圖形數據庫,尚有爭議。FlockDB和其它圖形數據庫(如Neo4j、OrientDB)的區別在于圖的遍歷,Twitter的數據模型不需要遍歷社交圖譜。盡管如此,由于FlockDB應用于Twitter這樣的大型站點,以及它相比其它圖形數據庫的簡潔性,仍然值得我們值得關注。

AllegroGrap是一個基于W3c標準的為資源描述框架構建的圖形數據庫。它為處理鏈接數據和Web語義而設計,支持SPARQL、RDFS++和Prolog。

GraphDB是德國sones公司在.NET基礎上構建的。Sones公司于2007年成立,近年來陸續進行了幾輪融資。GraphDB社區版遵循AGPL v3許可協議,企業版是商業化的。GraphDB托管在Windows Azure平臺上。

InfiniteGraph基于Java實現,它的目標是構建“分布式的圖形數據庫”,已被美國國防部和美國中央情報局所采用。除此之外,還有其他一些圖形數據庫,如OrientDB、InfoGrid和HypergraphDB。Ravel構建在開源的Pregel實現之上,微軟研究院的Trinity項目也是一個圖形數據庫項目。

百度開源的分布式圖數據庫。支持標準的Apache Tinkerpop Gremlin圖查詢語言,支持屬性圖,可支持千億級規模關系數據;支持多種后端存儲(Cassandra,HBase,RocksDB,MySQL,PostgreSQL,ScyllaDB);支持各類索引(二級索引、范圍索引、全文索引、聯合索引,均無需依賴第三方索引庫);提供可視化的Web界面,可用于圖建模、數據導入、圖分析;提供導入工具支持從多種數據源中導入數據到圖中,支持的數據源包括:CSV、HDFS、關系型數據庫(MySQL、Oracle、SQL Server、PostgreSQL);支持REST接口,并提供10+種通用的圖算法;支持與Hadoop、Spark GraphX等大數據系統集成。

免責聲明:

本公眾號為個人研究專題學習分享,非商業公眾號無任何商業目的,如果文章內容有侵權或者非法信息,請立即與本號聯系刪除謝謝

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號