杭州2020年6月9日 /美通社/ -- Nebula Graph V1.0 于6月9日正式發(fā)布,它采用 shared-nothing 分布式架構(gòu),擅長處理千億節(jié)點(diǎn)萬億條邊的海量關(guān)聯(lián)數(shù)據(jù)集,從而更好地服務(wù)企業(yè)級應(yīng)用。Nebula Graph 的設(shè)計(jì)初衷是為了解決企業(yè)應(yīng)用中海量數(shù)據(jù)的實(shí)時處理問題,相比其他解決方案,它可以更快處理更多的數(shù)據(jù)量,這使得 Nebula Graph 成為業(yè)界領(lǐng)先的高性能圖數(shù)據(jù)庫。
Nebula Graph 是一個開源的圖數(shù)據(jù)庫,由杭州歐若數(shù)網(wǎng)科技有限公司(下文簡稱:歐若數(shù)網(wǎng))自主研發(fā)維護(hù)。歐若數(shù)網(wǎng)研發(fā)人員來自阿里巴巴、Facebook、華為、IBM 等大廠。
Nebula Graph 優(yōu)勢
Nebula Graph 分布式架構(gòu)能處理的數(shù)據(jù)量遠(yuǎn)大于其他圖數(shù)據(jù)庫。
此外,高可用的分布式架構(gòu)使它在企業(yè)級應(yīng)用中具有在線水平擴(kuò)容、數(shù)據(jù)恢復(fù)特性。
除了分布式架構(gòu),Nebula Graph 獨(dú)創(chuàng)圖查詢語言 -- nGQL。這是一種為圖結(jié)構(gòu)設(shè)計(jì)的類 SQL 查詢語言,有 SQL 使用背景的工程師可快速上手 nGQL。
同時,Nebula Graph 開發(fā)了一款圖數(shù)據(jù)可視化工具 -- Nebula Graph Studio,具備數(shù)據(jù)導(dǎo)入和圖探索功能,可對數(shù)據(jù)進(jìn)行實(shí)時交互分析,幫助用戶理解圖數(shù)據(jù)結(jié)構(gòu)。
圖數(shù)據(jù)庫市場和應(yīng)用
在過去的2年時間里,近1.25億美元注入 Nebula Graph 所在的圖數(shù)據(jù)庫行業(yè),資本市場對圖數(shù)據(jù)庫行業(yè)的支持可見一斑。
和 RDBMS 不同,圖數(shù)據(jù)庫不僅存儲數(shù)據(jù)本身,也存儲了數(shù)據(jù)之間的深層關(guān)系。因此,圖數(shù)據(jù)庫可高效地管理萬億級別關(guān)聯(lián)數(shù)據(jù),挖掘數(shù)據(jù)之間的深層關(guān)系,而這恰恰是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(RDBMS)難以解決的問題。
對 CIO 而言,Nebula Graph 是挖掘現(xiàn)存數(shù)據(jù)關(guān)聯(lián)關(guān)系潛在價值的絕佳選擇。對希望低成本、高效地處理關(guān)聯(lián)關(guān)系的架構(gòu)師而言,Nebula Graph 也是一個理想的選擇方案。此外,數(shù)據(jù)科學(xué)家也可用 Nebula Graph 深挖數(shù)據(jù)背后的關(guān)聯(lián)價值。
現(xiàn)代商業(yè)社會產(chǎn)生了海量數(shù)據(jù),不同的數(shù)據(jù)儲存在不同的地方,容易形成信息孤島。利用 Nebula Graph,企業(yè)可以打通信息孤島,挖掘數(shù)據(jù)中有意義的關(guān)聯(lián)信息加以利用。例如,在金融領(lǐng)域,可以利用 Nebula Graph 發(fā)現(xiàn)潛在風(fēng)險(xiǎn),預(yù)防團(tuán)伙作案的金融欺詐事件;政府有關(guān)部門也可用于監(jiān)控線上活動、機(jī)構(gòu)、賬號等,第一時間發(fā)現(xiàn)潛在威脅、應(yīng)對可疑情況。
除了上述場景,還有許多 Nebula Graph 適用場景。通過 Nebula Graph,社交媒體網(wǎng)可將用戶進(jìn)行點(diǎn)對點(diǎn)連接,更好地服務(wù)于他們;在物聯(lián)網(wǎng)(IoT)領(lǐng)域,只有設(shè)備間的關(guān)聯(lián)有意義,才能帶來更大的商業(yè)價值;線上零售、醫(yī)療保健領(lǐng)域、人工智能(AI)領(lǐng)域,Nebula Graph 也可助力處理、挖掘關(guān)聯(lián)信息。
如何使用 Nebula Graph
目前 Nebula Graph V1.0 已發(fā)布,可基于 Apache 2.0 許可證使用 Nebula Graph。近期 Nebula Graph 將會提供云上服務(wù)。
用戶寄語
“之前京東數(shù)科的圖服務(wù)是由 JanusGraph 提供的,我們碰到的主要問題是寫入和查詢速度很慢,且社區(qū)不活躍 bug fix 不及時,導(dǎo)致業(yè)務(wù)使用體驗(yàn)不理想。正在尋找新的解決方案時,遇到 Nebula Graph 剛啟動,所以京東數(shù)科圖技術(shù)團(tuán)隊(duì)立刻就參與了 Nebula Graph 的開源社區(qū),并一起參與和合作開發(fā)了很多功能。借助 Nebula Graph 圖數(shù)據(jù)庫的高性能分布式存儲和查詢能力,從京東數(shù)科海量數(shù)據(jù)集中挖掘重要的關(guān)聯(lián)關(guān)系,很好的助力內(nèi)部和集團(tuán)業(yè)務(wù)的開展。目前,我們正在將更多的圖項(xiàng)目從傳統(tǒng)方案遷移到 NebulaGraph?!?/p>
-- 京東數(shù)科圖技術(shù)團(tuán)隊(duì)負(fù)責(zé)人錢勇
“在接觸 Nebula Graph 之前,我們的圖譜項(xiàng)目已經(jīng)試用過多個知名的開源圖數(shù)據(jù)庫,包括 Neo4j、JanusGraph、DGraph 這些在 DB-Engine 上排名非??壳暗漠a(chǎn)品,但在規(guī)模和性能上沒法滿足我們的要求,導(dǎo)致項(xiàng)目一直沒有上線。當(dāng)遇到 Nebula Graph 后,我們發(fā)現(xiàn) Nebula Graph 的架構(gòu)設(shè)計(jì)簡潔可擴(kuò)展,且基于 C++ 開發(fā),性能特別強(qiáng)勁,具備非常強(qiáng)的互聯(lián)網(wǎng)分布式基因;Nebula的同學(xué)們也非常給力靠譜,大家一起解決了N多個技術(shù)難題,成功把性能提升到遠(yuǎn)超最初規(guī)劃,并且基于公司已有基礎(chǔ)設(shè)施,搭建了一套圖數(shù)據(jù)庫平臺,方便業(yè)務(wù)接入。現(xiàn)在,我們正在通力合作,把更多的知識圖譜項(xiàng)目遷移到 Nebula Graph 上面來?!?/p>
-- 美團(tuán)點(diǎn)評AI平臺技術(shù)專家趙登昌
基于圖的風(fēng)控和推薦方案相比傳統(tǒng)方案有很大的技術(shù)優(yōu)勢,通過圖技術(shù)賦予的新能力,我們在業(yè)務(wù)上發(fā)現(xiàn)了很多有意思的增長點(diǎn)。但由于業(yè)務(wù)上對于低時延、高并發(fā)的要求,我們一直在尋找高性能的開源圖數(shù)據(jù)庫方案。在通過詳盡的比較 Nebula Graph、Neo4j、DGraph、JanusGraph 幾種開源方案后,我們最終選用了 Nebula Graph,是基于這樣幾個原因:
-- 有贊數(shù)據(jù)基礎(chǔ)平臺技術(shù)專家陳琦
“基于企業(yè)間關(guān)系的企業(yè)圖譜、供應(yīng)鏈關(guān)系、企業(yè)知識圖譜這些應(yīng)用都是非常典型的知識圖譜應(yīng)用,也非常適合使用圖數(shù)據(jù)庫來作為基礎(chǔ)設(shè)施支撐業(yè)務(wù)發(fā)展。最初階段,我們使用了某知名單機(jī)圖數(shù)據(jù)庫的方案,很好的支持了彼時業(yè)務(wù)的快速擴(kuò)張;但隨著互聯(lián)網(wǎng)式的數(shù)據(jù)量和訪問規(guī)??焖僭黾?,這樣的方案在擴(kuò)展性和時效性上的問題越來越突出。在得知 Nebula Graph 去年5月份開源后,我們就一直持續(xù)關(guān)注其動態(tài),其分布式架構(gòu)很適合我們的業(yè)務(wù)需求,并且迭代速度相當(dāng)快速。在經(jīng)過幾個月的試用和調(diào)優(yōu)后,Nebula Graph 已經(jīng)在相當(dāng)多內(nèi)部業(yè)務(wù)上替代了原方案;未來,隨著對于 OpenCypher 的兼容,我們計(jì)劃將更多業(yè)務(wù)遷移到 Nebula Graph上?!?/p>
-- 蘇州朗動網(wǎng)絡(luò)技術(shù)有限公司(企查查)知識圖譜算法專家鄭文裕
“I have a graph,a red graph. 小紅書作為一個在線社區(qū),有著很多的圖存在:用戶和筆記的交互關(guān)系,用戶和用戶的關(guān)注關(guān)系,電商交易關(guān)系等等。關(guān)系型數(shù)據(jù)庫往往不能有效支撐小紅書這樣一個量級的圖有效存儲和實(shí)時查詢計(jì)算。筆者接觸過不少圖數(shù)據(jù)庫,一些寄希望于摩爾定律的發(fā)展,其他在性能上達(dá)不到我們的要求。我們選用Nebula圖數(shù)據(jù)庫,首先來自對團(tuán)隊(duì)的信任,創(chuàng)始人和核心成員在Facebook和螞蟻金服,阿里等大公司做過圖數(shù)據(jù)庫,支撐了在線業(yè)務(wù)數(shù)據(jù)流下的推薦、搜索和風(fēng)控等多個場景,深刻理解數(shù)據(jù)和業(yè)務(wù)形態(tài)以及之上的算法場景和需求,是最熟悉中國一線互聯(lián)網(wǎng)公司圖數(shù)據(jù)庫需求的團(tuán)隊(duì)。其次諸多核心架構(gòu)設(shè)計(jì)保證了對于超大規(guī)模數(shù)據(jù)的支持和集群規(guī)模的可擴(kuò)展性。值得一提的是,對于圖上經(jīng)典的熱點(diǎn)問題,Nebula最早應(yīng)小紅書需求實(shí)現(xiàn)了蓄水池抽樣算法。我們也利用Nebula這個風(fēng)控底層武器來保護(hù)小紅書社區(qū)這個Red Graph,同時也在賦能給我們的其它業(yè)務(wù)算法線。”
-- 小紅書反作弊風(fēng)控策略算法負(fù)責(zé)人吹雪