21创投行研|资本“抢滩”图数据库:国内企业如何构建新的护城河?

创业·投资马婷婷 2022-09-16 16:31

因为优秀的表达能力、灵活的分析能力,图技术正在成为当下数据分析领域最热的技术之一。

21世纪经济报道见习记者 马婷婷 北京报道

因为优秀的表达能力、灵活的分析能力,图技术正在成为当下数据分析领域最热的技术之一。

知名研究机构Gartner 最新报告预计,到 2025 年,图技术将用于80%的数据分析创新,进一步促进企业的运营决策。但在去年底,这个数值仅有10%。

也有相关数据显示,截至2025年,包括图数据库管理系统(DBMS)在内的图技术市场将增长到32亿美元,复合年增长率为28.1%。目前,大型传统数据库管理系统供应商和初创公司都在瞄准这个极具爆发潜力的赛道。

与此同时,诸多嗅觉敏锐的投资机构对这一领域也在加速布局。在国外市场,去年,国际知名的图数据库公司Neo4j 宣布,完成由Eurazeo 领投、GV(原 Google Ventures)参投的 3.25亿美元F轮股权融资,创下图数据库与图计算赛道的最大单笔股权融资。美国图数据库厂商TigerGraph也在2021年完成了自己C轮1.05亿美金的融资。

在国内市场,投资机构也正在紧密的布局包括图数据库在内的整个数据库领域,2021年,获得新一轮融资的数据库企业超过了20家,一些头部基金投资的数量超过了3家。

今年初,国内图计算头部企业海致科技完成由中国互联网投资基金领投,上海人工智能产业投资基金、高瓴创投、君联资本、微村智科、一村资本、亿宸资本、禾其资本跟投的超过5亿元的D轮融资。

在此之前,海致科技完成多轮融资,投资方包括BAI资本、高瓴创投、君联资本等知名投资机构。

在投资行业人士看来,持续加码图数据库赛道投资,除了赛道本身的高爆发潜力,另一个重要原因是行业竞争格局未定,而该赛道本身的庞大市场空间,能够支撑出现多家独角兽企业。

技术:超越关系型数据库

近年,图数据库和图计算技术高速发展,其在复杂场景的计算速度,较传统关系型数据库有着指数级提升。

相比关系型数据库,图数据库更能实现对真实世界的完整描摹——以图的方式进行建模,能更好地表达万事万物之间的关系。

“某种程度而言,图数据库是知识图谱的一大核心技术环节,尤其是高性能图数据库,可以支持更大范围的实时应用场景,包括万亿级大图查询,对金融领域高频交易、工业互联网产效提升、能源领域电碳实时测算等应用场景都能提供强有力的支撑。”海致科技集团总裁杨娟在接受本报记者采访时表示。

在大数据时代,越来越多企业发现,原先的关系型数据库虽然简洁易理解,但它未必能全面真实的展现“现实世界”的描述。

以金融领域反洗钱为例,随着互联网技术发展与支付电子化,洗钱活动正变得更加专业复杂隐蔽。在关系型数据库有时对涉嫌洗钱行为的展示不够直观,难以甄别潜在的其他洗钱资金流向关系。

因此,越来越多全球银行正构建基于图数据库与知识图谱的反洗钱监测应用平台,通过覆盖千万级别节点和亿级关系,建立反洗钱客户关系网络,融合可疑交易特征和全量交易登录流水,以网络图谱方式动态展现资金流转全貌,完整准确展现团伙共用设备关系、账户资金分层结构和流向轨迹。如此,银行风控团队也能通过图的异常形态识别与人工智能图算法构建有效预警模型,从广大客群里“抓到”涉嫌洗钱团伙。

不仅是金融领域,全球工业制造,交通、能源、政府部门等各个领域都对图数据库技术的使用需求日益旺盛,而越来越多图数据库研发商通过将图算法和机器学习融合在一起,投射到各类业务场景,这项技术在金融、工业制造、能源、交通、医疗等领域得到迅猛发展。

然而,由于不同行业的数据来源与数据结构差别很大,如何通过图数据库、图计算等技术实现知识图谱升级迭代并构建多模态知识图谱,正成为新的挑战。

杨娟告诉记者,金融与政府行业的数据相对而言更具结构化特点,但能源、工业制造等行业有大量非结构化数据,比如文本、音频、视频、设备数据。这都需要图数据库研发商不断加大研发投入升级多模态知识图谱技术,致力于提升多模态知识数据的汇聚、检索、问答、模型训练、知识抽取、图谱构建与价值挖掘能力。

“我们的解决方案是采取底层技术与行业应用相隔离的策略,即产品是分层的,底下会有一个通用平台层,即各个行业都通用的技术组件,在这个平台层上,有不同行业团队去构建针对每个行业的场景和模型,与各个行业相匹配。”杨娟说。

市场:国内企业的超车机会

在关系型数据库领域,国外企业如Oracle、DB2因先发优势而具有较大优势,令国产关系型数据库行业的追赶周期相对较长。相比而言,图计算技术比较新,且国内外技术差距不大,令国内图数据库领域的追赶能力更强。

杨娟告诉记者,“尽管现在海外图数据库产品在国内占据较高市场份额,但国内相关产品正迅速兴起,且在某些技术环节具备较强竞争力。”

她分析指出:首先,多数海外图数据库产品仍是单机为主的技术架构,在分布式领域技术架构未必完善,无法在分布式环境下实现扩容,但国内众多图数据库研发平台基于云计算的分布式环境搭建新的技术架构,在分布式的高性能图计算方面具有一定领先性。

其次,基于国内企业需求的深入洞察与图计算技术迭代升级,国内图数据库企业在基础架构层设计、产品语言等方面也有一定前沿性。越来越多的国内金融机构与企业选择技术自主可控的图数据库企业合作,而后者通过与不同行业企业开展合作,产品性能得到更多打磨锤炼,业务空间得到进一步提升。

杨娟告诉记者,就近期参加的各种POC(Proof of concept,概念验证,针对客户具体应用的验证性测试)与评测分析,相比海外同行,海致的图数据库在不少性能方面表现更好。

在杨娟看来,超越欧美图数据库,形成新的竞争壁垒,国内企业必须在具体三大条件:一是,技术方面的深入洞察和前沿视野;二是,搭建卓越的技术研发团队,三是,与不同行业龙头企业开展合作,构建相关图数据库与图计算技术应用的“行业标准”。

据了解,海致今年参与了国际权威技术协会“关联数据基准委员会(LDBC)”立项的全球首个金融图数据库测试基准的编写,标准组成员还包括蚂蚁集团、Intel等国内外 6 家知名头部科技公司。

杨娟补充表示,国内大型互联网公司在图计算领域技术也有优势,但其技术、团队则与其主营业务紧密绑定,产品场景高度定制化。更多偏向2C端服务,因此与聚焦B端产品和服务的公司,并不存在诸多竞争。

“随着元宇宙产业的快速兴起,图能够更清晰的实现虚实映射,也是帮助数字人进行认知和思考的技术,我们也在探索图技术在元宇宙之中的应用以及发展空间。”杨娟说。

(作者:马婷婷 编辑:林坤)

马婷婷

记者兼研究员

关注创投行业大小事,联系邮箱:matt@21jingji.com