图数据库怎么样?图数据库的应用场景.pptx

上传人:夺命阿水 文档编号:351428 上传时间:2023-04-23 格式:PPTX 页数:28 大小:1.10MB
返回 下载 相关 举报
图数据库怎么样?图数据库的应用场景.pptx_第1页
第1页 / 共28页
图数据库怎么样?图数据库的应用场景.pptx_第2页
第2页 / 共28页
图数据库怎么样?图数据库的应用场景.pptx_第3页
第3页 / 共28页
图数据库怎么样?图数据库的应用场景.pptx_第4页
第4页 / 共28页
图数据库怎么样?图数据库的应用场景.pptx_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《图数据库怎么样?图数据库的应用场景.pptx》由会员分享,可在线阅读,更多相关《图数据库怎么样?图数据库的应用场景.pptx(28页珍藏版)》请在课桌文档上搜索。

1、图数据库的应用场景,图数据库怎么样?,传统的互联网行业,多数企业都已应用于关系型数据库,近年来数据存储技术飞速发展、数据量激增且数据间关系越发复杂,传统关系型数据库在灵活性、效率等方面已经不能保持其曾经的垄断地位。数易轩致力于图数据库技术服务,为您介绍图数据库在企业中的应用场景方法。,图数据库怎么样?图数据库的应用场景,NoSQL 作为一组迅速崛起的数据存储技术,用于解决关系型数据库在多变的应用场景下的性能限制,目前包含如下几种类型:,图数据库怎么样?图数据库的应用场景,键值型,如 Redis 或 Riak,列型,如 HBase 或 Cassandra,文档型,如 MongoDB 或 Couc

2、hDB,图型,如 Neo4j 或 GraphDB,这些数据库各有自己擅长的领域,都在企业有着非常广泛的应用场景。尤其是图数据库,作为企业知识图谱的底层存储方案,是多方数据的知识融合及提炼后进行汇聚的场所,为企业丰富的产品线与数据技术间的承转起着重要作用。,图数据库怎么样?图数据库的应用场景,图数据库简介,数易轩图数据库技术小组,PART 01,图数据库中的“图”,取自数学中的一个分支“图论”。在图论中,“图”代表的是一种数据结构,形式上,其实就是“顶点”和“边”的集合,用更为通俗地语言来讲,图通常具备如下特征:,图数据库简介,由节点和边构成,节点可以有属性(通常以键值对的方式出现),边可以有方

3、向,并总是有一个开始节点和一个结束节点,边也可以有属性,图数据库就是利用图的特性来对数据进行存储管理,并对传统图的概念进行了扩展。越来越成熟的数据模型,使得利用事物(即“节点”或“实体”)及事物之间的联系(即“边”或“关系”)来对各类业务场景进行抽象变得更加容易。也正因为图数据库基于图论的理论和算法实现,相对于关系型数据库,它也更擅于处理网状的复杂关系。,图数据库简介,图数据库在企业的应用,数易轩图数据库技术小组,PART 02,从数据规模来看,目前我们的图数据库已经融合了多方数据,包括业务系统主要产品线各阶段的数据、用户授权数据等。这些数据形成的实体规模已过亿,所形成的关系更是多达数亿。随着

4、企业产品越来越丰富,以及用户对企业平台越来越信任,这个数据还在持续高速增长;从数据产品来看,基于图数据库开发的知识图谱正在发挥着越来越大的作用,目前已经上线或待上线的产品覆盖了客户失联修复、反欺诈规则引擎、欺诈团伙调查等,近期还会覆盖风险预警、获客等方向。,图数据库在企业的应用,欺诈团伙调查,数据科学领域有名名言叫“一图胜千言”。图数据库的优势在于能通过“实体”和“关系”这种简单直观的描述方法来表述现实世界中错综复杂的关联关系。然而,图数据库呈现信息的方式,并不限于简单的节点和边。它可以提供逐层挖掘的方式,引导用户逐步深入分析各种关系;还可以快速及时地呈现实体之间最新的关系变化,为用户积累新鲜

5、的知识和经验;也可以清晰地呈现复杂关系间的联络线索,为用户判断事件来龙去脉提供有效引导。,图数据库简介,欺诈团伙调查,此处,我们仍然以企业的客户为例,参考下图中的客户徐某(因数据安全的原因,部分信息作了涂抹,并对原有图结构进行了简化),如果仅考虑该客户自己填写的信息,虽然我们也能看到一度关联信息,但完全看不出该结构会有什么问题,也无法进行深入调查。,图数据库在企业的应用,欺诈团伙调查,此处,我们仍然以企业的客户为例,参考下图中的客户徐某(因数据安全的原因,部分信息作了涂抹,并对原有图结构进行了简化),如果仅考虑该客户自己填写的信息,虽然我们也能看到一度关联信息,但完全看不出该结构会有什么问题,

6、也无法进行深入调查。,图数据库在企业的应用,欺诈团伙调查,当关联信息得到补充(相对于原来的进件联系人,补充了同事、邻居、亲属、朋友等关系,还基于用户授权数据进行了深度扩展)后,暂不考虑物品(如手机号、银行账号、地址等),仅考虑自然人,获取徐某二度关系内同时在企业有借款行为的用户,得到下图(基于同样原因数据有涂抹及简化)的结果,该图每一个圆都代表一位企业客户,图顶部的状态说明了客户当前所处状态。,图数据库在企业的应用,欺诈团伙调查,仔细观察左下角以徐某为中心的四个客户(已用红框标出),他们刚好是所呈现图的最大完全子图,符合图论中团的定义。再看除徐某外的三个客户:两个逾期,一个被拒。如果徐某是新入

7、图数据库的借款人,从数学模型的角度看,几乎可以直接判定拒绝。因为符合这种状态的团,是欺诈团伙或是组团代办的几率非常大。,图数据库在企业的应用,欺诈团伙调查,到这时工作并未完结,如果有需要,可以基于图中的关系尝试与几位客户联系以进行深入背景调查证实,调查的结论可以融合到图数据库中形成数据闭环,直接改善后续自动化预警的结果。,图数据库在企业的应用,风险事件预警,尽管欺诈团伙调查能取得很不错的效果,但因为其可能需要调查员随时联系客户或其周边人群以验证调查员的的推论,因此整体成本还是相当高的。为了解决这个问题,基于模型的风险事件预期就应声而出了。如果说欺诈团伙调查是主动出击,则风险事件预警更像是被动防

8、御。她随时守护着企业的客户群体,一旦有判定的风险事件就会警告相关方,必要的时候可以自动向调查员提请欺诈团伙调查。,图数据库在企业的应用,风险事件预警,风险事件预警会通过模型生成一组类似上述欺诈团伙调查中出现的场景,但给每一个场景一个相对低一些的初始置信度,后期通过不断地反馈迭代来优化置信度。当一个新客户到来之后,首先会将其信息整合到知识图谱中。紧接着,该客户会被规则引擎捕捉到,规则引擎会基于客户信息从知识图谱中提取一组特征,由该特征决定了引擎首先会触发哪些场景,而这些场景的结论可能导致规则引擎又触发另外一组场景。在满足特定条件下,最终结果输出,如果有相应的风险事件被触发则信息会送达相关团队。,

9、图数据库在企业的应用,风险事件预警,风险事件预警最有意思的地方在于,一个新客户的到来,可能会导致一个早先客户的风险事件被触发。这主要是因为新客户融入到知识图谱中时带进的新数据,可能会让图谱中的某些子网的结构发生彻底的改变。我们目前采用一组启发式的算法来扩展新进客户的影响,效果显著。这同时也意味着,风险事件预警并非只针对贷前风险事件,还会对贷后风险事件作为预警。比如触发了某个老客户的潜在逾期风险时,就可以引导相关团队提前关注,在情况恶化前及时止损。具体的技术细节不再赘述。,图数据库在企业的应用,失联信息修复,众所周知,互联网金融的核心是风险控制。无论属于何种风险,最终极的形态就是“人间蒸发”,行

10、话即“客户失联”。首先,“失联”是要尽量避免的。如果客户奔着欺诈而来,那几乎也注定了后续无法联系上,姑且让我们称此类失联为“第一类失联”;其次,“失联”是无法完全避免的,主要是因为失联的“成本”很低,很多客户受到一点挫折就可能游走在“消失”与“不消失”的边缘。,图数据库在企业的应用,失联信息修复,即使客户自身“消失”的意愿不高,换个手机号、搬个家、换个公司都有可能导致客户及其联系人完全联系不上,让我们称此类除第一类失联之外的为“第二类失联”。原则上,如果反欺诈做得好,“第一类失联”是不应该出现的。而对于第二类失联,则恰恰是图数据库大展身手的地方.将图数据库应用于失联修复是非常直接而自然的,因为

11、图数据库的特点就是其在数据丰富的条件下,能非常方便地进行各类关系的提取。,图数据库在企业的应用,失联信息修复,企业的失联修复项目结合了知识图谱(基于图数据库)及传统的机器学习技术,前者作为修复策略的具体联系方式来源;后者作为策略有效性的评估依据。目前我们能做到失联客户实时修复,修复专员完成具体操作后会有相应的备注及日志信息,这些数据会被实时收集用于改进修复策略。本文仅拿众多策略中较为容易理解的一条来略作说明,这条策略主要是从图数据库中提取和失联客户处于同一公司,且当前住址与失联客户接近的用户作为修复中间人。,图数据库在企业的应用,失联信息修复,虽然是一条简单的策略,但深入考虑一下,会发现国内有

12、很多规模不小的工厂会吸引周边村子的人去工作,而这些村子可能本身规模也不小,这样的话修复中间人不见得认识失联人。因此这条简单的策略背后会也会有一个启发式算法,通过公司/工厂的规模来调整当前住址需要匹配的粒度(比如,是到村、到组、还是得具体到门牌相邻)。,图数据库在企业的应用,失联信息修复,更进一步地,如果在此基础之上,修复中间人和失联人有过通话记录往来或是有通讯录关联(事实的条件远比这个复杂),就大幅增加了该修复中间人的置信度,甚至可以基于此条件在图数据库查询过程中提前中止,直接返回相关结论。以上操作基于图数据库可以将数据一次取出再进行处理,基本是毫秒级响应,如果触发了提前中止,耗时可能更短;但

13、如果基于关系型数据库,首先会涉及多张业务表的检索、关联;其次,还可能按照初次处理结果多次连接数据库,造成数据库资源的浪费。,图数据库在企业的应用,获客,这部分主要谈“开源节流”中的“开源”。互联网金融的出现,加速暴露了中国长期以来以银行为核心的金融体系形成的弊端。由于银行独特运营特征,让资金的融通出现了供给与需求较为严重的错配现象,在银行的金融体系中较为较为青睐的贷款客户很多压根都用不着贷款。而对于大多数真正需要借款作为资金周转的人往往很难达到银行所需的借款资质。,图数据库在企业的应用,获客,图数据库在商品推荐场景下的应用已然非常成熟,但主要集中在电商行业。我们采用的方案有两个步骤,第一步是自

14、动识别优质客户,采用 Bootstrap 方法,基于一组种子优质客户进行多次迭代以扩展优质客户。这个过程的特点是除了客户自身属性特征,还会基于图数据库提取基于社会网络分析的特征;第二步是基于图数据库挖掘较高置信度的优质客户周边人群,将满足特定模式条件人作为潜在客户,两个步骤各自都有严格的评估标准以保准最终效果。,图数据库在企业的应用,总结,数易轩图数据库技术小组,PART 03,在实际的应用架构中,通常会混合使用多种数据库,以利用它们各自的特点来创建一个数据生态系统。对于企业而言,业务系统的高效及事务特征会让关系型数据库继续出彩;大规模的用户授权数据可能会让我们在底层配上分布式的列式存储或键值存储库;但回归根本,企业期望为客户提供优异的财富管理及借款信息咨询与服务,就需要优秀的风险控制作保障。而这,恰恰也是图数据库能最大程度发挥价值的领域之一。我们长久以来践行将“风险控制”作为平台生命线,致力于以先进的金融创新技术护航平台安全,以知识图谱等最前沿的高新技术铸风控之盾,势必能打造一个安全、高效、用户体验好的互联网金融平台。,总结,感谢您的观看,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 在线阅读 > 生活休闲


备案号:宁ICP备20000045号-1

经营许可证:宁B2-20210002

宁公网安备 64010402000986号