《Giiso写作机器人教你如何看懂知识图谱.docx》由会员分享,可在线阅读,更多相关《Giiso写作机器人教你如何看懂知识图谱.docx(4页珍藏版)》请在课桌文档上搜索。
1、Giiso写作机器人教你如何看僮知识图谱在社会网络中,一个著名的理论是:最多通过六个人,你就能够认识世界上任何一个陌生人.如果把每个人看作实体,找出人与人之间的联系,其中涉及的就是建设知识图谱的技术.在知识图谱的眼里,这个世界长什么样什么是知识图谱,可能大家都还不是太清楚.简单来说,知识图谱就是一张由知识点相互连接而成的语义网络.它是一种人工智能技术,是基于现有数据的再加工、结构化,再通过各种数据挖掘、信息抽取和知识融合技术形成一个统一的知识库.既然它是一张网,那么这张“网又是怎样来描述我们这个世界呢?知识图谱包括三个要素:实体、事件和关系.而这些三种都包括有若干属性,这些属性,可以是事先根据
2、过往资料就已经存在的,比如我们去直看工商信息,上面可能就有了公司的资本、股东、公司所在地等信息了;也可以是事件发生时才获取得到的.举个例子:w2015年8月26日,智搜信息技术有限公司以下简称智搜联得金沙江创投500万美元得Pre-A轮融资用知识图谱的三要素来分析,就有实体就是智搜和金沙江,事件就是融资,关系就是智搜获得金沙江的融资,或是金沙江投资了智搜.同时,这些概念也包括了各自的一些属性.比如智搜,从这句话中,就可以看出,三个属性:名字:智搜;主营业务:人工智能+资讯.同样,关系中也包括了三个属性:时间:2015年8月26日;内容:智搜获得金沙江的融资;融资金额:500万美元.当然,正如上
3、面所说,有些属性是事先就已经有了,比如金沙江,主营业务是创投.这样看似复杂的描述,可以用知识图谱简洁地表现出来:知识图谱与传统的知识库的区别?公司名:8委4封AXW WK公司名:金沙江公司名:创投国外的一些文献用4个单词做了总结:Fromstringstothingsf简单的来说就是从文本到实体,把从原来松散的文本结构变成有有关联的实体结构.继续拿谢霆锋相关的知识来举例,老的基于ToPiC的知识结构我们可能得到如下几个知识:1、谢霆锋的出生年月是哪一年?答案:1980年8月29日2、谢霆锋多大了?答案:37岁3、谢霆锋的前妻是谁?答案:张柏芝4、谢霆锋的现任女友是谁?答案:王菲当我们要处理上述
4、问题:谢霆锋前妻比现任女友小多少?”这个问题的时候不可避免的我们要按照老的结构再新增一个知识,带来了冗余穷举的问题.因此知识图谱相比传统知识体系优势:1、具备知识推理的逻辑结构能力;上述举例:谢霆锋前妻比现任女友小多少?2、实体、属性、关系能更好的理解语义范围域,提升上层应用例如搜索的准确率等;如何构建知识图谱?知识图谱自上世纪60年代从语义网络发展起来以后分别经历了1980年代的专家系统、1990年代的贝叶斯网络、2000年代的OWL和语义WEB,以及2010年以后的谷歌的知识图谱.谷歌目前的知识图谱已经包含了数亿个条目,并广泛应用于搜索、推荐等领域.知识图谱前身知识图谱的存储和查询语言也经
5、历了历史的洗涤,从RDF到OWL以及SPARQL直询,都逐渐因为使用上的不便及高昂的成本,而被工业界主流所遗弃.图数据库逐步成为目前主要的知识图谱存储方式.由于大规模知识图谱的构建往往会有众多的实体和关系需要从原始数据(可以是结构化也可以是非结构化)中被抽取出来,并以图的方式进行结构化存储,而我4怵赖的原始数据往往存在于多源异构的环境中,所以进行海量知识抽取和融合,就成了首要的无法回避的严峻问迤.对于结构化的数据转换为图结构是比较容易和相对轻松的工程,所以建议这一步应该首先被完成.对于复杂的非结构化数据,现阶段进行知识图谱构建的主要方法有传统NLP和基于深度学习模型两类方法,而目前越来越多倾向
6、于使用深度学习来抽取AVP(属性-值对有很多深度学习模型可以用来完成端到端的包括命名实体识别NERx关系抽取和关系补全等任务,从而构建和丰富知识图谱.展望分析随着大数据应用渐成趋势,未来一切数据都有可能会被纳入知识图谱与可视化分析,大幅提升决策效率.如果说大数据刚出现的头几年,人们还想青少年谈论性”一样,对这个概念之上谈兵;现在的大数据应用已经真正渗透到了各行各业,也使得分析人员对跟高效地从中提炼结论有了迫切需求,而知识图谱技术能够解决这一痛点.未来各垂直领域的海量数据如果都能以知识图谱的形式呈现,将有望优化行业资源,释放生产力和劳动力,提升社会整体的决策效率.随着AI技术的发展,知识图谱技术的应用领域也越来越广泛,未来会怎么样?我们拭目以待.