• 学前教育
  • 小学学习
  • 初中学习
  • 高中学习
  • 语文学习
  • 数学学习
  • 英语学习
  • 作文范文
  • 文科资料
  • 理科资料
  • 文档大全
  • 当前位置: 雅意学习网 > 理科资料 > 正文

    一种基于知识图谱的警用统

    时间:2021-05-03 16:00:26 来源:雅意学习网 本文已影响 雅意学习网手机站


      摘要:近年来知识图谱应用逐渐从知识分析扩展为对社会实体及其关系的表达,其在知识表示和碎片化知识融合方面的优势特别适用于警用大数据的需求。本文针对公安数据资源特点,提出了一种基于知识图谱的描述模型,用于在公安领域中对关注对象及其关系进行统一的描述,满足不同类型的大数据应用。实践表明该模型能够将海量异构多源数据统一组织,并较好满足多种警用大数据的计算需求。
      关键词:知识图谱;警用大数据;描述模型
      中图分类号:TP182 文献标识码:A 文章编号:1672-9129(2019)02-0022-07
      引言
      近年来,全国公安机关深入实施警务大数据战略,各地公安大数据应用得到蓬勃发展。随着海量数据的汇集,数据治理成为深化大数据应用的重要工作。由于公安工作的特殊性,公安大数据多源、异构、自治、高维、低质的特征非常明显,在数据治理过程中数据的清洗、转换和再组织一直是警用大数据系统的重要内容。这其中数据再组织一直是警用大数据的一个重点。在公安信息化早期,数据再组织主要通过建设专题库实现。信息系统数据从业务库进入专题库的过程中,通过一系列转换后成为具有某个公安业务属性的专题数据,从而支撑对应的应用。在数据仓库技术普及后,建立数据仓库成为数据再组织的重要内容。然而,专题库往往基于某个业务需求制定的规则而建立,其适用范围必然收到业务的限制,甚至在规则不够普适的情况下更受到规则的限制,造成专题库的应用范围较窄。随着公安信息化的深入,数据汇集加大,数据共享需求宽泛后,专题库建设也愈发频繁,不可避免的因为各种原因造成建立很多专题库,但其中又存在大量的冗余数据项。而数据仓库更适合统计分析,在以OLTP为主要应用的场景,数据仓库并不能很好的支持。因此,在数据仓库出现后,公安信息化部门不仅要维护专题库,还要维护数据仓库,数据维护压力更大。在RMDBS技术环境下,随着数据的增长,无论是专题库还是数据仓库规模不断增加,其性能增长明显滞后于需求发展,而维护复杂度却显著超前于数据增长。大数据技术出现后,基于分布式文件系统和列式数据库技术能够有效满足超大规模数据库应用需求,但是在警用大数据建设应用过程中,我們发现,仅仅使用大数据技术在数据治理过程中仍然体现出被动性。主要表现在无论是使用Hive还是HBase,使用MapReduce或者Spark,在面对公安应用场景时存在计算复杂、效率不高的情况。因为公安应用场景重点在于对公安关注的对象,这种对象可能是人、地、案、事、物等公安五要素的一个多个,及其吃住行消乐网等行为的分析。这种分析是多元的,对数据要求是多源的,只使用传统大数据技术仍然会陷入过往专题库建设的困境,即对不同应用需求要么建立专题库,要么使用诸如虚拟表等技术临时组织,这样虽然能满足需求,但实践表明效率不高。特别是公安民警在使用大数据系统时,由于线索掌握不足,多数时候查询精确度不高,在多人并发时系统性能下降非常明显。而这种方式在面对更复杂的查询,如“张三密切联系的人”等,更多是依靠人工定制的方式建设专属功能,但这种方式显然难以满足在大数据应用普及下层出不穷的需求。
      在公安大数据建设中,需要一种统一的描述模型,用于对公安关注的对象进行描述,并具有较好的普适性能够用于公安业务的不同场景而不需专门针对业务定制数据模型。这种模型既要具有丰富的社会属性,能够表达出不同种类、不同属性的社会生活中公安关注的对象(后文为表述方便,我们均统一称之为对象),同时又能够便于在社会关系分析中使用。在构建社会关系网络过程中,我们发现一般的社会网络缺乏语义的支持,在进行社会关系分析时灵活性不高,语义网络具有较好的支持性,如果加入恰当的领域知识或本体,则在进行知识推理的同时,实际上也能够作为基本的模型来使用。因此,在参考知识图谱有关概念的基础上,我们提出一种基于知识图谱的警用统一对象描述模型,实际应用表明其能够较好满足当前公安大数据应用场景下的大多数需求,具有较好的描述性、推理性和性能。
      1知识图谱的概念及应用
      知识图谱由Google于2012年5月17日正式提出,最初是为了提高搜索引擎的能力,提升搜索质量,让用户获得更好的搜索体验。其本质是Google的语义网络知识库,采用语义检索技术从多种信息源收集与某一主题相关的实体或概念,以及他们之间的关联所形成的网络图,图中的节点对应实体或概念,图中的弧对应实体或概念之间的关联关系。知识图谱为互联网上海量、异构、动态的大数据表达、组织、管理以及利用提供了一种更为有效的方式,使得网络的智能化水平更高,更加接近于人类的认知思维。随着智能信息服务应用的不断发展,知识图谱已被广泛应用于智能搜索、智能问答、个性化推荐等领域。
      虽然知识图谱最初是用于网页中的知识的建模,但是由于网络中的信息本身就反映了现实社会,因此知识图谱建模的过程,将网络空间包含的各类实体关联知识用有效的组织方式存储,其实质反映的是社会生活中各类实体及其之间的关联关系,知识图谱中实体的概念就自然被扩大为广义对象,包含世界中客观存在的事物以及人类思维空间中的概念。因此知识图谱近年来已逐渐从传统的知识分析应用扩展到对社会实体及其关系的研究和应用中,特别是在行业知识图谱应用领域得到广泛应用。另一方面,知识图谱具有适用于表示和融合碎片化知识的优点,不仅给出了局部知识到全局知识的统一表示形式加速知识融合,也简化了碎片化知识间关联关系的搜索。知识图谱的这两个特点特别适合公安领域应用。一方面,公安机关面向的对象就是社会上各类个体,主要工作内容就是分析个体及个体间的关系并开展相应的工作;另一方面,公安机关获取的信息天然就是碎片化的,但是公安工作必须要将碎片化信息整合为全局性信息才能正确开展。因此,知识图谱对公安工作具有很好的适应性,同时知识图谱也给出了一种全局知识统一表现形式,对警用大数据建设提供了很好的启发。
      当前对知识图谱的研究比较多,官赛萍等总结了当前主要的面向知识图谱的知识推理技术,李娟子等对知识图谱的知识表示、构建和应用进行了研究,刘峤等重点研究了知识图谱的构建技术,杨玉基等提出了一种“四步法”的知识图谱构建技术,张香玲等对实体搜索技术进行了研究。这些研究更多是针对网页等半结构化、非结构化的通用型知识图谱的一般性技术。在行业应用领域,陈德华等提出了一种基于深度学习的临床领域时序知识图谱链接预测模型,金贵阳等采用知识图谱技术在钢铁企业中应用取得了较好效果,结合国内其他的一些文献可见,当前在行业领域的知识图谱应用主要还是用于文档分析,服务于智能搜索。针对公共安全领域的知识图谱研究除了情报学领域是主要应用外,冯元为对公安情报工作中关注的信息采用知识图谱进行建模和分析,Neumann等对涉毒资金洗钱采用语义网进行分析.Szekely等使用知识图谱减少人口交易。但是这些公共安全领域应用仍然主要基于Web的分析和应用,多从语义解析上来建立实体间联系,且主要应用于某一个具体的应用中。

    推荐访问:图谱 警用 知识

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章