• 学前教育
  • 小学学习
  • 初中学习
  • 高中学习
  • 语文学习
  • 数学学习
  • 英语学习
  • 作文范文
  • 文科资料
  • 理科资料
  • 文档大全
  • 当前位置: 雅意学习网 > 小学学习 > 正文

    一种基于知识图谱的警用统一对象描述模型及其应用

    时间:2021-05-03 16:00:14 来源:雅意学习网 本文已影响 雅意学习网手机站


      摘要:近年来知识图谱应用逐渐从知识分析扩展为对社会实体及其关系的表达,其在知识表示和碎片化知识融合方面的优势特别适用于警用大数据的需求。本文针对公安数据资源特点,提出了一种基于知识图谱的描述模型,用于在公安领域中对关注对象及其关系进行统一的描述,满足不同类型的大数据应用。实践表明该模型能够将海量异构多源数据统一组织,并较好满足多种警用大数据的计算需求。
      关键词:知识图谱;警用大数据;描述模型
      中图分类号:TP182 文献标识码: 文章编号:1672-9129(2018)04-0112-05
      Abstract: Recent years, knowledge graph has been widely used to present social entities and their mutual relationships for its outstanding advantages in knowledge representing and merging. The police data is large scale and complicated connected, which makes the knowledge graph much useful in information extraction and inferring. In this paper, we proposed a descriptive model based on knowledge graph to describe the important police-related objects and relationships universally. This descriptive model can organize and distinguish the heterogeneous police-big-data, and at the same time can satisfy the computation requirements required by the multi-kinds of police usages.
      Key words: knowledge graph; police-big-data; descriptive model
      引言
      近年来,全国公安机关深入实施警务大数据战略,各地公安大数据应用得到蓬勃发展。随着海量数据的汇集,数据治理成为深化大数据应用的重要工作。由于公安工作的特殊性,公安大数据多源、异构、自治、高维、低质的特征非常明显,在数据治理过程中数据的清洗、转换和再组织一直是警用大数据系统的重要内容。这其中数据再组织一直是警用大数据的一个重点。在公安信息化早期,数据再组织主要通过建设专题库实现。信息系统数据从业务库进入专题库的过程中,通过一系列转换后成为具有某个公安业务屬性的专题数据,从而支撑对应的应用。在数据仓库技术普及后,建立数据仓库成为数据再组织的重要内容。然而,专题库往往基于某个业务需求制定的规则而建立,其适用范围必然收到业务的限制,甚至在规则不够普适的情况下更受到规则的限制,造成专题库的应用范围较窄。随着公安信息化的深入,数据汇集加大,数据共享需求宽泛后,专题库建设也愈发频繁,不可避免的因为各种原因造成建立很多专题库,但其中又存在大量的冗余数据项。而数据仓库更适合统计分析,在以OLTP为主要应用的场景,数据仓库并不能很好的支持。因此,在数据仓库出现后,公安信息化部门不仅要维护专题库,还要维护数据仓库,数据维护压力更大。在RMDBS技术环境下,随着数据的增长,无论是专题库还是数据仓库规模不断增加,其性能增长明显滞后于需求发展,而维护复杂度却显著超前于数据增长。大数据技术出现后,基于分布式文件系统和列式数据库技术能够有效满足超大规模数据库应用需求,但是在警用大数据建设应用过程中,我们发现,仅仅使用大数据技术在数据治理过程中仍然体现出被动性。主要表现在无论是使用Hive还是HBase,使用MapReduce或者Spark,在面对公安应用场景时存在计算复杂、效率不高的情况。因为公安应用场景重点在于对公安关注的对象,这种对象可能是人、地、案、事、物等公安五要素的一个多个,及其吃住行消乐网等行为的分析。这种分析是多元的,对数据要求是多源的,只使用传统大数据技术仍然会陷入过往专题库建设的困境,即对不同应用需求要么建立专题库,要么使用诸如虚拟表等技术临时组织,这样虽然能满足需求,但实践表明效率不高。特别是公安民警在使用大数据系统时,由于线索掌握不足,多数时候查询精确度不高,在多人并发时系统性能下降非常明显。而这种方式在面对更复杂的查询,如“张三密切联系的人”等,更多是依靠人工定制的方式建设专属功能,但这种方式显然难以满足在大数据应用普及下层出不穷的需求。
      在公安大数据建设中,需要一种统一的描述模型,用于对公安关注的对象进行描述,并具有较好的普适性能够用于公安业务的不同场景而不需专门针对业务定制数据模型。这种模型既要具有丰富的社会属性,能够表达出不同种类、不同属性的社会生活中公安关注的对象(后文为表述方便,我们均统一称之为对象),同时又能够便于在社会关系分析中使用。在构建社会关系网络过程中,我们发现一般的社会网络缺乏语义的支持,在进行社会关系分析时灵活性不高,语义网络具有较好的支持性,如果加入恰当的领域知识或本体,则在进行知识推理的同时,实际上也能够作为基本的模型来使用。因此,在参考知识图谱有关概念的基础上,我们提出一种基于知识图谱的警用统一对象描述模型,实际应用表明其能够较好满足当前公安大数据应用场景下的大多数需求,具有较好的描述性、推理性和性能。
      1 知识图谱的概念及应用
      知识图谱由Google于2012年5月17日正式提出[1],最初是为了提高搜索引擎的能力,提升搜索质量,让用户获得更好的搜索体验。其本质是Google的语义网络知识库[2] [3],采用语义检索技术从多种信息源收集与某一主题相关的实体或概念,以及他们之间的关联所形成的网络图,图中的节点对应实体或概念,图中的弧对应实体或概念之间的关联关系。知识图谱为互联网上海量、异构、动态的大数据表达、组织、管理以及利用提供了一种更为有效的方式,使得网络的智能化水平更高,更加接近于人类的认知思维。随着智能信息服务应用的不断发展,知识图谱已被广泛应用于智能搜索、智能问答、个性化推荐等领域[4]。

    推荐访问:图谱 及其应用 警用 模型 描述

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章