• 学前教育
  • 小学学习
  • 初中学习
  • 高中学习
  • 语文学习
  • 数学学习
  • 英语学习
  • 作文范文
  • 文科资料
  • 理科资料
  • 文档大全
  • 当前位置: 雅意学习网 > 作文范文 > 正文

    数据挖掘:从信息优势到知识优势

    时间:2021-05-27 20:01:51 来源:雅意学习网 本文已影响 雅意学习网手机站


      摘要:在信息化战场上,来自陆海空天各种传感器的战场信息浩如烟海,如何从大量数据中及时捕获有用信息是科学决策、克敌制胜的关键。数据挖掘技术正是将信息优势转化为知识优势的重要工具。介绍了数据挖掘的主要方法,探讨其在军事领域的应用。
      关键词:数据挖掘;作战筹划;目标确定;情报处理;监视预警
      中图分类号:TP391文献标识码:A文章编号:1672-7800(2012)012-0127-02
      1数据挖掘的基本方法
      数据挖掘的方法有很多,基本方法有3种:关联、分类和聚类。它们的特点和难点各异,有不同的适用性。在实际使用过程中,需要进行大量的实验并结合领域专家的经验,方能取得预期的效果。
      1.1关联
      关联挖掘是数据挖掘中的基本过程,它挖掘数据属性(也称为数据项)之间的关联关系。通过设定支持度和置信度的阈值,找出所有满足最小支持度的频繁项集,并在此基础上,找出所有满足最小置信度的关联规则。这些规则就是反映数据项之间关联关系的知识。根据关联规则,可以由关联的数据项推测未知的数据项。
      1.2分类
      分类是人们认识事物的知识。通常,分类规则(或者说分类模型)是由人工给定的,是一种先验性的知识。当缺少先验性知识的时候,分类挖掘则可以用于发现分类知识。分类挖掘是指从有类别标记的训练数据中提取分类模型,并利用分类模型对未知类别的数据进行分类的过程。
      分类挖掘的困难在于训练数据的获得。训练数据通常是由人工标记的。人工标记的问题有两个,一个是工作量大,为了达到分类模型的精度,通常需要大量的训练数据;人工标记的另一个问题是只能标记已知的类别,对未曾出现过的新的类别无能为力。
      1.3聚类
      聚类挖掘是依据数据的相似性将数据划分到不同簇的过程。聚类的结果是使同一个簇中的数据有最大的相似性,而不同簇中的数据尽可能相异。聚类挖掘常常用于对数据进行筛选,以便降低数据的规模且不影响信息量。比如,通过聚类,筛除相似的网页。聚类也用于异常检测,对异常行为或者系统故障进行预警。
      聚类通常不需要对训练数据进行人工标记,对数据相似性的度量成为聚类挖掘的难点。尽管相似性的度量方法有很多,但是,对不同领域的数据采用怎样的相似性度量仍然需要进行大量的实验。
      关联、分类和聚类都是数据挖掘的基本方法,是挖掘各种复杂类型数据对象的基础。它们既可以独立使用,也可以结合使用。
      2数据挖掘的军事应用
      制定战略、战役、战术都需要从大量的数据中获得有用的信息。信息化战场可以被看作是一个由众多传感器连接而成的数据空间。部署在陆海空天的传感器不断地传回数据,形成了数据的海洋。如果没有有效的工具帮助理解这些数据中隐含的对决策有用的知识,我们将因为缺乏知识而被淹没在数据的海洋中。利用数据挖掘技术可以提取众多传感器数据中隐含的关系和知识,不仅知道敌人正在干什么,还能知道敌人为什么这么干。从而帮助我们从战略、战役、战术各层面了解对手和战场态势,掌握其作战特点,采取相应的对策,达到好的作战效果。
      2.1作战筹划
      利用数据挖掘技术对作战仿真实验数据进行分析,可以对战场态势、作战行动的关键环节等与作战效果密切相关的因素之间的关系进行深层次、精细化的描述,对态势的发展进行预测,进而帮助作战指挥人员建设作战预案库,更好地进行作战筹划。邓桂龙以背景较为简单的某型战斗轰炸机编队突击地空导弹阵地为例,应用数据挖掘技术,分析作战过程中的某些重要事件与作战效果之间的关联关系,也说明了数据挖掘技术在战法研究中的应用方法。
      事实上,利用数据分析得到的规律进行作战筹划的做法早在朝鲜战争期间就已经开始了,只不过当时分析的数据量比较小而已。美军指挥官李微奇总结分析了志愿军入朝后历次作战特点,发现志愿军由于机械化程度低、后勤保障能力差,每次战役单兵携带的给养只够7天的作战需要,美军戏称志愿军是“礼拜攻势”。李微奇结合美军机械化程度高、陆空火力强的特点,制定了“磁性战法”:按志愿军一昼夜攻击距离预设多道防线,当志愿军发动进攻时,美军利用机械化快速撤退到刚好志愿军一昼夜攻击距离之外,且远程火力可以打击志愿军的防线上,保持一定的接触,联合空军打击志愿军后方交通点线,迟滞和消耗志愿军。当志愿军给养弹药消耗殆尽,部队攻击乏力时,美军利用机械化兵团和空降兵团快速穿插分割包围志愿军,给志愿军造成不小损失。
      在信息化作战时代,作战筹划涉及多个方面的大量数据的分析,利用数据挖掘工具可以辅助决策。国家战争动员涉及社会资源数据的挖掘、挖掘空间数据,战略上可以开拓陆海空天一体的作战领域,战役上可以研究预设战场,设置作战预案,战术上有利于部队机动,发扬火力;挖掘气象数据,可以利用对我作战有利的气象条件,或发动气象战,打击敌人;挖掘主要作战对象装备数据,可以给部队提供快速识别目标和选择摧毁的先机条件。
      2.2情报处理
      情报是部队作战效能的倍增器。提高情报工作的效率,将有利于作战效能的提高。网络技术的发展提高了信息传输的能力,单位时间内情报(数据)可能爆炸式增长,而且通常会有很多来源,有时各种情报会集中到达,这就给情报的分类分析带来巨大的工作量。利用数据挖掘技术对情报文本的内容进行分析,提取情报分类模型,进而对情报进行自动分类,极大地提高情报的处理效率。
      假定作战情报分为战略情报、战役情报和战术情报三个层次,又分为敌情、我情和友情三大类,包含了战场态势、兵力编成、兵力机动、攻击模式、部队士气、领导个性、补给手段、补给方式、装备实力和技术保障力量等方面。通过准备足够数量的训练数据和测试数据,亦即标记了类别的情报文本。从训练数据中提取分类模型,用测试数据对分类模型进行测试,如果测试精度达到要求,即可使用该分类模型对新的无类别标记的情报进行分类。如果分类精度不能满足要求,需要重新建立分类模型,直至达到精度要求。

    推荐访问:优势 数据挖掘 知识 信息

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章