• 学前教育
  • 小学学习
  • 初中学习
  • 高中学习
  • 语文学习
  • 数学学习
  • 英语学习
  • 作文范文
  • 文科资料
  • 理科资料
  • 文档大全
  • 当前位置: 雅意学习网 > 理科资料 > 正文

    XML存储方式之比较研究 百香果存储方式

    时间:2018-12-25 03:36:27 来源:雅意学习网 本文已影响 雅意学习网手机站

      摘要: XML作为Internet数据表示和交换的工具,已经成为了众多应用领域中的标准数据格式。XML文档的存储方式极大地影响了查询处理的效率,成为一个非常重要的研究方向。目前一些组织和学者已经提出了一些XML文档的存储策略,本文主要对主要的存储策略进行优劣分析。
      关键词: XML 存储方式 关系数据库
      
      1. 引言
      
      XML数据海量出现,XML文档的存储成为研究的热点。本文重点介绍XML的存储方式,分析了各存储方法的优劣。根据存储方式的不同,我们可以将处理XML数据的基本方式分为四种类型:文件系统、半结构化数据仓库、原生的XML数据库和数据库管理系统。
      
      2. 文件系统
      
      XML文件系统就是把XML直接存储为文件,访问时首先通过文件系统的目录结构,然后通过XML文档的元素结构来提供对数据的层次访问。基于文件的XML文件系统简单而容易实现,无需使用底层的数据库或对象存储管理。同时由于XML文档被直接存储为文本文件,文件的存储方式无需存储转换和重构查询结果。但是它在查询处理、文件的大小、并发性、安全性等方面存在限制。
      
      3. 半结构化数据仓库
      
      半结构化数据通常它的内容与模式都包含在数据中,因此被称为是“自描述的”。有些半结构数据没有单独的模式,而有些只对数据做不严格的约束,由于XML数据与半结构化数据十分相似,利用半结构化数据仓库管理XML数据似乎是比较自然的方式。在这种方法中,XML数据被聚族存储为有向图。斯坦福大学的Lore项目在这方面作了初步尝试,然而,目前半结构化数据库技术尚不成熟,利用半结构化数据仓库处理XML的性能仍然难以让人满意。
      
      4. 原生的XML数据库
      
      原生的XML数据库以某种(逻辑的)模型(如:XPath模型或DOM模型)为基础来存储和检索XML数据,将XML文档作为一个整体来存储,并把XML文档作为数据处理的基本单位,不要求有某种特定的物理存储模型,可以建立在数据库系统、对象管理器或文件系统之上。近来出现了一些这样的数据库系统,如:Tamino。
      原生XML数据库有其优势,它以XML格式存储信息,完整地保留XML文档的信息,存储映射不需要DTD结构。因此原生XML数据库有利于文档存储和检索,消除了不必要的转换操作;以信息的原始XML格式检索文档,而不需任何附加编码,并且可以使信息以一定的样式显示;大多数Native-XML数据库具有完善的全文搜索的能力,包括整个同义字支持、字根(匹配一个字的所有形式:现在时、过去时和进行时)以及相近搜索(DTD NEAR XML Schema)。
      但原生XML数据库也有其劣势:(1)当文档被添加到数据库中时,原生XML数据库就开始对文档内的所有信息建索引,这将导致对存储空间的需求飞速上升。(2)当进行信息更新时,即使用户所需要的只是文档的很小一部分,很多原生XML平台也要从数据库返回整个文档。(3)XML数据缺乏多重管理、协同工作能力、规划能力等等,这些恰恰是大型关系数据库所拥有的优点。(4)缺乏明确的标准也是XML数据库领域的一个问题。
      
      5.关系数据库
      
      虽然关系模型与XML文档模型有一定的差距,但是利用关系数据库系统来处理XML数据的方式有如下优点:一方面当前的关系数据库的技术已十分成熟,商用的关系数据库系统都具有高性能的查询引擎,良好的可扩展性、安全性和健壮性。因此,利用关系数据库系统管理XML数据可以重用数据库的查询优化器和事务处理机制,能够保证XML数据的一致性和完整性,另一方面,目前大量的WEB数据主要存放在关系数据库中,XML――关系系统便于在关系数据库上建立适于二者的应用,使关系数据库进入WEB领域成为可能。但是,由于数据模型上的差异,利用数据库系统来管理XML数据也给数据库技术带来了许多新的挑战。近来,基于关系的XML数据处理技术受到了研究者和数据库厂商的关注,在这方面已经有了许多工作和成果。按照将XML数据转存为关系的映射方式的不同,我们可以将基于关系的XML数据存储分为两类:独立于文档的关系存储和依赖于文档的关系存储。前一种是用固定的关系模式来存储所有的XML文档,这种方法不考虑XML文档本身的结构特点,对任何XML文档都产生一样的表结构,这对于一部分无模式的XML文档在关系数据库中的存储是非常有用的,后一种是从XML模式中导出关系模式。
      
      6.结论
      
      通过以上分析,可见利用关系数据库进行XML存储是优良的方法,也是未来重点研究的方向。
      
      参考文献:
      [1]Natanya Pitts著.徐晓梅,龚志翔,王晓云译.XML技术内幕.北京:机械工业出版社,2002.
      [2]万常选.XML数据库技术.北京:清华大学出版社,2005.
      [3]R Bourret.Mapping DTDs to Databases[EB/OL]. http: / / www. xml. com/ pub / a / 2001 / 05 / 09 / dtdtodbs. html. Web page, 2001-05.
      [4]许卓明,刘琴,董逸生.基于关系数据库的XML存储技术评述.计算机工程与应用,2003,39(10):197-200.
      [5]章义,黎峰.基于XML的数据库储存访问技术.计算机工程与设计,2005,26(1):208-211.

    推荐访问:方式 研究 XML

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章