• 学前教育
  • 小学学习
  • 初中学习
  • 高中学习
  • 语文学习
  • 数学学习
  • 英语学习
  • 作文范文
  • 文科资料
  • 理科资料
  • 文档大全
  • 当前位置: 雅意学习网 > 高中学习 > 正文

    [搜索引擎的智能化和知识库系统在其中的应用] 智能化知识库

    时间:2020-03-10 07:35:00 来源:雅意学习网 本文已影响 雅意学习网手机站

      摘 要:分析传统搜索引擎与智能化搜索引擎,并以此为基础讨论了知识库系统在智能搜索引擎中的应用。   关键词:搜索引擎;知识库;智能化   中图分类号:TP273+.5 文献标识码:A
      
      The Intelligent Search Engine and Knowledge Base System in Which the Application
      HU Feng-hua,GUO Dan-feng,LIU Bing
      (Computer and Information Technology Institute, Henan Normal University,Henan Xinxiang 453007)
      Key words: search engine; Knowledge base system;intellectualization
      
      随着互联网网站页面的激增和用户队伍的不断壮大,搜索引擎越来越成为人们上网浏览时的重要工具,用以在浩瀚的网站页面的海洋中迅速地找到自己所需的信息。这种市场的需求刺激着搜索引擎的技术不断地走向完善。但是从用户的角度来看,当前的搜索引擎主要存在以下几个方面的不足。
      1 信息检索质量不高
      搜索引擎通常依赖于自动建立的摘要,该摘要一般取自Web页的主题或前几行内容形成的,不一定能够反映实际情况。
      2 检索方式单一
      搜索引擎一般提供分类浏览的查询方式和关键词的全文检索,不能实现概念检索,不能从文献的多个方面对检索提问进行限制,只能就某一关键词或者概念进行笼统的检索。
      3 搜索引擎对信息的标引深度不够
      目前,搜索引擎检索的结果往往只提供一些线形的网址和包括关键词的网页信息,与人们对它的预期存在较大的距离,或者返回过多的无用信息,或者信息丢失,特别是对特定的文献数据库的检索显得无能为力。
      4 信息收集与检索的分离
      搜索引擎进行信息的收集和查询是两个分离的过程,缺少有机的结合。系统无法根据用户的检索要求进一步提供相关信息,用户不能依据有关提示进行理性的检索,操作比较机械。
      5 智能搜索引擎功能特点
      5.1智能型的自然语言技术
      智能型的自然语言技术包括“自然语言搜索”和“动态关联词、联想词提示”技术。内建完整的“布尔逻辑运算组合”的搜索条件和“邻近搜索”功能,配合“智能型快速响应模式”,有效提高搜索速度和精确度。用户可灵活选择欲搜索的数据库,配合“中文同音”、“中英文近似概念”、“简繁转换”、“通配字符搜索”、“词组搜索”和“多字段平行检索”等多项智能搜索功能,从而更加高效、便捷获取有用信息。
      5.2灵活的检索机制
      提供多重模板设计功能,可按照用户自身需求轻松修改搜索结果的显示画面;并可依据不同的搜索方式,套用可获得不同的搜索结果的模板文件。提供“机动权值排序机制”、“阶层式分类目录”、“动态关联词、联想词提示”等功能,向用户提供更友好的搜索界面,增加搜索结果的适用性。
      5.3强大的索引功能
      采用“多线式资料获取机制”、“平行索引模式”、“动态文件分析技术”及“实时差异式索引更新技术”等多种功能,有效提高文件与数据库的索引速度,大幅降低索引等候时间和更新周期。提供“多重索引数据库”架构及“群组式分类目录”功能,缩短资料索引时间,灵活整合文档资料。
      6 知识库系统在智能搜索引擎中的应用
      6.1知识库系统
      知识库系统包括知识的获得、利用和管理三个方面。知识库、推理机及存贮器是知识库系统的三个组成要素。知识库系统的核心组成部分是知识库和推理机。知识库是以一致的形式存储知识的机构,推理机构则是为了使用知识库内的知识执行推理的控制机构。
      6.2在智能搜索引擎中的应用
      目前的搜索引擎具有关键词检索和目录查询的缺点,为了克服这些缺点,应该采用自然语言理解技术来进行自然语言智能答询。
      下面就是当前智能搜索引擎在知识库系统中所采用的一些自然语言理解技术。
      6.2.1智能分词技术
      关键词查询的前提是将查询条件分解成若干关键词。可以利用语义知识库进行总结,获得每个词出现的概率及词与词之间的关联信息,就可能有效地排除各种歧义,大幅度提高分词的准确性,从而准确地表述查询请求和文档信息。
      6.2.2同义词处理
      汉语词语之间复杂性的另一个方面是同义词的问题,同一个词组往往有许多不同的意思,处理同义词的一种方法是在语义知识库中人工构造同义词表,对专用领域的搜索引擎,这种方法是非常有效的。另外一种方法是从语义知识库中自动取得同义词关系,给出一个查询的关键词,搜索引擎能主动"联想"到与其同义或意思相近的词。
      6.2.3短语识别技术
      用短语描述查询请求的情况很常见,但是因为汉语词组的复杂性,所以在中文搜索引擎中,我们不能像英文词组一样简单的将中文短语分离成词组。
      7 结束语
      目前的搜索引擎主要提供基于文字的信息检索服务,而对于语音、图像的检索有大量的工作要做,搜索引擎真正地实现智能化并不简单,但是我们相信技术的进步将会给用户带来更好的信息检索工具。
      
      参考文献:
      [1]殷雪松,徐斌.WWW网络搜索引擎介绍[J].大学图书馆学报,1998.
      [2]吴丹.搜索引擎的智能化研究[J].情报理论与实践,2002.
      [3]李研,陈新中.基于web挖掘的智能门户搜索引擎的研究[J].计算机工程与应用,2002.
      [4]张兴华.智能搜索引擎的机理,实现技术及发展趋势[J].现代情报,2003.

    推荐访问:知识库 智能化 搜索引擎 搜索引擎的智能化和知识库系统在其中的应用 智能化搜索引擎原理及实现 智能搜索引擎工作原理

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章