• 学前教育
  • 小学学习
  • 初中学习
  • 高中学习
  • 语文学习
  • 数学学习
  • 英语学习
  • 作文范文
  • 文科资料
  • 理科资料
  • 文档大全
  • 当前位置: 雅意学习网 > 小学学习 > 正文

    基于随机搜索逐步优化的自动组卷算法及试题库结构的研究|自动组卷算法

    时间:2018-12-23 19:42:42 来源:雅意学习网 本文已影响 雅意学习网手机站

      摘 要:本文简要概括了自动组卷算法的现状,全面分析题库试题应包含的主要属性,给出了基于随机搜索逐步优化的自动组卷算法的基本思想,设计出了配合此算法执行的试题库。实践证明,这种结构下的试题库能很好地配合基于随机搜索逐步优化的自动组卷算法的执行,组卷成功率较高,系统性能稳定,冗余度小。
      关键词:自动组卷 试题库结构
      
      引言
      
      试题库这一概念,近年来在教育机构、学校都引起了极大的兴趣。事实上,国内外许多教育机构和大学在花大力气研究试题库,因为,试题库对考试机构变得越来越重要,其明显潜在的优点是试题库使教育测量的质量不断提高而测验编制者所花费的时间不断减少。所谓试题库,是由许多适用于不同目的、技能和任务需求,且具有必要参数的大量优质题目组成的试题集合[1]。试题库中的题目是供测验编制者能根据需要按预定的要求组卷,当试题库中的题目在内容恰当和技巧完备时则测验编制者的工作就会变得简单且卓有成效,组卷的质量就变得更高,就能使测验更加高效地达到既定的测量目标,从而在试卷质量方面保证教育测量的信度和效度。
      在当今数字化教育时代下自动组卷系统是智能教学系统(CAI)的重要组成部分,自动组卷卷算法的成功与否以及能否达到既定的测量目标很大程度上取决于相对于算法的试题库的库结构,试题库的结构设计成为建立智能组卷系统的重要内容。现存的自动组卷系统针对各自的组卷算法提出的试题库结构大致可分为四类:(1)主要依托于随机函数或随机量的算法所确定的试题库结构;(2)针对深度及广度搜索算法所确定的试题库结构;(3)依托于智能搜索算法所确定的试题库结构;(4)基于遗传算法所确定的试题库结构。这些数据库结构中,都没有全面地考虑到为达到既定测量目标所需的试题的全部属性。前三类只适合于对组卷质量要求不高的场合,后一类虽然组卷质量较高,但是,当考虑的题目参数增加时,其算法会变得非常复杂,会带来性能上的问题。
      基于此,本文提出一种与基于随机搜索逐步优化的组卷算法相适应的,使组卷效率更高、速度更快、试题库冗余更小的试题库结构。
      
      1 算法基本思想
      
      该算法的基本思想是设计一随机函数random( ),对题库随机抽取试题,然后匹配用户录入的组卷要求,若匹配,则记录试题编号,否则,放弃该试题,反复此过程直到符合组卷要求的题量为试卷要求的题量,即组卷完毕。
      ①接收用户输入的组卷要求(如题型、题量、满分值分值、答题时间、曝光度、难度分布、知识点分布、能力层次分布和重要程度分布等)。
      ②根据美国著名的网络公司cisco公司的在线测试系统的试卷满分及学生成绩计算方法,本文用百分制计算学生的考试成绩,但试卷满分不一定为100分,有可能出现试卷满分大于100分或小于100分的情况。换算公式为:
      
      其中s 为用百分制计算的成绩,s 为原始成绩,t为试卷满分。由于分数属于顺序量表,经过这种变换后不会影响既定的测量目标[2]。故可以认为试卷满分为100分,而且学生成绩也是百分制的,这解决了题库分值属性与用户要求题量挂钩的难题。
      ③设计随机函数random(sum)(sum为题库中的记录总数)抽取n个试题使其满足用户要求的题型、题量、知识点分布及重要程度。
      用test[n]来记录n个试题的编号,设试卷包含qu_cl个试题类型,每个试题类型的题量为qi(i=1,2,…,c),则有:
      
      用二维数组qu_cl_sum[c][1]来记录各类题型的当前题量,当qu_cl_sum[i][1]=qi(i=1,2,…,c)时,题型及题量满足用户要求;
      用集合kn_point{}来记录当前已抽到的题目所属的知识点集合,利用一个集合中的元素不能重复的性质来保证知识点的覆盖面;
      用二维数组qu_im[le_sum][1]来记录le_sum个不同重要程度的试题的当前累积分值,设lj(j=1,2,…,le_sum)为试卷要求的不同重要程度的试题的在试题中所占的分值,当qu_im[j][1]=lj(j=1,2,…,le_sum)时,不同重要程度的试题的在试题中所占的分值满足用户要求。
      通过这一步的处理试题在题型、题量、知识点分布及不同重要程度的试题的在试题中所占的分值满足了用户要求。接下来局部调整试卷在难度和能力层次上的分布以及每题在出题次数上的合理化,以实现试卷的逐步优化。
      ④评估当前试卷中不同难度的试题所占比重qu_de[de](de表示不同难度级别的数量)是否符合用户要求的比重dk(k=1,2,…,de)(一般不符合),则有:
      sub[k]=qu_de[de]-dk
      其中sub[k](k=1,2,…,de)为当前各个不同难度等级的试题在试卷中实际所占比重与组卷要求的比重的偏差大小。若sub[k]=0,则转到⑤;否则,若sub[k]>0,则实际所占比重偏大,若sub[k]0的题目具有相同题型、题量、知识点和重要程度的题目来替换sub[k]>0的题目(根据sub[k]大小,决定需更换题目的类型及数目)重复这一步,直到满足要求。
      通过这一步的处理试题在题型、题量、知识点分布、不同重要程度的试题的在试卷中所占的分值及难度方面满足了用户要求。试卷得到了进一步的优化。
      ⑤用类时的方法调整试卷中不同能力层次的试题所占的比重qu_ca[ca](ca表示不同能力层次的等级数量)以满足用户的要求。
      经过以上处理得到的试卷就是一份质量较高的试卷,能较好地保证达到既定的教育测量目标。
      2 试题库结构设计[3]
      试题库中的试题有两类属性:性能属性和内容属性。试题属性提供了试题的内容及答案等信息,这些信息不作为组卷算法的参数。性能属性则要参加组卷过程,这里主要对影响组卷算法的性能属性进行讨论研究。通过上述对组卷算法的分析,要得到一份高质量的试卷需要包含下属这些性能属性:题型、分值、难度、知识点、能力层次、重要程度和出题次数。
      ①题型。试题类型有多种划分形式,将其划分为填空题、判断题、单选题、多选题、简答题、论述题、作图题和综合题等,参与运算时可用编码值代替。试卷所包含的试题类型及相应得试题量一般由用户输入。
      ②分值。同一道试题在不同的试卷中可能会有不同的分值,但是,当试题入库的时候必须给定分值,因为在自动组卷的过程中,不同能力层次或难度的试题在试卷中所占的比重是根据分值这个参数计算的。这使得同一道试题在何的试卷中都具有相同的分值,这是不合适的,但目前还没有更好的解决方法。
      ③难度。难度是衡量试题难易程度的指标,不同的教育测量类型,对试卷的难度要求及不同难度的试题分布比重不同。难度系数通常用通过率来表示,即答对或通过试题人数的比例来表示[1]。
      当题目以二分法计分时,计算公式为:
      
      ④知识点。可以用十进制的字符类型字段表示章节,如用4位十进制字符表示时可以用前两位表示章,后两位表示节,类似的可以用知识点属性表示到更精确的知识点(如某一章节的某个知识点)。在自动组卷时,可以根据这一参数所表示知识点的精度,利用知识点不重复确保试卷中所考查知识点的不重复。
      ⑤能力层次。美国心理学家布卢姆教育目标的认知领域划分为六个主要类型,即知识、理解、应用、分析、综合和评价。这些类别由简到繁顺序排列,而且前一种类别是后一种类别的基础,后一种类别有涵盖了前一种类别。按照命题双向细目表的要求,根据不同的教育测量目标,不同目标层次的试题在试卷中所占的比重不同。
      ⑥重要程度。重要程度是某知识点对教学的要求程度,这种相对重要性可以由该内容项目的教学课时的多少来体现。这样应将知识内容按重要程度划分等级,使试卷中每一内容的比例与其相对重要程度相符合。
      ⑦出题次数。用于指示试题库中某试题在实际试卷中出现过的次数。通过该参数可以控制题目在试卷中出现的概率。
      
      结束语
      
      本文在分析了现存的组卷系统的组卷算法及相应的试题库结构的基础上,给出了基于随机搜索逐步优化的智能组卷算法的基本思想和数据库结构的设计方法,经过实验比较,试题库设计比较合理,可以较好地配合这种组卷算法,所得到的试卷基本符合用户的输入要求,试卷质量较高。不足之处是速度较慢,另外需要进一步对测验的信度和效度进行分析评估,考虑到这项工作难于实施,这里不作讨论,将在课题研究的下一阶段进行。
      
      参考文献:
      [1]张敏强.教育测量学.北京:人民教育出版社,2001.
      [2]许建钺.教育测量与评价.北京:教育科学出版社,1999.
      [3]于莉.题库系统的智能组卷算法研究.计算机应用研究,2004.
      [4]金汉均,郑世钰,吴民武.分段随机抽取算法在智能组卷中的研究与应用.计算机应用与研究,2003.
      
      基金项目:全国教育科学“十一五”规划教育考试学研究重点课题项目(2006JKS3017);山西省教育科学“十一五”规划课题(GH-06106)。
      
      注:“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。”
    本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

    推荐访问:算法 试题库 随机 优化

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章