• 工作总结
  • 工作计划
  • 心得体会
  • 领导讲话
  • 发言稿
  • 演讲稿
  • 述职报告
  • 入党申请
  • 党建材料
  • 党课下载
  • 脱贫攻坚
  • 对照材料
  • 主题教育
  • 事迹材料
  • 谈话记录
  • 扫黑除恶
  • 实施方案
  • 自查整改
  • 调查报告
  • 公文范文
  • 思想汇报
  • 当前位置: 雅意学习网 > 文档大全 > 公文范文 > 正文

    基于xAPI的研究性学习多源数据融合研究

    时间:2023-06-03 22:25:07 来源:雅意学习网 本文已影响 雅意学习网手机站

    余明华,张 治,刘小龙,祝智庭

    (1.上海师范大学,上海 200234;
    2.上海市宝山区教育局,上海 201999;
    3.上海市电化教育馆,上海 200086;
    4.华东师范大学,上海 200062)

    大数据时代下,每天产生的数据呈爆炸式增长[1]。数据资源已经成为教育领域系统变革的重要工具[2],如何采集和处理分析数据是研究者们必须面临的挑战[3]。研究性学习是一种围绕课题或项目进行组织的情境学习方式[4],技术的支持为其规模化开展提供了基础,学生能够随时随地持续深入地开展学习。但在实践中,不同学校根据自身需求使用或开发不同的研究性学习支持系统,由于缺乏统一的教育数据规范与框架,学生海量数据散落于不同的“信息孤岛”,形成“数据壁垒”,无法形成统一的数据平台[5],导致出现数据收集散乱、数据质量差强人意、数据访问权限模糊等问题[2]。如何破解这些难题以实现数据的互联互通、整合和共享以及发挥数据的价值,是当前教育领域迫切需要解决的问题之一。数据融合是一种针对多源数据的处理手段,旨在通过提供公共、统一的接口和视图,让用户不必考虑数据模型的异构性、数据抽取和合成等技术问题[6],能够为破解以上难题提供新的解决思路和可行的实践视角[7]。

    基于此,本研究以上海市电化教育馆研究性学习数据融合项目为背景,提出一种基于xAPI的研究性学习多源数据融合的方法,通过构建研究性学习行为记录库实现多源数据的融合,为构建学生画像及综合素质评价提供数据基础。

    (一)多源数据的异构性表现分析

    数据融合的根本任务是解决多源数据的异构问题,支持用户访问具有透明性、一致性和实时性的异构数据源[8]。因此,要实现数据融合,首先需要明晰多源数据的特点。异构性是多源数据的主要特点,具体包括系统异构、数据模型异构、逻辑异构以及多时空和多尺度性等特征[8-9]。系统异构是指不同数据源由于依赖于不同的软硬件系统(如数据库系统、操作系统、底层硬件系统等)所造成的异构。数据模型异构是指不同数据源存在不同的存储模式,如关系模式、对象模式和文档嵌套模式等,形成了结构化、半结构化和非结构化等异构数据。逻辑异构主要包括语义异构、命名异构和值异构等。其中,语义异构主要表现在相同形式的数据表示不同的语义,或相同的语义表示不同形式的数据;
    命名异构主要表现在同一数据属性具有不同的命名;
    值异构是指同一数据属性在不同数据源中具有不同值。多时空和多尺度性是指不同数据源在不同时间和空间进行的集成,并且在时空上也存在不同的尺度[10]。由此可知,多源数据的各种异构情况让数据融合工作充满了复杂性和挑战性。

    (二)多源数据融合方法分析

    数据融合最早在1973年被应用于军事领域,是一种将多传感器的数据进行关联与组合的融合技术[11]。后来被广泛应用于民事领域,传感器的数据也被发展为包括计算机系统数据库和人工输入等广义数据源。目前数据融合尚无统一定义。一般认为,数据融合是指由多个数据源所产生的、具有不同数据呈现形式的(如文本型、数值型、音视频、图片等)、描述相同主题或环境的数据为了共同的目标或任务进行融合的过程[12-13]。根据数据抽象层次,数据融合主要包括数据级(或像素级)融合、特征级融合和决策级融合三个层次[14],分别对应原始数据、从中提取特征信息和经过进一步评估或推理所得到的局部决策信息[15],其中数据级和特征级融合属于中低层次融合,决策级融合属于高层次融合。虽然已有一些关于多源数据融合方法和技术的研究,但是由于这些技术方法是针对某个具体问题或应用场景的,比较零散,还无法满足跨界多源数据融合的需求[15]。因此,教育多源数据融合有必要参考国际上已有的规范,以支持多源数据的特征提取和标准化。

    基于上述内容,本研究采用数据级融合方法对研究性学习多源数据进行融合(如图1所示),遵循xAPI规范,通过构建研究性学习多源数据融合架构,设计基于xAPI的研究性学习活动流,以支持研究性学习数据融合中心的实现。

    目前国际上有关学习分析的技术规范,包括IMS的Caliper Analytics、ADL的Experience API(以下简称xAPI)和IEEE的学习技术标准[16-17]。其中,xAPI规范具有多功能、开放且简单[18]等特性,因此本研究选择xAPI规范作为多源数据融合特征提取的解决方案。

    (一)xAPI概述

    xAPI是一种开源的存储和访问学习经历的互操作性技术规范[19],详细定义了如何对技术支持下学习者活动和经历的交互数据进行跟踪及交付,实现跨平台、跨设备学习经历数据的采集、存储和共享,并支持教育评价以及不同系统之间的数据共享,促进学习随时随地发生。xAPI的构成要素主要包括活动流、学习行为记录库(Learning Record Store,简称LRS)、活动提供方和活动使用方。目前有三种主流的xAPI架构以实现不同系统或程序的集成[20],即LRS独立于LMS(学习管理系统)、LRS包含于LMS以及结合以上两种架构特点的混合架构,如图2所示。

    其中,LRS独立于LMS的架构是指LRS从独立的在线课程、教育游戏、模拟训练、移动应用和商业系统等学习环境中收集数据,并将数据提供给仪表盘创建报告,形成学习分析或作为活动提供方服务于开放徽章。LRS包含于LMS的架构是指LRS可以与外部活动提供方或LMS进行交互,不仅可以从LMS中提取数据,也可以从外部活动提供方提取数据。同样,也可以为仪表盘、报告和学习分析程序提供数据,或作为开放徽章的提供方。混合架构是指结合了以上两种架构的特点,存在多个LRS可以使用,LRS不仅可以包含在LMS中,也可以与外部的LRS交互。

    (二)研究性学习多源数据融合架构

    为了给用户提供访问多源数据所需的统一接口和视图,本研究采用独立的LRS架构,并提出基于xAPI的研究性学习多源数据融合架构,支持从多源平台汇聚学生学习经历数据进行融合,如图3所示。该架构主要包括研究性学习行为记录库(数据融合中心)以及学习数据的提供方和使用方。其中,记录库从活动提供方采集数据进行汇聚,将数据共享给活动使用方。

    1.数据融合中心:研究性学习行为记录库

    LRS是xAPI架构的核心,所有xAPI生成的记录都被传输并保存在LRS中。只要遵循xAPI规范就可以向LRS传输数据。LRS不仅负责接收、验证并存储Statements,还允许外部应用程序通过xAPI定义的接口交换Statement格式的学习经历数据。LRS不仅可以为数据的聚合和分析提供来源[21],也能作为存储库从Statements中提取重要信息[22]。

    作为多源数据融合中心,研究性学习行为记录库是独立的系统,通过xAPI定义的接口接收并存储学习者在各个研究性学习平台上的学习经历数据,且支持与学习管理系统(如学生综合素质评价系统)进行数据共享,聚合到其他学习行为记录库(如市级学生成长空间)上,支持教育部门全面掌握学习者学情、评价教育质量。同时,研究性学习行为记录库也能基于所融合的学习经历数据开展学习分析及数据可视化。

    2.数据源:研究性学习活动提供方

    活动提供方(Activity Providers)是提供xAPI Statements的来源,是指“任意能够生成学习经历、成就和工作表现数据并将其发送给LRS的工具或系统”[23]。在技术的支持下,学习者不仅可以随时随地基于脚手架开展课题探究,也可以通过网络搜索学习资源、通过虚拟实验等获得实验数据,还能开展线下探究获取研究数据。因此,研究性学习活动提供方除了研究性学习支持平台之外,还包括自主学习、互动课程、虚拟实验、增强现实和线下探究等。这些平台(或应用程序)数据只要遵循xAPI规范都能被记录在研究性学习行为记录库中。本研究中,记录库的数据主要来自市级的研究型课程学习支持平台MOORS,也有来自校级学习系统(如A和B中学的学习平台)的数据。

    3.数据共享:研究性学习活动使用方

    活动使用方(Activity Consumers)是指能够使用LRS中Statements数据的平台(或应用程序)。研究性学习行为记录库采集的数据不仅包括研究性学习行为数据、课题数据、交互数据,还包括学习者部分学籍数据以及其他平台共享的数据,这些数据能够支持统计描述和研究性学习行为分析、实践能力表现和学习效果分析呈现、学生画像构建等。受数据隐私限制,活动使用方除了市级学生成长空间和学生综合素质评价系统之外,目前仅有MOORS平台能够获取所有学习经历数据用于学习分析及数据可视化。

    xAPI遵循活动流(Activity Streams)规范跟踪和记录学习者学习经历。xAPI活动流也被称为“Statements”,用于描述学习者如何与对象交互,遵循三重模式,即某人做了某事。Statements通过JSON格式封装、记录和交换数据。在已有研究中,Duhon提出了一种将学习经历映射到xAPI的方法,过程分解为“经历-事件-活动流”(Experience to Events to Statements,简称EES)[24]。本研究采用该方法对研究性学习活动流进行设计。

    (一)设计原则

    作为xAPI用于描述和跟踪学习经历的主要数据结构,在具体实践中需要遵循Statements的设计流程及原则。首先,确定所需数据。在这个阶段,首要关注的重点不在于如何获得数据,而在于可能获得的数据中确定所需要的部分,也就是找出设计学习经历所需的数据。因此需要数据的详细列表,列出所要捕捉的学习经历数据。其次,获取数据。据确定的所需数据,制定如何获取这些数据的可行方案,需要具体根据实践过程中不同的学习经历和情境选择最佳方法。在具体实践中,还需要考虑成本因素以调整技术或所需数据,从而找出最佳方案。最后,组织数据。进一步考虑如何将所需数据组织成遵循xAPI标准的Statement语句,具体结合xAPI语句的结构和不同要素以及需要考虑的事项进行设计。

    (二)研究性学习经历和事件分析

    1.学习经历描述

    本研究旨在融合多个研究性学习平台的数据,虽然不同平台功能各异,但是核心模块主要包括课题研究、课题研讨、课题资源、研究群组和课题笔记。其中,“课题研究”模块有基于平台预设的研究支架开始新课题或继续之前的课题研究、管理或同步课题等操作;
    “课题研讨”模块有分享课题、查看、点赞、收藏、评论已分享课题等操作;
    “课题资源”模块有自主搜索资源、查看系统推送的资源、添加或删除兴趣标签等操作;
    “研究群组”模块有与组内成员、指导教师讨论交流等操作;
    “课题笔记”模块有与笔记记录相关的操作。

    2.学习事件筛选

    由于不是所有可预见的学习事件都具有分析意义,需要根据具体需求确定学习经历跟踪的粒度,所以不是所有粒度级别的学习经历都有必要记录和采集。因此,重点关注有助于学习分析的学习事件,以便为后续的研究性学习“活动流”设计中确定和定义执行者、动词和活动对象等重要属性提供依据。其中,“课题研究”模块包括创建、填写、上传和分享课题等重要学习事件;
    “课题研讨”模块包括分享、收藏、点赞课题和发表评论等;
    “课题资源”模块包括学生搜索、阅读或观看资源以及添加兴趣标签等;
    “研究群组”模块包括课题组内成员协作讨论、师生交流、关注同伴等;
    “课题笔记”模块包括学生记录笔记等;
    常规操作中学生平台登录频次、时长等都是研究性学习分析的重点内容。

    (三)研究性学习经历Statements映射

    Statements语句的必需属性包括执行者、动词和活动。基于以上对研究性学习经历和事件的分析,接下来详细定义执行者、动词库和活动对象库,从而将学习事件映射为一组具有语义特征的Statement语句,以实现研究性学习多源数据的标准化。

    1.执行者

    事件的执行者(Actor)可以是代理人或小组。本研究中,执行者可以是单个代理(学生或导师),也可以是课题小组。其中代理通过系统自动生成的ID作为身份识别,小组则是通过枚举多个组员的对象作为标识符进行识别。

    2.动词

    动词(Verb)定义了执行者所采取的行为,其筛选策略一般基于学习报告和数据分析需求,其定义遵循以下两条原则:提供足够的动词清楚表达可预见的学习事件;
    确保不使用不同的动词对相同语义进行描述[25]。

    目前xAPI官方提供动词库包括xAPI Registry和XAPI.VOCAB.PUB,同时,还对活动类型、活动扩展、情境扩展、结果扩展、附件使用类型和配置文件等提供了定义和描述。如果在动词库中无法找到所需动词,也可以自行创建新动词。结合筛选的研究性学习事件,参考xAPI官方动词库,预先归纳出24个行为动词。但是,为了确保不同动词的语义不重复,结合自然语言和计算机语言特点,修改部分动词以更准确地跟踪学习经历。最终动词表见表1所示。

    表1 研究性学习xAPI行为动词表

    3.活动对象

    活动(Activity)在Statement中用于描述事情(Thing)或对象(Object)。活动实际上是需要跟踪的并且依赖于现实要求;
    活动对象来源于对学习者学习经历的分解。结合xAPI官方活动对象类别库和分析需求,划分了7类研究性学习活动及相关对象,包括学习管理系统(LMS)、功能模块(Module)、课题(Project)、资源(Resource)、消息(Message)、笔记(Note)和交互(Interaction)。

    通过构建基于xAPI的研究性学习多源数据融合架构,支持从底层实现研究性学习多源数据的关联和融合;
    设计基于xAPI的研究性学习活动流,支持研究性学习多源数据的特征提取。接下来基于具体的实践,进一步对所获得的数据及其处理、分析及可视化应用等进行介绍,以便支持数据驱动的教育决策,达到多源数据融合的目的。

    (一)多源数据获取

    目前LRS主要有自己创建以及使用免费开源或商业化的LRS等两种获取方式[19]。本项目目标是基于xAPI采集多源研究性学习经历数据并进行学习分析,为了让数据采集和分析有效且准确,必须使用来自活动提供方的Statement语句在线交付到LRS中,因此采用自建方式构建LRS。基于以上分析和设计,在技术方面采用ElasticSearch架构、Java编程语言实现了研究性学习行为记录库。

    用户登录记录库系统后,界面直接呈现融合了所有研究型课程学习平台的所有数据。用户可以通过设置时间段查询指定的非实时数据,也可以直接获取实时数据。由于ElasticSearch是面向文档型数据库,存储的是整个对象或者文档,所以获取的数据以JSON格式嵌套的语句进行呈现,以文本形式存储。

    每一个嵌套式的Statements语句代表学习者每一条的学习经历。JSON格式数据对机器可读,但当数据量很大时,对于研究人员来说并不友好。如果想要更好地理解数据,需要对数据进行解析。常用的方法包括通过已有的解析平台进行解析,如json.cn(常用解析网站之一)等;
    也可以通过程序进行手动解析。

    (二)数据转换与预处理

    获取的Statements语句在用于分析之前,需要进行数据转换和预处理。其中,本研究采用的数据转换方法是基于Python编程读取JSON数据每一行Statement,然后将其全部写入CSV格式的表格中。这种手动处理的方法十分便捷且简单,能够直接生成CSV格式数据表。

    经过转换后,还需要对整体数据进行预处理,清洗原始数据中的缺失数据、错误数据、冗余数据和不确定性数据,将其进一步转换成有意义的数据结构[26]。根据JSON格式数据Statements的特点,每条学习经历记录都包含了系统生成的标识符、调取活动流字段的地址等与分析无关的属性,因此需要进一步抽提出与分析相关的属性值。抽提工作完成之后,再对整体数据进行清洗处理,主要剔除缺失数据,以提高数据分析的精确性。

    (三)数据可视化应用

    在本项目中,处理后的数据(非实时)用于支持学生画像中能力特征的呈现,通过因子分析和聚类分析对研究性学习阶段和不同行为特征的学生群体进行划分,以刻画出不同学生群体在不同学习阶段的行为表现差异并赋予标签,旨在帮助教师掌握学生学情,并提供有针对性的指导。

    实时数据主要用于两方面的应用,一是用于呈现学生的学习轨迹,供师生查看,以便更精准地了解学生在研究性学习探究过程中是如何学习的。二是用于构建学生画像模型,支持在研课题的进度、行为特征和兴趣特征的呈现。下面重点介绍基于xAPI的定量学生画像建模的方法。

    为了更好地理解不同层次的行为特征、更清晰地描述学习行为且更高效地开展行为分析,有必要在画像建模之前对研究性学习行为进行层次划分。本研究参考了Guerra行为交互模型和OCCP学习行为模型[27-28],将研究性学习行为划分为操作行为、认知行为、协作行为和问题解决行为四个层次。其中,操作行为(浅层)包括登录、退出、点击访问、浏览下载、保存删除等;
    认知行为(中层)包括查看、分享、收藏、点赞和评论课题、搜索和查看资源、记录笔记等;
    协作行为(中层)包括生生、师生讨论交流等;
    问题解决行为(深层)包括基于研究支架开展探究并填写报告内容等。划分行为层次有助于为计算机提取和分析不同行为的数据提供框架。

    在前期研究中,确定了研究性学习学生画像的维度及呈现内容,包括能力特征、行为特征和兴趣特征三个维度[29]。为了实现其中的定量画像部分,本研究基于xAPI的数据,采用表单形式对学生画像不同维度进行建模(如表2所示),每个维度都映射了Statement语句的行为指标去捕捉学习者的学习经历数据。通过提交表单以明确学生画像的刻画指标,将主观刻画转变为有量度指标的客观刻画。

    表2 基于xAPI的研究性学习学生画像模型

    根据行为映射所捕捉到的数据情况,构建了研究性学习学生画像的标签体系;
    结合可视化技术实现了面向不同用户的学生画像。其中,面向学生的个人画像主要呈现了学生个人的能力特征、行为特征和兴趣特征,学生可以通过画像可视化了解自己问题解决能力的水平、不同探究阶段的表现、参与度和兴趣标签等;
    面向教师的群体画像主要呈现了指导教师团队学生的总体概览、学情监测和资源分析,教师可以查看学生的个人画像以提供有针对性的干预和指导,也可以查看团队学生近期的研究热点,根据学生的兴趣和需求推荐相应的学习资源;
    面向管理者(校长或教育管理者)的群体画像,管理者可以通过群体画像了解整体学生的能力水平、热点研究领域、行为特征等,不仅可以查看本校的学生情况,还能通过与全市平均水平的对比,了解本校的优势和需要提升的部分。

    通过对研究性学习多源数据融合展开研究,采用数据级融合方法并遵循xAPI规范,构建了研究性学习多源数据融合架构,明晰了整合哪些多源数据、共享给哪些用户等问题;
    基于EES方法对研究性学习活动流进行了设计,通过对研究性学习经历和事件的分析,明确了活动流Statements中动词和活动对象。基于此,构建了基于xAPI的研究性学习行为记录库。在实际应用中,该记录库能够满足研究性学习多源数据融合的需求,所汇聚的数据能够更好地支持综合素质评价工作的开展,支持学生画像的构建并改善师生学习体验。

    在后续工作中,将继续完善多源数据融合的数据模型,以便能够融合更多不同情境下的异构数据;
    继续细化Statements的动词和活动对象,以便融合更多的行为数据提升数据融合质量;
    同时积极探索融合后的数据分析应用,以更好地发挥大数据的价值。

    猜你喜欢 异构画像研究性 ETC拓展应用场景下的多源异构交易系统中国交通信息化(2022年7期)2022-10-27离散异构线性多智能体系统的输出一致性计算技术与自动化(2022年2期)2022-07-04威猛的画像小哥白尼(神奇星球)(2022年3期)2022-06-06试论同课异构之“同”与“异”小学教学研究(2022年5期)2022-04-28实践,让研究性学习课堂精彩起来河北画报(2021年2期)2021-05-25画像非公有制企业党建(2020年10期)2020-10-27凝聚与铺张——孙绍振教授《以丑、呆为美》两岸同课异构教学观摩后记福建基础教育研究(2019年11期)2019-05-28画像瞭望东方周刊(2017年7期)2017-03-01浅谈“研究性”阅读教学人间(2015年22期)2016-01-04谈高中研究性阅读教学散文百家(2014年11期)2014-08-21

    推荐访问:研究性学习 融合 数据

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章