• 工作总结
  • 工作计划
  • 心得体会
  • 领导讲话
  • 发言稿
  • 演讲稿
  • 述职报告
  • 入党申请
  • 党建材料
  • 党课下载
  • 脱贫攻坚
  • 对照材料
  • 主题教育
  • 事迹材料
  • 谈话记录
  • 扫黑除恶
  • 实施方案
  • 自查整改
  • 调查报告
  • 公文范文
  • 思想汇报
  • 当前位置: 雅意学习网 > 文档大全 > 公文范文 > 正文

    基于用户需求视角的古籍数字资源获取路径研究

    时间:2022-12-07 08:25:02 来源:雅意学习网 本文已影响 雅意学习网手机站

    许 莉

    (湖南图书馆 长沙 410011)

    古籍是珍贵的特色文化遗产,出于对古籍文献价值的认同,我国政府非常重视古籍保护和开发利用工作。特别是进入21世纪以来,在国家经济文化大发展的背景下,政府发布了一系列政策文件,指导古籍保护工作。2007年,国务院办公厅发布了《关于进一步加强古籍保护工作的意见》(国办发[2007] 6号)。2011年,文化部下发《关于进一步加强古籍保护工作的通知》(文社文发[2011] 12号)。2017年,文化部印发《“十三五”时期全国古籍保护工作规划》,系我国古籍保护工作方面的首个五年规划。2022年4月,中共中央办公厅、国务院办公厅印发了《关于推进新时代古籍工作的意见》。在政策支持和现代信息技术背景下,大量古籍实现了数字化,古籍数字资源向多元化、智能化、开放化的信息获取方向发展。

    2.1 助力古籍文献保护工作

    古籍文献记载了古代社会生活的信息符号,其载体和装帧形式也体现了古代手工和生产力发展水平。古籍价值珍贵,已经退出了日常阅读流通市场,通常被收藏在图书馆、博物馆等公共文化服务机构中。古籍载体已存在几百年甚至上千年,已经处于自然衰退的过程。出于原生性保护的目的,古籍已不适于多次提取阅览和使用。对古籍进行数字化,就是将古籍信息内容进行转移,实现古籍文物价值和信息价值的分离,以数字资源取代古籍对外开放阅览和服务,从而延长古籍的寿命。2007年国务院《关于进一步加强古籍保护工作的意见》明确指出,要规范古籍数字化工作,向社会和公众开放古籍资源,发挥古籍应有的作用[1]。古籍保护工作既要保护古籍原件,又要将古籍承载的内容化身千百,传播给社会大众。古籍数字资源形式多样,存储空间小,通过网络可实现跨区域的大范围传播。古籍数字资源便于开发和利用,对信息知识进行深入发现和挖掘,实现其再生性价值,为用户提供优质的知识服务。用数字资源取代纸质文献,符合社会信息传播发展趋势,是传承历史和发扬传统文化的科学性选择。

    2.2 推动社会信息公平的实现

    信息公平是人类社会的基本权利之一,是图书馆核心价值观的体现。1948年的《世界人权宣言》是最早规定人的权利的规范性文件,其中包括人类获取信息的权利。联合国人权宪章确定了信息获取权应当作为基本人权受到尊重与保护。1994年,国际图联和联合国教科文组织联合发布《公共图书馆宣言》,重申读者信息获取的自由和权利[2]。2017年11月,全国人大常委会通过了《公共图书馆法》,这是我国信息获取权保障基本制度建设的重要内容。

    古籍资源稀缺且分布不均衡,存在明显的地区差异、机构差异。在传统古籍服务模式下,用户必须到现场阅览纸质文献或缩微文献,获取路径单一,收藏机构服务范围有限。非本地区的用户很难获得古籍收藏机构提供的信息服务。现存中文古籍总量约为20万种,主要集中在国家图书馆、北京大学图书馆、上海图书馆、南京图书馆等古籍重点保护单位。其他单位所藏的古籍文献种类和数量相对不足,也限制了现场用户信息需求的满足。古籍数字资源可以通过计算机存储和网络传播的特征,突破了古籍文献传播的时空限制。推广古籍数字资源,能够显著扩大用户地区范围,弥补古籍信息获取的社会差距,从而实现古籍信息获取的相对公平,减轻资源分配不公造成的公共文化服务不均衡现象,也有利于古籍文献的社会化传播和阅读推广。

    2.3 助力数字时代优秀传统文化传承

    古籍是灿烂中华文明的结晶,是中华民族优秀文化的载体,记录了我国各朝代各阶层人民的生产和生活状况,是不可再生、不可替代的历史资料。保存和开发古籍,对于传承发扬中华民族文化,加强民族团结,具有不可替代的重要意义。

    近年来,以计算机、互联网以及数字化为核心的变革,影响了全社会的信息生产和传播模式,以及用户的信息获取和使用方式。人们的生产和生活已经进入全新的数字时代,数字阅读逐渐成为社会阅读和学习的常态。据第七届中国数字阅读大会上发布的《2020年度中国数字阅读报告》,2020年中国数字阅读产业规模达351.6亿,数字阅读用户规模达4.94亿,日均数字阅读时长为29分钟[3]。数字阅读具有成本低、易存储、信息更新快等优点,对促进全民阅读、提升全民文化素质具有不可忽视的意义。古籍数字资源是数字时代的传统知识文化载体,是适应现代社会阅读习惯和阅读潮流的信息资源。将古籍转化为数字资源,再整理加工为多种形式的数字产品,实现了传统文化与现代社会的知识连接,产生了新的社会效益。传统文化内容以数字时代的传播方式进行扩散,迎合了用户的信息获取和阅读习惯,有利于古籍阅读活动推陈出新,有利于现代技术助力古籍研究工作。

    3.1 信息源选择

    3.1.1 数据库

    全国范围内的中文古籍数字化工作已经取得阶段性成果,由古籍收藏机构、高校、信息技术开发公司等合作开发的古籍数据库已经推广使用,成为教师、学生、古籍研究者的重要信息来源。

    (1)全文数据库

    全文数据库有文本型、图像型和图文型3种类型,通过人工将古籍全文录入数据库, 再进行分类标引形成可检索的文本数据库。它为使用者提供了文本格式的古籍全文,可以实现全文检索、文本复制和编辑[4]。由南开大学组合数学研究中心、天津永川软件技术有限公司等联合开发的“二十五史全文阅读检索系统(网络版)”就是文本型全文数据库。文本型全文数据库运用于古籍文献,是古籍数字化的最初尝试。但是手工录入工作量大,繁体字、异体字辨认和校对难度高,古籍的版本特征不复存在。

    鉴于此,我们可以通过扫描古籍全文,建立图像数据库,同时著录相应的元数据,形成基于元数据的古籍全文数据库[5]。公共图书馆自建的馆藏古籍数据库以图像型全文数据库居多,如首都图书馆“馆藏古籍珍善本图像数据库”、上海图书馆“古籍善本全文光盘”等。图像全文数据库建设对扫描设备和技术要求较高,前期经费投入大,占用存储空间大。但采集录入环节相对简单,省去了文字校对的步骤,对数据技术要求不高,适合图书馆文献基础强而技术力量弱的现实情况。图像能保存古籍原貌,为用户提供版式、批注、印章等有用信息。最大的缺点是只能阅览和基于元数据检索,不能进行文字全文检索和复制编辑。

    图文型古籍数据库是图像型与文本型的结合[6]。它不仅支持基于文本的检索,还提供影像形式的古籍原文内容对照,可有效避免文字识别时出现的错漏,对古籍版本的研究具有重要价值。目前数字出版商开发的古籍全文数据库以图文型为主,例如爱如生公司开发的“中国基本古籍库”、书同文公司开发的《四部丛刊》全文检索系统、时代瀚堂公司开发的《瀚堂典藏》古籍数据库等[7]。图文型古籍数据库是古籍数据库的发展趋势,结合了文本数据库和图像数据库的优点,既能够进行全文检索,也能通过切换文本和原图像,浏览原文图片来校对内容,查看原书版式。

    (2)参考数据库

    参考数据库是能指引用户到另一信息源获取原文或其他细节的数据库[8]。古籍参考数据库以书目数据库、索引数据库居多。

    古籍书目数据库主要指图书馆目录数据库,针对特定的馆藏图书资料等进行内容及存储地址的揭示与报道,在统一机读目录格式下,将古籍文献的基本信息著录到计算机存储。用户可检索古籍的馆藏地点、版本等信息,为进一步利用古籍提供依据。上海图书馆古籍书目数据库2001年推出使用,包含数据近13 万条。2004年,国家图书馆完成全部馆藏古籍书目数据库建设,数据达39 万余条[9]。目前,古籍联合书目数据库的建设成为发展趋势。我国及海外一些古籍收藏机构开始统一标准、规范,进而实现联合编目的历程,出现了一些比较有影响力的古籍联合编目项目,如中国高等教育文献保障系统(CALIS) 的“古籍善本联合目录数据库”、美国的“中国古籍国际联合目录”项目等[10]。

    索引数据库是存贮书名、刊名、篇名、主题、人名、地名等信息的外部特征,并将这些外部特征按一定方式编排,注明出处,以供检索的数据库[11]。欧美地区在编制中文古籍索引数据库实践方面发展较早。日本学者编制的中文古籍索引数据库较多,如东京大学图书馆编制的“东京大学总合图书馆汉籍目录·索引”。国内于1988年启动电脑编制索引,此后古籍索引数字化越来越普遍,如北京师范大学图书馆开发的“全元文篇名作者索引”,南京师范大学开发的“全唐五代宋词索引”“全宋词索引”。索引数据库大大减少了用户对古籍文献的翻检时间,是用户进一步利用古籍文献的有效工具。

    3.1.2 电子图书

    (1)光盘电子图书

    早在20世纪80年代,各研究机构和出版社就联合将原有古籍原版书转化为电子图书,通过精选优质的古籍底本,再进行数字转化后汇编,将其存储在光盘中。香港迪志文化出版有限公司与上海人民出版社合作出版的“文渊阁《四库全书》”电子版, 1997年开始制作,1998年推出“原文及标题检索版”(167张光盘),1999年推出“原文及全文检索版”(183张光盘)[12]。光盘版古籍容量大,一张光盘可以记录多部图书,便于携带。大多数光盘版古籍,可以在电脑上实现多种途径检索,还有整理、裁剪等多种编辑功能。现在因为网络技术的发展,光盘版古籍已经逐渐被网络版电子图书取代。

    (2)网络电子图书

    网络电子图书是指以互联网为媒介,以电子文档方式发行、传播和阅读的电子图书。网络古籍电子图书,有综合数字图书馆中收录的,由古籍文献转化的电子图书,如方正阿帕比数字图书馆,其中包括12万册珍贵古籍,可以提供翻阅、全文检索和在线试读;
    还有独立制作的专题古籍电子图书系统,如“‘中医药珍善本古籍多媒体数据库’对320种中医药珍善本古籍进行了数字化处理,初步建成了网络版的中医古籍电子图书系统”[13]。

    3.1.3 网络数字资源

    一些专业性网站或综合性网站的专题栏目,也收录了许多古籍数字资源。国内最有影响的古籍网站是国学网和爱如生网站。国学网所辟“文献部”为免费数字资源,分经、史、子、集四部分,但只能按卷或篇名浏览,不设字词检索功能。爱如生网站内所设“典海”,以数字化古籍为主要内容,收录历代典籍和民国书刊10万种。该网站收录的大量的明清人诗文笔记、学术著作,成为其一大亮点。古籍收藏单位和研究机构,也会在网站上开放自制古籍数字资源,供用户免费使用或注册使用。国家图书馆的国际敦煌项目(IDP),提供敦煌及丝绸之路其他遗址出土的10万余件写卷数字资源。国图还开辟了甲骨世界、碑帖菁华、西夏碎金等栏目,提供各种出土古书的数字资源[14]。

    3.2 获取路径选择

    3.2.1 公共获取路径

    信息资源公共获取,即“一定区域范围内某一社会共同体的不特定成员免费或低成本、无歧视、无障碍地获取有关信息资源”[15]。国内公共图书馆集中了我国大部分现存古籍,是保障公民基本文化权益的公共文化设施。

    公共图书馆向用户提供两种来源的古籍数字资源,即自建的和购买的古籍数字资源。随着“中华古籍保护计划”的深入开展,各图书馆相继建设各具特色的古籍数据库,开放古籍在线发布平台,供用户免费或注册使用;
    将小部分馆藏古籍内容制作成单本光盘、U盘型数字资源,收取制作成本费,满足用户个性化信息需求。公共图书馆利用公共文化服务资金采购商业化古籍数据库,免费提供给注册用户使用,基于维护公共文化权利的立场,为用户提供古籍数字资源的公共获取路径。

    公共图书馆向用户提供的古籍数字资源内容有:公有领域的古籍信息内容,著作权法豁免保护范围内的古籍数字资源。古籍因为年代久远,其信息内容已经进入公有领域,不受《著作权法》的限制。但是古籍载体本身又是文物,受到《文物保护法》的保护。因此,将古籍文献进行信息转移,制作成数字资源再提供给用户阅览,是解决古籍文物价值和信息价值之间矛盾的优选方案。我国《信息网络传播权保护条例》规定:图书馆可向其服务对象提供本馆收藏的合法出版的数字作品。因此,公共图书馆可以购买古籍商业数据库,供到馆用户和注册用户阅览学习。

    近年来,我国加大了推进公共文化服务的力度,公共图书馆古籍数字资源显著增长,服务能力增强。用户可以通过公共获取途径取得古籍数字资源,在文献种类、供给机构、服务形式上都有较大选择空间。这能够满足绝大部分用户的基本信息需求,而且有效降低了信息获取成本。但是,公共获取路径并不支持涉及商业化传播和营利性的古籍信息需求。

    3.2.2 商业获取路径

    信息资源商业获取,是指信息用户通过付出经济成本的方式,从商品流通市场上交换取得所需的信息资源。古籍文献的收藏机构,如图书馆、博物馆,是古籍数字资源商业获取的源头。超越古籍数字资源公共获取边界,公共图书馆、博物馆向营利性机构提供商业使用目的的古籍数字资源转让,属于商业获取行为。图书出版商、信息技术企业,向古籍收藏机构购买古籍数字资源后,经过再次技术化加工,增加资源的附加知识价值,再向用户提供古籍数字资源的商业化知识产品。

    古籍数字出版是在古籍数字化的基础上,通过筛选、点校整理和编辑加工后,以数字产品的形式提供给用户的一种出版活动。相关机构在古籍数字出版过程中打破了传统出版模式,发挥计算机处理技术优势,使用Unicode编码字符集、OCR移动数据采集、自然语言处理与语义关联、知识组织体系建设等方式实现古籍数字出版及数字资源合作[16]。不同于纸质资源,用户更看重古籍数字资源智能化、自动化、个性化的功能以及服务的多元、质量和效率。这就要求对古籍数字资源进行组织、标引、检索、分析、数据挖掘,实现深度知识揭示和呈现。信息技术公司和学术研究机构合作,将数字人文前沿研究应用于古籍数字化实践已成为趋势。例如:借助GIS技术进行文献知识与历史进程的静态与动态可视化分析;
    构建基于网络数据采集、专业数据库获取、词频分析的古籍文本信息可视化展示库;
    在全文人工标注的基础上,将大量电子化的文本集合为语料库,构建自动识别模型[17]。这种以古籍文本数据为对象的知识加工服务,增加了古籍数字资源的知识价值和经济价值,成为制造商的优势知识商品。进入信息资源市场后,用户通过付出经济成本购买其使用权,完成商业获取。

    3.2.3 开放获取路径

    信息资源开放获取(OA),是指任何用户可以免费在线获取数字化信息资源,并允许其进行阅读、下载、复制、传递、打印、检索等合理利用[18]。严格来讲,开放获取也是公共获取的一种形式,但是两者有共性也有区别。公共获取的资源可以是所有的信息资源载体形式,开放获取的资源则是在线典藏的学术数字资源。公共获取的资源,要依据法律法规和国家政策,在资源提供机构的管理和服务许可范围内有限获取;
    开放获取资源,免费开放就是其本质属性。古籍数字化是传统古籍整理研究工作在数字时代的延续与发展,以此为基础的古籍开放获取将逐渐成为古籍整理工作的未来发展方向[19]。

    世界各国知名公共图书馆,在收藏大量珍贵古籍的基础上,积极开放在线古籍数字资源,取得了丰硕成果。通过哈佛大学图书馆中文研究导航页的链接可查看宝卷、中国珍稀旧方志、拓片收藏、明清妇女著作等专题集,所有用户无需登录即可在线浏览古籍图片,支持无级缩放、下载打印等操作[19]。“书格”是国内为数不多的古籍开放获取资源整合网络平台,汇集了日本国立国会图书馆、德国柏林国家图书馆、法国国家图书馆、美国国会图书馆等海外众多著名图书馆的中文古籍数字资源,为用户提供开放获取服务[20]。

    海外古籍文献的数字化水平和开放获取程度要高于国内,流失于海外的中文古籍开放获取资源,使我国用户不出国门就能方便地获取和利用许多国内不复存在的古籍文献,可以有效地挖掘古籍文献中珍贵的历史信息资源。开展对于海外收藏的古籍文献的相关研究,具有重要的历史意义和现实意义[21]。开放获取资源建设也存在投入经费高、建设周期长、受收藏机构文献种类所限等缺点。相对于现存的中文古籍文献总量来说,全球开放获取的中文古籍数字资源还很有限,开放获取只能是获取部分古籍资源的选择途径。

    4.1 资源策略:优化古籍数字资源建设,做好源头供给保障

    做好古籍数字资源建设,为用户提供更多可获取的资源种类和数量,是推动古籍数字资源获取的基础性工作。优质高效的古籍数字资源是满足不同用户需求的基础保障。

    (1)挖掘珍贵特色古籍数字资源

    对古籍进行数字资源建设,为用户挖掘珍贵古籍的文献价值,要选择优质主题的古籍文献,选取那些既具有较高文献价值又高度契合用户需求,知识性和市场性完整统一的古籍,扩展古籍数字资源的学科范围。尽量避免对同类别古籍数字资源的重复建设,如文渊阁《四库全书》电子版,就曾出现了包括武汉大学图书馆、岳麓书社等8个机构参与的3个电子版书目。这些电子版书籍内容大体一致,带来较大的资源浪费,多个数字版本也容易使用户难以辨别与取舍[22]。因此,建设古籍数字资源要做好前期选题规划,挖掘学科类价值高和稀缺的文献资源,避免盲目追求热点内容,细化古籍数字资源的学科类别,扩大资源覆盖广度。

    (2)开发深层次的古籍数字资源

    以存档和检索为目的的古籍文献表层数字化已取得丰硕成果,深层次的古籍文献开发主要是古籍知识单元标注及知识网络构建、古籍文献之间的关联、文本内容分析及挖掘等[23]。

    在检索功能上,要加强知识组织与关联技术的研究,实现检索扩展和智能检索,由专家对本领域知识进行组织整序,形成一种内部知识相互关联的网络结构。一方面扩大检索入口,提高检全率,另一方面为用户提供知识链接的环境[24]。嵌入外部知识工具,常见的外部知识工具有古汉语字典、人名与地名词典、生僻字输入工具、时间换算法 (古今纪年、干支公元换算)等。

    基于自然语言处理技术,对古籍的文本进行分析,实现相似度对比,以及字词频分析。相似度对比可以用于分析文献的引用关系,或者文献校勘。字词频分析,可以收集数据库中词汇的出现频次,从而找到相似内容。古籍数字化可通过技术逻辑和人文逻辑相耦合的“数字人文”的研究,构建可持续完善和丰富的数据集和分析工具,充分利用新的信息技术与跨学科方法对古籍进行深层次的分析与挖掘[25]。

    4.2 版权策略:加大对公共使用的资金投入,扩大古籍数字资源的合理使用边界

    著作权法在保护权利人基于作品的专有性著作权的同时,通过一系列的专有权例外的公共领域保留机制,确保其促进文化科学事业发展与繁荣的制度目标得以实现[26]。公共领域具有使用的自由性,即著作权法下任何人都可以自由使用的部分和领域。

    (1)公有领域作品

    公共领域重要内容之一,为著作权保护期限届满的作品。古籍文献基本都过了著作权的保护期,其信息内容进入公有领域,可以提供给用户使用。但是古籍文献作为文物被收藏在公共文化单位,用户使用受到文物保护政策的限制。最好的解决方式就是推动古籍文献的公益性数字化建设,方便用户使用。2016年, “中华古籍资源库”向社会公众免费发布,已经在线发布超过 80%的馆藏古籍善本数字影像,是我国公共图书馆古籍数字化的重要成果[27]。2017 年文化部印发的《“十三五”时期全国古籍保护工作规划》明确指出,要加强古籍数字化工作,鼓励和支持各古籍收藏单位加快古籍数字化步伐,扩大古籍数字资源开放,促进资源共享,提高利用效率。古籍收藏单位对馆藏古籍进行数字化建设,虽然不受著作权约束,但是会产生其他费用,比如硬件设备采购、人力资源投入、信息技术支持等。特别是一些大型的古籍数字化建设项目,要集中多个收藏单位的古籍文献资源统筹开发,项目经费投入较高。鉴于此,大型古籍数字化建设项目可由政府投入经费,或积极筹集其他慈善组织、基金会、民间机构和个人的资金,以实现古籍数字化成果的公共使用。

    (2)合理使用内容

    著作权法公共领域的另一项重要内容,即对著作权作品特定情况下的“合理使用”。我国《信息网络传播权保护条例》规定,图书馆可以不经著作权人许可,通过信息网络向本馆馆舍内服务对象提供本馆收藏的合法出版的数字作品和依法为陈列或者保存版本的需要以数字化形式复制的作品。此项规定将合理使用限制在馆舍和保存版本的数字化,不适于网络发达的现实需要。图书馆应寻求立法改革支持,扩大合理使用边界,可购买一些商业古籍数字资源,供到馆用户和注册用户使用。具体可以采购商业数据库镜像副本,安装在本地服务器,供馆舍内用户使用,如单机版、局域网版;
    也可以采购远程访问包库服务,分年或按照点次付费,用户远程访问产品官网。经统计,53所在古籍研究方面有专长的高校图书馆累计购买古籍全文数据库64个,其中获购量最多的是“中国基本古籍库”[7]。政府部门要加大对图书馆的公共服务资金支持力度,支持为用户个人学习和研究免费或低成本提供商业化古籍数字资源。

    4.3 技术策略:大力探求技术突破,推进古籍数字资源的整合和处理

    商业信息机构对古籍信息价值的追逐,使得古籍商业数据库大量涌现。商业信息机构要专注于发挥自身技术优势,把开发古籍数字资源的内在信息和知识作为服务特色,吸引对古籍信息有深层次科研需求的用户。

    (1)信息整合

    信息整合主要是指通过分类法、主题词法等信息组织体系,将不同信息源、不同信息结构、不同信息载体的相对独立的信息进行集成,实现原有信息的优化配置和价值增值[28]。数据库是信息整合的成熟方式之一,有高效的数据处理能力和良好的检索性能,还适合通过网络传输信息。因此,古籍数据库可以提供快速检索浏览、主题排序、下载分享、定制推送等常见信息获取功能,为古籍用户提供集成化信息服务。同时,大量生产的古籍数据库、数字图书、数字产品也为用户筛选带来了不便,为了帮助用户提高资源的检索效率,还应该对分散的古籍数字资源进行整合。细粒度的整合,即对具体典籍资源进行整合,构建互联互通的古籍资源联合平台;
    粗粒度的整合,即对古籍数据库进行整合,构建古籍数据库导航平台[29]。

    有学者提出,建立古籍数据库分类分面体系,收集多个古籍数据库,并采用都柏林核心元数据集来标注古籍数据库的特征,再设置不同分面,来表示古籍数据库的不同维度。用户可以通过分面筛选来快速检索到需要的古籍数据库条目[29]。还有研究提出,古籍数字资源存在资源分散、建设主体多元、数据格式多样化的特征,适宜建立古籍数字资源导航系统,将多种数字资源的网络入口集合在一起,在线发布给用户使用[30]。

    (2)信息处理

    信息处理是对古籍数字资源的深加工,扫清用户使用的浅层文字障碍,提取用户所需的深层知识内容,并加以呈现。古汉语文字的特点,又区别于现代汉语,学术研究机构和信息技术企业应加快古籍信息处理的研究和实践探索。“古籍信息处理是利用现代信息技术对古籍文本的音、形、义进行加工和处理,并基于此实现古籍文本的数据挖掘和知识发现。”[31]古籍数据挖掘主要的方法有:建立古汉语精加工语料库,为古籍断句、标点、分词和标注提供数据支撑;
    将序列标注模型应用于古汉语词法分析;
    开发古汉语一体化词法分析平台等[32]。利用现代技术对海量古籍文本进行自动分析,可以大大减轻人工标注的负担,还可以挖掘出文本的特征和规律。

    在古籍知识挖掘方面,结合数字人文的研究方法,利用知识抽取、知识融合、知识推理等技术和方法,可以实现古籍信息服务智能化。一些学者提出要“利用文本挖掘技术提取事先未知、容易理解、有潜在价值的知识;
    借助GIS技术进行文献知识与历史进程的静态与动态可视化分析;
    构建基于网络数据采集、专业数据库获取、词频分析的古籍文本信息可视化展示库;
    在全文人工标注的基础上,将大量电子化的文本集合为语料库,构建自动识别模型”[16]。

    4.4 服务策略:精准分层用户群体,提升用户数字素养

    古籍数字资源在完成资源建设、技术处理后,扫清版权障碍,最后到达用户终端。通过服务机构辅助和用户自主获取,古籍数字资源才得以完成信息知识的最后传递过程。

    (1)用户群体分层服务

    古籍数字资源的服务提供者,应精准区分服务用户群体。公共文化服务机构面对的用户群体存在需求差异,应该对用户需求进行差异化管理,根据用户群体的综合需求做好古籍数字资源的内容建设,提出针对性服务方案。对有鉴赏、阅览需求的用户,提供自建和共建共享的古籍数字资源,实现公共获取;
    对学术研究型用户,提供自建古籍数字资源和公共资金购买的商业古籍数据库,实现公共获取,尽可能保障古籍数字资源在著作权许可下的公共传播权利;
    对于对特藏文献有营利性需求的用户,提供特藏古籍数字资源,实现商业获取;
    对需求复杂的用户,提供综合途径的获取方案。公共服务机构应主动引导用户,选择符合其自身利益和价值需求的资源获取途径,节省公共资源,满足大众文化需求。提供商业获取资源的服务者,应在正常营利性服务模式下,做好版权处理和审查,保障用户对获取的古籍数字资源免于著作权纠纷。对海外特藏中文古籍的开放获取,有利于开展专业领域研究。

    (2)提升用户数字素养

    “数字素养与技能是数字社会公民学习工作生活应具备的数字获取、制作、使用、评价、交互、分享、创新、安全保障、伦理道德等一系列素质与能力的集合。”[33]数字素养是信息素养的“升级版”。2021年12月27日中央网络安全和信息化委员会发布的《“十四五”国家信息化规划》,将“全民数字素养与技能提升”作为十大优先行动之首。数字素养已成为数字化社会公民的核心素养,是公民生存的基本能力。

    古籍文献用户要适应数字智能时代,从研究传统文献转变为利用古籍数字资源,要形成和培养自身的数字素养。培养古籍用户的数字素养,是提升古籍用户数字资源获取能力的基本途径。数字时代,获取信息依靠的是对数字工具和技术的运用能力。古籍数字资源用户,需掌握的数字技能主要有:数字设备的物理操作和软件操作,通过互联网平台和数字工具浏览、搜索和筛选古籍数字资源,通过数字工具进行网络沟通和互动,网络安全风险下个人隐私和数据保护,使用数字工具和技术对古籍数字资源进行分析和研究等。古籍数字资源服务平台对用户开设数字素养教育培训课程,是便捷有效的途径。平台可以开展集中专业的培训课程,用户还可以通过平台进行交流研讨,提高资源获取和利用效率。

    猜你喜欢 古籍文献数据库 Hostile takeovers in China and Japan速读·下旬(2021年11期)2021-10-12西藏大批珍贵藏文古籍实现“云阅读”布达拉(2020年3期)2020-04-13古籍修复师的巧手与匠心出版人(2019年11期)2019-12-19Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph大东方(2019年12期)2019-10-20The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges科学与财富(2017年22期)2017-09-10The Role and Significant of Professional Ethics in Accounting and Auditing商情(2017年1期)2017-03-22数据库财经(2017年2期)2017-03-10数据库财经(2016年15期)2016-06-03数据库财经(2016年3期)2016-03-07数据库财经(2016年6期)2016-02-24

    推荐访问:古籍 视角 路径

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章