《古籍数字化与开发利用规范.docx》由会员分享,可在线阅读,更多相关《古籍数字化与开发利用规范.docx(33页珍藏版)》请在课桌文档上搜索。
1、ICSCCS苏州市地方标准DB古籍数字化与开发利用规范(征求意见稿)SpecificationfordigitizationofancientChinesebooks2023-XX-XX 发布2023-XX-XX实施苏州市市场监督管理局发布目次前言本标准按照GB/T1.1-2020标准化工作导则第1部分:标准化文件的结构和起草规则的规定起草。请注意本标准的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本标准由。提出并归口。本标准起草单位:苏州图书馆(苏州市古籍保护中心)本标准主要起草人:本标准为首次发布。引言为实施国家文化数字化的战略,结合苏州市对于数字苏州标准化建设的总体要求,
2、基于已广泛开展的古籍数字化工作,从古籍资源的生命周期出发,规范古籍的数字化前准备、数字化加工、数字资源开发利用的工作环节,推动古籍资源开发利用,为古籍数字资源互联互通和共享利用提供标准化基础,为实现古籍数字化工作高质量发展提供保障,制定本标准。古籍数字化与开发利用规范1范围本标准规定了古籍数字化技术和管理要求以及开发利用要求。本标准适用于苏州全域各古籍保藏机构的古籍数字化加工和开发利用过程的管理。2规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB18030信息技术中文编
3、码字符集GB/T31076.I-2014汉文古籍特藏藏品定级第1部分:古籍GB/T21712古籍修复技术规范与质量要求GB/T31219.3图书馆馆藏资源数字化加工规范第3部分:图像资源GB/T33770.1信息技术服务外包第1部分:服务提供方通用要求GB/T32419.5信息技术SoA技术实现规范第5部分:服务集成开发GB/T379652019信息与文献文化遗产信息交换的参考本体GB/T35662-2017古籍函套技术要求WHAT66古籍元数据规范WH/T20古籍定级标准WH/T91汉文古籍集外字描述规范3术语和定义下列术语和定义适用于本文件。3.1古籍ancientbooks中国古代书籍的
4、简称。主要指书写、印刷于1912年以前又具有中国古典装帧形式的书籍。注:凡内容具备三性”(历史文物性、学术资料性、艺术代表性)之一,且采用中国传统装帧形式的书籍,其时代断限可适当延伸至1949年。3.2珍贵古籍rareancientbooks具有历史文物性、学术资料性、艺术代表性的古籍,包括写印年代较早、存世数量较少,以及精校、精抄、精刻、精印的古籍。3.3普通古籍commonancientbooks珍贵古籍以外的古籍。3.4古籍数字化digitizationofancientbooks古籍整理工作的一部分,从保护和利用古籍的目的出发,采用计算机技术对古籍进行数字化处理,制成可以再现或检索、阅
5、读、分析的古籍数据库,从多个角度揭示古籍文献信息资源的一项系统工作。3.5古籍资源ancientresources包括古籍原件实体、古籍数字资源、古籍数据、古籍数据库和古籍衍生品等。3.6古籍数字资源digitalresourcesofancientbooks将古籍原件信息转化为数字存储而获得的资源总和。3.7古籍数据ancientdata古籍数据是在古籍数字化过程中获得的机器可识别、可理解和可计算的各类数据或数据集合,主要包括原生数据、语义数据、关联数据、智能数据等类型。(此处可精简,不对上述数据类型进行解释。原生数据是对古籍元数据与内容的呈现;语义数据是通过RDF和本体组织等技术实现古籍内
6、容的语义重组;关联数据通过数据挖掘、本体或实体对齐等技术实现古籍内容的多模态融合;智能数据是指通过知识图谱、深度学习算法等技术实现对古籍隐性内容的自动生产。)3.8古籍数据库ancienbooksdatabase按一定的概念结构组织的数据集合,其概念结构描述古籍数据的特征及其对应实体间的关系.3.9古籍衍生品以古籍原件实体为依据,通过外观仿制、内容提取、元素组合、与现代科技结合等方式所生产开发收藏品、文化用品、生活用品、服饰装饰品、娱乐用品、数字人文展品等产品类型。3.10古籍修复restorationofancienbooks使破损古籍尽可能恢复原貌,而对其进行去污、脱酸、修补、装订等处理。
7、3.11古籍数字化外包digitizationofancientbooksoutsourcing古籍保藏机构将古籍数字资源加工、古籍数字资源描述与组织、古籍数据库建设等业务以合同的方式委托给其他机构完成,以降低成本、提高效率的行为。3.12古籍数字化开发利用digitaldeveIopmentandutiIizationofancientbooks用信息技术手段提取和加工古籍数字资源中的有用信息与知识单元,根据用户的需求提供服务并加以利用。4基本原则与要求4.1 基本原则苏州全域各古籍保藏机构,统筹规划、科学开展古籍数字化及开发利用工作。应遵循全面规划、规范有序、深度开发、有效利用的原则。4.
8、2 古籍数字化与开发利用主要包括组织与管理、数字化前准备、古籍数字资源加工、古籍数据库建设、古籍数字资源发布、开发利用等环节。5组织与管理1 .1项目规划应建立古籍数字化工作项目组,对数字化工作进行统筹规划、组织实施、协调管理、安全保障、技术保障、监督检查、成果验收等。5 .2人员安排5.2.1 人员配备应配备相应的项目管理人员、技术人员、修复人员、书库管理人员。5.2.2 人员管理应建立科学的管理制度,规范人员管理。应对外聘工作人员和服务提供方工作人员的资质与能力进行审核。5. 3场地空间管理5.1.1 应设置专用加工场地,宜选择在古籍保藏机构内部。合理布局,形成古籍存放、数字化前处理、古籍
9、扫描、图像处理、数据著录、成品验收等工作区域。5.1.2 加工场地应确保古籍安全及古籍受环境影响在合理范围。场地内应配备可覆盖全部场地的防火、防水、防有害生物、防盗报警、视频监控等安全管理的设施设备。1 .4设备管理应合理规划、配备和管理古籍数字化设施设备,确保设施设备安全、先进。5 .5管理制度5.5.1 应制定科学化、规范化的管理制度并严格执行。5.5.2 古籍数字化管理制度应包含外包管理、岗位管理、人员管理、场地管理、设备管理、数据管理、古籍实体管理等方面。5.5.2.1 外包管理制度主要规定发包方选择服务提供方的基本流程和要求,对服务提供方的资质与能力等进行规范。5.5.2.2 岗位管
10、理制度主要规定数字化工作各岗位的工作目标和职责,形成明确的岗位业务流程规范、考核标准、奖惩办法等。1.1.1.1 管理制度主要对人员的安全责任、日常行为、外聘人员信息审核及管理、非工作人员来访登记等进行规范。5.5.2.4 场地管理制度主要对数字化工作各环节涉及的场地和全部设备的管理进行规范。5.5.2.5 数据管理制度主要对数字化各环节所产生的数据的管理进行规范。5.5.2.6 古籍实体管理制度主要对古籍实体在数字化过程中的交接、管理、存放、归还等工作进行规范。6古籍数字化前准备6.1 古籍数字化外包组织由古籍业务主管部门对参与古籍数字化的发包方、服务提供方等业务工作进行规范、检查与监督的过
11、程。6.1.1 古籍数字化发包方6.1.1.1 发包方古籍数字化服务外包的需方。本部分是指苏州市古籍中心和各类古籍保藏机构。6.1.1.2 发包方工作规范发包工作应分为规划与审批、服务提供方筛选与确定、合同签订、合同执行与监督、评估与改进5个步骤。发包方应掌握和遵守古籍数字化服务外包工作中适用的国家法律法规和标准。发包方应确定古籍数字化外包的范围、内容、流程、质量和安全等要求,并在合同条款中明确。发包方应制定和落实安全管理体系,避免古籍实体受损毁以及国家秘密、商业秘密和个人隐私泄露。发包方应对服务提供方的人员、工作场所、基础设施、技术、管理工作、业务操作等进行全过程监管。发包方应建立古籍数字化
12、外包项目管理档案。6.1.2 古籍数字化服务提供方6.1.2.1 服务提供方古籍数字化服务提供方是指具有独立法人身份和相关资质的机构。6.1.2 .2服务提供方资质服务提供方应为依法注册的法人,具有独立承担民事责任的能力,经营业务范围必须包括文献数字化加工或数据处理类项目,技术设备与人员等应具备工作要求。服务提供方应具有履行合同所必需的服务能力、经验和信誉、保密资质等。6.1.3 数字化服务外包过程组织6.1.3.1 服务提供方应接受发包方全过程和全方位的监管。6.1.3.2 服务提供方应与发包方签订合同,约定双方的权利与义务。6.1.3.3 服务提供方应严格履行合同条款。6.1.3.4 服务
13、提供方应接受发包方的服务质量评价,将评价结果作为改进服务质量的重要参考依据。6.1.3.5 古籍数字化外包安全管理古籍数字化外包安全管理按照安全第一、预防为主的原则,采取科学有效的安全管理措施,应用确保古籍安全的技术手段,建立权责明确、覆盖古籍数字化全过程的岗位责任制,确保古籍实体、信息和数据安全。在同等条件下,应优先选用具有与数字化加工相关涉密资质的数字化服务提供方。服务提供方应制订并执行古籍数字化安全与保密制度,制订并执行古籍实体交接、数字化加工过程管理、数字化成果验收与交接、存储介质管理、古籍实体保护等操作规范和管理制度。服务提供方应对工作人员进行安全与保密教育和必要的上岗培训,并与工作
14、人员签订安全与保密协议,履行安全与保密责任和义务。数字化加工场所应符合防盗、防火、防尘、防水、防潮、防高温、防日光及紫外线照射、防有害生物、防污染等安全管理要求。2. 2古籍数字化项目遴选6. 2.1古籍类型选择根据古籍存藏情况,结合古籍数据共享目的和开发利用场景,优先选择承载古城历史文化,体现苏州城市发展,具有地方特色的古籍(家谱、地方志、舆图等)开展数字化工作。7. 2.2古籍版本选择6.2.2.1 版本类型宜根据GB/T31076.1WH/T20的规定优先选择级别较高的古籍。宜优先选择已入选国家珍贵古籍名录、地方名录或已文物定级和具有地方特色的古籍。或以学界和业界公认的版本鉴别标准遴选优
15、秀版本,明确底本、参照本等版本选择方式,指明版本的来源、质量和数量等。6.2.2.2 版本细节宜选择较优版本作为数字化底本,体现古籍版刻工艺、装帧形式、纸张行款、字体边栏、墨色藏印、题跋等版本细节信息,保证各类型古籍数据库对于古籍版本内容展现的细节程度。6. 2.3古籍开发利用项目选择按照古籍数字资源特点和使用需求,选择开发具有地方特色的古籍数字化服务项目(数据库、共享平台),特别古籍数据与其它数据融合的数字人文项目或应用场景。6.2.3.1 数据库建设建设苏州方志数据库、历史地理特色数据库、家谱专题数据库、藏书家特色专题库等。6.2.3.2 开放共享保藏机构应建设专题古籍资源体系,实现古籍数
16、据的共建共享、互联互通。6.2.3.3 应用场景拓展打造古籍数字化产品品牌。创编和出版古籍数字内容产品,利用数字技术和演绎手段展示古籍形制和内容,开展形式多样的古籍数字化竞赛项目,深度开发内容资源和相关衍生品,拓展古籍数字资源应用场景。6.3古籍数字化项目调查6.3.1 明确古籍数字化目标和开发利用需求,制定古籍数字化方案。6.3.2 在全市范围开展古籍资源普查,明确古籍资源数量、分布和数字化情况,制定全市古籍目录、数字化古籍分级分类名录,明确数字化内容和对象。在全国范围内调查与苏州有关的古籍资源及其数字化情况。6.3.3 对需要数字化的古籍开展实地调查,制定古籍数字化工作清单。7古籍数字资源
17、加工7.1 加工前处理7.1.1 记录描述对数字化古籍书况进行全面检查,重点对阙叶、错叶、夹叶位置及破损清苦进行描述和记录。7.1.2 技术修复破损严重或因其他原因无法直接进行扫描的古籍,先由古籍专业修复人员依据GB/T21712进行技术修复。7.1.3 拆除装订以古籍保护为原则确定是否拆除装订。特殊形制且拆除装订后需恢复的古籍,在拆除时应使用拍照等方式记录原貌。7.1.4 2加工分级根据古籍数字资源图像的加工目的和使用要求,将图像数字资源的应用级分为以下三种级别(参考GB/T31219.3图书馆馆藏资源数字化加工规范第3部分:图像资源;DB34/T古籍数字化工作指南):7.2.1 长期保存级
18、(archivesimage)用于长期保存和必要时复制用于高品质的出版印刷,也可作格式转换和复制加工级的母本。需满足以下.技术要求:色彩位深不低于24bit;分辨率不低于600dpi;像素不低于3600万;文件保存格式为TIFF(LZW)或RAW(sRAW);一一色调再现使用ICC配置文件。7.2.2 复制加工级(ProCeSSimage),即专家浏览级或普通印刷级,由长期保存级图像经技术手段转换而成,用于加工复制各种精度、尺寸的屏幕浏览图像的母本文件。供专家、合作伙伴及专门组织成员在网上有条件、有权限地访问,也可供一般品质的出版印刷使用。需满足以下技术要求:-色彩位深24bit;分辨率不低于
19、600dpi;文件保存格式为TIFF或JPG、JPEG2000;色调再现使用ICC配置文件。7.2.3 发布服务级(displayimage)由复制加工级图像转换或压缩生成,用于古籍数据库建设,直接面向公众发布,供网上浏览,可下载、打印。需满足以下技术要求:一一扫描或拍照制作而成的资源色彩位深24bit,缩微胶片转换制作而成的资源色彩位深8bit灰度;分辨率不低于200dpi;像素不低于1000万;文件保存格式为JPG、JPEG或封装到PDFo7.3器材准备(参考GB/T31219.3图书馆馆藏资源数字化加工规范第3部分:图像资源;DB34/T古籍数字化工作指南)7.3.1 扫描设备宜选择零边
20、距或非接触式扫描仪。需满足以下技术要求:应为无紫外线的同步冷光源;设备实际光学分辨率不低于600dpi;CCD感光元件不低于5000像素点;色彩位深24bit;宜在A4(21Omm297mm)A()(1189mm841mm)Iffll幅间自由调整。7.3.2 拍照设备宜选择数码相机或数码后背,并配置托稿台、背景等配套设备。需满足以下技术要求:数码相机或数码后背有效像素不低于3600万;托稿台材质应经过脱酸处理,托架稳定牢固;宜选择中灰色的纸板作为扫描或拍照背景。7.3.3 缩微数字转换设备宜选用专业级所谓胶片扫描仪。需满足以下技术要求:扫描设备具有胶片保护装备,不划伤、损伤胶片;设备光学分辨率
21、40OdPi以上;色彩位深8bit灰度。7. 4数字资源的创建7.1.1 数字资源创建原则数字资源创建应符合以下原则:-在不损坏原始资源的基础上,尽可能完整地获取资源信息;-尽可能利用扫描、数码拍照等先进的数字化技术,同时采用先进的图像处理技术;-数字化产品均应保留数字化过程中所有的参数,以及数字化产品做过的影像处理动作的记录,以利日后必要的修正与追踪;-在数字化加工过程中应记录采集生成的数字图像数据的技术和管理信息,包括加工完成的图像数据的信息资源标识符、来源、格式、代理标识符、代理名称、事件标识符、操作日期时间等,供元数据加工环节的编目人员利用。7.1.2 古籍扫描(拍照)采用扫描或拍照的
22、方式进行数字资源创建应满足以下要求:一一应确保古籍安全及古籍受环境影响在合理范围内;宜注意拍摄光源及环境光源,避免透光或反射光的影响;扫描或拍照后的图像清晰,没有重叶、缺叶、错叶、折页等情况(原书缺叶、错叶除外);一一扫描或拍照后的图像与古籍原件颜色一致;一一扫描或拍照后的图像以中缝为中心线,保持原文献的天头、地脚尺寸不变,图像倾斜角度不大于0.2度,尽量减少畸变与失真;每部古籍第一册封面宜与色卡及标尺一同拍摄,色卡及标尺宜放置于古籍原件左侧,距古籍0.1Cm1.0cm;-按1:1比例扫描或拍摄,拍摄图像外围应有留白,宽度不超过1cm;-扫描或拍照时原则上不进行拆卷处理,如遇特殊情况(夹字、粘
23、连等),需经古籍数字化管理人员与古籍修复人员会商核定后,由古籍修复人员进行拆卷、修整与还原;-扫描或拍照时出现透字现象,由古籍修复人员选择纸性相近的修复纸进行托衬;-古籍原件表面如粘贴有其他物件时(如签条等),需先将原件与粘贴物一同扫描,然后将粘贴物揭开,再次扫描;古籍原件内夹有其他物件时(如夹页、夹签),可记录夹签位置,取出单独扫描或拍照后置于该册末尾。7.1.3 缩微胶片数字转换采用缩微胶片数字转换的方式进行数字资源创建应满足以下要求:一一应注意对缩微胶片的保护;宜选择第二代负像缩微品进行数字化;一一宜选择专业级缩微胶片数字转换设备:一一缩微胶片整体密度较为均匀、图像质量较好、图像大小基本
24、相同时,宜采用高速扫描仪对其进行快速整卷/盘扫描,否则宜采用低速扫描仪逐画幅扫描。7.1.4 图文转换(参考GB/T31219.2图书馆馆藏资源数字化加工规范第2部分:文本资源)对扫描或拍摄后的图像进行图文转换需满足以下要求:-文本采集方式主要包括光学字符识别和文本录入;-光学字符识别图像内容完整,无残破和缺失,颜色深浅适中,字迹清晰,酌情对图像去污,无明显倾斜和扭曲;字符识别准确率达到95%以上;-结合运用纵向校对、横向校对、对比校对、抽检等方式保证识别内容质量;-宜照实录入,保留原始文献中的错别字及各种文字变体,保持古籍内容的原始面貌;采用编辑软件校对功能、双工录入方式保证录入内容准确率;
25、字符编码处理符合GB18030O7.1.5 多维数据采集古籍数字化采集、处理、管理、保存、服务应用活动中的相关记录数据的采集与保存。7.1.6 多媒体数据采集古籍数字内容、古籍数字化工作和管理相关的以视频、音频、动漫等媒介形式存在的相关数据的采集与保存。747古籍装具数据采集(参考GB/T35662古籍函套技术要求)古籍装具数据采集应包含以下内容:一一外观和工艺,包括内外部形态、尺寸、抗压强度等属性;材质选择,纸和纸板、纺织品、胶粘剂、金属材料等属性;一一附件,函套别子、题签等属性。7.5 图像处理(参考GB/T31219.3图书馆馆藏资源数字化加工规范第3部分:图像资源;DB34/T古籍数字
26、化工作指南)7.5.1 图像处理原则图像处理应满足以下要求:-尽可能保持与原始资源的一致性;-不改变各级别图像数据的色彩、分别率、格式等属性;-图像处理环节包括裁切、旋转与纠偏(斜)、去污、锐化、色彩管理、图像拼接、数字水印。7.5.2 长期保存级图像处理长期保存级图像处理应满足以下要求:图像纠偏:对方向与角度不正确的图像进行旋转纠偏,使其更好满足阅读习惯;一一图像裁剪:对图像外边缘空白处进行裁切修剪,可根据实际裁至0.5Cm0.75cm;图像拼接:对画幅较大导致分幅扫描或拍摄的图像进行拼接,接缝处无缝吻合,不应缺失或增加内容,可完整还原古籍原件全貌。7.5.3 复制加工级图像处理复制加工级图
27、像处理应满足以下要求:-制作时宜使用长期保存级图像的备份文件,避免制作中损坏原始数据;一一制作完成后的图像应与长期保存级图像的分辨率和像素相同,且一一对应。7.5.4 发布服务级图像处理发布服务级图像处理应满足以下要求:-制作时宜使用复制加工级图像的备份文件,避免制作中损坏原始数据;-制作时宜添加水印,但不应对正常阅读产生影响;一制作时可适当压缩图片分辨率和像素,但不应对正常阅读产生影响。7.6 元数据加工7.6.1 核心元数据参照GB/T3792.7,结合实际情况符合WH/T66的要求;7.6.2 描述元数据记录扫描或拍摄过程的信息,创建的存储文件的信息,以及有关组成单个对象的各个不同块的信
28、息;7.6.3 管理元数据记录数字主文件的创建,标识数字图像以及需要什么软件浏览或使用数字图像,建立数字图像各个部分或示例之间的链接,版权和复制操作等信息。7.7 知识组织7.7.1 标引与标注7.7.1.1 标引是指在古籍数字化过程中,通过分析古籍文献内容,把古籍文献主题以及其他有意义的特征标识出来作为古籍文献存储与检索依据的一种处理过程。7.7.1.2 数据标注是对未经处理过的古籍数字化成果等数据进行加工处理,从而转变成机器可识别信息的过程。主要有图像标注、语音标注、3D点云标注和文本标注等类型,在具体实现上可以采取人工标注、自动化标注、众包方式标注等形式。7.7.2 分类组织根据古籍内容
29、、形制,数字化技术特点,开发利用需求等方面,对古籍数字资源进行多角度、多维度地分类组织,对古籍资源进行深入开发。7.7.3 创建古籍叙词表古籍叙词表构建过程应包含以下内容:一一叙词表构建原则,包括编制原则与标准、选词原则等;-叙词表构建准备,包括确定古籍标引平台与模板、形成相关古籍语料库等;一一叙词表构建过程,包括选词、编制主表、编制词族表、编制范畴表、编制英汉索引表等。7.7.4 构建古籍本体设计古籍通用本体及领域本体,内容包括本体及其类和属性命名规范、本体构建规范(构建原则、技术要求、利用方法等)、本体扩展原则和方法、本体应用指南。8古籍数字资源验收与保存1.1.1 化成果验收1.1.2
30、收方式数字化成果验收应采取以下方式:一一成立专门验收组对古籍数字化成果进行验收;-采用计算机自动检验与人工检验相结合的方式对古籍数字化成果进行验收检验。1.1.3 验收内容(参考DA/T纸质档案数字化规范;DB34/T古籍数字化工作指南)数字化成果验收应包括以下内容:应对图像数据进行验收,主要包括数字化参数、存储路径、命名的准确性、图像的完整性、排列顺序的准确性、图像质量等。应对文本数据进行验收,主要包括文本数据的准确性、文件格式与编码无误、文本数据按要求保存并命名。应对元数据进行验收,主要包括元数据元素的完整性、描述的规范性、存储格式的通用性等;应对目录数据进行验收,主要包括数据库中各条目内
31、容、格式等的准确性以及完整性;一一应对工作文件进行验收,主要包括工作文件的完整性、规范性等;-应对存储载体进行验收,主要包括载体的可用性、有无病毒等。1.1.4 数字化版本选择根据软硬件条件变化,对古籍数字化的技术手段、存储载体、数据加工深度、数字化质量要求、共享开发产品等进行选择与迭代的过程。古籍数字化版本选择应遵循技术先进、质量优先、经济高效和共建共享的原则。8.2古籍归还入库8.2.1 古籍检查古籍数字化工作完成后,应注意检查古籍书况,注意保持古籍原貌,做到安全、准确、无遗漏。8.2.2 古籍归还入库按照古籍入库相关要求对古籍进行处理和清点,并履行古籍入库手续。9古籍数据库建设9.1 数
32、据储存9.1.1 数据安全参照有关法律法规并结合古籍特点进行明确。可以将古籍数据分为重要数据和一般数据。9.1.2 数据分类以传统四部分类法为基础,但不限于此分类方法。9.1.3 长期储存应配置专门的数据空间用于存储数据,记录与数字资源保存、调用、迁移等活动关联的元数据信息。9.1.4 异地备份入选国家珍贵古籍名录、地方名录或已文物定级的善本古籍数据宜托管异地备份至有关单位服务器或数据中心。92数据挂接9.2.1 目录数据库建立目录数据库的建立应满足以下要求:应制定目录数据库数据规则,包括数据字段长度、字段类型、字段内容要求等;数据库结构设计应注意保持古籍的内在联系,有利于数字化成果的管理和利
33、用;应将数字化前处理工作中对古籍目录进行修改、补充的结果入库,形成准确、完整的目录数据;应采用计算机自动校对与人工校对相结合的方式,对目录数据的质量进行检查。9.2.2 借助相关软件对目录数据和与其对应的古籍数字资源进行挂接,实现目录数据与数字资源的关联。9.2.3 逐条对挂接结果进行检查,保证数据的准确性、一致性。9.3数据库功能(参考DB34/T古籍数字化工作指南)9.3.1 数据库基本功能数据库系统应具有输入、输出、存储、修改、更新等基本功能。9.3.2 查询检索功能宜首先建立起基于元数据仓储模式下的查询、检索平台,逐步实现词义匹配、全文检索以及多种知识信息关联。9.3.3 应用服务功能
34、应提供图像基础细节及缩放、翻页、目录、册次选择等基本功能;设置访问统计及用户反馈模块,确保古籍数字化项目应用的有效性。9.3.4 安全管理功能应包括系统用户管理、系统日志管理、数据库备份与恢复功能。10古籍数字资源开发利用10.1 应用处理10.1.1 发布平台宜优先选择关系型数据库系统,提供数据接口供其他系统调用,平台应支持OAl(OPenArChiVeSInitiatiVe开放文档先导)协议。10.1.2 发布模式根据古籍数字化项目选题确定发布模式,网站发布优先选择B/S(BrowserZServer,浏览器/服务器模式)直接浏览访问,支持移动端展不.10.1.3 访问控制遵循W3C(国际
35、互联网联盟)的易用性原则和分析要求,优先保障各种复杂条件下的用户方便地获取系统服务,实现信息安全访问和产权保护。10.1.4 元数据登记实现元数据发布、登记和检索,提供元数据格式和体系的公开查询和调用。10.2 古籍资源开发10.2.1 古籍资源原生性、再生性和传承性开发应对古籍实体进行整理、编目、展示等原生性开发,发挥其文物与文献的双重价值。应对古籍资源进行缩微复制、影印出版、数字化等再生性开发。应采用各种方式对古籍进行传承性开发,使古籍所反映的文化为其受众所认知和掌握。10.2.2 古籍数据挖掘应用自然语言处理技术挖掘古籍数据,应用和推广古籍自动句读与标点、古籍词语自动切分、古籍命名实体识
36、别、古籍事件抽取等技术。10.2.3 古籍资源语料库将古籍数据分类整合,形成具有地方特色的古代人名库、地名库、职官名库、名物库、各种语言类词典等。10.2.4 古籍资源知识库基于古籍内容分类、古籍叙词表、古籍本体进行古籍资源知识开发,形成各类知识服务产品。10.2.5 古籍资源展示提供数字资源终端展示、古籍实物三维展示、虚拟现实(VR)和增强现实(AR)等基于场景的展示,实现人与古籍的连接互动。103古籍资源共享利用1.1 3.1古籍数据共享利用原则古籍数据共享利用遵循统采共用,共建共享,推陈出新,活化利用”的原则。1.2 3.2古籍数据共享利用方式应将古籍数据纳入到文化大数据体系和文化遗产保
37、护战略中进行治理。古籍基础数据原则上在专题数据库或城市公共数据平台上统一进行开放与共享。允许和鼓励不同主体主导和参与各种形式的古籍数据开发利用,保护古籍数字化产品的知识产权。1.3 古籍数据与各类型数据融合应用增加古籍数据与时间、空间数据等各类型数据的关联,实现数据融合,推动各类综合集成平台和移动应用创新开发。通过古籍数据打通古籍文献间的壁垒,提取和丰富地方文化元素,再现、复原和演绎优秀传统文化。鼓励通过古籍数字化与其它数字人文项目的融合,打通推动跨学科研究和古籍数据的深层次利用。1.4 开发利用规范1.4.1 开发利用原则与条件应遵循广泛参与、应用牵引的原则,开发利用的内容和方式符合国家相关
38、法律规定,鼓励古籍的公益性、公共性开发利用。1042开发利用形式古籍开发利用形式分为文创产品开发、展览演绎、宣传推广、研究利用等。应通过外观仿制、内容提取、元素组合、与现代科技结合等方式进行文创产品开发,生产开发收藏品、文化用品、生活用品、服饰装饰品、娱乐用品等产品类型。应通过线上、线下等方式将古籍及其数字化产品进行展览演绎,开展珍贵古籍展、书籍演变历史展、典籍中的地方历史文化展、多主题的传统文化展,以及古籍制作、古书修复等展示体验活动,挖掘古籍文本,打造集文化价值、教育价值和商业价值合一的品牌内容IP。应通过传统媒体和社交媒体等方式进行宣传推广,对古籍留存与保护状态以及古籍中包含的地情地貌、
39、历史文化、名人事迹、风土人情的记载等进行宣传介绍。鼓励社会各界通过点校、考证、深度揭示、专题开发等形式对古籍及其数字化产品进行研究利用。10.4.3 开发利用场景古籍数字化成果应在数字城市建设、文旅融合、网游(或电竞)产品、智慧图书馆和智慧博物馆等应用场景中多维植入和活化利用。参考文献iGB31219.2图书馆馆藏资源数字化加工规范第2部分;文本资源2GBT18391.3信息技术元数据注册系统(MDR)第3部分:注册系统元模型与基本属性3GBT3792信息与文献资源描述4GBT25100信息与文献都柏林核心元数据元素集5GBT3792.7古籍著录规则6WHT90汉文古籍文字认同描述规范7 WHT91汉文古籍集外字描述规范8 ISO37500外包指南(GUidanCeOnoUtSoUrCing)