图书馆论坛 China 。 。。 。 : — 噩 图书馆古籍数字化资源建设研究 陆健’ 李洪波 (1.山东省图书馆 济南 2501 O0;2日照职业技术学院 山东日照 276826) 摘要:本文分析了我IllIll书馆古籍数字化工作概况及建设的意义,介绍了当前古籍数字化的方式,并提出古籍数字化前处理工作应该遵 循的重要原则。 关键词:古籍数字化 再生保护 数字化方式 中图分类号:G 2 5 0.7 文献标识码:A 文章编号:1 673—9 79 5(201 O)09(b)一02 51—01 图书馆在组织古籍数字化处理工作 时,应该进行统筹规划,努力做到“三个结 合”。一是把古籍数字化处理工作与馆藏古 更 1我国图书馆古籍数字化建设的发展 用,同时,使用它们可以更加方便、快捷,概况 据不完全统计,截止到2010年3月,我国 受客户的欢迎,使用范围将会更广,使用频 率将会更高。 的图书馆收藏约2750多万册的古籍, 其中国家图书馆、上海图书馆、北京大学图 书馆以及南京图书馆的收藏量均超过l00 万册。近年来,我国图书馆积极对如此丰富 的古籍资源进行数字化的开发,如在古籍 书目数据库以及古籍全文数据库建设等方 面均取得了丰厚成果。 1.1在古籍书目数据库方面的建设 将古籍书目进行数字化建设是我国图 书馆最初对古籍数字化建设的尝试和探 索,在我国地区这项工作起步较早,上 世纪90年代古籍书目数字化建设开始在大 陆进行。最早在古籍数据库方面建设的图 书馆是辽宁图书馆。南京图书馆先后建设 了 中国古籍总目》、《南京图书馆藏书目 录 以及《南京图书馆藏地方志目录数据 库》。从1999年开始,国家图书馆也进行了 古籍书目数据库的建设,到现在已经完成 的古籍书目数据近30余万条。 1.2在古籍全文数据库方面的建设 从20世纪9O年代中期开始,很多的出版 社、学术机构以及商业公司分别加入了古 籍资源的数字化建设工作,这使得我国古 籍数字化建设的规模快速地扩大。在国内 最早开始进行古籍全文数字化建设的图书 馆是上海图书馆。上海图书馆自1996年启 动了古籍善本全文光盘工程这个重点科研 项目,该馆同时与长江计算机集团合作,全 部将馆藏古籍善本进行数字化建设,并进 行分期上网服务,实现了古籍资源数字化, 尤其是善本古籍数字化建设逐渐朝着全文 服务方面发展,开创了制作古籍善本全文 光盘与服务客户的先河。 2进行图书馆古籍数字化建设的意义 2.1抢救了即将毁灭的图书馆古籍 采用古籍数字化建设可以对那些由于 年代久远,破损严重的古籍进行抢救,弥补 了只靠传统的修补裱糊方法的缺陷。 2.2忠实地保存了图书馆古籍原件 数字化的古籍是古籍原件的“翻版”, 完整地保存了古籍的原来面貌,古籍信息 没有丝毫的损失,既可以作为古籍原件的 替代品投入使用,同时也可以作为古籍原 件的附件进行保存。 2.3促进了图书馆古籍资源的利用 古籍的数字化建设由于保留了古籍的 原样,与古籍原件具有“异曲同工”的效果, 作为古籍原件的替代品完全可以投入使 2.4存储容量太,存放空间小 籍的基础整理、资料完善工作结合起来;二 图书馆古籍经过数字化的建设可使用多 是把古籍数字化处理工作与馆藏古籍的保 种方式进行存储,存储容量太,其存放空间却 管期限鉴定工作结合起来,以便利用技术 很小,及其便于收藏与保管。同时可从著者、 手段将古籍中真正具有永久查考价值的资 书名等多途径检索,十分方便读者查阅。 料预先列入数字化范围;三是把古籍数字 化处理工作与抢救修复破损古籍的工作结 3当前图书馆古籍文献数字化的方式 合起来。通过“三个结合”尽最大限度地实 目前,一般来说图书馆古籍文献数字 现古籍数字化处理工作的综合效益。 化的方式有以下四种。 4.2突出重点.先急后缓 3.1完全图像方式 古籍数字化工作非一日之功,由于馆 完全图像方式是一种最简单的数字化 藏古籍数量大,资金和人力相对有限,所以 方法。这种方式只需要将古籍原文扫描形 在计划安排数字化工作时必须统筹兼顾, 成图像形式,存储在各种介质上就可以,利 遵循“突出重点,先急后缓”的原则。各图书 用这种方式得到的古籍文献的数字化版本 馆应根据此原则,制定详细规整的工作计 被称之为“全图像版”。这种方式简单实用, 划表,分步骤按顺序地组织开展古籍数字 但由于资料是以图像的方式如B M P、 化工作。 JPGE、TAG、GIF等格式存储,无法对文献 4.3确保质量,追求效率 内容进行检索,不方便查询。 古籍数字化工作势在必行,但资金投 3 2目录文本 正文图像方式 入量大,技术要求高,任何图书馆和个人都 这是在“全图像版”基础上的一种改 不能随意浪费国家宝贵的资金和人力资 进,称为“标题检索版 。采用图像方式存储 源,谁也承担不了因工作质量问题带来的 的正文部分可与文本方式存储的目录建立 反工责任。因此古籍数字化的质量问题是 链接关系。读者可以依据目录进行检索和 放在首位的。信息社会的发展对古籍数字 查找,并可根据目录与正文之间的链接关 化的要求十分迫切,这与大量古籍不能及 系,检索到所查找的正文图像。这里的目录 时进行数字化处理是相矛盾的,这在客观 不但包括卷册、书名、大小标题,还包括图 上也对古籍数字化处理工作提出了更高的 名和表名等,是一种广义上的目录。 要求,必须追求高效率,在最短的时间内把 3.3全文本方式 工作完成。 “标题检索版”只能在目录中检素与查 4.4规范古籍书目数据的格式 找,不属于真正意义上的数字图书馆。而将 为满足古籍长久保管和利用的需要, 书中所有文字全部采用文本方式存储的全 古籍数字化处理工作必须坚持规范和标 文本方式可以实现覆盖全文的检索与查 准。1986年北京图书馆提出了适用于专著、 找。通过这种方式得到的古籍文献数字化 连续出版、试听、乐谱、测绘资料等的 版本我们称为“全文本版”。 cNMARc的讨论稿,l991年书目文献出版 3.4全文图文对照方式 社正式出版《中国机读目录通讯格式》,现 该方式是目前图书馆界应用较多的方 在CARC已成为国内图书馆界所认同的行 法,是以上几种方式的综合体。它不但将古 业标准。作为综合书目数据库组成成分的 籍以图像和文本方式存储,还对古籍中的 古籍书目数据库,在MARC上也应使用 每一个汉字与它在原书中的图像建立链接 CNMARC格式,以保持其一致。数据库的 关系,用户在进行全文检索的同时,又可以 每条记录必须根据《古籍著录规则》的要求 方便地查看图像资料。这种既可以通过“全 制作,对每一条数据都要采用标准化的术 文本版”进行检索、查找和阅读古籍,又可 语进行著录,以免造成不必要的浪费。 以迅速方便地翻阅到当前文字所在“全图 像版”中对应位置的古籍文献数字化版本 参考文献 我们称为“图文检索版 。 f1】王璇.我国图书馆古籍数字化探析[J】. 四川图书馆学报,2007,5. 4古籍数字化处理前应遵循的重要原 【2】曾洁莹.浅谈图书馆古籍保护工作f川. 则 科技信息,2006,3. 4.1统筹规划,“三个结合” 中国科教创新导刊 China Education Innovation Herald 25