电子书与数字图书馆
一位朋友发来email,询问一个多次被问及的问题。罗罗嗦嗦写了一些答复,发在这里,供大家补充并批评指正。
现在的数图建设工作主要的工作之一还是纸书的电子化,还有一二次文献的 整理、特色资源的制作,您觉得在未来的发展中,电子图书在数图系统中居于什么样的地位呢?从您的文章中可以感觉到,数图系统涉及许多新技术、手段,也诞生 了很多新的服务模式,是一个相当复杂的系统。可电子图书行业中方正APABI、超星等主要的业务仅仅是制作、销售电子版图书,当然他们的商业模式有所不 同,可他们都宣称自己的产品是数字图书馆,您觉得这种说法正确或严谨吗?您能设想一下以后这样的电子图书系统的发展吗?
回答:
数字图书馆所面临的问题的确不是数字化或电子书的管理所能完全涵盖的,但是这个问题又绝对是我们现在图书馆所面临的主要问题,所谓“复合图书馆”所要解决的最现实的问题,也是目前各家“图书馆集成管理系统”的提供商希望抢占图书馆市场所处心积虑加以营销的最大卖点。但是如果把电子书的建设和管理系统就称为数字图书馆系统,未免太狭隘了。
当然电子书的问题很重要,是图书馆或“号称”的数字图书馆需要努力解决的问题。但是仅仅解决这个(电子书管理)问题,或者仅仅“想”解决这个问题,实际上并不能解决好这个问题,或者说并不能彻底解决这个问题。主要原因在于,数字图书馆所面临的数字资源管理问题,绝大多数绝对不会以所谓“书”的形式存在,“书”是知识的一种历史存在状态,“电子书”的形式本身是一种新型知识载体对古老的、过时的载体的一种本拙的模拟。这也就是为什么我总是认为方正电子书(尤其是其版权管理模式)是一种对先进生产力的制约和“反动”的原因。生产关系必须(终将)挣脱这种形态,发挥出其应有的效能。
那么数字图书馆的基本组成结构如果不是“书”,又将是什么呢?目前数字化的“知识/信息单元”还处在变化多端的过程之中,我们将各类不同类型、粒度、格式的单元统称为“数字对象”,数字图书馆的基础理论中就确定了这种“数字对象”的基本构成和特性(包含句柄、元数据及代码或连接指引等基本内容,例如Warwick框架等)。数字图书馆构造的一个最重要的原则就是尽最大可能使计算机能够操纵数字对象,从而形成了各种微观和宏观结构。
这么一说把问题复杂化了。简而言之可以这样认为,电子书只是数字图书馆需要管理的一类资源,目前对于大多数图书馆来说可能也是一种需要管理的重要资源,必须有相应的系统(例如Apabi、超星、书生、同方、万方等都提供自己格式和PDF等“标准”格式)提供解决方案。图书馆在进行数字化的时候不应只看到书本、杂志,而应该从内容出发,不拘泥于形式,充分利用计算机技术所提供的能力,实现数字资源的管理、发布、利用。
除电子书之外,网上各类免费信息的应用(一个极端的例子就是搜索引擎)和图书馆租用、订购的各类全文、二次文献数据库的集成是数字图书馆另外两个很重要的资源来源,数字图书馆也需要对他们提供有效的集成。
数字图书馆还要解决以下问题:
- 数字对象标识符的解析、管理(目前多表现为各类链接标准);
- 元数据的标准规范体系、映射方法、著录编码等;
- 各类词表及其编码,用于规范控制;
- 分类法或知识体系(目前称为本体),应用于建立实体或属性之间的联系;
- 多煤体或复杂数字对象的管理;
- 互操作协议及实现架构;
- 可视化和人机界面;
等等。






