存档三月 18, 2007

2.0的困境与希望

现实总是不完美的,有时甚至是痛苦的。在向图书馆2.0转型的机遇面前,图书馆员、馆长以及整个图书馆行业的所有利益相关者来说都面临抉择。我们正走在一个进退两难的十字路口。

积极倡导图书馆2.0的图书馆员可能在任何地方都是少数民族,当然网上可能稍微好一些,但也不见得能好到哪儿去。面临未知的未来许多人会产生恐惧,这是正常现象,图书馆2.0不可避免地会使图书馆员承受岗位、职位、要求、流程、以及工作量方面的变化,有许多图书馆员拒绝变化,又有什么理由指责他们呢?

图书馆的馆长们能够支持这种变化吗?这种变化意味着承受不同以往的更多、更复杂的服务要求,以及更多的监督、一目了然的绩效数据和苛刻的评价方法。读者的真实体验与馆长的职业生涯会有什么样的直接联系呢?我们固然应该承认并相信大多数馆长还是有事业心、职业心和进取心的,但馆长业绩的评价机制毕竟没有与图书馆2.0所产生的效益挂钩,何况这个效益是什么还没有定论。

读者是否就真的需要图书馆2.0?前面已经说过,图书馆2.0实际上是图书馆自救的产物。网络时代是注意力稀缺的时代,有无数的图书馆的替代品可供读者选择,许多信息服务方式在过去、现在和未来,都不会是图书馆的当然业务,图书馆2.0固然能为读者带来更好的服务,但却并非是读者的必然选择。

更大的阻力并非来自变革的危机,事实情况可能正好相反,来自于当前的一派大好形势。面对我国近年来图书馆事业大发展,任何危机论者都像是在杞人忧天。某些人看起来“数字潮流,浩浩荡荡”,而更多的人则认为“世间本无事,庸人自扰之。”这是最大的忧患。

出于图书馆事业的特殊性,图书馆2.0并不具有自主改革的动力。我们的图书馆事业不是基于法律保障独立运行的社会事业,也不像企业那样具有强烈的生存意识,因此从体制上来说没有明显的升级2.0动因。图书馆事业依附于社会文化事业,要存在自然会存在下去,要消亡也有它消亡的理由。对于未知未来的挑战,只有靠不断的呼吁来警醒,而并没有理论来说服他们。

对于趋势的主动把握能够决定资源的配置和流向,影响到行业的发展方向,因此我们如果不能居安思危,就会丧失当前的大好机遇。如同美国前副总统戈尔在“难以忽视的真相(Inconvenient Truth)”中所说的,我们真正危机在于漠视环境的变化,未察觉环境变化对自己的影响将是致命的。就如同一只温水中青蛙,在温暖中会失去知觉,懵懵懂懂而变得无知无畏。不知道这些对图书馆2.0的呐喊,能够唤醒几人?

评论(3)

图书馆走向2.0

图书馆升级2.0最大的动力可能来自企业。一些图书馆集成管理系统的开发商早就嗅到了机会,开始了技术储备,希望等待业界重新洗牌的机会能够脱颖而出。但是他们往往太高估自己的技术能力,而小看图书馆的判断能力。他们习惯于沉迷于过去的技术老本,不思进取,急功近利,以新瓶装旧酒,甚至连概念都玩弄得似是而非。他们没有意识到,图书馆2.0是图书馆员主导的变革,同时是以服务为主要增值手段的变革,他们不在思维方式上来一个2.0版本升级,他们就不可能进入这个图书馆2.0这个充满机遇的蓝海。单靠出卖产品赚取超额利润的商务模式,恐怕再也难以为继了。

由于互联网技术发展到了一个转型的阶段,网络成为平台,软件就是服务,适合当前“复合型”图书馆需求的商业软件或者服务远没有定型,开源(包括开源软件和开放内容等)是图书馆2.0的一剂天然补药。然而吃这剂补药首先要有一定的身体素质——要有一定的人才储备和持续的资金投入,在管理上也会遇到一定的挑战。开源从来就不是免费的,尽管资源本身免费,但开发与服务不可能是免费的,甚至不是低成本的。开源的最大好处是,你对它具有完全的控制,你不满意的时候,可以随时更换它,而且系统能够能伴随业务的增长而成长。不像购买商业软件,一旦签订协议,你就失去了自由,连数据似乎都不是你的了。

开源运动与图书馆在很多地方是一致的,不仅因为他们都崇尚自由,重视信息的开放存取,而且目前图书馆2.0的许多需求不得不借助于开源软件。图书馆领域有一套复杂的业务规范和需求,诸如馆际互借、元数据互操作、联邦检索、资源仓储和永久保存等等,对于软件的需求十分特殊,图书馆也十分注重遵循开放标准,这并不是说商业公司就无事可做了,相反正因为此图书馆倒更需要商业公司的专业支持和长期服务。

商业公司如果把眼光放远一点,不仅开发和服务可以挣钱,免费的服务也可以通过一定的商务模式而营利。只要看一看当前的许多2.0公司就可以获得一定的启迪。ILAS正在失去广泛的用户基数,能不能转化为新的盈利模式的基础?《全国报刊索引》也死抱着传统的订购模式,能不能通过免费和更好的链接技术而赢得市场?机遇与挑战并存,这些都是值得探讨的问题

评论(1)

如果亚马逊接管图书馆……

让我们根据亚马逊的行为特征,进行一个思想实验:如果亚马逊接管图书馆行业,会建立怎样的系统?

首先亚马逊肯定不具有那么多的专业知识和对图书馆学的感情,它不会把书目系统神秘化或者神圣化,OPAC(Online Public Access Catalogue,即联机公共检索目录)系统只不过是另一个仓储管理或者物流系统而已。用户的体验和方便性才是第一位的。

其次它不可能雇佣那么多成本高昂效率低下的图书馆员进行编目工作,它会与OCLC结成战略同盟,直接以OCLC的数据为基础(OCLC不会不干的,因为这些数据是OCLC的会员图书馆上载的,对于OCLC来说是无本万利的事情)。
同时它会建立“注册用户上载数据”的2.0模式,让用户(或者外包给用户)替它做一部分数据。同时有强大的过滤功能,能够防止Spam、Hacking以及滥用。
它从不认为OCLC的数据就够用,起码它还会把封面图片、目录以及免费阅读的章节加上去,同时附有书、刊或文章的全文检索功能。
它内部已经建立了基本的主题、作者/人物、地名、时代、事件等内容的规范控制机制,但是这种机制必须不断完善,因此它不在乎所有公开的数据是不是“权威”的数据,它有一个反馈评价及纠正机制,能够基本保证对不同主体生产的数据进行评估、分级和及时纠错。

它肯定搞不定MARC,而寻求MODS或DC LIB-AP等简化的元数据。它会把所有的数据打乱,统一按照最有效率的方式操作和存储。但是在输入输出方面,它会支持各种基于XML标准的格式,从而与出版商、发行商、图书馆以及相关的上下游行业建立起紧密的合作和联系。

它会在用户输入提问词的同时,动态地显示该提问词的相关主题、分类、相关关键词、大约命中数、输入同类词的用户、有没有评论推荐、是否可定购、可预订或最 近可借的图书馆信息等等。它会非常神奇地猜测你的喜好,把你归入某些人群中。当然某些“越用越好”的个性化功能需要经过你的设定许可。

它会给最终用户开发一个“豆瓣”,鼓励他们建立社区、标签图书、评论图书、做网摘,想买想借都可随意。它可以依据用户的使用信息建立相关反馈,改进算法,充分挖掘他们的“集体智慧”,制定更好的索引排序系统,传递信息、推送广告、推销商品。

它会以开放数据和开放API的形式(就像它的A9现在做的那样),提供其最新最详尽的书目数据库,并且所有数据提供都有RSS发布。于是给图书馆开发虚拟的“集成管理系统”简直是举手之 劳,图书馆的读者同时就是它的用户,可以向图书馆提供在线的CRM客户管理系统以及虚拟参考咨询服务,使图书馆在向读者提供最优良最详尽服务的同时,又保 证了用户的良好体验,同时图书馆在某种程度上都成了它的社区服务中心和代理商。

它时刻警惕Google虎视眈眈的野心,因此它在语义信息组织和语义互操作方面不断研发,拥有大量专利……

评论(7)

让MARC安乐死

2006年11月12日,全世界最大的联合书目数据库,OCLC的WorldCat起用了9位数的记录号,意味着它的第一亿条记录的诞生[4]。这家总部 位于美国俄亥俄州的图书馆会员制机构,可以说是伴随着20世纪60年代书目数据格式MARC的诞生而诞生,随着MARC的发展而发展,目前已拥有全世界 112个国家5万7千多会员图书馆和超过十亿条的馆藏数据(Items)[5],虽然是非盈利机构,依靠向全世界的图书馆和会员图书馆提供服务,全年的营收逾2亿美元。

MARC是我们这个职业的最重要核心竞争力之一,如同OCLC一样,甚至是我们行业赖以生存的基础。全世界的书目数据基本上反映了当前人类非“实物”文化 遗产的概貌,在迄今为止所生产的所有人类知识中也占有相当比例,如果时间倒退四分之一个世纪,可以说占有绝大的比例。在目前一年的信息产量相当于过去 5000年的总和,而其中绝大多数为数字资源的情况下,这个比例正大幅减少,可能用不了多久,我们所掌控的“知识”记录,就会被复制拷贝,而使我们的 MARC变得微不足道。

MARC最大的价值在于标准化而适于机器处理,从而有利于规模化应用,并极大地提高了系统效率。以历史的眼光来看,MARC领导了图书馆行业最辉煌的时 代,至少说明我们的信息技术应用曾领先于绝大多数行业。然而也是碍于当时的技术,严格的形式化并不是为了读者而设计的,而是为了传统的业务流程(例如卡片 或印刷目录输出)而设计,甚至仅仅为了机器而设计(定长不定长的考虑),造成MARC的七宗罪:

  1. 字段众多,且重复严重。真正对读者有意义的字段(主要指与内容描述有关的字段)很少,因此真正作索引的字段也并不多。据最新的研究统计,80%的书目记录只使用了36个字段或子字段[7],国图数据的抽样中多于30个字段的记录只占0.09%[8],几乎可以忽略不计。
  2. 技术严重过时。格式设计所依赖的是以磁带为主要存储介质的技术,在目前各种集成系统的技术实现中早已采用了关系数据库技术,乃至其它更为先进的全文索引、面向对象技术甚至XML技术(在与其它数据格式进行数据交换时)等,MARC格式可以是一个动态映射的用户视图。
  3. 规范乃至著录规则很不统一,语义含糊。特别是不同国家地区和不同版本的MARC,即便不是不能互操作,也绝难互操作。从各家系统对于多MARC的支持情况就可以看出来。
  4. 字段、子字段标识和结构复杂。书目记录的描述主体、客体及关系模型不清晰,格式规定琐碎、不统一。例如新引入的数字资源链接856字段,著录方式千差万别千奇百怪,造成系统实现方式也难以统一。况且这个字段随着新的链接机制的应用普及,其本身的必要性也值得怀疑。
  5. 数据加工成本巨大,专业门槛高,难以普及。
  6. 数据生产的周期较长,时间滞后,不利于服务开展。
  7. 语义与语法及结构捆绑,适应性和灵活性差,难以适应新媒体和新技术发展的需要。具体表现在难以应用于电子资源编目,以及难以进行无损失的元数据映射。

我们最大的财富正在成为我们最大的包袱。头脑清醒的人没有认为MARC对数字资源还能继续有用,而一旦我们的书目宝库不能融入互联网庞大的信息库中,成为 前朝遗老,我们就有极大的可能被信息社会边缘化。令人振奋的是我们已经看到OCLC(当然这也是为了它自身的生存)正在引领整个行业走在一个正确的方向上,例如DC元数据的提出、FRBR化、“元数据”(XML)化等;美国国会图书馆等业界大佬,虽然步履蹒跚,也并未止步不前;许多图书馆或图书馆联盟,也在积极研究,寻求合作,采取行动。

近年来兴起的一些研究(特别是元数据研究)对书目数据的功能进行了较为全面的梳理,如果把MARC看成一种元数据的话,满足要求的MARC可以完全不必如 此,而且MARC也可以仅作为图书馆集成管理系统中的“一种”元数据而已,而且是粗粒度的、着眼于与历史数据兼容的元数据形式。新的图书馆系统即便仍然以“元数据”为核心,也应该能够灵活地支持多种元数据格式。

MARC面临改造是必然的,然而这一步究竟应该走得多大,才能保护图书馆行业半个世纪以来在MARC上的投资,才能实现平稳过渡?我们依然不清楚。目前编目界围绕RDA的争论就反映了这个问题。换句话 说,我们目前面临的问题,不是MARC该不该死,而是如何使其安乐死?

评论(8)