存档论文
三月 18, 2007 @ 11:49 pm
· 归类于 2.0, 专业评论, 论文
现实总是不完美的,有时甚至是痛苦的。在向图书馆2.0转型的机遇面前,图书馆员、馆长以及整个图书馆行业的所有利益相关者来说都面临抉择。我们正走在一个进退两难的十字路口。
积极倡导图书馆2.0的图书馆员可能在任何地方都是少数民族,当然网上可能稍微好一些,但也不见得能好到哪儿去。面临未知的未来许多人会产生恐惧,这是正常现象,图书馆2.0不可避免地会使图书馆员承受岗位、职位、要求、流程、以及工作量方面的变化,有许多图书馆员拒绝变化,又有什么理由指责他们呢?
图书馆的馆长们能够支持这种变化吗?这种变化意味着承受不同以往的更多、更复杂的服务要求,以及更多的监督、一目了然的绩效数据和苛刻的评价方法。读者的真实体验与馆长的职业生涯会有什么样的直接联系呢?我们固然应该承认并相信大多数馆长还是有事业心、职业心和进取心的,但馆长业绩的评价机制毕竟没有与图书馆2.0所产生的效益挂钩,何况这个效益是什么还没有定论。
读者是否就真的需要图书馆2.0?前面已经说过,图书馆2.0实际上是图书馆自救的产物。网络时代是注意力稀缺的时代,有无数的图书馆的替代品可供读者选择,许多信息服务方式在过去、现在和未来,都不会是图书馆的当然业务,图书馆2.0固然能为读者带来更好的服务,但却并非是读者的必然选择。
更大的阻力并非来自变革的危机,事实情况可能正好相反,来自于当前的一派大好形势。面对我国近年来图书馆事业大发展,任何危机论者都像是在杞人忧天。某些人看起来“数字潮流,浩浩荡荡”,而更多的人则认为“世间本无事,庸人自扰之。”这是最大的忧患。
出于图书馆事业的特殊性,图书馆2.0并不具有自主改革的动力。我们的图书馆事业不是基于法律保障独立运行的社会事业,也不像企业那样具有强烈的生存意识,因此从体制上来说没有明显的升级2.0动因。图书馆事业依附于社会文化事业,要存在自然会存在下去,要消亡也有它消亡的理由。对于未知未来的挑战,只有靠不断的呼吁来警醒,而并没有理论来说服他们。
对于趋势的主动把握能够决定资源的配置和流向,影响到行业的发展方向,因此我们如果不能居安思危,就会丧失当前的大好机遇。如同美国前副总统戈尔在“难以忽视的真相(Inconvenient Truth)”中所说的,我们真正危机在于漠视环境的变化,未察觉环境变化对自己的影响将是致命的。就如同一只温水中青蛙,在温暖中会失去知觉,懵懵懂懂而变得无知无畏。不知道这些对图书馆2.0的呐喊,能够唤醒几人?
固定链接
三月 18, 2007 @ 11:47 pm
· 归类于 2.0, 专业评论, 论文
图书馆升级2.0最大的动力可能来自企业。一些图书馆集成管理系统的开发商早就嗅到了机会,开始了技术储备,希望等待业界重新洗牌的机会能够脱颖而出。但是他们往往太高估自己的技术能力,而小看图书馆的判断能力。他们习惯于沉迷于过去的技术老本,不思进取,急功近利,以新瓶装旧酒,甚至连概念都玩弄得似是而非。他们没有意识到,图书馆2.0是图书馆员主导的变革,同时是以服务为主要增值手段的变革,他们不在思维方式上来一个2.0版本升级,他们就不可能进入这个图书馆2.0这个充满机遇的蓝海。单靠出卖产品赚取超额利润的商务模式,恐怕再也难以为继了。
由于互联网技术发展到了一个转型的阶段,网络成为平台,软件就是服务,适合当前“复合型”图书馆需求的商业软件或者服务远没有定型,开源(包括开源软件和开放内容等)是图书馆2.0的一剂天然补药。然而吃这剂补药首先要有一定的身体素质——要有一定的人才储备和持续的资金投入,在管理上也会遇到一定的挑战。开源从来就不是免费的,尽管资源本身免费,但开发与服务不可能是免费的,甚至不是低成本的。开源的最大好处是,你对它具有完全的控制,你不满意的时候,可以随时更换它,而且系统能够能伴随业务的增长而成长。不像购买商业软件,一旦签订协议,你就失去了自由,连数据似乎都不是你的了。
开源运动与图书馆在很多地方是一致的,不仅因为他们都崇尚自由,重视信息的开放存取,而且目前图书馆2.0的许多需求不得不借助于开源软件。图书馆领域有一套复杂的业务规范和需求,诸如馆际互借、元数据互操作、联邦检索、资源仓储和永久保存等等,对于软件的需求十分特殊,图书馆也十分注重遵循开放标准,这并不是说商业公司就无事可做了,相反正因为此图书馆倒更需要商业公司的专业支持和长期服务。
商业公司如果把眼光放远一点,不仅开发和服务可以挣钱,免费的服务也可以通过一定的商务模式而营利。只要看一看当前的许多2.0公司就可以获得一定的启迪。ILAS正在失去广泛的用户基数,能不能转化为新的盈利模式的基础?《全国报刊索引》也死抱着传统的订购模式,能不能通过免费和更好的链接技术而赢得市场?机遇与挑战并存,这些都是值得探讨的问题
固定链接
三月 18, 2007 @ 6:50 pm
· 归类于 2.0, 专业评论, 论文
让我们根据亚马逊的行为特征,进行一个思想实验:如果亚马逊接管图书馆行业,会建立怎样的系统?
首先亚马逊肯定不具有那么多的专业知识和对图书馆学的感情,它不会把书目系统神秘化或者神圣化,OPAC(Online Public Access Catalogue,即联机公共检索目录)系统只不过是另一个仓储管理或者物流系统而已。用户的体验和方便性才是第一位的。
其次它不可能雇佣那么多成本高昂效率低下的图书馆员进行编目工作,它会与OCLC结成战略同盟,直接以OCLC的数据为基础(OCLC不会不干的,因为这些数据是OCLC的会员图书馆上载的,对于OCLC来说是无本万利的事情)。
同时它会建立“注册用户上载数据”的2.0模式,让用户(或者外包给用户)替它做一部分数据。同时有强大的过滤功能,能够防止Spam、Hacking以及滥用。
它从不认为OCLC的数据就够用,起码它还会把封面图片、目录以及免费阅读的章节加上去,同时附有书、刊或文章的全文检索功能。
它内部已经建立了基本的主题、作者/人物、地名、时代、事件等内容的规范控制机制,但是这种机制必须不断完善,因此它不在乎所有公开的数据是不是“权威”的数据,它有一个反馈评价及纠正机制,能够基本保证对不同主体生产的数据进行评估、分级和及时纠错。
它肯定搞不定MARC,而寻求MODS或DC LIB-AP等简化的元数据。它会把所有的数据打乱,统一按照最有效率的方式操作和存储。但是在输入输出方面,它会支持各种基于XML标准的格式,从而与出版商、发行商、图书馆以及相关的上下游行业建立起紧密的合作和联系。
它会在用户输入提问词的同时,动态地显示该提问词的相关主题、分类、相关关键词、大约命中数、输入同类词的用户、有没有评论推荐、是否可定购、可预订或最 近可借的图书馆信息等等。它会非常神奇地猜测你的喜好,把你归入某些人群中。当然某些“越用越好”的个性化功能需要经过你的设定许可。
它会给最终用户开发一个“豆瓣”,鼓励他们建立社区、标签图书、评论图书、做网摘,想买想借都可随意。它可以依据用户的使用信息建立相关反馈,改进算法,充分挖掘他们的“集体智慧”,制定更好的索引排序系统,传递信息、推送广告、推销商品。
它会以开放数据和开放API的形式(就像它的A9现在做的那样),提供其最新最详尽的书目数据库,并且所有数据提供都有RSS发布。于是给图书馆开发虚拟的“集成管理系统”简直是举手之 劳,图书馆的读者同时就是它的用户,可以向图书馆提供在线的CRM客户管理系统以及虚拟参考咨询服务,使图书馆在向读者提供最优良最详尽服务的同时,又保 证了用户的良好体验,同时图书馆在某种程度上都成了它的社区服务中心和代理商。
它时刻警惕Google虎视眈眈的野心,因此它在语义信息组织和语义互操作方面不断研发,拥有大量专利……
固定链接
三月 18, 2007 @ 1:45 pm
· 归类于 2.0, 专业评论, 论文
2006年11月12日,全世界最大的联合书目数据库,OCLC的WorldCat起用了9位数的记录号,意味着它的第一亿条记录的诞生[4]。这家总部 位于美国俄亥俄州的图书馆会员制机构,可以说是伴随着20世纪60年代书目数据格式MARC的诞生而诞生,随着MARC的发展而发展,目前已拥有全世界 112个国家5万7千多会员图书馆和超过十亿条的馆藏数据(Items)[5],虽然是非盈利机构,依靠向全世界的图书馆和会员图书馆提供服务,全年的营收逾2亿美元。
MARC是我们这个职业的最重要核心竞争力之一,如同OCLC一样,甚至是我们行业赖以生存的基础。全世界的书目数据基本上反映了当前人类非“实物”文化 遗产的概貌,在迄今为止所生产的所有人类知识中也占有相当比例,如果时间倒退四分之一个世纪,可以说占有绝大的比例。在目前一年的信息产量相当于过去 5000年的总和,而其中绝大多数为数字资源的情况下,这个比例正大幅减少,可能用不了多久,我们所掌控的“知识”记录,就会被复制拷贝,而使我们的 MARC变得微不足道。
MARC最大的价值在于标准化而适于机器处理,从而有利于规模化应用,并极大地提高了系统效率。以历史的眼光来看,MARC领导了图书馆行业最辉煌的时 代,至少说明我们的信息技术应用曾领先于绝大多数行业。然而也是碍于当时的技术,严格的形式化并不是为了读者而设计的,而是为了传统的业务流程(例如卡片 或印刷目录输出)而设计,甚至仅仅为了机器而设计(定长不定长的考虑),造成MARC的七宗罪:
- 字段众多,且重复严重。真正对读者有意义的字段(主要指与内容描述有关的字段)很少,因此真正作索引的字段也并不多。据最新的研究统计,80%的书目记录只使用了36个字段或子字段[7],国图数据的抽样中多于30个字段的记录只占0.09%[8],几乎可以忽略不计。
- 技术严重过时。格式设计所依赖的是以磁带为主要存储介质的技术,在目前各种集成系统的技术实现中早已采用了关系数据库技术,乃至其它更为先进的全文索引、面向对象技术甚至XML技术(在与其它数据格式进行数据交换时)等,MARC格式可以是一个动态映射的用户视图。
- 规范乃至著录规则很不统一,语义含糊。特别是不同国家地区和不同版本的MARC,即便不是不能互操作,也绝难互操作。从各家系统对于多MARC的支持情况就可以看出来。
- 字段、子字段标识和结构复杂。书目记录的描述主体、客体及关系模型不清晰,格式规定琐碎、不统一。例如新引入的数字资源链接856字段,著录方式千差万别千奇百怪,造成系统实现方式也难以统一。况且这个字段随着新的链接机制的应用普及,其本身的必要性也值得怀疑。
- 数据加工成本巨大,专业门槛高,难以普及。
- 数据生产的周期较长,时间滞后,不利于服务开展。
- 语义与语法及结构捆绑,适应性和灵活性差,难以适应新媒体和新技术发展的需要。具体表现在难以应用于电子资源编目,以及难以进行无损失的元数据映射。
我们最大的财富正在成为我们最大的包袱。头脑清醒的人没有认为MARC对数字资源还能继续有用,而一旦我们的书目宝库不能融入互联网庞大的信息库中,成为 前朝遗老,我们就有极大的可能被信息社会边缘化。令人振奋的是我们已经看到OCLC(当然这也是为了它自身的生存)正在引领整个行业走在一个正确的方向上,例如DC元数据的提出、FRBR化、“元数据”(XML)化等;美国国会图书馆等业界大佬,虽然步履蹒跚,也并未止步不前;许多图书馆或图书馆联盟,也在积极研究,寻求合作,采取行动。
近年来兴起的一些研究(特别是元数据研究)对书目数据的功能进行了较为全面的梳理,如果把MARC看成一种元数据的话,满足要求的MARC可以完全不必如 此,而且MARC也可以仅作为图书馆集成管理系统中的“一种”元数据而已,而且是粗粒度的、着眼于与历史数据兼容的元数据形式。新的图书馆系统即便仍然以“元数据”为核心,也应该能够灵活地支持多种元数据格式。
MARC面临改造是必然的,然而这一步究竟应该走得多大,才能保护图书馆行业半个世纪以来在MARC上的投资,才能实现平稳过渡?我们依然不清楚。目前编目界围绕RDA的争论就反映了这个问题。换句话 说,我们目前面临的问题,不是MARC该不该死,而是如何使其安乐死?
固定链接
三月 17, 2007 @ 5:05 pm
· 归类于 2.0, 专业评论, 论文
建设图书馆2.0要从集成管理系统做起,可能会出乎许多人的预料,一般都是从Web2.0的技术应用做起。例如许多图书馆建立的面向员工甚至读者的博客, 设立了Wiki,提供了新闻RSS甚至新书预告或专题订阅的RSS等,更深入一些,有的图书馆还能够通过向读者提供一些工具,让读者用户在浏览资源的时候 能够方便地链接到图书馆的数据库进行查询。他们的理念是:2.0是以用户为主导,变革应该首先产生于用户界面,产生于图书馆的服务与用户的需求产生碰撞的 临界点。
这些2.0的服务都是必要的、很好的,图书馆在对员工进行2.0培训之后,每个部门都可以发起或参与一定的“2.0改造”项目,由技术部门协助实施,作为走向图书馆2.0的起点。
然而图书馆2.0的意义远不限于此。Web2.0看起来都是小插件小工具,花拳绣腿人人可为,但静水深流,它起因于互联网技术的长期积累,反映了从 理念到 结构的深刻变化。各类互联网应用的2.0化,实际上都可归结为其业务模式的重组和新标准规范的建立,从而引发整个行业的重新融合以及升级改造。图书馆应用 系统的大规模技术升级,大约10年左右来一次。七十年代的主机终端形式,八十年代的客户机服务器形式,九十年代的浏览器服务器 形式,许多大型图书馆的系统更换或者升级,即便不是有意的,也在无意中暗合这个时间表。目前风起云涌的Web2.0,又一次给图书馆技术的改朝换代带来了 契机。
Web2.0以互联网作为平台,将数据变成“Intel Inside” (以数据为核心),采用参与式架构设计,达到用户驱动的社会分享和集体智慧的收集,通过开放标准的建立和应用全面支持内容与服务的融合,轻量级的面向服务 的技术能够使服务和应用无所不在(如同时支持各类移动和手持设备),并且支持在用户体验中不断改进完善(永久的Beta版)。把这些特征汇集起来,绝不是 仅仅重新设计用户界面这么简单,也不是依靠单一方面的技术革新所能够达到,所需要的“技术”,甚至超出了技术本身,而包含艺术、文化、认知、媒体、传播以 及社会心理等内容。
图书馆要实践Web2.0,在目前可以预见的技术条件下,图书馆集成管理系统必须脱胎换骨。尽管我们还不能全面确知图书馆2.0需求是什么样的, 但我们可以从两方面着手变革:数据方面和系统平台架构方面。数据方面首先需要摆脱MARC的束缚,融合数字资源管理的各类元数据标准,构建新型的 OPAC2.0和ERM(数字资源管理)系统;在系统平台架构方面支持像构建2.O应用一样构建图书馆服务:仓储的标准化流程和管理、数据的多面展示、应 用的松散集成、社区的自我组织,做到像亚马逊那样管理图书馆。当然,“数字图书馆”的许多目标不是一套集成管理系统能够包含的,例如理想的联邦检索需要依 靠整个互联网实现一定的数字对象调度和永久维护机制,更好和更大范围的“知识”组织也有赖于语义技术的应用突破和大面积实施。在设计2.0版的图书馆集成 管理系统时应该考虑到数字图书馆的远景和需求,我们最终的目标是:把Google的种种功能集成进来,让Google为图书馆打工!
固定链接
三月 15, 2007 @ 6:54 pm
· 归类于 2.0, 专业评论, 论文
Lorcan曾对“图书馆集成管理系统(Integrated Library System)”进行过两种解读:集成图书馆的管理系统或图书馆的集成管理系统(as a system for the integrated library, or as an integrated system for the library)。传统图书馆形成的采编分典流期刊目录等固定的业务模式,在一定程度上是对于图书馆传统业务的标准化,软件系统的采用固化了这套流程,尽 管从来没有100%满足图书馆员的需要(没有一套系统不被图书馆员骂的),称之为“集成系统”并不为过。
然 而一旦把数字资源集成进来,纳入到管理流程之中,图书馆的处理对象就越来越多地“侵入”到传统上的“情报工作”领地:文摘、索引乃至全文,而且要“可存 取”与“可获得”并重,图书馆于是都变成了“复合”型图书馆,其原有的业务系统再称为“集成管理系统”显然已经名不副实了。
新加坡图书馆局在《2000年的图书馆》中提到未来图书馆七个方面的“范式演变”[1],意味着传统图书馆业务模式和管理系统需要进行全面变革。这七个方面是:
- 从图书的保管者到服务本位的信息提供者;
- 从单一媒体到多媒体;
- 从本馆收藏到无边界图书馆;
- 从我们到图书馆去到图书馆来到我们中间;
- 从按时提供(in good time)到及时提供(just in time);
- 从馆内处理(in sourcing)到外包处理(out sourcing);
- 从区域服务(local reach)到国际服务(globe reach)
在 这种“范式演变”中图书馆集成管理系统依靠修修补补或增添模块显然是不行的了。我曾经以为数字图书馆系统可以完全独立于传统图书馆系统之外,经过“门户整 合”而形成复合型图书馆的管理系统;我也曾设想数字图书馆解决方案以传统图书馆系统为核心,在外面或者上面添加应用层、互操作层或者抽象的整合管理层,作 为新一代数字图书馆的解决方案。Web2.0的突如其来让我感到必须打乱现有的业务模式,完全彻底地进行“再造工程”(re-engineering), 因为现在的“信息环境”已经完全不同,人们获取数据、传播信息、接受知识的方式进入了一个没有门槛、随处可得和自由互动的时代,任何行业的应用软件都在为 这种新的环境进行基本架构方面的改造。
应该说我们仍处在一种大变革的过程当中,图书馆2.0是我们走向数字图书馆的一环,上述这些转变究 竟将如何影响我们的业务系统,我们最终能达到怎样的目标,都还是个未知数。我们现在能做的,就是不断地审视我们的新需求,以及现有的技术如何来具体满足这 些需求,进而重新定义“图书馆集成管理系统”。
[1]见吴建中《战略思考——图书馆发展十大热门话题》
固定链接
三月 14, 2007 @ 5:14 pm
· 归类于 2.0, 专业评论, 论文
变革的时代也是动荡的时代,当业界对于该做什么莫衷一是的时候,一方面是最具有创新性和机遇的时期,另一方面也是怀疑与困惑最多、最迷茫的时期。如果不加以及时梳理、引导、总结,人们的热情和新鲜感很快就会被无休止的争论和不成熟的创新所消磨。
自上世纪九十年代开始,图书馆界的先知先觉们就已经开始寻找通向未来的钥匙,这就是数字图书馆。如果说数字图书馆还算是有识之士主动的、自发的、理性的对 于图书馆的改朝换代的话,图书馆2.0是这个进程中的一种催化剂,完全来自外界,却来势异常凶猛,引发为图书馆员自草根而精英的一种自救。OCLC的《环境扫描 》以及《图书馆的社会感知 》(中文节译 )等报告可以看成是这种自我危机意识的觉醒,而后来轰轰烈烈的图书馆2.0运动就是成批的图书馆员自觉的行动了。
全球范围内各种类型的图书馆用户呈总体减少的趋势,这已经是铁的事实。国家图书馆发布的数据 也已证明了这一点,上海图书馆也在经历这样的变化。这种变化实际上已经引发了关于传统图书馆价值的重新思考,作为一项在理念上颇为崇高的社会事业,算一算 人均拥有成本和有效使用成本,实在是一个非常昂贵的事业,世界上可能只有我们还在经历传统图书馆的大规模超常规发展阶段,数字图书馆作为互联网时代图书馆职能 的延伸和替代,即便不能说在经济上有显著的优势,在方便性、效率和效益等方面,其好处和竞争力也是不言而喻的。
然而数字图书馆建设至今,碍于版权、技术和运营模式三大障碍,内容贫乏、机制落后、使用不便,还不足以把日益流失读者拉回到图书馆。近年来一直低调躬身实践的张晓林教授早已提出了“让图 书馆无所不在”的2.0思想,大音希声,大象无形,数字图书馆不必处处彰显,通过“e划通”、“导航条”之类的工具,让信息去找用户,让图书馆的服务融入到读者用户的信息 过程中去,就是最大的成功。
因此图书馆2.0是图书馆的一次全面彻底的为了用户而改变自己的运动。图书馆2.0没有别的目的,只为了把读者用户重新拉回到图书馆来,重塑图书馆对于读者用户的“感知”,不管这个“图书馆”是有形的还是无形的。
固定链接
三月 14, 2007 @ 12:31 am
· 归类于 2.0, 专业评论, 论文
“不论你们喜不喜欢,这个世界已经变了。……你们不能再仅仅依靠对原先软件的修修补补糊弄我们,你们必须有一套严肃认真的、从头开发的策略,发挥你们的想象力和创造力。否则你们将难以生存。”美国图书馆杂志(Library Journal)专栏作家、美国图书馆界的名嘴”Roy Tennant在“致图书馆软件开发商的公开信”中这样告诫那些长期自诩为图书馆伙伴的商人们。
公平地说,这不是他们的错。软件公司都是靠错误的修正、局部的更新、模块的堆砌、功能的积累、代码的重用过日子,许多情况下,都是“用户”叫他们那样做的。他们一直认为,只有这样,才能在一个十分狭窄的专业化区隔市场中,以最小的代价,取得最大的利润。
现在时代不同了。图书馆自身正在面临革命。在一个什么都冠以2.0的时代,2.0已经成了一个符号,一个象征。尽管谁也说不清它的确切含义,但是它就是“革命”的代名词。你如果不思进取,你只有死路一条。
2.0的到来,图书馆首先感到似乎自己被读者抛弃了。图书馆员特别是图书馆员中的奇客(Geek)们愤青辈出:他们看什么都不满意。图书馆不再是信息的集散地,互联网上几乎什么都有;OPAC不再是查询信息的入口,Google 以搜罗普天下所有有用信息为己任;古罗马澡堂是人们的聚会场所,时光流逝到21世纪,图书馆正在竭力成为市民的公共空间;不仅要做“公共空间”,还要进入 专属于你的“我的空间(MySpace)”,并在你的“第二人生(Second Life)”里占据一席之地……
“天谴”到来之前真的有预兆,ILS Vendor的日子首先开始不好过了。Sirsi与Dynix刚刚抱团取暖(看来也并不暖和,刚刚得到消息:SirsiDynix已经放弃Horizon8.0的完整版,转而开发“激动人心”的以Sirsi的Unicorn为基础的Rome/罗马,Dynix的用户,哭吧!),Exlibris的新东家赶快把Endeavor揽入怀中,连OCLC也忙不迭与RLG合并。这些看似个体行为,背后却有着深刻原因。
OCLC首席思想家Lorcan Dempsey在他的一些相关帖子中进行了深刻的分析。大致而言,图书馆在数字时代的业务模式(Business Model)虽然还没有定论,但千真万确,已截然不同于传统图书馆了。当图书馆员失去知识伊甸园看门人的角色的同时,图书馆就不再是从前那个天堂。一方面,传统的图书馆集成管理系统满足不了数字资源管理与服务的丰富多彩普遍全面的业务需求,另一方面,图书馆特有的专业化需求正在为更多的新型技术所替代, 特别是大量的开源技术和2.0技术,这个市场已不足以养活那么多的专业公司。
“你有压力,我有压力!”巴士阿叔也替图书馆与图书馆软件供应商们喊出了的共同心声。2.0时代的到来反映了人们信息获取和传输方式的彻底改变,连图书馆自身已经朝不保夕,寄生图书馆的软件商们更是面临灭顶之灾。这不是“相煎何太急”的问题,而是“一荣俱荣,一损俱损”的问题。如果软件商们不看到这一点,在图书馆被千禧一代抛弃的同时,那些“图书馆集成管理系统”的软件开发商们只能在记载图书馆发展历史的文献中找到他们的位置。
固定链接
二月 10, 2007 @ 10:43 am
· 归类于 论文
按:最近三篇关于“数字图书馆评估指标体系研究”的博文,是为参与王世伟教授主持国家项目所作论文的一部分,作为“印前论文”贴在这里,希望得到大家的批评指正。
数图评估指标体系大纲(一、二级)
|
类别
|
标识
|
指标
|
说明
|
级别
|
取值
|
备注
|
| 数字资源测度 |
R01 |
二次文献数据库数量 |
所有二次文献或书目数据库 |
1 |
记录数 |
不包括数字期刊全文数据库 |
| R011 |
自建二次文献数据库数量 |
自建的书目、索引、文摘数据库 |
2 |
记录数 |
| R012 |
二次文献数据库保有量 |
本地保存的二次文献数据库资源数量 |
2 |
记录数 |
不包括某些年限内可获取的、停止订购之后不再能够存取的数据 |
| R02* |
全文数据库数量 |
|
1 |
篇数/字节 |
包括数字期刊全文、电子书、网上免费资源等 |
| R021 |
自建全文数据库数量 |
自行数字化的数据量 |
2 |
篇数/字节 |
| R022 |
全文数据库保有量 |
馆藏数字资源总量(不论何种渠道获得) |
2 |
篇数/字节 |
不包括某些年限内可获取的、停止订购之后不再能够存取的数据 |
| R03 |
多媒体数据库数量 |
|
1 |
字节 |
|
| R031 |
自建多媒体数字资源数量 |
自行数字化多媒体资源的数量 |
2 |
字节 |
|
| R04 |
自建数字资源总量 |
基本上是R011、R021和R031之和 |
1 |
条数/字节 |
可替代R011/ R021/R031 |
| 服务测度 |
S01 |
供读者使用的计算机数量 |
|
1 |
座位数 |
不包括OPAC检索用机 |
| S011 |
供读者使用的上网计算机数量 |
能够上网的计算机总数或座位数 |
2 |
座位数 |
|
| S012 |
无线上网服务 |
提供读者自带电脑上网的座位数或带宽 |
2 |
座位数/AP数*带宽 |
取值可具体规定 |
| S02 |
网上参考工作提问数量 |
|
1 |
年总数/日均数 |
取值可具体规定 |
| S021 |
网上参考工作回答满意度 |
|
2 |
满意所占百分比 |
实施指南中说明具体如何取值 |
| S03* |
网页/资源访问数 |
指资源网页点击率 |
1 |
年总数/日均数 |
|
| S031 |
网页/资源访问用户数 |
指独立IP访问数 |
2 |
年总数/日均数 |
|
| S032 |
资源查询数量 |
查询提问式的绝对次数 |
2 |
次数 |
|
| S04* |
注册用户数 |
具有网络访问权限的注册用户 |
1 |
人数 |
|
| S041 |
注册用户占目标用户比例 |
|
2 |
百分比 |
目标用户取值需要定义 |
| S042 |
注册用户使用率 |
人均单位时间登录次数 |
2 |
次数 |
需定义单位时间 |
| S05* |
资源下载数 |
|
1 |
篇数/字节 |
|
| S051 |
人均资源下载数 |
可按注册用户计 |
2 |
篇数/字节 |
需定义单位时间 |
| 管理测度 |
M01 |
电子资源总支出 |
年度数字载体资源定购的总金额 |
1 |
货币单位 |
|
| M01a |
电子资源支出占总资源支出的比例 |
|
1 |
百分比 |
|
| M021 |
资源使用单位成本 |
每人每次使用某项资源的平均成本 |
2 |
货币单位 |
以订购资源的直接成本计,不算管理、设备成本 |
| M022 |
资源使用单位时间 |
每人每次使用某项资源的平均时间 |
2 |
时间 |
|
| M023 |
电脑使用率 |
每台电脑每天平均使用时间 |
2 |
时间 |
|
| M03 |
资源使用的用户培训数量 |
对用户进行培训的时间或次数 |
1 |
时间/次数 |
|
| M031 |
受训人数的比例 |
评估期限内受训人数占目标用户数之比 |
2 |
百分比 |
目标用户可以使注册用户,也可以是用户总数 |
| M04 |
工作人员培训情况 |
工作人员受培训的人均次数或时间 |
2 |
次数或时间 |
需要在实施评估时具体规定 |
| 用户感知 |
P01 |
满意度 |
满意度问卷调查取得的数据 |
1 |
人数比例 |
|
上表按照数字资源、服务、管理和用户感知四方面的测度,给出了一、二两极指标的简单说明,其中一级指标13个,二级指标18个一共31个。按类别分数字资源测度指标9个,服务测度指标13个,管理测度指标8个,用户感知指标1个。表中带星号*的系列指标(R02/S03/S04/S05/M02/P01)在具体应用时可重复,分别应用于各个不同的电子资源或服务项目(如果能够区分的话),作为不同电子资源使用情况或服务项目的测度,也可定义为所有数字资源的指标。分别测度时可以为具体的数字资源或应用系统的使用情况提供客观的跟踪报告,以便下一年度根据利用情况进行考评、取舍。表中部分指标带有标识符a,意为可以替换不带标识符的相应指标,即两个指标可以二选一,当然也可以都采用。
具体应用中可以只用一级指标、只用二级指标,或者一、二级指标都用。在都用的情况下某些一级指标可以省略(因多个二级指标可以构成一级指标),或者将二级指标的归属关系进行调整。有时在进行传统图书馆评估时如果已经考虑了部分指标的测度,可以直接以某些一类指标作为类别测度的代表指标,以简化数字资源与服务的测度。例如可以选取全文数据库总量作为数字资源测度,也可以由一级指标相加作为数字资源测度。这些规定都可以在具体评估的“实施指南”中具体规定,然后在开发相应的评估系统自动实现校验和设置。
指标测度完成后可以将评估中所取得的绝对数值转化成相对值或者分值,以便进行比较。各指标的加权方案可以由不同的评估主体在实施评估前采用专家调查法等一定的方法进行确定。这些工作应该在评价模型中建立。
附表:本文参考的主要评估标准和项目
|
标准/项目名称
|
主要内容
|
指标数
|
特点
|
|
ISO2789:2002《信息与文献国际图书馆统计指标》附录A
|
图书馆电子服务使用评价,包含4个核心指标(任务数、下载数、访问数等)和4个可选指标(检索次数、拒绝次数等)
|
8个
|
客观静态指标为主,缺乏投入、人员、效果方面的评估,从设立的角度看也略显过时。
|
|
NISO Z39.7-200X《信息服务和利用:图书馆计量》
|
这是一套完整的图书馆业务统计测度标准,其中部分指标涉及图书馆的数字资源和服务。
|
23个
|
罗列了图书馆常见的数字资源类型、访问统计、相关服务、培训等内容,难以与时俱进。
|
|
美国研究图书馆学会(ARL)“电子图书馆评价项目”(E-Metric)
|
“数字资源使用评价指标体系”,重点在获得统计数据。
|
20个
|
功能上较为完整。范围测试主要考虑了以下四个方面的内容:①统计数据的可获取性;②建议方法的有效性;③收集指定数据的可能性④收集特定数据的可行性。
|
|
ISO11620 (1992/1998) 《图书馆绩效指标标准》
|
传统图书馆评估的标准,涉及图书馆服务满意度、读者服务、技术服务、人力资源等。
|
5大类29项指标
|
基本不涉及数字图书馆相关内容,如信息服务、数字资源及提供等。
|
|
欧洲图书馆绩效评价和质量管理系统项目(EQUINOX)(1998)
|
“图书馆数字资源服务绩效评价指标体系”大致分为5类14个指标:数字馆藏使用类、服务成本类、基础设施类、人力资源培训类和用户满意度类。
|
14个
|
可以看成是对ISO11620的补充。目标较为综合,包含了资源、服务(满意度)和投入的评估。一些指标的获得性较差,比较繁琐。
|
|
ARL在线网络电子资源使用统计(COUNTER:Counting Online Usage of NeTworked Electronic Resources)
|
对于数字资源的联机使用进行了规范。
|
定义了55个相关词汇,规范了8种报告格式并规定了报告级别。
|
制定者希望建立一套独立的、能被国际上广泛接受的网络数据库使用统计“实施规范”,然而技术变化太快,原有的电子资源应用模式已经发生了很大变化。
|
|
SERVQUAL /LibQUAL+/DigiQUAL
|
SERVQUAL是一套应用于各类服务性机构的用户满意度测评体系,包括指标和方法,LibQUAL+是ARL应用SERVQUAL进行传统图书馆内容和服务的评估的一套改进,DigiQUAL是ARL为评估美国NSDL(国家科学数字图书馆)成果而研发的评估体系。
|
LibQUAL+
22个问题 |
以大规模用户调查为依据,把图书馆服务质量分为五个方面:服务效率、可靠性、整体环境、馆藏提供和获取信息的途径。目前主要分为服务效果、资源控制和图书馆环境三大类。
|
|
文化部《省级图书馆评估指标细则与标准》
|
给相应指标设定分值,一定范围内专家主观估值,指标分类分级,第一级:六大部分,第二级:28个项目,第三级:67个子项,第四级:11个要素。总分1000分。
|
约4-5处
|
无专门的数字图书馆评价指标,相关指标有:电子文献年入藏数量、机读数据、数据库数量、计算机数量、网络情况、网站情况等。
|
固定链接
二月 8, 2007 @ 11:05 pm
· 归类于 论文
希望依据该模型而提出的数字图书馆评估指标体系,促成世界级城市图书馆能够达成以下八个目标:
目标一:为读者提供足够的数字资源内容。“足够”意味着对符合范围的服务对象具有相当的资源保障率。当然可以从资源的收藏和可获得性两个角度得到数字资源的保障率。
目标二:数字图书馆应该确保读者能方便地使用相关系统和设施,并提供无障碍的访问。
目标三:数字图书馆应该确保提供满意的图书借阅与后续服务的辅助,包括远程的利用网络的服务。
目标四:数字图书馆应该确保数字与非数字资料的永久保存。“永久保存”对于数字资源具有特定的含义,通常是指数字资源内容和载体的生命周期管理。图书馆对于自身数字化的资源、订购的资源和网络上相关的免费资源都应该制定相应的保存政策,并建立一定的管理机制进行永久保存。
目标五:数字图书馆应该鼓励人们充分利用数字资源服务,进行相应的宣传培训工作。
目标六:数字图书馆应该确保读者对图书馆服务的满意度。
目标七:数字图书馆应该为读者提供多样性的图书资料。包括语种、载体、使用方式等各方面。
目标八:数字图书馆应该提供高水平的员工服务,对员工提供多种人力资源培训。
固定链接
二月 6, 2007 @ 4:53 pm
· 归类于 论文
数字图书馆评估由于“数字图书馆”这个概念的复杂性而变得复杂,难有统一的认识。本文所探讨的“数字图书馆”可以定义为“文献信息机构等社会实体所进行的整体或局部的数字资源服务系统”,属于对“复合型图书馆”中数字资源服务体系的评估,其中借鉴或考虑了其它两类评估(项目评估和技术评估)中比较重要的相关指标,特别是对于数字资源的评估,但着眼于机构实体服务绩效的整体评估。
任何评估都是由评估主体根据评估模型对评估客体进行测度与衡量的过程,评估主体、评估客体和评估模型构成了评估的一种三角关系。
评估主体是基于一定目的主动实施评估行为的实体,根据评估主体来自于行业或上级主管部门、中介机构或用户以及自身,可以分为管理评估、用户评估、自我评估三类,当然有时评估主体是一个以一方为主包含各方的综合体。
评估客体就是实施评估(被评估)的对象。评估“复合型图书馆”的数字资源建设与服务,与系统软件和技术的评估以及数字图书馆项目的评估,具有截然不同的评估目的,可以认为评估的是不同的对象。对同一类评估客体也可以根据不同的评估目的,从不同的角度,针对不同的侧重点,建立不同的评估模型进行评估。因而从评估客体的角度又可以将评估分为综合评估、单项评估,宏观评估、微观评估和输入评估、输出评估等几类。
评估客体是一个客观的实体,但是既然是评估就必然包含了评估主体的价值判断,评估的价值就在于测度客体之于主体的满足程度,这个满足程度是以主体对于客体的属性和功能的认识为前提的,这种认识就构成了评估模型。因而客体是客观的,而模型是主观的。同一个客体可以有多种模型来表达,来满足不同的评估需求。因而评估模型又是评估客体的一种价值承载体和虚拟表达。这里需注意,评估模型包含评估指标及其测度、指标之间的关系以及评价模型(评价标准),评价可以有具体的环境和语境。其中评估指标的测度(measurement)与评价模型(evaluation)是分开的,测度并不一定是评价,同样的值在不同的条件和语境(评价模型)中含义可能完全不同,这取决于评价主体的目的和要求。
因此评估模型的建立实际上是基于对评估客体的认识,附加一套测度方法和价值判断体系。图一中对“评估客体”的描述就采用了一种综合的观点,认为数字图书馆的评估是针对“数字资源”、“服务”、“技术”、“管理”和“用户认知”五个方面,应用所建立起的相应指标体系和评价模型而进行的测度过程。评估过程的关键是建立评估模型,好的评估模型能够应用科学方法,体现出评估活动的最终目的。
一个好的数字图书馆的评估模型应该具有以下特点:
1. 完整性:全面反映评估主体对于客体的认识,能够实现直接或间接的评估目的;
2. 可操作性:包括数据的可获得性,评价的直观性等;
3. 灵活性:指标体系可分可合,根据不同的评估任务或目标可拆可并;评估方法也可选(例如用于比较的指标用到几级粒度,值是绝对值还是相对值,值的单位选取等);
4. 可扩展性:评估主体可以根据具体情况对指标体系进行进一步的限定、修饰或扩展,而能够“向上兼容”,不至于影响整个体系的完整性;
5. 规范性:作为评估依据的文本,应该在命名、定义、格式、数据获得、采样及测度、统计实施等方面都制定一定的规范,如果有可能,建立相应的软件系统对所有的指标进行注册登记管理,通过软件系统能够实现一定的自动数据获取、查验、跟踪、研判、积累等,进一步还能够提供数据挖掘。

固定链接
十一月 4, 2006 @ 11:32 pm
· 归类于 论文
说明:本文的主要内容作为论文的一部分投稿给《数字图书馆论坛》,刊登于本月号。如需参考或引文请以正式发表的文章为准。特告。
“2006年国际都柏林核心及元数据应用”(DC-2006)于10月3日至6日在墨西哥西海岸小镇曼萨尼约(Manzanillo)召开,主办单位是墨西哥著名的科利马大学。会议以“Metadata for Knowledge and Learning”为主题,吸引了大约250名元数据研究者和应用专家(注册代表187名),分别来自24个国家和地区,在规模上超过了以往各届DC年会。
曼萨尼约是一个人口只有十余万的小城,地处中美洲太平洋海岸,火山众多,地貌丰富,风景秀丽,交通便捷,是一个天然良港,也是一个度假胜地。会议主办方将会址选在该城设施最为齐全的Karmina Palace酒店,完善的服务和近乎封闭的半岛环境让代表们心无他骛、专事“核心”。
会议沿用2001年日本DC年会以来的一贯程式,四天的正式会议包括培训(Tutorial Session)、主旨报告(Keynote Speech)、大会论文宣读(Plenary Session)、分组论文交流(Paralleled Session)、工作组专题会议(Workshop)、特别会议(Special Session)、联合会议(Joint Session)等,正式会议的前后还有应用委员会(Usage Board)、咨询委员会(Advisory Board)和理事会(Board of Trustees)的会议各一天,所以整个一周都是在紧张的会议中度过。年会是DCMI最重要的活动形式,除此之外只有几个委员会和少数工作组需要在两次年会之间再开一次会议,其余的活动几乎完全依赖网络进行。
大会安排了两场主旨报告,紧扣本届年会的主题:为了知识和教育的元数据。第一场主旨报告题为“资源网络和信息流的共享管理”(Shared management of source networks and information flows),由拉丁美洲地区著名的情报专家、毕业于美国雪城大学的Abel L. Packer 主讲,他目前担任国际卫生组织拉丁美洲信息中心主任(Director of Latin American and Caribbean Center on Health Sciences Information)。其人不愧是个情报专家,从网络知识交流的角度,探讨了学术情报传播和利用的一些规律性的现象,发人深省。
另一场主旨报告安排在会议最后一天,即10月6日上午,由华盛顿大学信息学院的Michael Crandal主讲。Mike是DCMI的老朋友和积极参与者,曾作为盖茨美琳达基金会华盛顿大学项目的负责人,华盛顿大学是DC研究和应用的重镇,特别在教育元数据方面颇有建树,Mike的主旨报告题目就是“DC教育:产品、过程和人(DC-Education: Product, Process and People”,高屋建瓴地回顾了DC对于领域应用的历史,总结了取得的成就,并对目前的问题和令人振奋前景进行了展望。
会议共交流了27篇论文,其中12篇大会交流,分三个主题:元数据模型(Metadata Models)、本体与控制词表(Ontology and Controlled Vocabularies)和教育元数据(Metadata for Education);小组讨论的论文有15篇,分成四场:元数据方案实施(Implementation)、调整与共享(Adapting and Sharing)、应用部署(Deployment Issues)以及领域中的资源(Resources in Context)。大会交流论文大多是由DCMI的成员参与,因此水平较高,代表了DC元数据研究和应用的最新进展。会议录与往年一样,除了以印刷形式出版之外,还将存档于由OCLC维护的DC历届年会的论文库中,这个论文库是大家学习和应用元数据非常好的资料库。
DC年会中的培训是DC普及推广和本地化的重要举措,虽然每年的培训内容大同小异,基本上都包括DC元数据语义(DCMES、DCQ标准的介绍)、DC元数据编码(XHTML、XML及RDF,今年增加了模型的介绍)、规范词表(如SKOS等)、应用纲要四个方面,但每年都有新的内容,而且由这些元数据大师来介绍他们的孩子,别有一番深意,特别体现在提问与回答阶段,深入浅出,挥洒自如。
会议结束后提出一个“DC2006曼萨尼约宣言(Manzanillo Resolution 2006)”,主要基于许多的拉丁美洲(西班牙语和葡萄牙语区)参会代表的提议。网络文化一直是英美强势,DC元数据也不例外,亚洲、拉丁美洲都一直处于被动跟随地位,非洲更是一片荒漠,几乎连参会的成员都没有,于是这些地区的文化特殊性就不可能反映在元数据标准的制订中,对于其它语种无疑是不公平的,对于文化的多样性来说无疑也是一种损失。近两届DC年会都在西班牙语区召开,因此本届会议顺理成章地提出这个宣言,对于促进拥有4亿人口的拉丁美洲地区来说是一个重要的进步。宣言提出在拉丁美洲地区促进元数据的普及和推广,倡议设立专门的实体或组织,召开专题会议、组织培训,建立西语DC网站,利用邮件列表、Wiki等技术手段展开全面的交流。所以这个宣言同时也是一个行动纲领。
DC年会前后的DCMI的工作会议(包括前述的三个委员会会议)构成了DC年度进展的重要内容,其中第一天咨询委员会的会议本人在第一时间已经作了报道,这些内部会议的内容将在下一年度DC工作进展中一一体现,包括中文DC也将有一些新的举措,请大家拭目以待。
参考阅读:
固定链接
十月 31, 2006 @ 12:39 am
· 归类于 论文
DCMI目前有17个工作组,作为一个纯志愿性的学术组织,DCMI每年取得大量的进展都应该归功于这些工作组成员无私的辛勤劳动。过去一年这些工作组主要进行了一下工作:
- DCMI“可获得性”工作组(Accessibility WG) 积极参与了国际标准ISO/IEC JTC1 SC36 以及W3C相关工作组的活动,主要成果体现在提出的一个普遍适用的可获得性描述框架:AccessForAll。国外对于信息系统(包括网页)的可获得性非常重视,但是由于对可获得性的描述缺乏统一的规范,在应用中颇为不便。DCMI的可获得性工作组与IMS教育元数据组织(IMS Global Accessibility)、欧洲标准化组织(CEN ISSS Learning Technologies Workshop)和国际标准化组织(ISO JTC1 SC36)一起制定了这个标准,目前进展顺利,ISO国际标准将于2007年推出。
- DCMI“代理”工作组(Agents WG)的工作还主要在明确功能需求方面,1998年就成立的这个工作组至今还没有一个像样的描述“代理”的功能需求文档出台。相对于FOAF、hCard等标准格式的不断出台并得到普及应用,虽然只满足了某一方面的需求,但DCMI这方面的工作显然是落后了。
- DCMI“架构”工作组(Architecture WG)的工作显然是非常重要和卓有成效的。除了前述的有关DC元数据编码的工作草案之外,架构工作组还展开了命名域管理政策方面的讨论和研究,结果参见:http://dublincore.org/architecturewiki/NamespacePolicy,以及探索应用纯文本进行元数据编码(DC-Text)的一套体系规范。命名域问题是国内元数据标准规范制定和应用中一个非常头疼的一个问题,这个文档颇值得我们参考。纯文本在描述元数据方面有着非常独特的优势,具有很强的编码独立性,正是由于目前各类编码语言的能力局限,以及应用中的障碍,使得DC-Text有望成为一种互操作性很强的中间编码格式,此次DC年会Pete Johnston专门有一篇论文介绍DC-Text。由于DCMI架构工作组日益体现出其重要作用,特别是在今后与Web标准制定组织W3C将开展更紧密地合作,“架构”方面的标准、规范、规则、推荐意见及最佳实践将成为今后DCMI的主要工作,所以该工作组即将升格为“架构论坛”,以期能够发挥更大的作用。
- DCMI“引文”工作组(Citation WG)在参考了各种正式或事实引文格式标准之后,希望编写一份“书目引文XML编码指南”(Guidelines for the Dublin Core in XML Encoding of Bibliographic Citations),目前该工作组的推荐规范是2005年6月13日版“DC元数据进行书目引文编码指南(Guidelines for Encoding Bibliographic Citation Information in Dublin Core Metadata)”,见http://dublincore.org/documents/dc-citation-guidelines/。
- DCMI集合描述工作组(DCMI Collection Description WG)可以说是一年中工作最勤奋的工作组,推出的“资源集合描述应用纲要”已经是草案第十二版(参见8月24日版本)。许多内容比初期的草案已发生了很大的变化,大多变化是由于需要同时满足揭示对象属性和集合属性两层描述而来,例如扩展了“集合类型”元素cld:CDType以及其下的五个元素,区分了“资源集合的描述”和“资源集合描述的描述”两个层次等,这些变化经过了充分的讨论,在本届年会上提交应用委员会审议,目前已成为DCMI正式认可的第一个应用纲要正式版(参见第12版的status状态:This is a Dublin Core Application Profile),即将提交ISO和CEN审议。该应用纲要是目前DCMI在研的系列标准中最成熟,能够很快成为国际标准的一个规范草案。但由于资源集合描述涉及的环境很复杂,问题很多,达成一致的困难也不小,目前该工作组还在努力之中。
(从DC CD AP发生众多的变化而最终顺利成为DC标准的过程可以看出:
1、DCMI并非不可添加元素、添加修饰词、改变模型架构;
2、大牛就是大牛,只要大牛投入精力想干的事情,即使变化再大,也可以通过;
3、目前在DCMI可能只有Andy、Pete和Michael具有此等能力。)
- DCMI“教育”工作组(Education WG)过去一年的主要工作有两项,一是继续完善DC教育资源描述应用纲要,以期在尽可能短的时间内拿出推荐草案;另一项是与IEEE LOM LTSC元数据标准化组织合作,提出一个复用IEEE LOM中的元素的推荐方案。DCMI与IEEE LOM的合作一直很密切,双方都认可基于RDF的元数据抽象模型,因此这两套元数据规范在互操作方面还是比较容易达成一致的。然而对于具体应用来说DC太过简单,而IEEE LOM由太过复杂,应用中一致性存在较大问题,所以教育领域对一个灵活的、中等复杂程度的元数据方案的需求还是十分迫切的,因此从DCMI方面来说尽快拿出一套适中的应用纲要规范仍然十分必需。
- DCMI“政府”工作组(Government WG)继续完善应用纲要,目前的草案是2005年8月的版本。除此之外,该工作组重点讨论了“服务”的描述和规范词表的应用问题。该工作组建立了一个Wiki用于工作交流,参见:http://dublincore.org/dcgapwiki/ 。
- DCMI“图书馆”工作组(Library WG)一直是人数众多、富于成果的小组,DC图书馆应用纲要也是最早提交应用委员会讨论的规范草案,目前的版本是2004年9月4日公布的,但主要是碍于“应用纲要”这种形式的规范性和支持其互操作性的DCMI抽象模型一致没有成熟,使得图书馆应用纲要还处在工作草案阶段,从一定程度上影响了DC在图书馆应用一致性和互操作性。过去一年中主要进行了两项工作:其一是对RDA进行评估。由于美国国会图书馆推出了AACR2的数字升级版:资源描述与存取RDA,与DC-Lib的应用领域有所重叠,于是有人动议对RDA进行研究,于是DCMI成立了一个子工作组,与美国图书馆协会的CC:DA(the Committee on Cataloging: Description & Access)进行了接触。目前发现RDA还不足以对DC-Lib构成威胁。第二项工作是探讨在DC-Lib应用纲要中使用MODS元素的规范化问题,由于这两者背后的模型相差太远,给元素的语义互操作带来不少问题,目前还没有很好的折中方案,问题尚在讨论之中。
- DCMI本地化和国际化工作组(Localization and Internationalization WG)一直致力于DC标准文本的翻译、在世界各地的应用推广等工作,与登记注册体系工作组关系密切,并且配合“DCMI附属会员计划”的实施做了许多工作。
- DCMI“保存”工作组(Preservation WG)一直试图明确保存性元数据描述的功能需求,并提出一套基于保存性需求的资源描述应用纲要,然而该小组取得的成果很少,本届年会对是否继续保留这个工作组(转变为社区)也进行了讨论,最后大家一致认为这个工作组还是很有必要的,特别是可以结合OAIS模型提出一套应用纲要。
- DCMI注册工作组(Registory WG)自从建立了DCMI元数据登记注册系统之后似乎就没什么事情了,目前各类不同功能和作用的登记注册系统都陆续开发出来,投入使用,DCMI的注册系统只实现了简单的术语维护和参考查询功能,要真正实现基于Web的多种元数据服务,道路还很漫长。
- DCMI“工具”工作组(Tools WG)应该说是DC元数据普及应用的一个很重要的论坛,然而长期以来该工作组定位不是十分明确,也可能由于涉及面太广而难以集中在某一方面做些卓有成效的工作。过去的一年主要在六月份召开的美国“联合数字图书馆国际会议”JCDL2006上组织了一次有关元数据应用工具的专题会议,并在美国数字图书馆杂志2006年7月号发表文章对会上交流的内容进行了回顾总结。
- DCMI其它几个工作组基本上已处于停滞状态。标准(Standard)工作组的主要职能已于DC-2005年会之后交由DCMI领导小组(DCMI Directorate)承担,ORDL/DCMI Profile联合工作组、日期(Date)工作组、环境(Environment)工作组以及核心Kernel工作组都没有新的进展。
固定链接
十月 30, 2006 @ 10:10 pm
· 归类于 论文
DCMI每年发布两次“现状报告”,每届年会之前的现状报告是DC元数据年度进展的重要参考,发布这个报告之前Makx Dekkers都会催促各委员会和工作组负责人对上一年的工作进行及时的清理和总结,以便年会中汇总意见,并进行讨论决策。
2006年4月底应用委员会召开过一次中期会议,以下内容根据2006年9月DCMI最新发布的现状报告整理。
固定链接
十月 16, 2006 @ 3:12 am
· 归类于 论文
DC-2006十大看点
来不及系统整理DC-2006的收获(已答应图有其表投给他的《数字图书馆论坛》),先放一个“十大”在这里,也算一个提纲。
1、DCMI的发展方向。
似乎与外界没有什么直接关系,但是从去年Tom Baker的主旨报告中可以看到DCMI历史上多次潜移默化的深层次的变化,决定了DCMI根本目的、基本特征、主要任务、实现道路、依靠力量、领导力量、发展战略等大是大非问题,也决定了人心向背。可以说迄今为止DCMI尚无重大失误,然而图书馆界作为早期的一支重要支持力量,感到DC在逐渐远离我们,是不是这样?此次会议提出的DCMI的组织和活动方式的重大变化(Working Group将变成Community和Task Force,Community应用的基础就是AP),会议形式的变化动议以及对于普及、扩大群众基础等问题的讨论会产生一定的效果。这样一个开放的论坛至少使人感到,所有的意见都会产生影响。
2、元数据标准规范从词表(关注基本语义)到模型的变化(主要指DC元数据抽象模型DCAM,但是FRBR、OAIS等模型思想的普遍应用也是一个动向)
3、元数据方案从平面到立体(加入实体关系的揭示)的变化(主要指DC元数据应用纲要DCAP不再是平面化的东西,而引进了本体)
4、DC框架(DC Framework)

来自:Mikael Nilsson, Pete Johnston, Ambjörn Naeve, Andy Powell. Towards an Interoperability Framework for Metadata Standards
5、提出一种新的元数据编码方式:DC-Text,简洁、方便,符合DCAM,可以转换成其他XML/RDF形式
6、互联网的规范控制问题(功能需求,解决什么问题,现状如何?如何做?)
7、网络知识组织体系(NKOS包括分类、词表、本体)的标准化(W3C在推动,即将推出一种通用语言支持KOS的编码,意义非同小可),以及NKOS的应用及转换问题等
8、围绕RDA的争论(普遍不被看好,这也是个先天不足、一出世就要被数字时代抛弃的东西)
9、Google对网页元数据应用的调查所反映出的问题(参见Mike Crandel的报告)
10、普遍意义上的词表的网络化和规范化问题。元数据是词表,任何KOS(包括本体)都可以看成词表,Wikipedia也是词表,如何使机读词表在SemanticWeb时代发挥基础作用,提到了元数据讨论的议事日程。
固定链接
九月 18, 2006 @ 12:15 am
· 归类于 论文
- “用户-资源-标签”是一组联系,可以用一组RDF复合语句形式化描述。
- 标签的价值来源于其社会属性:用户(不论是作者还是读者)为自己而作,很大程度上避免了滥用,产生了价值。
- 用户和用户之间的关系有一大堆属性,可以通过FOAF、hCard等显示化描述、获取。
- 资源和资源之间的关系有一大堆属性,表现为DC、MARC元数据描述记录。
- 各类具体应用中用户、资源、标签之间及相互关系如何外显化表达,是一个问题。采用元数据是一种方法,必须付出时间成本(制订),必须在一定的框架机制下(如Microformat)实施。PageRank等揭示内部关联和结构的算法也是一种方法。可能还有许多未知的内在关联有待发现。
- 利用资源之间的属性关系作用于用户,可使用户由资源而聚类和建立社会性网络。例如使用同一/同类资源的用户形成社区。
- 利用用户之间的关系可以作用于资源,可验证、强化资源的聚类和建立社会性网络,向相关用户推荐资源。
- 只有共享的标签(标签的社会化)才能形成folksonomy。
- 标签是如何社会化的?标签的处理流程是一个去个性化过程,目前利用民俗分类法的各大网站是如何处理和利用的?
- 标签是否应建立起其相互之间的关系?如何建立?能否利用资源和用户及其关系自动建立标签之间的关系?
- 一个系统中用户可能分多种角色,例如作者(内容创建者)、读者甚至标引人员(图书馆员),区分他们的标签(例如赋予不同的权重)也常常是很有意义的。
- 不同的标签体系(各网站)能否共享folksonomy?如何共享?
相关阅读:
固定链接
八月 18, 2006 @ 9:25 pm
· 归类于 论文
这次清华DL论坛上没有把这篇《Web2.0技术图书馆应用分析》的链接做到屁屁踢里,答应了几个朋友在这里公布一下(接受超平师和包工头的意见,只有屁屁踢是不行滴,别人是看不懂滴,以后有空要多多部落格和屁得福),欢迎下载,并提意见。http://www.libnet.sh.cn/sztsg/fulltext/reports/2006/libraryTech20.pdf
几个说明:
- 这篇文章本来是为毛军先生组稿的《现代图书情报技术》“跨界合作”专栏而写,后来根据编辑部要求进行了浓缩修改,篇幅删掉了近一半(主要是图表和前半部分文字),文字也做了很大改动,“博客味”主要是由毛军先生帮忙剔除的,最后也是由毛军赐名为《从Web 2.0到图书馆2.0:服务因用户而变》,估计将于《现代图书情报技术》2006年第十期刊出。所以在这里要向毛军老弟特别鸣谢!
- 本文是一个没有最终定稿的版本,图一和图四(关于Ajax的图示,忘了给出标号了)都没有给出出处,其它的图表都是自己的创造,也没有给出说明。秦健老师在审阅时曾提出这些意见,一直没有修改,因此如果需要引文,最好引正式发表在《现代图书情报技术》中的版本。
- 在这里提供本文给大家参考,主要因为其内容较全,有一些背景说明和更多的图示。最近我介绍数图2.0的许多观点在其中都有涉及,所以也算是屁屁踢演示文件的补充说明吧。
- 另外有一篇葛秋妍独立完成的文章《Web2.0技术和软件在图书馆的应用现状研究》因本人感到未达到发表质量而没有投稿,作为背景材料在这里也一并提供给大家参考。
- 文章内的许多观点不一定正确,欢迎大家来函商榷,批评指正。

固定链接