存档九月, 2006

Hi, Mexico! Saludos, DC2006!

eFoundations已经连续预告了他们在DC2006(都柏林核心元数据2006年国际会议)上的活动:

其中有他们此次会议上进行报告的演示()、对一年来进展的回顾以及对他们负责的架构工作组、集合描述工作组的工作评估与展望。有一些新的动向,特别是他们新开张了一个讨论和指导DC编码的Wiki:guidelines for encoding DC in XML and RDF,对跟踪和研究元数据及应用的同行来说,值得一看。

就要上路了,去参加这一年一度元数据的盛会。这是我旅途最长的一次出国:今晚11点半出发,要第三天(10/1)下午才能到达会议主办方Colima大学所在的Manzanillo市,其中30日晚要在墨西哥城住一晚。旅途是辛苦的,但好奇心和求知欲能够冲淡任何辛苦。

算上2004年上海主办的一次,这是我第四次参加DC元数据国际会议了。回顾自己这些年在数图和元数据方面的收获,的确要感谢上图提供的很好的平台和机会。上图领导一直认为,在专业学术领域和宏观战略管理方面没有国际眼光是不行的,因而在培养国际化人才方面一直不遗余力。无奈愚钝如我,多年下来,依然书呆子一个,无以为报,只有好好学习。

出国这段时间可能无法上网,但我会尽可能多记笔记,一有机会就上载。与专业无关的见闻、笔记和照片可以看这里(目前是我的旅程安排),如果有建议和要求敬请留言。

欢迎跟我一起游历墨西哥,参加元数据大会

留言

关于人文与技术的笔记

把技术与人文对立,在哲学上是可笑的。技术从来就不在人文的对立面,它是人文的一种。并且在现代和后现代社会中,它构成了人文的大多数,笼罩着人文的每一个角落。

与人文对立的是自然。

在认识论中,技术始终在人文和自然的边界上挣扎。这种挣扎实际上是人企图摆脱“动物性”而进行的挣扎,动物性使人屈从于自然,而人性使人作为自然的主宰。人类永远在这两者之间摇摆不定,而技术正好是人用来摆脱自然束缚的工具,这个工具越来越强大。这个工具来自于人的主观智能对于人和自然的属性的认识,从而不可能剪断与自然血脉相连的脐带。正由于这一点,反过来又遭到人们的鄙夷。就像一个出身卑微的暴发户,越是挤入“上流”社会,越是鄙夷自己的出身。

一种很古老的观点认为,技术是人的器官的延伸和投射,另一种观点认为,技术也是人类心理的表达。不论如何,技术都是人类智能进化的产物。因而可以将技术看成是人的一部分,却又并不是器官,作为器官千百万年才能进化一点点,而掌握技术的人却能在瞬间具有无穷的潜能。

正像动物因欲望而自相残杀一样,人类也会因欲望而利用技术戕害自己。但并不能因为这一点而恐惧技术,或者以技术为敌。同时也不能在享用了技术的盛宴之后认为人类无所不能,以一种“只要肯出价,一切都是可能的”的狂妄,把技术当作一条狗,可以随时呼来唤去。

人文是精神的体验和升华,但是它依然根植于人。人是自然的产物,也是自然的奴仆。人类应该对自然充满敬畏,同样敬畏其所掌握的、驾驭自然的能力。

评论(4)

图书馆学高层开放论坛课件下载

在这里严重感谢东莞图书馆的钟新革老师和李东来馆长,同意把此次论坛的课件放在这里与大家共享。当然也要感谢北京大学信息管理系和所有的授课老师。东莞图书馆作为此次“高层开放论坛”的主办方之一,与李馆长的母校一起为大家献上一年只有一次的专业大餐,尽情享用吧*!

2006北京大学图书馆学高层开放论坛

(2006年9月16日-23日)

专家姓名及单位

演讲主题

文件下载

李炳穆(韩国延世大学 荣誉教授)

我们的图书馆:今天和明天

Lbm.pdf

陈传夫(武汉大学信息管理学院教授)

图书馆业态的变化及其发展趋势

暂无

Abdus Chaudhry 博士 ( 新加坡南洋理工大学, 传播与信息学院, 信息科学系主任, 知识管理专业主任)

Prospects of Knowledge Management for Libraries and Information Services (知识管理在图书馆和信息服务中的前景)

Asc.pdf

Khoo Soo Guan, Christopher 博士 (新加坡南洋理工大学, 传播与信息学院, 信息科学系执行主任, 信息科学专业主任)

Research Trends of Knowledge Organization (知识组织的研究动向和趋势)

ck.pdf

陈书梅(台湾大学图书资讯学系副教授)

后现代主义与图书馆阅读指导服务

Csm.pdf

吴慰慈(北京大学信息管理系 资深教授)

图书馆学研究的现状与发展趋势

Wwc.pdf

李东来(东莞图书馆馆长 研究馆员)

论城市图书馆集群化管理

Ldl.pdf

刘兹恒(北京大学信息管理系 教授)

传统图书馆、数字图书馆、复合图书馆及三者的关系

Lzh.pdf

王子舟(北京大学信息管理系 教授)

面向知识的图书馆学发展新趋势

Wzz.pdf

李国新(北京大学信息管理系 教授)

中国图书馆法治建设的进展与问题

Lgx.pdf

马张华(北京大学信息管理系 教授)

关键词搜索引擎组织系统研究——特点、成份及其基本要素

Mzh.pdf

段明莲(北京大学信息管理系 教授)

信息描述的研究现状与发展趋势

Dml.pdf

张久珍、张广钦、王军、王继民(北京大学信息管理系 副教授)

综合述评:图书情报学研究进展

暂无

*并非多余的话:网上越来越多的资料,特别是课件,都是基于“创作共用”的。但是“创作共用”并非随意处置甚至盗用剽窃,至少要遵循(缺省情况下)“署名”、“非商业”、“保持一致”原则。如果您有修改,应加以明确说明。

开放存取是图书馆人的理念和理想。只有我们都能够遵循创作共用的一些基本原则,开放存取才能得到广泛的普及和更好的实施,才能实现图书馆人所追求的普遍的知识共享。愿每一个图书馆人共同努力。

评论(4)

我的数图“鸡汤”

每天有看不完的博文post。

并不是因为数量多,当然358个订阅也不能算少。许多风花雪月的帖子扫描一下就过去了,就如每天的新民晚报,从头到底大约只需要10分钟。

主要因为博大精深。博客文章虽然没有专著那么系统、有结构,却是丝毫不失专著的深度。特别是当你不断搜罗参考资料的时候。

在我的bloglines订阅的DLelite栏目(意为数字图书馆精英博客)中有这样几个是最为经久耐看的:

  • Lorcan Dempsey’s Weblog. 不用我多做介绍,这个人生来就是为图书馆思考,图书馆信息技术应用的领军人物,从英国到美国,成为OCLC的智库,甚至整个图书馆界的智库。
  • eFoundations. 上一篇博文专门介绍过,UKOLN的技术专家Andy Powell和Pete Johnston的博客。
  • Weibel Lines. DC元数据的创始人,OCLC的高级研究员(他们叫科学家)。技术与人文结合的典范人物,可能因为是德裔,行文严谨而深思熟虑,但文笔异常优美,对一个简单事物的描写需要我在词霸中查个半天。
  • Catalogablog. 不熟悉David Bigwood,但他的博客中常常有我最关心的行业动态和技术报道,主要是元数据与知识组织方面。博文短小,链接丰富,判断准确。
  • 编目精灵II — on the fly. 不用多介绍了吧,深刻而敏锐,颇多来自于实践的第一手资料,经验丰富,实践指导理论的典范。
  • Blyberg.net. AAPL的技术主管,2.0大拿,Geek,近来似乎有些疲惫,不太勤奋了。
  • OCLC Research. 来自OCLC研究团队的官方报道。
  • It’s all good. OCLC(又是OCLC)几位研究人员共同的博客,时有精彩篇章,但一般比较散漫。
  • Library Technology Guides automation update. 图书馆自动化系统方面的动态报道,要知道国外ILS厂商的最新情况,比方说谁又卖掉一套系统,谁又推出了新产品,谁召开了用户大会等等,这是个很好的园子。
  • Disruptive Library Technology Jester. 新订阅的一个群体博客(但并非以时间倒序编排文章,像一个维客,基于Wordpress软件),可以群体维护,收录了图书馆可能的颠覆性技术介绍,是不是很吸引人?目前内容还不多,当然比较偏技术。还订阅了关于这个博客的评论,有时评论中有许多好的帖子。

看不完很烦恼。但是为什么要看完呢?与自己的工作有什么必然的联系吗?好像并没有。

一时间倒是羡慕起教师的职业了。能够学以致用更好,学无所用的部分,至少可以影响下一代。

能够遍撒思想的种子,就算刀耕火种,也总有收获吧。

评论(3)

Welcome landing the blogshpere, Andy and Pete!

Stu的博客中得知,Stu从Lorcan的博客中得知UKOLNAndy PowellPeter Johnston开博了!他们联合开了一个博客:eFoundations。这实在是个大好事!关注DC的同行都知道,这两个人是DCMI的技术中坚,“他们帮助UKOLN奠定了数字图书馆的基础,赢得了美誉,同时他们也对DC元数据作出了基础性的贡献(These folks helped build the reputation of UKOLN as a nexus of solid work in digital librarianship, and their work in the Dublin Core has been foundational.)”,Stu作为DCMI的前主席(director)在博客中这样评价。

的确是这样。碍于语言问题,我跟他们的直接交流不多,但却从他们的论文和讲座中学到了很多东西。Andy不拘言笑,给人的感觉甚至有些孤傲,但颇有绅士风度,Pete长发披肩,素食,后现代作派,却像个大男孩一样十分腼腆。他们两人都参加了DC2004,每次DC会议,他们都是技术讲座的当然老师。我甚至认为,他们两人与Rachel Heery组成了UKOLN的三剑客,加上英国曼彻斯特大学Ann Apps成为四人帮,对于DC的贡献绝对不在OCLC之下!

留言

竟有如此好东西?Zotero:下一代研究工具

个性化的研究工具一直是知识管理领域的一种热门软件,我们几年前差点代理一家欧洲公司的产品(e-gems),记得其能够随时建立本地网摘数据库、资料自动聚类、在线提示相关文献、自动形成参考文献等功能让人印象深刻。但当时还没有2.0,还做不到不同网络应用之间十分便捷的Copy-Paste。现在大不相同了,因为我们马上就要拥有Zotero:zoh-TAIR-oh。

秉承2.0精神,Zotero是免费的。安装好之后你可以看到火狐狸(是的,又是火狐狸,只有火狐狸)的右下端有一个Zotero标志,按下shift-control-Z就会出现(或消失)Zotero窗口,像博客工具Performancing一样呈现在浏览器窗口的下半部分,左侧是你的资料库(My library),以及你的私人收藏(作为My Library的一部分),中间是左边选中内容的详细信息,右边是中间选中信息的详细信息,以及自己做的标签、批注、附件、相关信息等等(参见下面图示,以及官方简介)。

Zotero有如下特点(参见这里):

  • 自动从网页中获得引文的相应信息,存入资料库的相应字段,不需要键入、剪切粘贴
  • 支持引用、pdf、文件、图片、链接以及整个网页的存储
  • 允许直接在补捉下来的资料上作注解
  • 使对研究资料的组织方便易行而且方式多样
  • 提供快速“边打字边查找”功能帮助你利用记不真切的资料
  • 可以输出引文到你的文章、专著或网站上
  • 简单易学、界面时髦,能够自动存储你的笔记,简化了研究任务
  • 就在你的浏览器中运行,可以作为一个平台支持数字研究的其他工具和服务
  • 免费的开源软件
  • 名字来自于阿尔巴尼亚语zotëroj,意为学习的同时”获取(to acquire),和掌控(to master)”

所有Office2.0的东西都像是对桌面Office软件的拙劣模仿,Zotero似乎打破了这一点。

评论(9)

关注“高层开放论坛”

近来图林大会不断,继上个月的“数字图书馆前沿问题高级研讨班”和“第一届中美大学图书馆馆长论坛”之后,突然又冒出个“北京大学图书馆学高层开放论坛”,平地一声惊雷,有多“高层”、“开放”?不参加不知道,一掺和吓一跳。16日以来的三天会议高潮迭起,精彩纷呈,全是国际一流学者,真可谓图林的“百家讲坛”。给我印象最深的当然是昨天下午吴慰慈先生的第六讲:《图书馆学研究的现状与发展趋势》。正如“江南书生”在老槐也博客中的留言:“吴慰慈教授高屋建瓴,目光如炬,远见卓识,非比寻常,不愧有理论泰斗之誉”。 “行走在图林边缘”已经作了详细报道,老槐也在第一时间作了呼应和解读,我就不多嘴了。

我最关心的当然是技术、技术和技术。其中南洋理工大学Christopher Khoo博士的《Research Trends of Knowledge Organization》全面而深入,完全从图书馆知识组织的角度出发,结合哲学、认知心理学和人类学,回顾总结了各类传统的KOS(知识组织系统)的来龙去脉,涉及控制词表体系、分类体系、主题地图、本体等以及他们的构建方法,甚至对这些体系的应用问题(置标语言和部署实施等)也作了详细介绍,整个演讲120多页slides,展开就是一本有关知识组织及其系统的专著,呵呵,偶正打算写这本书呢,看来已经没有必要了(可惜了我那些素材)。

台湾大学陈书梅教授的《后现代主义与图书馆阅读指导服务》另辟蹊径,从社会思潮的角度分析图书馆对于“阅读”的不可替代性和社会价值,颇有新意,应该能够得到包租公游园的共鸣和喜爱。

其它如刘兹恒教授的《传统图书馆、数字图书馆、复合图书馆及三者的关系》以及李东来馆长关于公共图书馆“集群化管理”的创新也是我非常关心的(东莞图书馆还是此次会议的主办单位之一,了得!),明后天还有王子舟、李国新、马张华、段明莲的精彩演讲,哈哈,饕餮大餐,要弄得俺消化不良了啊,哇呀呀!

所有的演讲者无不有备而来,把自己某方面的平生所学呈现给大家。许多内容都是一门课的内容,虽说浓缩在半天之内,但比其它学术会议,给各位演讲者安排的时间还算充裕,交流从容,更令大家美不胜收。“图林边缘”一定也深有体会吧,笔记都来不及整理了。可惜此次会议没有做个网站,无法“以飨网友”,及时报道实况。我索性把会议日程拷贝在此,让大家垂涎三千尺,目瞪口呆吧!

预告一下:10月份还有中信所成立50周年会议、中日韩元数据国际会议、开放源码图书馆应用会议CODATA2006科学数据国际会议等相继要在北京召开,厦门还有图书馆青年论坛,天津还有沿海城市情报协作网会议,有机会的话大家不要错过啊。这是不是图林振兴第二春呢?图林众生真的有福了。

北京大学图书馆学高层开放论坛
演讲时间与演讲者安排

说明:每位专家演讲60分钟,中间休息10分钟。演讲最后的30分钟为提问与研讨时间。

开幕式地点:北京大学校内三院院内草坪
上课地点:北京大学三院121教室

日程安排:
2006年9月16日上午(星期六)
9:00-9:30: 开坛仪式 全体被邀专家、听众
主持人:王余光(北京大学信息管理系 教授)
9:30-10:00: 专家合影
10:00-12:00 第一讲:我们的图书馆:今天和明天
演讲者:李炳穆(韩国延世大学 荣誉教授)

2006年9月16日下午(星期六)
14:30-17:30 第二讲: 图书馆业态的变化及其发展趋势
演讲者: 陈传夫(武汉大学信息管理学院教授)

2006年9月17日上午(星期日)
9:00-12:00 第三讲:Prospects of Knowledge Management for Libraries and Information Services (知识管理在图书馆和信息服务中的前景)
演讲者:Abdus Chaudhry 博士 ( 新加坡南洋理工大学, 传播与信息学院, 信息科学系主任, 知识管理专业主任)

2006年9月17日下午(星期日)
14:30-17:30 第四讲:Research Trends of Knowledge Organization (知识组织的研究动向和趋势)
演讲者:Khoo Soo Guan, Christopher 博士 ( 新加坡南洋理工大学, 传播与信息学院, 信息科学系执行主任, 信息科学专业主任)

2006年9月18日下午(星期一)
14:30-17:30 第五讲:后现代主义与图书馆阅读指导服务
演讲者:陈书梅(台湾大学图书资讯学系副教授)

2006年9月19日下午(星期二)
15:00-17:30 第六讲: 图书馆学研究的现状与发展趋势
演讲者:吴慰慈(北京大学信息管理系 资深教授)

2006年9月20日下午(星期三)
14:00-16:00 第七讲:论城市图书馆集群化管理
演讲者:李东来(东莞图书馆馆长 研究馆员)

16:00-18:00 第八讲:传统图书馆、数字图书馆、复合图书馆及三者的关系
演讲者:刘兹恒(北京大学信息管理系 教授)

2006年9月21日上午(星期四)
8:00-10:00 第九讲:面向知识的图书馆学发展新趋势
演讲者:王子舟(北京大学信息管理系 教授)

10:00-12:00 第十讲:中国图书馆法治建设的进展与问题
演讲者:李国新(北京大学信息管理系 教授)

2006年9月22日下午(星期五)
14:00-16:00 第十一讲:关键词搜索引擎组织系统研究——特点、成份及其基本要素
演讲者:马张华(北京大学信息管理系 教授)

16:00-18:00 第十二讲:信息描述的研究现状与发展趋势
演讲者:段明莲(北京大学信息管理系 教授)

2006年9月23日上午(星期六)
9:00-11:00 综合述评:图书情报学研究进展
演讲者: 张久珍、张广钦、王军、王继民(北京大学信息管理系 副教授)

11:00-11:30 闭幕式
主持人:王余光(北京大学信息管理系 教授)

评论(3)

关于tag和folksonomy的进一步思考

  • “用户-资源-标签”是一组联系,可以用一组RDF复合语句形式化描述。
  • 标签的价值来源于其社会属性:用户(不论是作者还是读者)为自己而作,很大程度上避免了滥用,产生了价值。
  • 用户和用户之间的关系有一大堆属性,可以通过FOAF、hCard等显示化描述、获取。
  • 资源和资源之间的关系有一大堆属性,表现为DC、MARC元数据描述记录。
  • 各类具体应用中用户、资源、标签之间及相互关系如何外显化表达,是一个问题。采用元数据是一种方法,必须付出时间成本(制订),必须在一定的框架机制下(如Microformat)实施。PageRank等揭示内部关联和结构的算法也是一种方法。可能还有许多未知的内在关联有待发现。
  • 利用资源之间的属性关系作用于用户,可使用户由资源而聚类和建立社会性网络。例如使用同一/同类资源的用户形成社区。
  • 利用用户之间的关系可以作用于资源,可验证、强化资源的聚类和建立社会性网络,向相关用户推荐资源。
  • 只有共享的标签(标签的社会化)才能形成folksonomy。
  • 标签是如何社会化的?标签的处理流程是一个去个性化过程,目前利用民俗分类法的各大网站是如何处理和利用的?
  • 标签是否应建立起其相互之间的关系?如何建立?能否利用资源和用户及其关系自动建立标签之间的关系?
  • 一个系统中用户可能分多种角色,例如作者(内容创建者)、读者甚至标引人员(图书馆员),区分他们的标签(例如赋予不同的权重)也常常是很有意义的。
  • 不同的标签体系(各网站)能否共享folksonomy?如何共享?

相关阅读:

评论(2)

谈谈数图方案(三)

近一年前胡侃图书软件市场风云变幻群雄并起 的帖子中是这样写的:

市场上可以购买到的产品方面,就我所知,国外产品主要有ExLibrisALEPH500(中文介绍)及系列产品,SirsiDynixUnicorn(中文介绍)系列和Horizon系列产品, Innovative的Millennium产品在国内较活跃(由于Sirsi和Dynix的合并,现在变成3家公司4种产品),产品成熟度、功能性相差无几,而从媒体的报道和用户的口碑而言,ExLibris的系统可能由于起步晚而在设计上较为先进,而且由于是以色列产品而更为“国际化”一些,对多语种的支持可能更好一些,而且有较为完整的产品线,例如其SFX专利产品是最早支持数字资源的开放链接的产品,可能也是由于技术上稍稍领先一些,其价格也是最贵的,听说光是核心的ALEPH500(传统的图书馆自动化集成管理系统)就不低于***万人民币,如果是大馆,起码要**个许可,总价不会低于***万 -***万。Dynix虽然几经转卖、易主或兼并,但其技术在市场上却一直是不甘落后,虽然承诺的新功能总是推迟推出,但给人留下了深刻印象。相信与 Sirsi公司的兼并又有助于Sirsi提高技术,共同拓展市场。当然这些公司在技术方面的领先并不是难以超越,其它跟随公司往往不久也都掌握了类似的技 术、开发出类似的产品(见表二,分数字图书馆解决方案、开放链接解决方案和元搜索方案三个方面的附加产品)。由于Dynix与Sirsi的合并(传言是被兼并),使Dynix的Horizon变得前景不甚明朗,给原本在新产品中承诺的许多新技术将如何发展,SirsiDynix的两条产品线如何向用户提供同等的技术支持等都成了疑问,因此有不少想买系统、换系统客户都在犹豫,老客户也在观望。但是不论如何Sirsi自己的UnicornInnovative的Millennium几乎不相上下,还是有得一拼。这两个产品的最终总价(包括几十个许可证)应该在**万美金左右可以拿下。国外尚有许多企业未进入国内市场,例如很有竞争力的Endeavor公司,特别是面向低端市场的海外中小图书馆软件企业几乎是空白。

国内的图书馆自动化系统现在也是水涨船高。大约十几万人民币到**万人民币应该可以拿下。现在恐怕已经没有几万元的系统了(除非应用于中小学市场的)。目前比较有市场竞争力的恐怕也就南京的汇文系统、深圳的ILAS-II、北邮的MELINET了,另外还有北京的丹诚Datatrans、博菲特、金盘系统等等(见表三),由于没有使用或“近距离考察”过这些系统,恐怕无法评论好坏。从211高校的使用情况(见下表一),汇文口碑是不错的,装机量也最大, ILAS其次,但是由于公司近年来的重点在dIlas系统的开发,该产品至今尚未投放市场,目前市场占有率下降也属无奈,dIlas还未定价,据称定价不会低,不知其具体的市场定位如何,其开发思路给人的感觉是比较传统,希望市场策略方面能够有所创新,如果这个老牌产品不打组合拳,结合资源或者服务,在市场营销方面拿出一些新的手段,很让人担心这个产品的前途(本人也实在衷心希望有一个凝聚众人力量的民族品牌能够在国内占领市场,起码是中低端市场,造福图书馆界,从而造福广大读者,啊啊)。北邮的系统近来也没有听说新的市场拓展。这些软件主要实现的是图书馆传统核心功能,还没有国外大型产品的技术思路(例如支持Web Services以及RSS等)和完整的产品线,如果加上定制开发数字图书馆部分,虽然国内目前没有很成熟的公司(最成熟的可能要数参加CALIS数字图书馆认证的一些公司了,当然不排除还有数家不屑于参加CALIS认证的公司),但对新的功能要价都不低,杂七杂八加起来最少也需要**万左右。国内图书馆界一直存在喜欢自行开发的现象,这个趋势可能还会维持下去,国际上现在有用开源软件的趋势,特别是DLI1和DLI2遗留下大量的成果,当然这需要图书馆有一定的软件人才,或者合作伙伴能够提供技术支持作为前提条件。在一些老牌软件厂商创新乏力、服务下滑的情况下。一些新开发的厂商极有可能成为新星,在国产软件不合用而国外软件价太高的夹缝中寻找生路。东莞图书馆采用的新系统就是一家新兴企业开发的产品,最近这个产品又在黑龙江省图书馆的招标中中标,就是一个值得注意的现象。

更新:

就技术的先进性而言国内外的公司差距还是很大的,而且有越拉越大的感觉。支持这种感觉的理由,除了数字资源整合方面的明显差距之外,体系结构方面的落后导致开放性、可扩展性和灵活性的不足,在今后各类型图书馆迈向图书馆2.0需求中有可能成为致命的弱点,虽然已经有企业打出了2.0的旗号,我还没有看到真正2.0的东西。由于我对国内的软件并不熟知,希望有知情者来纠正我的这种感觉。当然2.0只是一个标签,其背后的人性化的需求和更大范围内的共享与融合是根本性的。

放眼望去,图书馆领域专业软件市场实在没有好东西:进口的系统太贵,技术支持又不好;本土软件对付传统需求还成,大致数年前的水平,能用,而对于新的需求,大多只能坑蒙拐骗了,全然不是那么回事。

当然如果有钱的话还是应首选国外产品的。因为:1、技术领先;2、起点高;3、能够培养人才;4、免责(连世界一流的系统都做不到…)。只是眼下一班代理商们实在难有看的顺眼的。Aleph一副舍我其谁的样子,比其他系统几乎高出一倍的价格,东西就好过一倍吗?未必。其实卖给“兄弟单位”的价格大家都心知肚明,完全没有必要摆谱,大不了不买你的。SirsiDynix在国内的营销团队着实该好好想想,你们的技术实际上不弱,然而作为用户都不好意思向别人推荐,当Unicorn推不出去的时候也不能好好地宣传一下Horizon8.0,似乎完全放弃了Dynix,为什么?III则让人感到徒有创新的虚名,虽然还偶尔在国内打打标,用户说好话的也不多。人们对于还没有进入国内的系统期待有加,然而人家看不起国内市场,或者是被前车之鉴吓得不敢进来了。国内应该有专业咨询或服务公司代理Endeavortalis公司的系统,并利用多家公司的产品甚至开源软件进行数字图书馆应用系统集成,应该有市场。

国内系统的最新情况了解不多。正如我一年前所说,ILAS正在失去机遇,可能并不是技术和人才问题,而是机制与体制问题。东莞的系统有可能成为黑马,但目前还只能说有特点,产品线还不整齐,而且他们的2.0“革命”似乎只走了一半,还没有从自发走向自觉,从必然王国走向自由王国。大连博特似乎已经开始“自觉”了,但没有看到具体的应用,不好定论。汇文系统据说很先进,但是同时好像也很神秘,开放性首先就让人怀疑。其它众多的系统在市场上的表现更有一种力不从心的感觉。总之,乏善可陈。

那么结论是什么呢?为了不被砖块砸死,结论还是直接发给杭州馆吧,请原谅在这里就不多说了。

评论(1)

谈谈数图方案(二)

对于具体的方案或设备选型,经费充裕的话就拣好的买,但希望给软件至少留出1/3的预算,一般而言,集成费、维护费都需要算到软件成本中去。这里须注意的是有些应用系统对操作系统和数据库有要求,操作系统和数据库又有可能对服务器架构有要求,需要考虑。

对于软件系统,回过头去看看近一年前写的胡侃图书软件市场风云变幻群雄并起,真是感到很有道理(自己先顶一个!虞姬虞姬留言说:“写得很好啊!”可惜没有多少人看,呵呵,郁闷)。当时也写到“如果储馆长能够看到这个帖子甚好”,在此更新一些想法,炒炒冷饭,再次献给杭州图书馆吧。

近几年图书馆自动化系统 (LAS, 又称图书馆集成管理系统LIS: Library IntegratedSystem)面临对数字图书馆需求的冲击。传统上以书目为中心的业务管理流程首先受到以读者为中心理念的冲击,书目的查询由专门的客户端程序向支持浏览器的方向转变,接着增加了许多基于Web的在线用户服务功能,比如在线续借、预约等,这就要求强化用户管理,支持更为广泛的用户身份 认证(一卡通)。图书馆的内部业务流程也开始重视面向工作人员的“界面友好”,区域协作更加强化了对集中Z39.50支持、联合编目、馆际互借、多 MARC格式以及多库的分布式管理功能,以及类似于中心图书馆的“LibraryConsortia”。这都是对传统图书馆自动化系统功能提出了更高的要求。在这些方面,国内的系统似乎没有“全能型”的,已经开始有点顾此失彼,难以应付了。

更新:

图书馆2.0的出现,使人们对书目数据的操控提出了更高的要求,需要灵活地展示图书/资源之间的联系(版本、类别、类型、主题、读者、地域、出版者)和可获得信息,需要提供读者参与标注的能力,而且所有这一切希望基于一个更大范围内的联合目录进行,而不是单个图书馆的书目。在功能上要求具有基于标准格式的数据开放和应用融合的能力,在界面上要利用Ajax技术实现完全基于Web的C/S应用。这就使得对MARC数据的操控需要采用全新的方式,并且在系统的架构上真正支持分布式的应用(数据的分布、事务处理的分布等),而不仅仅是实现一个B/S界面那样简单。

数字图书馆建设的要求首先是要将数字资源的采选订藏编目管理发布服务结合进来。虽然还没有形成固定的运行模式,但是国外的相关研究开发已经不少,有一些系统已经考虑到相应的功能。利用MARC的856字段加入链接从而支持电子资源全文获取是一个基本应用,进而随着 OpenURL开放链接标准的成型为图书馆的电子资源管理提供了一种基于“链接”的标准方法,国外的一些大型系统(Endeavor/Ex Libris/Sirsi+Dynix/Innovative) 都有支持开放链接的产品,甚至与数字资源出版/发行商合作,提供“软件+资源”的服务模式。OAI也是正在兴起的一种电子资源整合检索标准,但属于相对独 立的开放标准,还没有哪家图书馆软件系统提供商作为他们的软件产品或服务选件。现在国内许多公司把数字化管理系统、数字参考工作、电子阅览室管理、甚至办 公自动化也作为图书馆集成系统的选件。但是应该说图书馆还没有一揽子交钥匙的、很好的“数字资源”的集成管理服务方案,因而也还没有传统与“数字资源”结合的、功能全面的“图书馆集成管理系统”产品获解决方案。数字资源基本上是独立系统,各自为政,图书馆基本上采取分门别类个案解决的办法,例如加州数字图 书馆提出开放“裸”数据的购买要求,或者比较大的、有开发能力的图书馆自行开发特定中间件,国内外目前基于页面分析技术进行Web资源整合也是一种流行的通用方法。目前这些方法都有明显的缺点。

更新:

传统的图书馆自动化系统和“数字资源管理(ERM)”软件需要更好的“集成”,它们之间的联系必然越来越紧密,在体系结构甚至底层数据结构方面(特别是对元数据模式的支持),就需要支持更多的标准规范以达成更好的互操作,在标准规范尚未统一甚至成型的情况下,同一家公司的产品一般而言具有更好的互操作性,而业界领先、制定标准的公司往往最具竞争力。表二中列出的各家公司都有数字图书馆(实际上是内容管理)解决方案、开放链接系统和元搜索系统,不同公司的早期产品在兼容性方面肯定是有问题的。

留言

谈谈数图方案(一)

最近很忙,参与的许多工作不适于发表博客,因而荒疏了这片林子。前不久杭州图书馆布置作业,要我就他们的数图方案提点意见,想写得“通用”一些,一般化一些,就有了下面的文字。

随着《2006-2020年国家信息化发展战略》的正式出台和《信息化“十一 五”专项规划》的加紧制定(制定了快三年了,好像还没有正式发表,大致内容参见 这里),以及《国家“十一五”时期文化发展规划纲要》的新鲜出炉,国家在信息化和文化方面的投入越来越大。图书馆借此东风大干快上,也是顺理成章。看到各地数字图书馆方案及预算一浪高过一浪,每每感到太过奢侈,特别是当许多图书馆一年到头连一本书都买不起的时候。但实际上信息化大潮中只有数字图书馆来的最为实在:利在当代,功在千秋,本人也在这个林子里混饭吃,因此还是不要乌鸦嘴为好。图书馆有此机遇,奢侈一点浪费一点也未尝不可,关键在于购买的东西是不是搭配合理?能不能发挥作用?有没有实实在在地使更多的老百姓享受到图书馆的服务?以及可不可能使图书馆在成为信息枢纽、文明基地方面向前迈一大步?

目前最不合理的是数字图书馆方案通常只是一堆软硬件选型方案,软硬件选型要与图书馆的发展目标与定位联系起来,要与服务对象的信息需求和资源建设的规划结合起来。数图方案一般都是由一帮搞技术的提出来,又由一帮号称熟悉技术的业内专家来评判,这种机制难免要被老槐竹帛斋主等技术怀疑论者诟病。设备型号、技术参数在懵骗领导的时候是利器,而用来服务读者的时候,往往就要原形毕露了。这个时候馆长的领导艺术就体现在如何把握技术,为图书馆的管理目标服务,技术人员常常是没有这方面视野的,而馆长是否有明确的定位和目标,以及能否利用难得的机遇为其定位和管理目标服务,就成为考验馆长水平和能力的试金石。

方案来源于需求,任何信息系统的建设,最困难的地方也在于需求的明确和把握上,并不是说馆长不知道他的需求(当然也有这种可能),而是必须把各种隐含的、抽象的甚至模糊的需求显性化、具体化、明确化,与现有的解决方案很好地结合起来。在软件工程领域,需求分析是有一套方法的,虽然这些方法主要用于软件系统的开发,而且可能太过教条和琐碎,难以照搬到数字图书馆建设,但还是有不少东西值得学习。例如最重要的原则可能是“需求分析原则”(许多方案拿起来就做,对于用户需求想当然),即任何体系化的系统建设,必须经过系统化的需求分析,这是整个系统完整性、协调性的保证。业务需求是什么?现状如何?达到的目标如何?为什么这样考虑?目标要具体化、量化;用户需求是什么?哪些是用户?功能需求是什么?涉及哪些技术?需要支持哪些标准规范?等等,所有的需求要形成详细文档,要进行版本管理。当然这里的需求还不是指软件公司开发时所需的详细需求文档。

具体来说,可能有如下问题需要回答

  • 总体业务目标是什么(机构的愿景、使命与任务)?
  • 目前的业务量(分各类指标)?
  • 目前的业务流程
  • 目前的服务种类、方式
  • 预期系统完成后的变化,包括业务量、服务种类、方式的中长期目标
  • 目前的瓶颈在哪里?哪些问题需要通过系统建设/升级来解决?
  • 问题与解决方案矩阵图:哪些问题需要在哪些系统/方案中解决?
  • 问题与技术矩阵图:哪些问题需要哪些技术来解决?

(未完待续)

相关阅读:

评论(6)

愿MARC“永垂不朽”

多次被问及对于图书馆自动化系统未来发展方向的看法,心中总有一种企图,很狂妄的、不知深浅的企图,所以一直没敢说出来。心中总想,应该是图林中老一辈无产阶级革命家例如曾民族、徐如镜、张琪玉等先生,抑或新生代中坚力量张晓林、吴建中等同志提出,或者哪怕是海外学子曾蕾、秦健等来点这把火,甚至编目精灵说这话也比我有分量。本人实在没有这个资历,从理论、实践与技术各个角度来看都显得底气不足。然而等了这许多年,朋友们不断追问,看看好像没人愿意捅破这层窗户纸,俺就猫叫一声吧,等着被大家的口水淹没,就算成了烈士,也不枉来人世走一遭!

这句话就是:哪一天图书馆自动化系统挣脱了MARC的束缚,就称得上是“下一代”了。用张甲曾经的同事,美国图书馆界的名嘴Roy Tennant的话说,就是“MARC必须去死 (MARC must die)” (四年前他就说了这句话!这里还有一篇“谋杀MARC”)。

想一想现在谁最把MARC当回事?实际上一个也没有。有先生把MARC看成我们专业的核心竞争力,那是担心剪了辫子革命无法成功,因而不敢剪辫子。谁不清楚眼下还有多少信息管理学院教授这门课?还有多少图书馆完全依靠自己编目数据?

抛弃MARC最大的阻力应该来自图书馆所拥有的书目数据,以及业已装机的、成千上万的图书馆自动化系统。书目系统可能是人类知识财富中最大的遗留系统,在Google、Yahoo!们计划把所有流传下来的图书都数字化时,这个依附于图书的遗留系统还会成为问题吗?软件开发商们可能更多的以《失落的世界》中科学家看到恐龙的眼神向MARC致敬。MARC已经成为一种裹小脚一般的习俗,对数字图书馆来说是一种束缚,甚至灾难。

“王小石”在网络图苑中发帖说弄不懂为什么数字图书馆非要转换MARC数据,业界大家似乎讳莫如深,其实说出来也没什么丢人的,实在是因为数字图书馆玩不转这样一种格式。你想想,伴随磁带格式而生的MARC标准,还有哪个行业有如此史前怪物?看到Lib2.0的许多应用了吗?那些以OPAC开刀的例子无不让我们欢呼雀跃,啧啧称奇(看看北卡州立大学NCSU图书馆的例子。这里 张甲有介绍(pdf),把MARC数据彻底地转化为XML)。想想亚马逊是如何处理书目数据的?想象出版行业为什么提出PRISM元数据格式OCLC近年来对OWC做了哪些动作(frbrizing)?LOC又发生了哪些激烈的争吵?根源无一不在MARC

我们行业最大的财富,正在成为我们行业最大的绊脚石。然而事情是可以转化的。以书目数据的处理为核心的图书馆自动化系统,也是数字图书馆集成系统的核心,而不是可以并行的系统,这一点得到越来越多的图书馆软件开发商的认可。于是问题就转化为:数字图书馆集成系统的成败,与能不能玩得转书目数据直接有关。元数据格式都是相通的,但是只是在相通的体系架构中的相通是无缝的、最优的。书目系统的功能需求已经成熟得不得了、也明白得不得了,图书馆员和读者需要的是功能而不是内部数据,不管你葫芦里卖什么药,只要能治病,就能得到认可。实际上我不知道现在SirsiDynixEndeavorExLibrisInnovative等ILS系统中还有多少”纯MARC”,MARC只是一个临时拼凑出来的影子(虚拟视图)罢了,其作用与Blyberg做的虚拟书目卡片一样,可以让我们的老图书馆员们聊以自慰吧。

(在一个纪念日里写这篇博文纯属巧合。也算一种纪念吧。)

update:编目精灵 MARC、MARC,为什么不死?

评论(9)

请帮忙做个问卷

参加过、听说过或者对“上海国际图书馆论坛(SILF)”有兴趣的朋友请帮个忙,到下列地址填一个问卷调查表,不管你对SILF知道多少,有几道题总是可以填一下的,也算帮我们举办下一届国际图书馆论坛(SILF2008)出出主意。今年第三届,坚持下来不容易啊,大伙儿体谅体谅!

调查表网址:http://www.my3q.com/go.php?url=shlibrary/SILF2006。 (如果您想填英文版,在这里

这个调查表网站由于游园而得知,鸣谢一下!

评论(8)