存档一月, 2007

安装了unApi插件的post是这样地

下图是安装了unApi之后的Wordpress博客截图。

看来支持MARCXML, MODS, OAI-DC, RSS, SRW-DC等几种元数据格式,可以由机器识别和读取。这里是添加了Greasemonkey的js代码之后才显示在网页上的。

unApi插件在这里下载(需要用代理,感谢编目精灵帮我下载):http://www.lackoftalent.org/michael/blog/unapi-wordpress-plug-in/

Greasemonkey的unApi显示代码在这里下载安装:http://hublog.hubmed.org/archives/001380.html

unapi4wordpresskeven上传于Yupoo.

评论(1)

“学会”是做什么的?

昨天忽然当上了上海图书馆学会的秘书长,赶鸭子上架,又多了一摊自己不熟悉的工作,心中十分忐忑。
这个“数图研究”博客越来越远离数图,远离技术了。

秘书长就我的理解,就是打工干活的,给学会理事会打工,给全体会员干活。
干好干不好就另说了。

大是大非问题:首先必须弄清学会是干什么的。这个问题要搞清楚,这个问题不搞清楚,就要犯糊涂主义。
我周围有许多人对各类学会颇为不屑,甚至嗤之以鼻。
在他们看来,学会只是一种另类的管理工具,也是一个微型的政治舞台。大有大政治,小有小政治,都要讲政治。
政治是要讲的,但最终要落实到三个代表,落实到科学发展观上。也就是说能不能真正代表学会成员,能不能把学术交流搞起来,把学会工作搞上去,是学会工作最大的政治。

要弄清学会的宗旨,学会章程自然是最直接的文件。看此类文件是比较考验智力的。官样文章,冠冕堂皇,字里行间,如果不知来龙去脉,还真能被它唬住。前一阵刚开过计算机学会的换届大会,承蒙吴惠族老师的推荐和领导的支持,去做了一个理事,了解了一点学会的运作。一直以来也参加一些国际学术机构的活动,也不免进行一些国内外的比较,第三只眼睛看世界,有了些粗浅的想法。

为什么、是什么、怎么做,是学会的三大问题。
上海市图书馆学会,英文名称是Shanghai Society of Library Science,英文似乎更能说明问题一些。会上周德明馆长跟我交头接耳,感觉这个英文名称怪怪的。美国图书馆协会名称为ALA:the American Library Association,决定了它是图书馆相关机构的联合体,它的成员是图书馆或与类似的组织机构,个人会员是组织机构的代表,因此它是一个行业协会,也即类似于现在吴馆长主持的“上海图书馆协会”,宗旨是promote the highest quality library and information services and public access to information。 中图学会的名称是“Library Society of China”,其章程总则中说成员“是由全国图书馆及相关行业或机构科技工作者自愿结合”,仔细推敲也不尽合理,似乎应该名为Librarian Society of China更名副其实,这个名称可能为其向协会过渡埋下伏笔吧(然而图书馆事业本身是政府主导的公益性事业,有一种观点认为其缺乏独立性,缺乏成立行业协会的基本条件)。上图学会也是一个以从业人员为主的组织,可能更强调学术性吧,所以把Science放进去了,这样做有助于区分上海同时存在学会和协会的现状吗?我们现在促进行业立法、推进行业准入制度等,似乎都应该是行业协会的事情,以后学会是否以“学术委员会”的职能为主了呢?这些都是需要探讨的问题。

1998年颁布实行的国家《社会团体登记管理条例》是目前各类学会、协会修改章程的准则。这个条例其实非常强调协学会的独立性,例如规定了属地管理、财务独立、法人不得兼职、不鼓励挂靠等等,当然由于历史原因还是保留了双重管理体制(民政部门登记和“上级”业务指导),各地大量的学会都隶属于科协实施“业务 管理”,有点莫名其妙,可能没有了婆婆媳妇反倒不知所措了。从长远看随着事业体制改革这一点肯定是会发生变化的。一个健康的社会必须有大量独立的NGO, 才能真正的百花齐放,促进各项事业的发展。这也是一种2.0精神吧。

参考阅读:

评论(4)

变革,从流程开始

精品报告,馆长必读—-
pub139cover
keven上传于Yupoo.
任何技术上的革新必须有管理上的配套才能得以成功实行。看看这份报告,可能会有很多灵感。

评论(2)

QOTD:Lib2.0成功要诀

创业者们的十大迷思 让我想到,Lib2.0技术酒徒也需要有一个好想法,联合/组织一个好团队,把想法做成好的产品或服务,最终应用于数字图书馆门户中。

参考说法:

商业成功是需要有一个好想法、组织一个好团队、把想法做成好产品、最终把它卖给客户。很简单,也很复杂。

powered by performancing firefox

留言

QOTD:图林与开源

Linux.com最近前天发表了一篇文章,专门讨论图书馆领域的开源软件和一些典型案例,主要观点认为专业公司在帮助图书馆采用开源软件方面还是能够有所作为的,企图调和商用软件和“免费”软件的关系,为图书馆软件公司寻找新的利润增长点。

对开源软件是否能拯救正步入危机的图书馆专业软件公司我存在疑问,但赞同下列说法:

开源运动与图书馆在很多地方是一致的,不仅因为他们都崇尚自由,重视信息的开放存取,而且最近图书馆界已经慢慢投身开源软件的运动中了。图书馆社区有一套复杂的业务规范,诸如馆际互借、元数据共享和联邦检索等,对于软件的需求非常特殊,没有商业公司的支持和缺乏IT技术人员使得图书馆采用开源非常困难…

powered by performancing firefox

留言

数字图书馆十种新岗位

Laura Cohen说她的图书馆得到一笔资助去雇佣以下十种岗位的员工,帮助图书馆加强技术工作。真是个幸运的图书馆!这些岗位看起来很2.0。(这里仅根据自己的理解简单解释,原文对这十种岗位说明得很详尽)

  1. 社会性网络支持Social Networking Support
    Librarian:帮助读者利用社会性网络工具(例如QQ、MSN)开展研究或其它工作,促进图书馆资源的利用。与参考馆员和编目员协作利用通用的
    2.0服务为馆藏建立推荐性的标签或网摘。并跟踪社会性网络最新发展动态,探索图书馆利用的可能性,必要时对读者进行培训。
  2. 2.0应用协作Collaborative Publishing Librarian:协调图书馆的博客、维客、RSS等互动应用,在图书馆网站为机构库等资源或应用建立基于民俗分类法的应用,整合馆内外的各类RSS种子,支持手持设备的发布。
  3. 多媒体制作Multimedia Publishing Librarian:负责播客、音视频内容的制作和上网。
  4. 读者/学生协调员Coordinator of Student Participation:负责协调读者/学生与图书馆的联系,特别是服务的效果反馈、意见征询等,例如该校的Wal-Mart greeter活动(估计类似于厦大的“走进图书馆”活动)。可能删除读者/学生的留言也是这个岗位的职责。
  5. 程序员Programming Risk-Taker:就是图书馆Geek们做的事情,负责各类应用的“混搭”,涉及到各类开源工具的应用和编程。
  6. OPAC升级OPAC Transformation Librarian:负责建立0PAC2.0。
  7. 测试平台技术支持Testbed Technologist:负责各类图书馆2.0应用的开发平台建设。
  8. 数字化馆员Digitization Librarian:这个岗位我们早已有之。
  9. 远程用户支持Remote User Librarian:支持远程用户访问图书馆资源和利用图书馆服务。
  10. 图书馆员培训师Exploration and Training Librarian:培训图书馆员成为图书馆员2.0。

powered by performancing firefox

评论(7)

我所需要的元数据服务

留言

不羁的种子

“你的博客每天大约有多少人访问?”王书记一次突然问我。
“我们现有几个RSS有多少人订阅?”缪馆长在一次会上问技术部门的负责人。

对这些问题,我们只能回答个大概。伴随草根主宰世界时代的到来,内容提供者似乎越来越难以控制自己信息的流向,播下的种子(Feed)会像蒲公英一样飘向四方,并繁衍子孙。RSS被 Feedburner、Bloglines、Greader、Feedsky、Gougou、蚂蚁、抓虾……等等数十个服务网站串烧、聚合,被各类搜索引擎的爬虫骚扰,提供丰富多彩的订阅方法和阅读体验。你的网站每天可能只有200多次点击,但feedburner有300多次访问, bloglines上有100多个固定订阅……难怪Pageview正走向死亡。
RSS是个不受约束的孩子,一出世就由不得爹娘,所以才有这么多的表叔,这么多的寄养的家。后生的孩子如微软的SSE(Simple Sharing Extension)等,增加了回馈机制,就只能做个乖乖女了。

如果你想知道你的读者,只有当他通过bloglines、抓虾、gougou等聚合器订阅,且他愿意让你知道的时候才有可能。并且你只能通过枚举归纳,把所有可能的RSS和RSS服务都加起来,才能算个大概。图谋已经为网络图林进行了好几次的普查了,但都很不完整。

因此这是一个信息的流动完全不同于传统的时代,信息流程中的各类游戏者都需要确立新的角色。

librsskeven上传于Yupoo.)

这幅图是台东大学RSS应用全图,可以看到,小小的RSS并不简单,解决方案也不能只靠一种。务实的台湾同行们已经扎扎实实地做了起来,我们呢?
(前不久台湾淡江大学召开的Web2.0与图书馆 研讨会,还有许多看点,特别是林泰宏先生的两个报告。)

评论(2)

终于放弃bloglines

greadertrendskeven上传于Yupoo.

终于放弃Bloglines
看了这张截图你就知道,为什么要放弃Bloglines。
并非因为bloglines不好,实在是因为Google太强大,Google Reader进步太多。
几个月前keso转向GReader,我还曾不以为然。

甚至因为有了“加星星”和“加标签”功能,估计今后365key网摘也会少用很多。
如果能够做网摘,furl、delicious都可以关门了吧。 令人恐怖的Google帝国时代即将到来。

几天前随手写的Greader的好处:

1.节省时间。订阅了那么多rss,不读是最好的节约时间的方法。当然同时不能漏过你确实感兴趣的。除了一个好的过滤机制外,可用性设计的好坏是非常重要的。目前的GReader同一目录下的不同rss订阅可以像邮件一样浏览,一行内容可看大概,不感兴趣即可略过,最后Mark all as read。这个功能使我的rss阅读时间减少三分之一,因此我得以突破每日300多个rss阅读量的极限,现在订了400多个。
2.GReader的评级和标签比Bloglines方便实用的多。在Bloglines上有200多个标为unread的精华帖,一直没空仔细读,想找到某篇特定的帖子非常难,要浪费很长时间,还不一定找得到。GReader加注星号,很方便地加tag,作为资料存储起来,很容易查找,还可共享(甚至推送)给同行。我的RSS阅读共享在这里,还有RSS
3.打开列表,不读内容不会自动标记成已读,不需要像Bloglines那样看了一时读不完,还需要标记成未读。但是太容易标注可能会造成好帖子永远不去读。

Winters Mi 在这里有说,偶就不多说了。

评论(2)

思考:资源按时空呈现

在思考上海年华图片库的呈现方式时曾经考察过一些新技术,希望探索一些开放的(2.0的)解决方案。

大量的信息资源(例如图片库)都需要标注地理信息,关于地理信息的管理一直是数字图书馆技术的热点,随着Google earth、Yahoo map等应用的成熟该技术已经走向开放、标准和实用(例如Flickr已经开始支持地理位置标注,以及图片按照地图呈现)。当然距离最重要的需求:“简单”,似乎尚有距离。
“简单”的含义是,只要标注有一定的地理/空间信息,系统就能自动提供多种呈现方式。另一方面,对于地理信息的标注或者获取,也需要有系统(平台)或工具(如通过相应微格式的havesting)的支持,并且足够简单。

据说MySQL4.1以后有一个Spetial Extension,能够在关系数据库里管理地理信息。了解了一下,大致有以下功能:

1、数据类型扩展。支持GIS数据,例如用POINT表示二维信息(dc:point; dc:box; etc.);
2、特殊操作。例如可以支持封闭图形的面积计算;
3、GIS数据的输入输出;
4、对GIS数据进行索引,以便快速查找、排序等。

不知道MySQL的这个扩展是如何实现这些功能的。只是觉得依靠关系数据库恐怕会有点问题,特别是对于目前大多数网络应用都希望以XML方式管理数据的情况下,局限性就不多说了,不必要的输入输出转换会带来效率、兼容性、互操作方面的很多问题。

目前语义Web领域对信息以时间和空间方式的呈现和管理有许多项目在做,例如SIMILESWAD-Europe 等,前者已经开发出一个很好的开放的Timeline表示方法。将来对于空间/时间信息也希望以RDF标注并能采用SPARQL查询。

有趣的是这些语义技术往往在Blog或Wiki获得最先应用:通过PHP插件或扩展的形式。可能因为这个领域最为活跃,有一批TechSavvy吧。当然这些应用可以“试错”也是一个重要原因,永远的beta版,错了也没什么关系,改了就是。

所以我们的博客、Wiki应用如果在创建内容的时候能够支持标准格式,将给搜索引擎或其他应用揭示、共享带来很大的准确性和便利性。例如我们在描述自己的时候利用博客工具提供的表格输入,就能够建立hcard或foaf数据,我们在增加链接时添加了链接者与本人的关系描述,就增加了XFN格式的社会关系描述(wordpress有这个功能)等等。目前许多个人知识管理/共享系统(例如Piggybank)就是通过内容的格式化标注和发现,建立知识库的。

参考例子:

geobloggers.com
mapufacture.com
Google Earth

用中文点亮地球


评论(2)

元数据应用平台的开发需求

华为的朋友在我的博客上留言,要开发一个元数据应用系统,关于互联网或者电信网内容(资源)管理:

内容包括文本,图片,音视频,多媒体等网络资源。
期望通过对内容进行结构化的描述,例如元数据,然后发布,实现对内容或者资源进行检索,依据内容之间的相关性进行聚合,以及统一的访问机制等.

目前大致的思路是,先基于RDF/DC元数据等技术,建立一个简单的资源管理与控制平台,把资源(应该是由URI所确定的)按照某些元信息或是简单的标签进行描述,然后注册在某个地方,然后以此为基础研究对资源的聚类,搜索,资源之间的关联,Web服务对资源的调用访问,资源与服务的匹配关系等等。

对这样一个系统,希望大家出出主意。

首先明确需求如下:

1、资源对象:来自网络(提供URI);
2、资源类型:任意(文本、图片、音视频等);
3、资源描述:规范的元数据(如DC),以RDF编码;
4、应用需求:搜索、聚类、关联;
5、访问方式:开放,支持Web服务。

我们参考原型法来考虑问题:满足上述需求的应用,应该有两类现有应用可作参考:

资源导航门户:

1、资源对象:各类网站、网页(可通过URL链接);
2、资源类型:网页,可能会有pdf等文件;
3、资源描述:专业人员加工的元数据(很多应用了DC,但不一定以RDF编码);
4、应用需求:提供搜索、浏览功能,以及人工的分类(聚类)、(主题)关联;
5、访问方式:开放访问,但不一定支持Web服务,但有这种趋势,例如可能支持SRU/W的REST访问等。

个人知识管理(网摘)系统(如365key、Zotero、PiggyBank等):

1、资源对象:网页或网上的任何资源(提供URL或能够被一定服务解析的DOI/OpenURL等);
2、资源类型:任意(文本、图片、音视频等);
3、资源描述:任何规范的元数据(如DC、微格式)或不规范的元数据(如Tag),以XML/RDF或自定义形式编码;
4、应用需求:标注annotation、存档(在线或离线)、搜索、获取、聚类(多种算法、相关反馈或纯粹人工)、关联(规范控制);
5、访问方式:本地、圈内(可定义)、开放,支持或不支持开放API,提供或不提供基于标准或非标准的Web服务。

针对您的需求描述需要进一步澄清的问题:

1、您需要上述哪些功能?
2、您需要开发的是应用型系统(上述第一种为主)还是工具型系统(上述第二种),或者在开发应用的同时开发一些工具?
3、您的系统开发工具和运行平台怎样考虑?纯开源还是商业应用?纯网络实现(Ajax)还是可以有C/S参与?
4、您希望支持各类“标准”,支持到什么程度?(例如元数据格式的类型——包括数据存储和交换的考虑、流程的耦合程度——即各模块的封装程度、服务标准的支持——如何注册、搜寻、发布服务等)

留言

2007:Keven因你而变

自从毛军建议我写《从Web 2.0到图书馆2.0:服务因用户而变》(现代图书情报技术2006/9),就让我感到,生活将由此不同。

果然,虽然2006总评不及格 ,但却成就了我的2.0元年。许多围绕Web2.0图书馆2.0的演讲、报告,Info2.0会议,以及自己涉猎的诸多领域无不打上了2.0的印记。大狗那边给第二届《Web2.0与信息服务》确定的主题也是“服务:因你而变”。好吧,2007,keven也因你而变。

2.0最大的价值在于一下子拉近了从理论到技术、从技术到应用的距离,在降低技术门槛的同时,加速了各种技术受实践检验的进程。人们呼唤杀手级应用,然而草根应用如雨后春笋,任何东西都在竞争中受到考验,物竞天择再次成为规律。不随需而变,就没有出路。

因此,我也就不做什么新年计划,只有给自己的新年寄语。以下的一些事情,诚邀“你”的参与,一切将因“你”而变。

1、进入“博客时代”的网络图林,仍然需要一支不断壮大的博客队伍。只有普及才体现草根性,只有每个个人主体意识的觉醒才有整个事业和整体学科的繁荣,才能克服陈腐的精英意识。在网络图林我们要倡导老槐竹帛斋(以及雨僧)的那种批判精神,以“网络图学”的学风抵御六大弊端
2、理论创见不是一朝一夕的事情,特别是还不知道有没有这种理论、需不需要某种创见的时候。无论如何,当前的图书情报领域迫切需要国际化眼光、跨学科视角和IT应用素材,传统的理论需要继承,但不能成为包袱,也不应成为阻碍创新的籍口。
3、Lib20′07数图大会是07年我最为关注的两场国内盛会,同时也将有机会参加DC-2007IFLA’07。躬逢盛世,不容虚度。
4、图书馆2.0必 须尽快由空谈转为实践。借助国内外数次2.0会议成果,可以对几个方面的应用进行一些总结。首先希望能够利用本馆的资源,跨部门合作,进行一些探索。某些 项目也不可能以一馆或一己之力而为之,应可以以2.0形式建立虚拟小组(Working Group或Task force),或招募并培训“志愿者”,或进行“泛地区”合作。
5、本人将致力于全面考察并试验开源软件在Lib2.0的应用,以打通元数据(及本体)应用从方案到实施的全过程为重点,选择适当开发环境和工具,提供一定的范例。同时将积极参与厦大图情百科的工作。

评论(10)

2006年总评:不及格

2006是我的2.0元年,这一年绝大多数与”学术”或”研究”相关的事情,基本上都是关于2.0,这在我的”新年愿望“中是始料未及的。

花生壳早早总结了”新年愿望”的执行情况 ,大致给自己打了60分。我可能连勉强及格都算不上。但对于去年的五项愿望,也得硬着头皮交待一下:

1、煽动图林博客起来。虽然与偶的努力没多大关系,但见网络图林之火已成燎原之势,熊熊燃烧,也很欣慰。这其中竹帛斋主功不可没,景仰一个!
2、数图”统一场”论取得阶段性进展。没有完成。2.0技术和应用的蓬勃发展缩短了从理论到应用的时间,也对单一的理想化的框架提出了挑战,框架是否可行有赖于符合趋势的切实应用。本想在06年内将基于博士论文的两篇论文修改完善之后投给两个学报,以弥补本人投稿的空白,然而完善还有很多工作要做。计划近期完成一稿投了再说,供大家批评指正。
3、“上海年华”项目 。尽力了,但自己不满意。跨部门项目管理一直是大型机构难以解决的问题,年内”上海年华”项目在管理体制上有了重大改变,”落地”到具体的业务部门,对于”总体组”的职能要求有所降低,本人将继续做好咨询和参谋工作。
4、信息资源组织方面的专著。与2相同的理由,没有完成。目前从本学科角度看待信息资源组织已经有多本教材和专著了,而跳出图情领域,将信息技术所带来的诸多变化上升到哲学层面,反过来审视”泛”资源(把参与活动的”人”也作为一种资源)的组织,同时对于”泛”资源组织所涉及的各类技术进行考察,明辨方向。循着这个思路还需要做大量的工作,不是一年两年所能完成的。所以去年的这项”愿望”未免太过于雄心勃勃,当时也是为了激励自己吧。
5、减肥计划。勉强及格吧。添置了一台跑步机,也偶尔跑上半个小时,感觉体力比以前好,但由于LD(领导)并没有规定具体减肥指标,自己也就瞒天过海,找点借口得过且过啦。

2006年评语:各方面工作取得一定进展,同时,各方面工作有待进一步提高。总之:不及格。

评论(8)