九月 12, 2006

9月期Library Journal 刊登一篇名为Library 2.0的文章,作者是Michael Casey与Laura Savastinuk。标题赫然醒目,我估计这篇可视作里程碑式的,本来仅用Library 2.0为题就很自信很大胆。不少国内外知名blogger都对该文推荐介绍,海峡对岸的图书馆观点更是第一时间选译了这篇经典著作。我没赶上时髦,不过better late than never。

我的理解是,文章三个子标题即为实现图书馆服务2.0的三个要素,分别为应用长尾理论来吸纳新读者将读者用户看作协作伙伴掌握信息技术。作者在这三个部分包括最后小结内广泛引用国外图书馆实践的2.0服务,为我们提供了不少详实的借鉴案例。对于作者所表达的Library 2.0内涵,因为Casey的博客,对他的观点也有所了解,个人感觉在这一年中没有多大变化,只是更成熟更全面。Casey不像Blyberg那样的愤青也不像T.Scott那样会旗帜鲜明地表示Why I Dislike the “Library 2.0” Tag,这篇文章同样延续了他本人的特点。

文章有价值的观点不少,可能在某些人看来没有新意,不过呢,我也要翻译几段。

  • 走进图书馆2.0。在网上、会议上、行政人员办公室里以及参考咨询服务台前,这种图书馆服务新模式不时地被提及。如果你和你图书馆馆员并不像我们所说的那样探讨过2.0,那么请留意,图书馆2.0可以让目前服务于读者和与读者交流的方式重新焕发生气。
  • 图书馆2.0的核心就是用户为中信的变化。这是一种图书馆服务模式,它能够鼓励持续的有意识的变化、邀请用户参与建设他们所需要的实体和虚拟服务,这些都是由不断地评估图书馆服务所支持的。同时,图书馆2.0也尝试吸引新用户以及通过改善现有用户驱动的服务和设施更佳地服务老用户。图书馆2.0本身的每个组成部分就是在向更好地服务于用户在迈进。通过所有这些的应用,我们就能做到图书馆2.0。
  • 图书馆2.0模式需要通过掌握读者的知识来供给改善各项图书馆服务。读者的评论、标签以及评级这些读者创造的内容都能反过来充实图书馆网站。最终对于其他读者来说这些服务将是更有价值的信息产品。你图书馆的读者总是有最喜欢的图书、作者和流派,允许他们去评论写书评、粘贴他们自己的标签并评级、通过功能更强大的OPAC分享这一切,以上这些可以提高促进编目。
  • 当创造读者个性化服务时,必须考虑到读者隐私问题,图书馆仍应该像过去一样警惕通过技术手段保护读者的隐私。比如说,允许匿名评论和标签,读者使用网络服务时不需要验证身份。
  • 什么样的服务可以称之为图书馆2.0?任何服务无论是实体或者网络只要能够成功地传递給读者,有效评估并利用用户创造的信息就可以称之为图书馆2.0。只要符合之前所说的标准,即使是过去的传统的服务依旧可以够得上格。同样地,使用新技术未必就能说这是图书馆2.0。
  • 当谈到如何向图书馆2.0迈进,想想你图书馆已有但尚可改进的服务以及能够开拓的新服务,这包括技术类和非技术类的。同时考察使用的系统软件比如虚拟参考咨询、图书馆集成系统。图书馆应该不断地改进以满足读者需求。重新评估现有服务和接受应用新观点都能使图书馆服务历久常新。
  • 无论图书馆使用何种技术工具来开发,经过专业技术咨询或者内部规划后,都应该建立起对新老图书馆服务常规评估的日程安排、对馆员和读者的意见和创造的内容一视同仁。对现有和潜在读者以及馆员都应需求调查,广泛的意见才能够知晓一项服务全面的需求或质量反馈。
  • 你图书馆目前提供的一些服务可以视作为图书馆2.0。如果你的组织能够继续这些图书馆2.0服务,并且建立起不断变化和将用户创造内容整合到图书馆运作中的组织框架,那么图书馆必将更顺利地走向图书馆2.0。

Update 9/13:全文翻译见图林中文驿站图书馆2.0

九月 10, 2006

9月1日Google Blogoscoped报道Google新发布的一个小游戏Google Image Labeler(该游戏的详细玩法见)。许多相关新闻评论都提到Google Image Labeler基于一个名为The ESP Game开发的。ESP Game是由卡内基梅隆大学计算机科学系的教授助理Luis von Ahn设计的,该游戏至今在网上已流传了3年。Ahn今年7月26日在Google做了一次名为Human Computation的技术演讲。看了他演讲的大致内容,总感觉似曾相识。搜索一下,果然是前些月看到一篇关于演讲的帖子——欢迎来到矩阵世界,从该文中得知Google买下ESP产生的巨大数据库。

讲座内容没有多大变化。相比较两次演讲,Ahn对于ESP项目的预期仍是乐观,他声称只要保证每天同时在线游戏玩家有5000人,经过2个月就能标记完所有Google图片。Ahn的信心来自于一些调查的数据。人们花费大量时间在休闲类游戏,例如2003年有90亿小时在玩纸牌游戏(相比较人类用了700万小时建成帝国大厦,2000万小时开凿巴拿马运河),经过3年的运作,ESP游戏已经吸引7万5千名用户,这些玩家总共贡献了超过1500万个标签,许多人每周至少玩20小时。但事实是这样的数据量对于图片检索来说,仅仅是个小样本。另外,最近我登录ESP Game网站,发现在线人数仅有100来人,与Ahn所说的5000人相去甚远,可以说依照这种方式恐怕很难完成任务。

我认为Ahn演讲的精彩之处在于,他坚持计算机与人类之间的关系是互依共存的,因为人脑是极为先进的处理器,能够解决计算机不能解决的问题,他将所有人类智慧视比作先进的广泛的分布式计算机集群。人类能够解决一些问题,同时计算机处理其他问题,两者互补才能共同创造更美好的世界。

Ahn将他设计的四个游戏ESP/ peekaboom/ verbosity/phetch分为2类。后三者是属于不对称性验证游戏,也就是说给予配对的2个玩家信息是不同的,假设给玩家A得到的输入信息(Input),玩家B所得是输出信息(Output),玩家B就需根据仅有的信息推断出玩家A的输入信息。比如peekaboom,玩家A知道所见图片及关联的标签,玩家B就根据不断显现出的画面片段判断该标签。经过用户的猜测推断,输入、输出信息间的联系就得到了验证。相反,ESP是属于对称性验证游戏,玩家AB得到相同的输入信息并判断可能的输出信息,当两者判断相同时即得分,但是这类游戏仅局限于少量的输出信息。

类似Google Image Labeler和ESP的还有Guess-the-Googlefastr等,这些游戏真正目的在于通过让用户为图片贴上标签、利用人类智能来提高图片搜索结果的准确度。游戏玩家需要在规定时间内和同玩者默契地对尽可能多图片使用的标签达成一致或者根据对方给出的信息找到图片。在游戏过程中,搜索引擎就可以对同一图片收集所有玩家输入的标签,并根据重复次数给予不同的权值,其中两个玩家都使用的标签重要性最大。

图片搜索对于搜索引擎而言一向是个技术难点。因为机器无法有效识别图像,目前有些技术可以使计算机辨认出颜色、形状、物体、人脸等等,但是面对海量的表达内容丰富的图片,程序仅仅是通过像素的数值得出简单结论或者依靠工具和模型分析判断,这些都是及其有限的,机器尚不能从像素间的差异归纳出各种讯息,图片搜索至今仍是愚笨被动的。Ahn举的例子很有说服力,计算机很难识别出某人比如说Martha Stewart,除此之外,她还是位女性、名人、罪犯,虽然拥有强大的计算存储能力,但是很难保证辨认相片上的所有信息。所以ESP这样的游戏将人类拥有但计算机却不曾掌握的图片识别能力挖掘出来帮助提高图片搜索的准确性。

实际上Ahn的几个项目和Google Image Labeler所指的标签意义上等同于现在应用的tag。Flickr的用户们常常会为自己拍摄的照片打上十几个tag,全面地表达照片内容。其实相比较ESP等游戏,Flickr已经事先为每张图片做好详实的索引或者说对于同一个标签有不同的角度来表现,而不用等到用户玩游戏的时候再开始数据库的数据积累。当然游戏的趣味性可以让用户更积极更投入地发挥自身的作用,发现partner和自己对标记图片的标签能够达成一致意见,那也的确是中乐趣。

五月 8, 2006
Squidoo 上有一份名为Library 2.0 Reading List的lens是由Jenny Levine和Michael Stephens共同创建。(via Squidoo Lens of the Day )

从中我们可以了解到Web2.0综述和重要文献,图书馆2.0的定义、奠基文献、Meme话题、重要讨论、图例、播客,还有标签为”Library 2.0″的Flickr图片以及标签为“ALAL2” 的del.icio.us网摘的自动生成。

Jenny Levine和Michael Stephens作为西方图书馆2.0的领军人物,两人还经常搭挡,四处奔波为Library2.0传教,由他们建立这张列表是再合适不过了。在我看来,Library 2.0 Reading List是既全面又精炼的。

三月 28, 2006

Human Factors公司做的一项调查

关于调查的出发点,网站上说到,就像其他关系一样,用户先前的经验感受无论好坏都会影响到以后访问你网站的期望预期。正如人际关系,如果你想好好运作未来能够顺畅,那么就需要知道一些他们的过去。

用户对网站的预期其实很大程度上反映了他们上许多其他网站的后得到的模式/pattern。这里的模式是指,比如他们认为那里可以发现他们所需比如导航、回主页、搜索。同时用户也知道如何去控制或者避免他们不需要的比如广告。

这项调查就准备研究用户对网页上内容的预期。Shaihk和Lenz对出现在网站主页的关键元素的用户预期做调查/users’ expectations,结果发现用户非常清楚他们想要什么,这些内容在哪里以及一些他们要避免的内容和链接。

这次做的调查选取的网页元素和2001年做研究一样。他们特别关注以下5点:

  • 返回主页
  • 网站搜索框
  • 内部链接
  • 关于我们
  • 广告

他们找了142个大学生在一张5×5格的纸上在他们在网页上预期内容出现的方位贴上标签。他们发现原来调查者的预期没有怎么改变。

比如:
网站搜索


从图中可以看到用户通常是在右上角或者左边在logo下寻找。

我觉得广告比较有意思。2001年时发现用户知道网页顶部是付费广告。一旦他们发现这一点用户就会忽略这块内容。后来广告发布到网页右部,用户也也发现了。


最后调查说,尽管网民越来越多、网络技术的不断进化,用户对在网页上哪里寻找自己所需内容却变化不大。在用户不经常使用的链接方面,他们注意力就分散了比如“关于我们”。用户能明确预期到自己所注意的内容和链接。他们会关注自己所需要的内容包括搜索框、内部链接、返回主页,也会避免他们不需要的内容比如广告。

不同层次不同地区的用户对网页预期是不同的。了解用户知道他们的不同需求以此来指导网页设计。比如,你知道用户常常会去网页的左部寻找网站的内部链接,那么你这样设计。如果你的网页设计符合用户的预期,他们就会将注意力集中在内容上而不是费力气弄清楚你的网页设计。

三月 24, 2006

为期3天的第21届CIL会议开始了。2000多图情专家汇聚一堂探讨应用于图书馆的最新技术、设备、软件和服务,想必热闹非凡。今天打开Bloglines,看到许多LIS Blogger都谈到了CIL2006。小小地吃惊了一把,随即乐开了,我阅读着详细的第一手会议报道就好像自己置身于会议现场,并且是那么得真切

CIL2006共有3个主题演讲分别安排在每天上午9点至9点45分。另本次会议有超过百位演讲者同时在4个分会场进行。这三天的报告无疑是密集的,信息量也是巨大的。今天看了第一天的报道,内容实在丰富,还没等我看完,第二天的会议资料又开始出来了。所以还是先贴些会议背景信息吧。

  • 地点:华盛顿特区希尔顿酒店
  • 时间:2006年3月22日至24日
  • 与会人数:2386人,比去年增长约15%,其中发言人和各会场主席共150人
  • 参展商:60家

三月 22, 2006

博客引爆的流行让企业逐渐认识到,原来这也是一种营销和公关的渠道,通过博客企业可以更快更广范围地获取客户的注意力。接下来的问题是,实施这一做法后的效果该如何评估。

今年2月中旬,英国Onalytica公司写了一份名为Who are the Most Influential Authorities on “Business Blogging”?报告。(via sayonly)重要部分摘抄如下:

1)报告一开始Onalytica就指出我们所认为Technorati对Blog的排名是按影响力/influence来的,但事实并非如此。Technorati根据指向博客的链接数量对博客进行排序。所以确切来讲,Technorati 依据的是流行程度/受欢迎程度/popularity做评估而非影响力;

2)宣称Onalytica从不强调使用权威性/authority这个指标,而是更关注影响力。同时不得不承认,权威性、影响力和相关性在这里的含义确实极为接近;

3)指出无法用流行程度来体现博客的影响力,相比较,博客反向链接的相关性更能体现博客的价值和影响力。该报告的作者Flemming Madsen对此举例说明。Madsen 在Technorati中搜索“禽流感”时,Google News排在了首位,Engadget也曾两次出现在首页搜索结果。从Technorati的排名机制来看,不难理解,这是因为Google News和Engadget拥有更多的反向链接。可事实是,无论Google News和Engadget都不是禽流感方面的权威。

4)那么影响力、权威、相关性之间有何联系,又应该怎样去评估博客?

前提是,Onalytica认为当信息资源被引用时,行为主体是因为觉得该信息是与其文章/网站/博客是有相关性并较其他信息更令人信服(不考虑行为主体的知识局限、信息不对称所造成的错误判断)。

首先,定义一个检索标准,也就是简单地制定一些规则。

其次,根据事先设定的标准,开始收集含有“business blogging”或“business blog”短语的信息包括网页、博客、pdf文件、各种文档等,发现其中的引用URL或者文本链接。(注:比如短语“The White House”与超文本链接www.whitehouse.gov在本研究报告中是一样。)

然后,提取这些引用链接,并经过一些人工干预,将这些链接转移到根据Leontief的理论得出的算法。

最后,根据算法得出相对的影响力排名,排名结果见Issue Influence Index。

5)Issue Influence Index是一个相对的、线性的判断影响力方法。指数1表示影响力不大,但还是有些影响力。随着指数的增大,影响力也随之扩大。指数为4的机构影响力是指数为2机构的2倍。

6)第4点中所说的Leontief,全名Wassily Leontief。其研究方向名为投入产出分析(Input/output analysis),致力于判别不同的经济领域是如何相互影响。Leontief利用数学矩阵解决了复杂的经济问题,并解决了一直以来难题“circular influence”(循环影响?)。鉴于其重大贡献,Leontief获得73年的诺贝尔经济学奖。

下表就是该研究成果,展示了在“business blogging”这个话题上最有影响力的25个机构/博客/媒体。

刚好,前天收藏了一个测试博客影响力的网站BlogInfluence (via PostShow)。

网站按照公式[(blog+posts+web links) + (Bloglines subs * 2)] * 1+(Google Pagerank/10)得出博客影响力数值。其中blog/博客反向链接数和posts/博文数量的数据来自于Technorati,web links的数据来自Yahoo。

关于这个网站我有太多疑问,站长Gorka Julio博客上有相关介绍,应该有些解答,可惜是西班牙文无法看懂。当然像这样的测试也只是做着玩玩,也就无所谓。

不过,我发现对互联网各种新媒体的影响力评估讨论得越来越多。前面报告中对商业博客话题影响力的排名研究,后面这个网站对博客影响力的研究。另外还有口碑营销该如何量化其效果其影响力,博客营销的商业价值该如何计算等等。我始终认为,我们可以通过各种算法公式对这些看似抽象的概念进行量化有效地评估其效果和影响。问题就是该如何去分析计算。目前的尝试探索,我想都是对解决问题有启发有帮助的。

三月 21, 2006

Reading 2.0会议上周在旧金山召开。虽说是为期两天,但其实主要演讲是集中在3月16日。与会者来头都不小,K师在其网摘中也曾提到。

Reading 2.0会议是由加州数字图书馆的Peter Brantley组织。Brantley在博客中引用了Thomas Jefferson的一段话

Were it left to me to decide whether we should have a government without newspapers or newspapers without a government, I should not hesitate a moment to prefer the latter. But I should mean that every man should receive those papers and be capable of reading them.
- Thomas Jefferson

这段文字中“newspaper without a government”和最后一句“every man should receive those papers and be capable of reading them”,可以窥探出读者/用户的信息透明和信息自由获取应该是为这次会议举办的主题,也是需要解决问题所在。

会议安排和会后上传的演讲PPT来看,议题都是现在热门的话题。首先引起我关注的是Lorcan Dempsey的演讲内容。Dempsey通过展示OCLC的FictionFinder项目,简单地介绍了FRBR。

Dempsey提问,到底什么‘book’?这里打引号的book,应该是泛指书籍。Dempsey后面说到,book是有层次的并存在于不同的层级中,FRBR就是划分层级的模型。经典的FRBR图例清晰地展示着各实体的层次及其之间的关联。

  • 作品/Work是不同的知识和艺术作品,如Huck Finn;
  • 作品的实现也就是知识艺术作品的实现就到了另一层次表达方式/Expressions,如Huck Finn的未删节法语有声读物、英文版、评论版;
  • 表现形式/Manifestation是作品的表达方式/的具体实现,如:1954年企鹅出版社的版本;
  • Item是表现形式的具体实例,如:我现在手上的这本书。

从上面的分析,可以看出,只有Item是实实在在的实体书籍,其他都是虚拟划分的概念层次。

OCLC的研究人员依照FRBR模型来设计算法,聚合相关著作。FictionFinderTop 1000 works就是两个FRBR的具体应用项目。

Dempsey介绍的FictionFinder研究项目不仅可以让读者查找到不同表现形式/Manifestation的图书,同时可以利用元数据进行搜索、筛选、排序。

经过数据库的改善和Bug更正,目前展现在我们面前的FictionFinder已经是比较成熟了。比较Dempsey演讲采用的截图,我们所能明显感受到的不同是,其上下网页框架变为左右。

FictionFinder项目的作用在于根据FRBR模型,重新组织书目数据库以反映信息资源的概念结构,更好地组织、展示书目数据。对于用户来说,FictionFinder原型系统能更全面地检索浏览到书目记录。

OCLC在应用研究FRBR时采用的书目数据都是来自于WorldCat。Dempsey演讲中引用了一些研究数据,值得参考。

在WordlCat中按FRBR层次划分,作品有4740多万条书目记录(其中印刷版的书目记录有2850万条),5990万条表现形式层次的记录(其中印刷版的3530万条);就作品来说,有1种表现形式的为所有作品总数的87%,这部分书目数据在WorldCat书目数据库占到总量的43%;12%的作品拥有2-5种表现形式,占整个数据库40%;大于5种表现形式的占1%,占总数的17%。平均下来,单元作品/Work的表现形式为1.3种,也就是说大部分的作品只有一种表现形式。

相应地,印刷版作品在WorldCat的数据如下图:

在PPT最后,Dempsey列举了其他FRBR应用实例,并提供丰富的FRBR理论研究和应用项目。绝对是了解研究FRBR的丰盛大餐。

1、注:

Work:作品

Expression:表达方式

Manifestation:表现形式

2、相关阅读:

关于Reading 2.0会议:

会议日程安排

与会组织

与会者

Tim O’Reilly的会议报道

Reading 2.0会议演讲PPT下载

3、近期FRBR博文:

书目记录的功能需求(FRBR)简述(注:后面的评论好!)

回答关于FRBR的一个提问