这几天做了点homework,想搞清楚什么是社会化搜索,英文是social search。有人称社会化搜索为“人肉搜索”,虽然夸张,但也很形象。我觉得所谓“社会化搜索”多多少少有些取巧,国内的媒体更是这样。 

其实问题很简单,大家也早就知道,来自于对现在的搜索结果的不满意。信息量巨大,动辄搜索出十几万个结果,而用户需要的是那个正确的结果。往往是想要的结果被淹没在一堆垃圾信息里了。 

为了解决这个问题,大家是八仙过海,各显神通。研究人员从理论上进行攻坚战,希望从人工智能、语言语义、模式匹配、神经网络等各个角度寻找解决方案,但收效不大,即使有方案,也因为成本太高,无法应用。 

另外一波人在走一条取巧的路,其实google本身就是这样,用的是page rank的方法,在index的基础上,使用网页之间的关联度来确定搜索结果的排序。社会化搜索基本想法是用你的朋友来做过滤搜索结果,使搜索更加精确或者说对搜索者更有意义。针对于google的page ranking,有人说这叫people ranking。 

基本想法就是想办法从用户以往的搜索行为中学习,并改善对用户的下一次搜索结果排序,使搜索结果与用户的兴趣更加相关。学习的对象包括用户自己,与用户有相同兴趣的人,和其他人用同样关键词做搜索时的行为。这就是所谓的社会化搜索的基本理念。与普通的搜索不同,社会化搜索要求用户注册,以便纪录用户的搜索行为。 

对如何学习的不同理解,带来了不同的模型。一种是要求用户输入很多信息,基础是所谓的custom search。Google和Yahoo等都有类似的产品。新的公司里比较有名的有Rollyo和Swicki。在此基础上,再根据用户的搜索行为和具有相同兴趣的用户的搜索行为调整搜索结果。我不知道这两家是如何定义和寻找所谓的相同兴趣的用户的。 

可是,用户在搜索的时候是很懒惰的。要想让用户主动地参与到学习中,是非常困难的。另外一家我觉得做得更好,是collarity。它不要求用户输入任何信息,我比较看好。还没有时间研究它的具体机制。 

Business Week上有一篇以social search为题目的文章,说微软在social search中比较有优势,主要观点是MSN有300M的IM用户和hotmail有230M的email用户。而social search的基础是community足够大,这样才能互相学习和参考。似乎有点道理。另外提到有传言,微软要买Swicki。如果是真的话,我觉得微软可能又是失败者。Swicki可能永远难以成为大众化的服务,而Collarity会成功。原因很简单,swicki依赖用户的参与太多。至少我就没有完成注册。 

国内的我还没有认真看,知道有两家:deyeb.com和bbmao.com。不太喜欢deyeb.com。主要是从他们写的文章上得到的印象。