一月 24, 2006

目前所有的RSS客户端阅读软件都存在一个明显的弊端,即每当阅读一个Item详细信息的时候都要请求到Item服务器进行在线阅读,而不能像摘要那样脱机浏览。这对于不能联网的用户和习惯于脱机浏览的用户来讲,实在是一个无法克服的障碍。

在RSS中只输出摘要的弊端还不仅仅只在于此。由于大多Item全文不像RSS一样有固定的格式,RSS提供者以不同的输出方式提供Item,有的是网页,有的是XML,有的是纯文本,如果配合RSS匹配全文,其解析步骤也是十分麻烦的一个环节。这是在做RSS搜索引擎的时候遇到的一个棘手难题。

基于RSS的搜索引擎的数据源依赖RSS,但目前的大部分BSP及RSS提供商都没有输出全文,这势必会造成数据索引的不完整,导致数据检索的准确性和覆盖面降低。没有了全文,搜索引擎只能对Item标题和摘要建立索引,搜索范围也仅限于标题和摘要,与传统搜索引擎相比,RSS搜索引擎在命中率和数据输出上显得太过于单薄。

如此一来,一个完全的RSS搜索引擎必然的基础是RSS的全文输出。这就要求RSS提供者们能够提供一个有全文输出的RSS,而不仅仅是摘要,然而,对于RSS提供者的经营商们来说,这无疑是要了他们的命,是不可能完成的任务。对BSP及其他RSS提供者来讲,RSS是一个工具,一个非常重要的工具,这工具不是用来共享内容分享内容传播内容,而是用来增加PageView用来吸引用户用来借助更多的客户端增加页面点击数字的一种手段。

没有全文的RSS,Web仍只是停留在Page阶段。而RSS搜索引擎的开发者们也只能由每个Page入手,分析提取全文,才能为用户提供更为准确详尽的搜索结果。RSS搜索引擎与传统搜索引擎相比在精度上有更高要求的需求,而提取精准的内容,就势必要对每个Item的目标Page作出精准的解析。这对开发和带宽来讲都是一种消耗。

当然,全文输出的RSS,也会存在一些弊端。比如对一些令人讨厌的SEO们来讲就有了更多的用武之地。然而这些潜在的负面因素并不足以影响我们对RSS全文的需求。

只有当RSS全文了,分享才会简单起来。

2条评论 »

  1. 严重同意,RSS应该可以抓取全文进行脱机浏览。

    评论 由 cat — 十一月 20, 2008 @ 7:12 pm

  2. 谢谢,明白了不少知识。

    评论 由 大蒜头 — 十二月 12, 2008 @ 3:16 am

RSS方式的评论。 TrackBack URI

发表评论

提示:如果你刚刚提交过评论,但是还没有被显示出来,请点击这里刷新一下: 刷新评论