二月 3, 2008

新浪科技最近又推出了个千万量级的科技博客徐荣祥,标题是:科学家徐荣祥的科学博客流量过千万(Link)。

徐 荣祥教授自2007年12月初在中国最大的门户网站新浪网上设立了博客以来,连续公布了他的生命科学前沿研究成果,到今天刚刚两个月的时间,博客流量已超 过一千万。在这两个月的时间里,徐荣祥教授公布了他全新的研究完成的生命科学前沿的科技成果文章40篇,每一篇文章都是论及人类生命的疑难症结和生命科学 最前沿研究领域。

徐荣祥称,以最快的速度将自己科学研究的成果以博客的方式公布,其目的有二:一是可作为其他科学研究人员借鉴,二是作为老百姓可直接将研究的成果拿来享受。“我选择博客方式,就是想利用现代的电子网络平台,快速地告诉大众。

乍一看很有点科学2.0的味道,徐荣祥是谁?Google了一下,这个人还是2007年新浪蒙牛网络盛典-公益奖的得主(Link)。M. Kaku是网络上的科普明星,他玩的是Myspace,深受美国青少年的喜爱,当然最重要的是Kaku确实是个科学家,很不错的理论物理学家。而这位徐教授,他官方主页上的介绍是这样的:

徐 荣祥教授,毕业于青岛医学院医疗系。现任美宝国际集团董事局主席,北京荣祥再生医学研究所所长,中国中西医结合学会烧伤专业委员会主任委员,中国烧伤创疡 科技中心主任,《中国烧伤创疡杂志》主编,中央国家机关青联副主席。他是美国国际人道主义奖第六位获得者;国务院1991年授予的有突出贡献的科学家;是 中国杰出青年科技创业奖获得者。同时兼任:中国中西医结合学会常务理事,全国烧伤创疡医疗急救网技术总指导,中国青年科技工作者协会副会长,中国科学会堂 专家委员会委员和国际烧伤学会成员。

徐荣祥号称是中国最有争议的科学家,这个称号难说好坏,从字面可理解为另类,不按常理出牌。美国有个文特尔, 当绝大多数遗传学家想着把基因组数据作为全人类共同财富共享的时候,他想的是利用这个数据去赚钱,所以他把自己的基因组测了一遍,和全球合作的人类基因组 计划同时发布。徐荣祥在赚钱的意识上可谓一点不比文特尔差,但看看他作的事情,就不得不怀疑这个人除了财迷心窍,还很可能是个骗子(Link)。

他赚钱的大概思路就是办了个杂志《中国烧伤创疡杂志》,申请专利,通过办学习班赚钱。至于专业圈内,比如外科烧伤学的权威黎鳌就明确对他的所谓学说进行了坚决的否定。而生物学家邹承鲁则更是认为其连基本的概念和定义都无法沟通(Link1Link2)。

近 些年,生物医学领域内的民族牌越来越多,比如有外国友人不远千里来北京的某疗养医院来治疗不治之症。越是不治之症,越是希望奇迹发生,越是高收费,这里的 “商机”可谓无限。而不良媒体对此则是推波助澜,10多年前有很多河南人在健康报纸上大打广告,称能不手术治癌症,钱汇过去给你寄包土回去。

徐荣祥可谓是这种骗子的升级版,他申请专利,自办研究所,主编杂志,捐钱买名。总算还有个治烫伤的土方子,但也就是治疗浅度烧烫伤的一个选择。现在徐荣祥则在新浪博客上忽悠起治疗癌症和干细胞了,看来他又要有新药推出了。

有趣的是在Web2.0的时代,徐荣祥的营销术也相应地升级到了2.0,凡是有相关的新闻评论或论坛讨论,就有大量吹捧徐荣祥的口水帖。(Link

学上没有平坦的大道,实践的长河中有无数礁石险滩。只有不畏攀登的采药者,只有不怕巨浪的弄潮儿,才能登上高峰采得仙草,深入水底觅得骊珠。

向往健康,向往美好的生活,我相信徐教授能给我们带来新的生命极限突破!支持教授!

相信他用全营养食疗法攻克癌症 很快就会体现在癌症患者身上,给癌症患者减轻病痛的折磨。

可悲的是,一向以第一网媒自居的新浪似乎在扮演很不好的角色,徐荣祥的博客被力推,即便不说是骗子,但带有明显商业目的和自我炒作的人物被评为公益人物。新浪如此不遗余力地强奸网民智商的解释只有一个,那就是他们收了徐荣祥的好处。

九月 22, 2007

Keso最近写了一篇搜索大战 Game 已经Over。这是一个有趣的话题,不妨再多说几句。百度在国内市场的占有率其实比Google在国际市场的占有率要高很多,但百度未必比Google更乐观。Google有象Yahoo和微软那样强劲的对手,但事实上即便是Yahoo和微软,也没有占到Google的便宜。

百度在 国内市场几乎没有过像样的竞争对手,真正有实力的竞争对手,一个是进入中国的Google(谷歌),一个是雅虎中国,全部有国外背景。搜索很大程度是依赖 于技术的,国际公司在纯技术领域占有很大优势,就这一点百度是令人尊敬的。二来国内做互联网有捷径,传统媒体的落后给新浪模式提供了成功的捷径,这种模式 下成长起来的企业强烈地依赖于编辑和事件,而编辑的文化某种程度上与工程师的文化是冲突的。新浪放弃搜索确实无奈,但也是必然。

谷歌仍然有可能对百度构成本质性的威胁,事实上Google在进入中国大陆前,在推出Google.cn前,其口碑和产品品质并不差。懂不懂中文的 问题,其实不存在,语言文化壁垒在搜索这个产品上远比想像的小,况且Google在美国就能雇到很懂中文的工程师。谷歌拥有的优势是显然的,如果说百度是 搜索的象征的话,Google更是,每篇对百度的报道几乎都要提一下Google,从这个角度谷歌会长期对百度保持压力。

 最近三个月的数据说明,谷歌已经无限接近搜狐和网易,但谷歌远未达到人们对它的预期。

就搜索本身,Google并没有太大问题,我甚至更满意进入中国前的Google搜索质量,Google唯一的问题是访问不稳定,包括 无法使用网页快照,这两项很大程度是政策决定的,可以认为是Google为了更大的利益而不得不作出的牺牲,但这两项足以使大多数人逐渐远离 Google,使用百度,特别是百度中文搜索本身并不弱于Google,如果对英文搜索没有特别需求的话,Google成为第二选择是自然的事情。

百度和Google并不只有搜索引擎, 通用搜索之外的产品,百度全面占优。mp3搜索是很中国国情的产品,Google短期内不会推出。贴吧、知道和百科这些所谓社区化的搜索,也是百度的强 项,Google英文不会推出自己的百科,只需要把流量不断地“送”到非商业的wikipedia即可,Google版的知道(Google Answers,收费服务)刚刚关闭,但我估计Google未来仍有可能重开类似服务,并采用免费的策略。Google Groups很好,但国内访问不稳定,贴吧和Google Groups是很不同的产品,贴吧更接近新浪的新闻评论,但贴吧按主题汇聚资料和评论显得更有价值,从这个角度Google除了Groups外,应当向百度学习贴吧。

谷歌在国内合作的动作很多,比如:天涯问答天涯来吧,但感觉这些服务都疏于管理,好像即不属于谷歌也不属于天涯。当然要想赶上百度,仅仅模仿是不够的,谷歌也有自己的优势,比如:网络广告方面,Google Adsense要比百度精准广告强,一方面是技术,另一方面则受惠于Google广告客户的国际化。

请继续阅读:

  1. 搜索引擎的新机会
七月 10, 2007

使用my.donews.com的感觉越来越糟糕了,以前的问题是垃圾评论太多和白天服务器太繁忙无法正常发贴。好在我更多的是在晚上写Blog,并且加上了超级严格的评论规则,所以影响不大。

最近又出现了新问题,在我一时冲动把关于页面的名字改为/about-this-blog/后,就不断出现以下警告:

Warning: unlink(/data/my.donews.com/wp-111/wp-content/index.static/q/i/qiji/index.html) [function.unlink]: Permission denied in /data/my.donews.com/wp-111/wp-settings.php on line 36

虽然不影响发贴,但发贴后新发的文章都上不了自己的首页了。看一下http://my.donews.com/qiji/ 还停留在2007年7月3日,但RSS订阅却又是好的,更新正常。

我也不知道这个问题是否是my.donews.com的普遍性问题,总之这是一个有待解决的问题。

七月 7, 2007

中国大百科都是国内相关领域学术权威或相当资深的学者所写,但并不意味着没有软硬伤。比如历史卷关于贝利萨留(Belisarius)的词条里说:

 据拜占廷史学家普罗科匹厄斯遗著《秘史》记载,贝利萨留晚年双目被查士丁尼一世弄瞎,沿街行乞。

正好最近在读普罗柯比(Procopius,大百科里译作普罗科匹厄斯)所著,吴舒屏等译,上海三联书店出版的《秘史》一书,可惜并未找到相关记述。而我查阅wikipedia.org中Belisarius的词条发现上面是这样陈述的:

 According to a story that gained popularity during the Middle Ages,
Justinian is said to have ordered Belisarius' eyes to be put out,
and reduced him to the status of homeless beggar condemned
to asking passers-by to "give an obolus to Belisarius"

也就是说并没有明确提到这个传说是出自普罗柯比的《秘史》,如果真是这样,者可算是大百科中的一个硬伤了,基本事实的错误。

大百科中还有一个问题,即中立性的问题,作为工具书,大百科的任务是提供资料和信息而并非替读者作出判断。由于时代的局限性(也影响到今天),大百科和其他一些我们认为的非常好的图书资料中都存在中立性的问题。

从这个角度,以协作形式书写的网络百科是有其优势的,比如我在百度百科“柏拉图哲学”条目中曾看到反动哲学家云云,本想用来做个反例,但今天再去看时已经被改没了。

不过,我在互动维客里发现了个中立性问题,在“物理学革命”条目,可看到:“物理学革命也带来了自然观的革命,使几个世纪以来在整个自然科学领域中占统治 地位的机械唯物主义自然观终于让位给辩证唯物主义自然观。”虽然每个哲学流派都努力从物理学的最新进展里找支持。但如果讲物理学革命对哲学的推动,倒不如 讲卡尔·波普尔的可证伪和库恩的范式。

套用罗素的观点,互联网的出现本身并不会使我们进步,因为谬论和真理一样容易传播。如果没有言论自由和理性独立的精神的话,互联网也并不能使我们进 步。(罗素的原话是:只在有言论和批评自由的地方,印刷品的广泛流通才有助于人们的探索。没有这种自由,真不如目不识丁倒好些。pp223)

七月 3, 2007

本日志最新更新:

  1. my.donews.com问题频频小结
  2. 关于伯罗奔尼撒战争的笔记
  3. 在中国大百科里挑错

所谓Web2.0是一个在国内逐渐烂掉的概念,但如果我们看一下国外典型Web2.0网站最近流量的走势的话,我们会发现,Web2.0并不完全是泡沫,至少从流量的角度它们已经相当可观了。

查看更多精彩图片

上图是国外主要Web2.0网站与百度流量的比较:蓝色为Youtube.com,褐色为wikipedia.org,土黄色为myspace.com,青色为craigslist.org,黑色是baidu.com。

如果遵循C2C(copy to China)的思路的话,我们可以把这些在国外成功的经验复制到中国来,事实也确实如此。比如大量分类信息网站是复制自craigslist.org,无数视频网站是复制自youtube.com,新浪博客、百度博客、还有和讯博客等等则越来越象myspace.com。

但也有个有趣的现象,就是几乎没人复制wikipedia.org,看着Alexa流量榜上维基百科(wikipedia.org)逐渐超越myspace.com,甚至百度。大家多少会投来惊讶和羡慕的目光,于是一个问题产生了,为什么没人在中国复制维基百科的成功呢,如果要复制,又应该如何操作呢?

说几乎没有,并不代表真的没有,大致罗列一下有以下几类:

  1. 百度百科,依托于国内最大的搜索引擎,同时也是流量最大的网站,百度百科应当获得相当的流量,从Alexa数据看,1%左右,低于贴吧(10%),和知道(5%)。
  2. 门户网站设立的百科栏目:代表是爱问辞典,这个产品新浪其实并未发力去推,只是爱问下的一个小栏目,而爱问本身推出后,初期虽获得一定赞誉,但不久即受到百度知道的阻击,事实上并未发展起来。最近网易也有类似百科产品推出,但似乎仅限于体育等个别频道。
  3. 独立百科站点:代表是互动维客,这是一个商业化运作的百科网站,有完整的团队和开发实力,除百度百科外,很可能是最有影响力的中文百科。
  4. 维基百科的中文版,目前国内无法访问。
  5. 个人或机构百科网站,这类网站多如牛毛,大多采用维基百科提供的工具(或类似工具)和数据。也有不少是为专门领域(如:量子化学维基)等开设的。

不可否认的是中文百科依然是中文互联网环境下被忽略(低估)的一个网络应用。相比于博客的深入人心,不论是维客还是维基都还是相对小众的概念。从这个角度我们可以说在中国复制维基百科还有机会,但我们应如何复制呢?

百科词条的写作不同于博客的写作,其门槛显然更高。如果说任何人都可以写作博客的话,百科词条的创建者一定是这个领域的权威,或拥有与权威相当的知识层次。不信,你写个最简单的词条试试,比如:物理学?当然词条的协作,编辑行文,补充一些资料,增加一些参考网址要简单得多,爱好者或Fans就可胜任。当然管理员的管理、协调组织工作的重要性相应就显得重要起来,合理完整的机制要从一开始就建立起来。

巴别塔一夜是建不成的,除非抄袭,灌入维基百科现有数据,从大百科全书或其他网站上抄等都是捷径。这样做确实存在版权的风险,但如果能够把这些抄袭来的词条及时地进行扩充编辑,也是可以接受的。即便如此,百科词条的获得依然是高成本的,因为其涉及专业性,非一般编辑所能胜任,否则你怎么和大英百科去比?从这个角度,获得10000个高质量百科词条的成本一定高于获取10000个视频的成本。后者是流程化的,流水线化的操作,前者则涉及专业性的写作,很难流程化。

那么英文版wikipedia.org近乎海量的词条是如何而来的呢?这当与互联网在国外的早期发展有关,互联网最早即是以教育、科研、国防之目的而发明的,也就是说在英文互联网环境下,本身已具有无数的技术性资料,教育资料等等。所以wikipedia.org词条早期的撰写者可以利用GPL下发布的一些资料进行汇编。从这个角度,发展中文百科首先面对的就是缺少汇编对象,直接抄大百科是个捷径,但也是毒药。相比较而言,组织网友力量系统地翻译英文wikipedia.org的词条不失为一个稳妥的方案。

为什么说抄袭是发展百科的毒药,是因为一个稳定健康发展的百科全书全仰仗于其贡献者,如果贡献者无私奉献,它就成功,否则就会成为无人耕耘的杂草。为了追求数量,大肆抄袭,漠视作者的著作权和署名权,会打击这些作者和其他作者成为词条的贡献者。狄德罗在编撰其著名的百科全书时,尚且与其出版商讨价还价,我们今天的作者就愿意集体成为活雷锋而无私为你奉献?

wikipedia.org本身发展的经历也给我们类似的启示,维基百科创始人本来是要搞个商业化公司的,但一直没进展,后来索性把代码开源了,网站也非商业化了,才逐渐有了今日的成功(流量上的,而非金钱上的)。非商业化运作意味着维基百科不赚钱,我也不以赚钱为目的,所以词条的奉献者自然也没有红利可分。激励奉献者去写作的动力就变成了参与公共事务,分享知识等。从这个角度说,wikipedia.org构成了互联网上的一个公共空间,大家在这里学习知识,讨论学问等。这就好比是网络时代的公共图书馆,公益的色彩非常浓厚。当然Google也可看作是公共图书馆,并且也是成功的商业。不能排除中文百科领域可能会出现一个成功的商业性网站,但如果我们总结wikipedia.org成功的经验的话,我会说这是纯公益组织在互联网环境下成功的一个典范,是网民对过度商业化互联网环境的反动。

从这个角度,我们更加期望在中国出现一个纯粹公益性的百科网站,退而求其次我们也会期望有一个恪守中立编辑立场、提倡理性、严谨严肃的百科。

相关阅读:

  1. 维基WIKI无法访问
  2. wiki真是巴别塔?
  3. 维基百科欲赎版权出版物自由身
  4. 好口碑与赚钱:商务印书馆 Vs Google
  5. 保留理想:没有商业模式的互联网

搜索引擎已经是互联网上很标准,很成熟的应用了。但从技术和功能的角度仍有创新的机会,也许后来者还有机会。

如果我们回顾搜索引擎的发展历史,我们会发现技术主导的网页式搜索和人力主导的分类目录几乎同时出现,但最终雅虎式的分类目录引爆了流行,并使雅虎成长为 流量第一的网络媒体,当然这中间的功劳并不能全部归功于雅虎分类,但我们不能否认雅虎分类是雅虎其后一系列发展的第一推动。

令人惊讶的是早期成功的网页式搜索AltaVista等并没有象雅虎一样成长起来,个中原因很复杂,简短说AltaVista等确实是成功的产品,并产生了巨大的搜索流量,但它并未找到赚钱的门道。

Google的成功可以归纳为两点,第一:对网页搜索而言,排序很重要,PageRank算法给出了一个网页评价体系,保证质量最“好”的网页会出 现在搜索的前面。这从某种程度上消减了雅虎分类目录的优势,人力主导的网站目录最大的优势就是质量。第二:Google找到了盈利的途径,在有了流量之 后,按关键字,按上下文出售文字广告,用流行的话说就是Google找到了长尾市场。

至此技术主导的网页搜索占了上风,雅虎自己也很快意识到了这点,收购了除Google外几乎所有提供搜索技术的公司,网站首页则不断改版,原来的主打分类目录已经快找不到了,首页风格更象精简了的报纸网站。

这时,第三种概念出现了,社区化搜索,其实没什么新鲜的,就是利用论坛(或其他通讯手段/形式),问别人而已。百度知道,新浪爱问和雅虎Answers等是其代表。反倒是Google未曾切入这个概念,Google原先有个付费的问答平台,也已在实验室阶段被放弃了。

那么,除此之外还有哪些搜索引擎的新机会呢?

I.可定制的搜索引擎

这里所说的可定制,指的是搜索排序可按个人搜索习惯或需求定制。网页式搜索引擎的质量其实就是排序保证的,但实际上并不存在一个让每个使用者都满意的搜索排序。

比如我搜索:XXX,对于99.99%的网络搜索者而言,这意味着性,一些有趣的图片或视频。但对物理学家而言,这是:xxx.lanl.gov,最著名的预印本网站。(类似的例子,我们还可以举蛋白质,学生搜索蛋白质是为了学习,普通人是为了保健知识,厂家则可能是为了猪饲料。)

搜索XXX,xxx.lanl.gov在雅虎里的排序是第四,在谷歌中是第五,在Google中则是第九,略去百度,因为它只懂中文

实际上在几年前,Google搜索XXX,xxx.lanl.gov可是高居第一的,这个可以解释为xxx.lanl.gov拥有很高的 PageRank,因为几乎每个大学的数学系、物理系和计算机系都会有它的链接。但现在xxx.lanl.gov的排名稳步下降,清晰地告诉我们 Google排序算法的复杂性和不断改进,除PageRank外也许还要考虑点击展现比率等。

这样做的后果是,大多数人在大多数情况下会欢呼Google的搜索给他们带来了便利。但他们也会在很多情况下,抱怨Google。事实上不可能存在对所有用户,所有情形下都适用的通用网页排序法则。在这个时候,推出可以定制,可以学习的排序机制就是必要的。

如果推出可定制的搜索服务,Google具有天然的优势,它的人力资源构成,庞大的用户信息等都是保证Google未来在这一方向成功的重要因素。

II.一键式搜索

网页式搜索的另一弊病是需要人力从十几,二十几网页中挑选打开哪一页。因此获得所需信息至少需要搜索、选择网页、阅读、再选择网页、再阅读……的过程。如果我们能把这个过程缩减至最少,对于用户来说就是最舒服的搜索体验,对搜索引擎来说则是最高效的。

而把以上过程缩减至最少就是所谓一键式搜索,不论你键入什么关键词,直接出来的就是你需要阅读的网页,里面信息足够丰富,可为进一步阅读的起点。

由以上叙述,我们可知一键式搜索很类似于综合搜索,综合搜索是把网页搜索、图片搜索、字典等搜索结果集成在一个网面中呈现。从实现的角度说综合搜索 是很容易的,而一键式搜索似乎没有那么容易。而就搜索体验而言,综合搜索其实并未比普通网页搜索有本质提高,究其原因是人们在搜索时对纯粹文字信息的需求 是占了压倒性优势的,此时把图片等一并集成往往并未本质地改进搜索质量。即综合搜索并未缩短:搜索、选择网页、阅读、再选择网页、再阅读……的过 程。

体验一键式搜索的最好范例其实是维基百科,或基于其上的Answers.com。维基百科可看作是人力主导的搜索(或信息组织方式)的进化版本,输入一个关键词,可直接进入词条,而该词条经众人协作写作,几乎已是互联网上的最好参考。

如果我们看一下最新的Alexa排名的话,我们会惊讶地发现,维基百科(蓝色)已经悄悄超过百度(褐色),QQ(土黄色),新浪(青色),Ask.com(黑色,美国第四大搜索引擎)等我们熟悉的网站了。

当然这经过了一个漫长的过程,

这里我们不讨论如何复制一个维基百科到中国的话题,但维基百科的成长告诉我们,一键式搜索这个概念确实是成立的,它有可能代表着搜索引擎的未来发展 方向。但纯粹使用机器的智能来汇总,编写百科全书确实是个挑战。换个角度,我们不难发现对于Google这样的搜索引擎巨头,鼓励CC确实是它们的利益所在。

六月 22, 2007

如果单讲流量,百度百科勉强可算是个成功的产品,用的人很多,人气超过爱问开放词典互动维客,当然还有暂时无法访问的中文维基等同类产品。

但是与标准的维基百科相比,百度百科甚至不能算是个“百科”,它其实是个贴吧。虽然换了名字,换了个皮,它还是贴吧,而不是百科。

随手Google一下,就能得到不少例子:

  1. 百度百科大量词条转贴而并非作者原创
  2. 百度百科,抄袭不改名?

这样的例子可谓数不胜数:

比如:羊皮纸羊皮纸。象百科词条这种知识性很强的东西,进行适当的标注是很必要的,百度百科在这个例子里进行了复制,但忽略了出处,或者是参考资料的来源。

比如:波里比阿 VS 波里比阿。原始出处的文字是摘要地译自英文维基,所以给出了Answers提供的维基词条链接。百度百科的复制者们一样也无暇复制出处,最下面波里比阿密码原始出处是个表格,到百度百科那里成了纯文字,幸好表格不算复杂,否则就要误导读者了。

更多例子:

  1. 三桨座战船 VS 三桨座战船。百度百科只能上传单图,使词条的表现力不足。
  2. 楼船 VS 楼船

从这些例子我们可以看出,百度百科的贡献者并非知识的爱好者,更非所贡献词条的专家,而仅仅是百度积分爱好者或积分奖品的爱好者。这样获得的词条质量如何保证非常令人怀疑。随便翻开一册中国大百科全书,你会发现其作者恰恰就是该领域的权威,如果翻开最著名的狄德罗百科全书,你会发现:狄德罗,达朗贝尔,伏尔泰,卢梭等一系列如雷贯耳的名字。专业性是任何一部百科必须保证的,即便是“草根”参与的协作式百科全书——维基百科也是如此,专业人士而非小偷们在维护着维基百科。

百度贴吧以操作简单获得了成功,百度百科似乎有意遵循这一原则,简单到不能再简单,但一个无法输入最简单数学公式的百科,无法制作最简单的表格,无法上传多图的百科是不是太简陋了呢?确实操作的简单,保证了百度百科象贴吧一样的人气,但功能的简陋注定会丧失专业并且有责任心的词条贡献者。

相对百度百科而言,wikipedia.org是一个更加理想的百科平台,没有广告,不是公司,打消了词条贡献者的疑虑。而从属于公司架构下的百度百科,即便暂时没有广告,也很难说服专业人士去产生内容,除非去帖小广告。这个是百度百科最大的硬伤,如果退而求其次,不如免费使用聚合wikipedia.org(或其他第三方百科),并注明出处,就好像Answers.com所作的那样。

三月 22, 2007

百度推出日文站,李彦宏说百度要打的牌是本地化而非国际化。那么百度对日本的了解有多少呢?有哪些是想当然地照搬了百度在中国的老经验了呢?

技术、服务器集群、双字节都是糊弄不懂技术外行的。用户要看的是内容。百度在国内的成功很大程度上是满足了国内互联网初级阶段用户对娱乐内容(mp3,图片等)的满足。

因此当我们在百度日文站里随便输入几个敏感关键字,就可以获得大量诱惑图片。恍惚间我们好像回到了90年代末中文互联网未发达的时代,不知道将来baidu.jp会不会被封掉。

但是你要想查点资料性,非娱乐资讯,就不那么灵了。比如:jpsj.ipap.jp是日本物理学会的官方网站,site:jpsj.ipap.jp是可怜的一条。而使用google.com我们可以得到64900条。

“日本人?那个变态的民族。”这是网友体验过baidu.jp的自然反映。看来百度机器人距离本地化尚有不少功课要做。

而半年前,我和一个日本人聊天,他告诉我雅虎日本现在最流行,但越来越多的人正在转向google.com。百度在中国能压倒google.com,那么在日本能吗?

十二月 9, 2006

前些日子写过一篇谁这么牛B,强奸了新浪和DoNews,当时就怀疑碰上了电信级流氓。这两天发现敲错的域名已经被指到了一个叫北京宽带网-纠错导航的网页上。

如果真的是想网友所想,温馨提示一下,域名敲错了也就算了。这个网页可算是有史以来让我看到最恶心的页面,密密麻麻,花花绿绿像块花尿布也就算了,最让人恶心的是这个网页上尽然还弄了个口眼歪斜的照片出来吓人,叫救救XX小XX,真是让人恶心,唯有迅速地将页面关掉了事。

通过这件事,我们可以得到以下结论:

  1. 电信级流氓真的是存在的,而且就在我们的身边,千万不要以为你交了上网费,他们就不想赚你的广告费,这不纠错导航网的左下角就写着招商电话呢,大概花钱就能做纠错导航吧。
  2. 北京宽带纠错导航目前的提供者是博博狗,从名字上看是做博客聚合的,和那个奇虎大旗类似,除色情外,又平添了几分恶心,让人不得不叹服其编辑的变态。
  3. 纠错导航是电信的权利吗?我们几乎没有讨价还价的余地,如果它们真的要做,还是应该做的正常清爽一点,比如百度谷歌的主页就很好,千万不要污染用户的眼球了。

永恒的利益

纠错导航能带来流量吗?答案是肯定的,下图是博博狗与Donews的流量对比,已经几乎一样了。

而纠错导航页面贡献了76%(Alexa数据)。

  1. navigation.bobodogs.com - 76%
  2. bobodogs.com - 16%
  3. sp.bobodogs.com - 2%
  4. tj.bobodogs.com - 1%
  5. pic.bobodogs.com - 1%
  6. Other websites - 4%

参考:

  1. 收集证据:fsjoy.com的流氓推广和幕后流氓主子
九月 24, 2006

百度是不是最懂中文我不知道,但最近我发现百度确实只懂中文。偶然地我查阅了一下arXiv.org在百度中的收录情况:

百度:site:arxiv.org;只找到相关网页6篇。

而Google:site:arxiv.org;则找到1,730,000项。

是不是百度不索引国外的服务器呢?百度一下site:cn.arxiv.org(这个网站是arxiv.org的镜像,由中科院理论所维护),只找到可怜的1篇。我们知道搜索引擎索引网站是按照遍历网址的方式进行的,指向这个网站的连接越多则被索引的几率越大。arxiv.org的连接数在互联网上可谓多如牛毛,至少每一个大学图书馆都会连接。而百度对arxiv.org收录数量如此之少,只能说明百度从策略上完全放弃了英文搜索,说白了百度搜索的不是互联网,而是咱们中国人自己的局域网。

按照这个思路,我们很容易得到更多的例子:

百度:site:nytimes.com;只找到2,070篇。

百度:site:pubmedcentral.nih.gov;只找到2篇。

百度:site:nasa.gov;只找到2,830篇。

不论多么优秀的知识和文化遗产,不论多么棒的精神食粮,只要是英文,百度一律是视而不见的。

有很多声音:我们已离不开百度,但这些人肯定不包括百度的工程师们,也不包括李彦宏们。你能想象计算机工程师只看百度国学吗?同样你能想象李彦宏只读人民日报吗?当然不可能!

当然我写这个Blog并不是抱怨什么,毕竟收录哪些网站,收录到什么程度是百度自己的事。但我还是希望百度开始索引优秀的英文网站,比如arXiv.org。百度是青年大学生的首选搜索引擎,对于他们来说搜索引擎并不仅仅意味着娱乐和休闲,更意味着是获取知识进行研究的重要渠道。

没错,100个人眼里有100个搜索引擎,但很不幸在百度眼里,搜索引擎仅仅是获得网民眼球、流量和商业利益的赚钱工具。这当然也是中国网民的悲哀,即便在网络时代,大多数中国网民的精神生活也更象是100多年前的义和团时代。

下一页 »