十一月 28, 2006

先别说“风马牛”,待我慢慢道来。

都说“写blog的是好人”,其实,读blog的也多是好人。我才说过我的IE7拥挤,马上就有很多认识和不认识的朋友来给我建议。有让我升级显示器的,有让我用F11转换全屏的,有让我自己组合button省空间的。大家的好意我心领了,可惜,你们碰上的,是一个懒人:我觉得,按F11这么简单的操作,实在是太麻烦了。你看,我从来没有去修改我这个blog的CSS,来添点什么,my.donews给我什么皮肤,我就用什么皮肤,多点一下我也不肯。

我以前也没这么懒,为什么现在懒了呢?因为我发现,让人偷懒的东西,比较容易流行。你看,自动档的汽车比手动的费油,但是比手动的流行,因为它适合懒人;鼠标比键盘效率低,但是巨多的人宁可用鼠标点来点去,就是不肯打个“ dir ”; 大多数用户要使用的产品的功能,其实就是那么几样,多的功能不仅是软件资源的浪费,也是对用户时间和注意力的浪费。增加大多数人不需要的功能,是浪费。或者说,违背用户的真正需求,是错误的。没有懒的用户,用户永远是正确的。

所以,在合适的时候做减法,适应懒人的少量而集中的需求,就可以得到巨大的成功。

在早年众多公司往CPU里添加功能和指令,把CPU变的巨大而缓慢的时候,RISC的提出,就是一次经典的减法。简单,高速的RISC CPU,一下就从性能上超越了CISC。图形界面把用户需要记住的繁杂命令,变成通俗易懂的图标;HTML把文本之间的引用和查找,变成简单的点击;自动档汽车让开车变成简单的加速减速,而不必去考虑什么换档,油离配合;傻瓜像机让人忘掉光圈快门的复杂组合;C的内存分配和删除让人头痛,跨平台的兼容性更是讨厌,java把这些都隐藏起来;当大家都在往web page上堆内容的时候,google只用一个输入框。你看,历史总是在重复自己,掀看纷繁的表象,下面的轨迹如此相似。简单而不简陋的东西,总是招人喜欢的。

这里说说我对google office(就是docs & spreadsheets啦)的担心。我们喜欢google office,是因为它简单:建立一个文档,然后在哪里都可以用,只要有browser就可以查看修改,可以容易的跟别人分享,共同编辑。不必象以前M$ Office那样,建立一个文档,还要存在flash drive里,还要担心要去的地方没有安装Office,要跟别人分享,还要贴到email里,还要担心多版本的问题,多么简单易用。这是google office的好处。

不过M$有一张王牌攥在手里:数据安全性。

肯花钱买Office的公司,是认真做生意的公司,必然有其不能公开的数据。一个个人可能是懒的,但是关系到生意和商业秘密,有相关利益的人都不会懒的。你能想象一个500人的公司的CEO把自己公司的产品路线图放到google office上么?你能想象一个在NASDAQ上市的公司把自己还没公布的年报放在google office上么?你能想象一个想和google竞争的startup把自己要申请的专利文档放在google office上么?Google越强大,人们对它的担心就越大。无论它怎么宣扬“不作恶”,即使它曾经拒绝将用户的搜索数据交给官方,但是人们的担心是存在的。我的一个美国朋友跟我聊起gmail右边的内容相关广告,他也是搞internet这行的,他对我说,尽管从心里他不相信,但是他一直觉得有人在看他的gmail来决定附加什么广告,而不是程序自动产生的内容相关。所以他肯定不会把重要文件放在gmail里来发。很有趣,是不是?越强大的公司,给人的安全感越小。而M$让用户拥有数据,自己不去碰。所以M$的强大给用户的不安全感要小得多。

我不是Gfan,不过我也不反对google,这里只是从商业上考虑google office的前途,没有感情色彩。那么,google office的前途在哪里?一个简单好用的应用程序,它的目标用户是长尾里面“懒惰”的用户,还是看重数据安全超过易用性的用户?或者,一个类似google企业搜索的企业级online office,是解决数据安全和易用性的最好折衷?

 

十一月 15, 2006

Techcrunch上面提到了Jangl,并说它是一个匿名电话号码的提供商。Jangl提供的服务,从文章和后面的评论看,是通过使用VOIP,为用户提供一个匿名的10位电话号码,用户可以公布这个号码,然后其他人就可以通过Jangl的服务和他/她通话。以后用户不希望被找到的时候,也可以禁止通过这个号码找他/她。目前这个服务是免费的,计划2007年收费。

比较有趣的是文章里面和后面对这个服务的评论,目前这个服务是用在网上约会的Match.com。这不禁让我想起我去年的一个想法。当时我正处在idea象泉水一样涌出来的状态里,其中一个想法就是用软件实现匿名的IM通信。我当时的目标是让做C2C的用户能够在想谈小生意的时候能够使用IM的虚拟ID彼此接触讨论,等生意做完了就可以断开这个ID,彼此不再联系。

这个想法的起因是我自己在craigslist上卖旧计算机,卖给了一个不太懂的人,对方对价格觉得很公道,但是却在事后打电话来问我怎么安装DSL。为了不让对方觉得自己是个骗子,以保护中国人的形象,我耐着性子,花了半个小时解释了为什么DSL应该是电话公司的事情,而不是我的事情。事后我的第一个想法就是:“如果我的手机有虚拟号码就好了。”后来我把这个想法延伸了一下,觉得如果通过卖IM上虚拟的ID,在C2C市场上会有收入。

后来我把这个想法跟我在国内的一个好朋友说了,他的第一反应是:“一夜情”。

这不,一夜情的应用来了。

好了,严肃的说,Jangl的应用在我看来,是针对海量的短暂的通信需要而来的,当然一夜情和网上约会是这个集合的子集。另外一个很大的子集是C2C。大家交易完成,一拍两散。而Jangl,卖的是它的10^10的号码。这是一个很典型的长尾的例子,把人们零散的通信需求给整合成了一块。

 

九月 18, 2006

这个题目很大,我去年和彼岸讨论的时候,说了一个上午也没完全弄明白。现在tinyfool也发表了他的见解,看来,这个东西很可能要写成一个系列。我很不想把这个东西写成论文,实在是没有乐趣,不过很难避免了。

最早知道p2p存储是在系里听一个教授谈研究方向,当时的论点是,计算机的空闲磁盘容量是如此的多,而p2p又是如此的成功,因此应该搞一个p2p的共享磁盘空间应用。事实上,个人计算机的空闲能力非常的多,而已经有很多应用来利用这些能力。最早的例子是使用空闲CPU时间,比如说NASA的SETI at home,就是利用个人计算机的空闲CPU时间,用屏幕保护程序来处理射电望远镜接受的数据,看里面有没有一串类似这样的东西:10,11,101,1001,1011,1101...Google在其早期还有好奇和共享精神的时候,也干过利用插件帮助计算蛋白质的空间结构的事情,现在反而在google lab里找不到了。

对空闲磁盘空间的利用,学术届有oceanstore, 工业界的应用,彼岸的“在线存储:现实还是明天?”里有很多例子。但是,存储数据的商业应用,还是有很多问题需要认真定义。我当时和彼岸的讨论中,有几个问题是比较重要的:技术上,p2p的服务质量。商业上,p2p的保密问题。后来还提出了服务的问题。

先说服务质量。tinyfool指出,要实现p2p的共享,一定要有两台机器同时在线。这里说的是服务质量的一个指标:可访问性。tinyfool同学认为,有人会提供这种服务。没错,比如说,tinyfool和keso要共享mp3,我愿意提供优质服务。可是,他们愿意用吗?我的机器跟他们之间的连接质量是怎样的?估计没有virushuo的好吧?不过,我的机器能一直在线,我不在乎电费,virushuo的机器就可能因为保证首都用电而被迫断电。那么,我的机器好,还是virushuo的机器好?我当时给了一个公式:Q = b * d * t ,量纲是byte^2。

这个公式里:b是两台机器之间可见的网络带宽,d是提供的共享空间,t是在线时间。这里有一个假定,就是机器的CPU都足够快。

那么,一台能够被高速访问到的,提供大容量磁盘空间的,7*24在线的机器,就是服务质量好的机器。目前美国的网络上,很多人家是用ADSL,磁盘很空,永远开机。所以Q应该是很好的。有了Q,就有可能象oceanstore里提到的,用自己家的机器为别人提供服务来赢利,Q是分红的指标。但是从中国的目前情况看,由于应用和ISP的问题,很多时候b和t都还不能保证,所以我当时提出,需要存在中央服务器群来作为补充。

为了保证可访问性,除了指望其他用户一直在线,从系统结构的角度说,还要有冗余和分布存储。keso共享出来的文件,应该是分布在不同的机器上的,我的机器上有几块,virushuo的机器上有几块,有的数据块是我们俩都有的(冗余),还有不认识的人的机器上也有。这样一来才能保证,当部分机器因为通信网或者电网的问题不能访问的时候,用户察觉不到。这样做的直接结果是:每个用户能够使用的磁盘空间,必定远小于他提供共享的空间。所以,allmydata的免费版本里,比例是1:10。

再说商业上的保密问题。

很可惜,我们的社会里有坏人。所以,当你使用第三台机器的时候,somebody is watching you!前面说的分布式存储可以从一定程度上防止第三台机器的主人偷你的全部源文件。但是,有的时候一段文字泄露也是要命的。所以,要加密。这个时候,前面说的公式里面,就要加进CPU主频f了:Q’=b*d*t*f.当然,如果你只是存点照片什么的,本来就是要跟大家共享,那就不必了。真的吗?且慢!keso共享给tinyfool的mp3,根据tinyfool交代( :P ),有几百首,那么,都是有版权的吗?当然,科学实验就不必追究责任了。不过,真的有人喜欢把银行帐号和密码存在一个文本文件里,然后放在共享盘上的…

最后的这个服务的问题,是比较新的想法。因为有了共享磁盘应用,还仅仅是有了一台裸机,实际的用户里面,能主动使用这种服务的人,少而又少。应当提供对用户的应用界面来把这个裸露的服务包装起来。在美国,因为Q已经很好,所以针对普通用户的应用会启动。

和以往一样,本文对很多技术细节都没有详述,所以是不完备的,不严谨的。本人也是不负任何责任的。:)

更新:

我当时在写出Q的公式以后,困惑了很久,因为byte的平方是一个很奇怪的东西,以前好象没有这个单位.那么,是否是公式有问题呢?现在看来,这两个byte描述的东西是不一样的.一个byte描述的,是存储的需求;另外一个byte描述的,是对更新的需求.因为使用这个服务的用户有两种:一种是要用空间来存东西的,另外一种是用空间来传递更新的.前者用的是d,后者用的是b * t.但是,从服务者的角度来说,一个新的用户的目的是不明确的(连用户自己可能也不知道),所以,用byte平方来描述一个用户所提供的空间质量,是适合的. 或者,为了区别,用于存储的应该叫byte,而用于更新的,应该叫bit.毕竟,更新速度慢.

九月 11, 2006

五年前的那场袭击,撞倒的是摩天大楼。但是,那场袭击的余波,破坏更大。当人们意识到,电视上的画面并不是好莱坞的大片的时候;当传统媒体除了一遍遍的播放撞击的镜头之外,对当时当地的细节一无所知的时候;当那个坐在总统位置上的人也掩饰不住惊慌失措的时候;人们终于明白,自己曾经被欺骗的多么深,多么久。好莱坞,电视台和总统的权威,也随着双塔一起,倒塌了。

CNN的一个民意调查中显示:1004个被调查的美国人中间,45%认为,小布什政府对911的责任“很大”,或者“相当大”,2002年6月的数字是32%。更加有趣的是,克林顿政府同样没有幸免,41%的受访者认为其对911的责任“很大”,或者“相当大”。

从这里我们可以看出,美国人对过去政府作为的反思。另外一个值得注意的数据是:57%的受访者认为,“无论美国政府如何做,恐怖分子总有办法对美国发动袭击。”

更多的评论,我看也没有必要了,数据自己会说话。

 

七月 26, 2006

在”报网(八)地图“中,张锐老师提到:

“但是目的是什么?用户凭什么耗时耗力为你添加内容?似乎没想圆。”

这里,就需要对用户有了解.什么用户最希望为一个地图添加数据?商家,大量的小商家,作不起广告的小商家.

设想一下,报网地图如果是北京最好的电子地图,每个人都可以用它方便的找到大量的信息,比如说如何坐车去某地等.但是某个小饭店的老板发现,自己的饭店不在你的地图数据库里,搜不到.他当然会考虑把自己的饭店地址仔仔细细的加进去,并且经常看看,是否还是正确的.好让别人找饭店的是否能找到自己的店,增加收入.

Keso说:”用户从来不是为任何商人贡献内容,他们只为自己贡献内容。

但是,有了千千万万小商家的贡献,你就有了这个巨大拼图的数据.当然,前提是:你为他们提供的服务足够好,让他们能赚钱.这就是长尾,就是craigslist如何击败报纸.

至于这个地图是否算个人地图?我想未必每个找饭店的人都需要一张个人地图吧,太多的定制,会把普通的地图使用者吓跑的.

七月 20, 2006

张锐老师(昨天忘了称呼老师了,今天补上:) )在”报网(七)走出sina(3)个性化阅读 “里,提出了更加详细的新闻改造路线,我总结了一下,要点是把编辑权限下放给读者,同时在网站方面提供编辑的技术和内容手段来方便用户编辑.

这个方向我是同意的,不过道路是曲折的(我听起来是不是很象你当年的政治老师?).94smart评论说:”可以个性化阅读的用户实在是太少了”,因为”从建设到使用,尤其是使用的技术门槛太高了”.所以我认为94smart这个名字取的很好,就是smart!

那么个性化阅读这件事情,就不能做了?否,我现在就在体验个性化阅读,不过,我体验的,是社会化阅读,一种更容易实施的方式.

很简单,我现在看国内新闻,主要是两个来源:新浪科技,和keso网摘.你看,我在用两个编辑:一个是新浪的科技编辑,一个是keso.

新浪的编辑,更象一个官方的声音,是基本不可订制的,除非有重大新闻.所以,我从那里得来的,是官方的尺度,大公司的动向.

而keso,我更愿意把他看做是一个超级用户,他制作的网摘,除了被baidu的扇子们搞烦了打嘴仗以外,还是很值得一看的.而且,他感兴趣的东西和我的比较接近,我信任他的涵盖范围(宽度)和眼光(精度),所以我看他的选择.正是keso这样介于编辑和用户之间的超级用户,连接起来了新闻网站和我这样的普通用户.

你看,我在这里描述了一个传播的模式:新闻网站-超级用户筛选-普通用户

这里,超级用户可以是很多形式的:可以是软件记录用户喜好(机械的个性化阅读),可以是keso这样的夜猫子(我的偷懒型社会化阅读),但是更加现实的,是让软件来提高超级用户的阅读速度和记录质量,并通过网络来聚合类似兴趣人群的阅读内容,最终达到社会化阅读的目标.

具体的技术实施,今天不说了.

 

七月 19, 2006

很久没有能让我兴奋的话题了,张锐的”报网(六)走出sina(2)精致阅读“,算一个.

张锐指出了新浪的弊端:海量一锅烩,但是他的解决方案是分类.既然是分类,就有个谁来分,用什么标准来分的问题.这个问题,张锐没有明确的写出来,但是从他的例子看,似乎是要编辑来分类.

分类是一个很诱人,但是很危险的方法.诱人之处是:可以把需要处理的信息数量降低几个数量级.危险之处在于:如果标准不合用户口味,就丢掉了用户.

所以有个性化阅读:根据用户以往的阅读兴趣(通常是通过软件来获取的),推测用户未来的兴趣.它比编辑分类的方式的优点在于:选取的内容是用户喜欢的,投其所好.缺点是:一个人的眼界是有限的,软件的推测是有误差的.

在网络时代,网络可以把类似兴趣的人聚合起来,进行社会化阅读.把自己喜欢的东西推荐给小圈子里的朋友,用群体的力量来应对海量的信息.既照顾到了面,又节约了时间.

 

六月 19, 2006

我在”Google是一家心理学公司“里列出了GOOG对人心理的纯熟利用.这几天看keso的网摘,GFANs们的文章又多起来,不禁感慨,GOOG真的象一个宗教.

成功宗教最大的特征是利用人的心理,产生传染性的传播,达到对某个对象的非理性崇拜.从keso同学收录的GFANs言论里,我们可以看到很多类似的非理性崇拜:

1.月光播客的”Google Earth揭密中国军事设施“.月光播客很担心的说:”而Google Earth这种民间的卫星地图已经让我们的军事专家们“震惊”和“害怕”了,可想而知中美军事科技差距有多大,如果说Google Earth真的泄密的话,我看是泄露了中国在高科技领域的落后面貌以及中国某些专家们的无知与愚昧。现代中国和西方的科技差距有多大,我实在是不敢想象。”

这其实是很典型的”印堂发黑“论.如果中国的空间技术如此不堪,那神5神6还上去干什么?

月光博客的读者还是清醒的,看那篇的回复22,Aiolos说道:”军事卫星是更厉害,可是你拍的再清楚有什么用?有很多照片是需要分析的,判定是真是假的,有的地名是否正确的,军事设施或部队什么时候在这里,什么时候又去了哪里?什么地方有可能存在秘密军工单位?这么复杂的工作,交给你们真的是太合适了,最起码分拣工作量减轻了一半~~最起码知道了调查重点~”

对了,我本来想说什么来着?GOOG是一家心理学公司.

2.相空间的”不带这么糟践人的!“相空间认为,百度所说的,中国网民的习惯和外国不一样,喜欢简单和送到眼前.然后痛骂百度的流氓行为.不过,为什么忽然话题一转,去赞美GOOG去了呢?这也太呼悠了吧?

我虽然不信神,不过我看圣经,当故事看.谁能告诉我,为什么旧约里面,很早就一再提出:不要崇拜偶像?而且还有那么多的人因为崇拜偶像而倒霉?

算了算了,扯远了.说说我今天看的武侠小说吧,好象是全庸,还是金庸巨的作品,里面说到捕快捉了山贼,发现压寨夫人很漂亮,一问之下,才知道是大家之后.捕快问起原由,夫人答:

“奴家当年行路,被贼人羞辱.谷,谷贼从路边跳出相救.奴家无依无靠,见他路见不平,必是英雄好汉,便从了他.官人救我!”

我又被呛了一口.

六月 10, 2006

先说点闲话: 

小孩子们一起玩游戏,有的输不起了,就说:”你丫耍赖,我不玩儿了.” 

看,多么的有面子.我不玩了,不是我玩不好,是我主动不玩了.我为什么不玩了?不是我不会,是你丫耍赖.至于一起玩的小朋友是否还能组成一队继续玩,关我什么事?不和耍赖的人一起玩,才是最重要的.我反正有别的地方玩.

回到正题,我的回答:未必

Google在中国,面临的是两个贫瘠:

1.网络内容和网页结构的贫瘠

2.收入来源的贫瘠

前者是因为中国的网络用户和美国的用户所关心的东西不一样,中国的网页内容里面,积累下来的有用的东西没有美国那么多.没有很多的人去专心的定义概念,说明问题,解决困难.好点的人风花雪月,没有那么好的人就直接黄下去了.对google更要命的是,中国的网页制作者链接少,转载多.谁让PV为王呢?谁愿意放走一个用户呢?用一个比方来说:中国的网络内容类似煤,流动性很差,还含有很多的流黄(不是硫黄).那么,用美国的油井设备,打下去得到的多半是瓦斯.

后者是中国商业生态环境的问题.Google在美国的收入,主要来源于无数几个人到几十个人规模的小生意(small business),AdWord/AdSense把广告的门坎大幅降低,使小生意也可以作广告.打出来的油有人买,google才有的赚.在中国,小生意不象美国那么多,而且很多是面向出口,定单型的,针对国内的小生意很少.肯在中文搜索结果上作广告的就少了.挖出来的煤没有人买,因为人家在烧柴.

这里顺便说一句,有个卖柴禾的马老板,生意很好,好到他家店叫”掏腰包”.

面对一个贫矿,怎么办呢?放着呗,煤和钻石都是碳,谁知道什么时候挖出一块钻石呢?只要,只要成本够低.

其实呢,煤里面如果混合了油,也是可以象油一样抽出来的.比如说,把美国积累的免费内容灌到中国来,从开源软件的手册开始,认真的翻译成中文,而不是一个个的汉字,就是一个很好的办法.毕竟,中国人已经有能力和手段支付美元了.

不过,显然google是没准备这么干.要么,为什么china blog被自动翻译成”中国性爱“(更新:词库已经改过了,blog被翻译成"博客",无论是中国的也好,马来的也好,一律叫博客了),而malaysia blog就被翻译成”马来西亚日记”呢?为什么自动翻译不认识the People’s Republic of China,但是少两个单词就认识了呢?(更新:现在 the People’s Republic of China 和 Republic of China 都不认识了)这么简单的bug,难道真的没有人发现吗?我挤兑google自动翻译,就是想看到好点的结果.

我相信,耐心源于信心.当google对在中国发展表示没有耐心的时候,我看到的,是没有信心.

六月 6, 2006

我对我的读者们道歉,前两天是太冲动了,上了 斯可特.银人 的当.不但说了粗话,更重要的是帮助他做了病毒式宣传.银人的目的不是真的想把移民当牛,他就是一没钱作广告的小老板而已,想出了这么一个恶毒的点子来出名.

今天的问题是:为什么各大internet厂商都在对用户的桌面进行争夺呢?各种toolbar/流氓软件,恨不得要把我的browser的一半空间占掉,每次上网都拉着我往它家门里进.这样带来的流量,质量怎样呢?

记得看到一个报道,提到google的 搜索次数/广告点击次数 在过去几年内上升了很多,也就是说消费者越来越聪明,不再盲目相信搜索引擎的推荐了.从另外一个角度看,搜索引擎的流量质量在下降,而且下降的很厉害.

在高速公路口守着,能产生效益吗?还是把流量拉过来,利润没过来?

下一页 »