2006中国互联网年度人物:谢文

Posted by xba @ 1:05 am, 十二月 22nd, 2006
谢文是我心目中的人选。与其说谢文是悲情的,不如说他是戏剧性的。他高调宣扬web2.0,又突然从和讯离职。继续高调宣扬web2.0,高调入职雅虎中国,又再一次突然离职。  

他只用40天时间就给马云筑起了一道高高的门槛:任何一个自认为自己有资历、有能力的行业人士,只要他还珍惜自己的行业履历,都会想到他前面有一个谢文。从此,雅虎成了只有不知天高地厚的毛头小子(他们丢掉的只是枷锁,毫无心理负担)才敢踏足的场所。这一切,谢文只用40天就做到了。

其他候选人:

李开复:李老师成功的一个又一个招收着“关门弟子”,他的个人声望随着他的跳槽以及不断的演讲而不断提升,与之相比市场地位不断下滑的谷歌似乎根本不重要。

半年前,参观GOOGLE的时候遇到李开复,他还能欣赏,至少是假装欣赏,我的冷笑话:我们(几个参观者)是百度FANS。不知道再有机会遇到,我还敢不敢继续这样冷场。毕竟,我的阵仗见的没李老师那么多。

王东:很无辜的成为了邮件门的牺牲者。原本这样的交易我们早就见多不怪,只不过网络把一切都摆在了台上。离开他,百度会继续按着老的规则不断的走向胜利,继续更懂中文,对了,还有日文。

张钰:她不是一个人!她开创了所有视频网站光荣的传统。木子美、竹影青瞳、芙蓉姐姐在这一刻灵魂附体,张钰一个人她代表了中国娱乐圈悠久的历史和传统,这一刻她不是一个人在战斗,她不是一个人!

周鸿祎:他不是厌倦江湖纠纷后洗手归山的大佬。他继续用江湖手段而试图转行当起电脑卫士。即使他的360卫士不成功,他和雅虎打的一系列宣传战,也都可以写入教科书:一方面是如何举重若轻、招招打在命门,而应对者是如何前后失据,左支右拙。可惜,他的对手马云已经在年度人物的候选中被谢文秒杀,否则周鸿祎本来是最佳的人选。

有时候,一个人的价值要靠对手来体现。

欢迎补充。

Tags: 无聊

数据证明中国互联网还没有进入长尾阶段

Posted by xba @ 10:21 pm, 十二月 13th, 2006
也许有点标题党,但我希望大家看完能认为我确实用数据说明一些网站并没有(和很多人宣称的那样)拥有“长尾”。

事情的起因是昨天和朋友聊天,说新浪BLOG。他认为新浪BLOG的流量让新浪很头疼,因为太分散了,所以无法象卖首页那样卖掉广告。但我的感觉正相反,新浪怎么赢利与我无关,但新浪BLOG的流量真是非常分散么?为什么我老听到作者们抱怨,推荐到首页就是几十万访问量,一但撤下来就问津寥寥。

如果分散到大量BLOG中,那么我们可以认为这是一个长尾。如果是首页引导+少数名人效应,那就是标准的28法则。

新浪的数据我拿不到,但正好访问到TECHWEB,它的BLOG数据是部分公开的。我昨天取数据的时候BLOG的注册量是2449,应该是从1月来所有注册的BLOGGER。把所有的数据转到EXCEL里,用发贴数做排序。

2449人共发贴15428篇,如果把发贴0篇的人扣除,只剩下1074人,发BLOG数在5篇以上的只有384人。我们取1074的20%,只要头200多人,发贴数就已经是所有BLOG数的85%。完全是二八法则的翻版。

而且,我们把发贴数做出曲线图来:

很显然,符合指数曲线的特征。jiyanjiang和我讨论:

“长尾是描述分布函数特性的通俗解说,尾巴很长是什么意思?简单说就是幂律分布函数:里面的就是长尾,这个和语言学中的zipf分布是一样的,Google是长尾很容易理解,因为人的自然语言本身就满足zipf分布。

很多人还把长尾和指数分布律混淆:,其实指数律是典型的短尾,只要抓住销量的前N名即可。”

事实上我很容易就找到了一条标准的指数曲线和TECHWEB BLOG的曲线重合。

兰色的是标准指数曲线。

用数学角度解释就是指数曲线是可积的,尾巴看起来很长,但是是收敛的。如果是真长尾的话那应该是一条不可积的幂律分布函数。

用事实解释应该是这样:我们还没有能摆脱资源稀缺的限制,在TECHWEB上发贴前列的那些人也是其他IT网站的常客:数位之墙、北城、蓑烟雨任平生。。还是这点人。而读者也欣赏口味单一,为大众趣味所左右。

这样的情况,形不成长尾。

Tags: 数据分析

长尾,理论和数据

Posted by xba @ 1:01 am, 十二月 11th, 2006
通常来说,我厌恶一切新词汇。但新词真要流行,谁也挡不住,比如“长尾”。

所以在5G评论里,我心怀恶意的说:不要只夸长尾,这理论也许用来做恶更好,比如短信欺诈。

不过这里我不打算讨论这个,我只是对安德森的成书过程有兴趣:他先写了篇文章,后来发现很受欢迎,于是他专门建了BLOG,用了两年多时间公开编撰书稿,最后一本畅销书问世了。若仅仅如此,他所做的也并不比起点中文或者幻剑书盟的诸多作家更超前。我羡慕他的是,他拿到了Amazon等公司的数据。因为我懒得看原书,所以我不知道,他是利用自己连线总编的位置,得到了内部数据,还是全都来自这些网站的公开数据。

无论是哪种方式,都是值得学习的。我相信不是只有安德森一人看到过这些数据。但多数人没有去问那些枯燥数字后面代表了什么,于是只有安德森总结出了“长尾”——即使我们不羡慕这理论,也还是要羡慕一本畅销书的收入的。

一个理论拍拍脑袋也很容易被创造,但如果没有扎实的数据分析做基础,那很可能只是海市蜃楼。面对一堆数据,只要真下功夫去分析,就会有收获。没有Amazon的数据?不要紧,从今天起就看自己网站的LOG、GOOGLE广告的统计、ALEXA曲线。。一切数据都可能有价值,只要你会发掘。

相关链接:长尾(中文网络翻译版)

Tags: 数据分析 长尾