早上看见黑板报上说“从喊话教材到 Google 翻译”,里面提到了现在的翻译是基于统计的机器翻译。也就是说,我们现在通过translate.google.com使用的,是那个著名的基于统计的,使用machine learning的,得分很高的机器翻译了?我赶过去试了试,比以前的效果要好一些。我这次厚道一把,不拿什么列侬的歌去挤兑google了。机器翻译的路还很长,真的很长。
另外,好象“一篇会议记录”的link有点小问题,把黑板报的url给接到前面了。
总有些想法,不写下来就忘了
早上看见黑板报上说“从喊话教材到 Google 翻译”,里面提到了现在的翻译是基于统计的机器翻译。也就是说,我们现在通过translate.google.com使用的,是那个著名的基于统计的,使用machine learning的,得分很高的机器翻译了?我赶过去试了试,比以前的效果要好一些。我这次厚道一把,不拿什么列侬的歌去挤兑google了。机器翻译的路还很长,真的很长。
另外,好象“一篇会议记录”的link有点小问题,把黑板报的url给接到前面了。
以前看到描述长尾的文章,如果里面有图,一定是一个大头,然后曲线迅速下降,形成一个细长的尾巴。然后文章就开始解释,这个尾巴的面积比那个头的要大好多。
If you pick an article describing “Long Tail”, and pick one that has a picture in it, normally you’ll see a big head, then the curve drops dramatically, and forms a long and thin tail. And the article argues, the area in this long tail is much much larger than the seemingly big head.
听起来很有道理不是?不过,你相信丫么?
Sounds reasonable, huh? But, do you believe it?
上周末,我老婆和女儿在看迪斯尼的片子,我独自对着一段程序发呆。忽然一段歌剧飘过来。“歌剧?”我觉得有点怪,就随口问:“在看《木兰》?”
Last weekend, my wife and daughter was watching some Disney DVD, and I was staring at some code. Then I heard something sounds like opera. “Opera?” I wondered. “You guys watching Mulan?”
“是《拇指姑娘》”
“It’s Thumbalina”
我笑:难怪没有Pixar生意好,什么东西都弄的一个样子。
Quite amuzed, I know why Pixar kicked Disney’s ass, ’cause Disney made everything the same.
然后我就没心思写程序了,因为这是一个很有意思的事情:以前在没有《寻找尼莫》的时候,我如果要找儿童电影或者童话故事,多半是找到迪斯尼的片子或者安图生童话,因为这些东西质量还行。不过,现在可以看《寻找尼莫》和《冰河时代》了,我才不要什么老掉牙的县长儿子(又称“王子”)跟牧羊女的爱情故事,弄的跟歌剧一样,最后还“从此幸福的生活在一起”,这里再问一句:“你相信丫么?”如果信的话,那么18年以后那个残酷的王后和昏庸的国王是哪里来的?
Then my mind wondered away from my code. Before the born of “Finding Nemo”, if I need some movie or fairy tale for my daughter, I would pick Disney or Mr. Andersen, simply because their OK quality. But now I have “Finding Nemo” and “Ice Age”, then why would I buy something old fashioned, like the love story between son of a county chief (aka. Prince) and some random girl? Why should I watch a cartoon opera, and in the end it’s always “live happily ever after”. BTW, do you believe it? If yes, then who become the cruel queen and stupid king 18 years later?
从这里想开去,其实所谓长尾的大头,在没有多少选择的时候,的确是存在的,因为我们没有其他的选择,只能“削足适履”,被迫适应。你想,让你做选择题,哪怕选项都是错的,你也只能选一个不那么错的。但是,现在选择多了,甚至,你可以自己创造一个新的选项,这个时候,你还会被迫选择那个大头么,长尾还会是细长的么?
My point is: the big head of the Long Tail does exist - that is - when you do not have much choice, you have to change yourself and fit into the options you have. This is like working on a multiple-choice quiz, even if your professor go nuts and made all options wrong, you have to pick one that’s less rediculous. But now, when you have thousands, or even millions of options, or you can create your own answer, will you still force yourself into that already-crowded big head, or you’d rather join the Long Tail, and make it stronger?
我想,当没有人限制你选择大头的时候,最后曲线会变成平的:没有大头,只有粗壮的一条尾巴。到那个时候,你就只能在Wikipedia里找到长尾的定义了。
My view of this is: when there’s nothing pushing us to the big head, the curve will go flat eventually, there will be no big head, only a flat, strong, long tail. That’s when Wikipedia is the only place you can find ”Long Tail”.
注:是翻译的我自己的东西 ![]()
期待“数学之美 系列十六(上) 不要把所有的鸡蛋放在一个篮子里 — 谈谈最大熵模型”的下篇。同时让我预测一下这个下篇里面的一个关键字,想来应该是
Bayesian?
前几天在“风在南方”的blog里面看到他翻译的《驾驭Web 2.0浪潮》一文。里面说:
文中开门见山地提出了3个有关Web 2.0的悲观看法:
看的我是一愣:与互联网没有任何联系么?后来去看了英文原文,原来是翻译的时候的一个笔误。原文说的是:
1) Web 2.0 does not have anything to do with Internet2:
是说web 2.0跟下一代互联网没关系。这里我把Internet2翻译成下一代互联网了。
这个2字可是事关重大,因为看到麦田的blog里面引用了译文,所以特意指出。
我看了原文,觉得作者的意思是,web 2.0虽然是很热门的词,但是它其实是目前Internet上的新的组织形式,而非革命性的变革。所以作者上来就把web 2.0和革命性的Internet2和全新的骨干网络区分开来。我想这也是很多人的共识,包括给web 2.0起名字的O’Reilly,web 2.0的意思,是以前web的翻新版本,革命性和web的出现是不能相比的。在我看来,web2.0能够让我们更好的使用网络,或者说,使用网络那边的资源,包括人的智慧。
我其实也算是internet比较早的用户了,从最早看着netscape的流星颗颗落下,一个页面在我面前生成;到自己用DOS EDIT一个‘〈’一个‘〉’的写自己的页面;到后来看台湾的BBS里面的“东东”觉得很有意思;当我在BBS奋力灌水的时候,从来没有想到过,自己会掉到自己挖的大坑:blog里面。
我已经记不清是怎么知道blog的了,我的记忆里有两个版本,一个是我的一个朋友在饭桌上问我“你看keso吗?”;还有一个是另外一个朋友在MSN上发过来一个著名blogger的网站,我很无知的问“他是谁?”,然后就收到另外一个URL,结尾赫然是当年BBS大水虫的id。于是我一下知道了两大blogger。
总之,去年快到万圣节的时候,我已经在看keso的blog了。不过我对写博依然很有抵触,弄不明白究竟是什么原因让blogger们如此的坚持。keso的文字让我很迷惑:有的观点我同意,有的观点我根本不同意。我也不能理解,为什么他要把自己的真名写上去,把照片贴出来,我觉得那是15到25岁的女生才会喜欢做的事情。不过,看到keso穿南瓜T-Shirt,表情有点尴尬的照片的确很好玩。
我当时是一个完完全全的吸收者,因为对互联网的关注而看博客。直到有一天,我忽然明白了,这不就是BBS嘛,于是,我在keso的blog后面留言,问他关于互联网去中心化的问题。这个留言被他转载为“十万个为什么之互联网为什么”,这篇东西我已经google不到了,不过当时留言的位置是在这里。
然后我就自己开博了,首先是用blogger.com,很快发现国内不能访问blogspot,于是去用blog.donews.com,发现连接很慢,后来又用了一阵blogbus.com,最后落脚在这里。
这一年来,认识了很多朋友,keso,老白,keepwalking,霍炬,tinyfool,只说,lovelock,爱搞搞,董璐,麦田,94smart等等等等。虽然都没有见过面,不过在网络上的交流就让我受益匪浅了:长尾,wisdom of the crowd这些新概念,把一个全新的市场呈现在我面前。我在博客的空间里找到了以前失落的朋友,而我自己,清晨6点钟醒来也不会无所事事的躺着无聊了。我也把自己的朋友彼岸给拉到这个大坑里了。
博客,其实和生活一样,有友善的交流;也难免有误会。好在大家都很友好,不太在意我偶尔的刻薄和玩笑。这里给大家说一声谢谢。
新的一年要来了,我还会继续写,不过,也会把更多的精力放在我自己刚开始的小项目上。毕竟,学习了这么多,要做点东西出来才好。
这里说的“富贵病”,有两层意思。第一层,是字面的意思,就是因为太舒服太有钱而出来的毛病。
美人她爹在国内找工作的时候,接触过很多家的外企。后来工作了,去朋友和师兄弟那里玩,又见到了很多。从已经没落的前超级计算机公司,到最早进入中国的计算机企业,还有当时如日中天的大牌(这里我就不提公司名字了,免得象前几天,一句话说不好,还要再写东西来补救,弄的跟写软文似的)。我记得当时的印象是:在外企的感觉真好,虽然没有那些进了国企的弟兄们拿的多,不过至少不象进了私企的倒霉蛋们那么搏命;就连回学校见老师都倍儿有面子。外企里面大家做事有明确的规则,最关键的是老同事们教我的一条:“又不是你的公司,你再努力工作,也不能让股票涨一块钱。该干嘛干嘛吧,太突出了大家都累”。怎么样,很犬儒吧?不过我们当时算好的,比起进入中国早的多的著名美国企业,人家是早就连做事方式都本地化了,那家公司招人的时候我的一个朋友就告诉我,只有一个名额,去面试没问题,但别抱希望。因为,offer已经是他的了。
很多大学毕业生去知名的美国和欧洲企业,图创业图发展的有,不过图安全的估计也不少。怎么让一个有着成功光环的企业的中国分部员工象startup一样拼命,这个激励机制得好好想想。
这第二层意思,是指外企的管理方式。美国的高科技企业中,有一个很重要的管理原则是自下而上。就是说,基层的工程师发现问题,告诉管理层,同时提供解决问题的建议。而管理层作决定的时候,要认真的考虑工程师的建议。暂时不谈这种方式的现实性,单就其初衷来说,是很有效的一种方式。因为工程师能最直接的看到问题,能在第一时间发现问题并提出解决方案。但是,这种方式也是很昂贵的,因为很多工程师所提出的问题彼此之间是要竞争公司资源的,而对管理层的要求也很高,要能够选择适当的建议加以执行,而且要让大家不会有太大的意见。这种昂贵的管理方式,就我所见到的,在中国的外企里并没有持续的成功过,或早或晚,或者是老板没有掌握好,或者是总部来了命令,需要集中了,民主就要退居二线,而且民主的管理从此以后就成了一句空话,再没有回到一线。好象这种富贵的管理方式,我们玩不起。最后剩下的,是比较廉价的老板拍脑袋,就算你反复说要民主,下面的人都附和的笑着说“是是是,好好好”。
很多外企在中国做的好,是因为他们的产品在中国没有替代品,比如说早年的像机复印机,后来的计算机手机CPU操作系统,所以虽然中国分公司未必能充分发挥雇佣的天才们的潜力,公司依然生意红火。不过,这个世界上中国不能造的东西是越来越少了。我看,与其硬撑着,不如象肯德鸡那样,针对用户的口味进行本地化。尽管用户的口味未必是总部喜欢的。在美国,对中餐的大众印象是油腻和味精。孰不知,在中国,根本不是他们想的那回事。
欣闻麦田的蚂蚁上线了,是从keso的365key那里看到的,于是跑去试一试。
蚂蚁社区是一个很干净的网站,这里干净不仅是指页面的简洁清晰,没有广告闪闪闪,更重要的是麦田的理念:远离美女帅哥,远离谩骂,远离娱乐游戏,远离虚假。在我看来,这个理念,比google的“不作恶”份量更重。毕竟,蚂蚁是中国的一个新兴小网站,面临的压力非常的大。不过,蚂蚁的生命力也在此。
我注册了我的常用id:eraera,不过蚂蚁是允许注册中文用户名的。注册页使用了AJAX,及时通知我id是否可用。我故意在验证密码的时候少输了一个字,于是在我离开这个输入框的时候,立刻得到了提示。这很好,因为我是从国外登陆,如果让我等待页面刷新再提示出错,我一定是不玩了。
注册的最后是选择居住地,这估计是麦田往本地化走的准备。如果选择一个省,旁边的市的列表会自动刷新。这里我遇到了一点小问题:只有中国的省市。我只好选了“上海”。
从网站的组织结构看,是最大众化的BBS+BLOG形式,有论坛和版主。允许个人发布广告。有网上商城。从蚂蚁的无马甲规定,可以看出会有虚拟币和信用记录等。管理方式是以站长+版主的集中式管理方式。
总之,一切都很熟悉,很干净。可能是β版的关系,我目前还没有看出有什么特别吸引我的东西。不过,一个干净的社区,总是让人值得期待的。这里顺便向张楚致敬。
你还别小看SPAM,那也是技术活.你看我这篇”Blog translation, KESO:M$ Accuses Sina for Copying“,因为是英文的,这回复啊TB啊居然到了174个,其中只有10个是人干的,剩下全英文SPAM.
Spammer也不傻啊.
上次写了关于雅虎信箱的blog以后,接连收到雅虎中国的两次留言(一共四个,两篇blog里都有,可见他们很细致)。如此看重在下,这让人挺感动的(其实是有点受宠若惊啦)。我也是做技术的人,虽然没有做过客户服务,但是我有朋友做,知道这行的不容易。我的雅虎信箱的问题,其实在firefox里就没有了,所以我没有换信箱,换了个browser来登录雅虎(这里很不厚道的想,微软的弟兄们,你们不会来找我吧?
我平时还是用IE多,因为公司内部很多东西还是要IE方便)。这里倒是没有小看雅虎技术人员实力的意思,实在是在下平时比较忙,连写blog都是挤时间,而且那个bug实在是很飘忽,有的时候有,有的时候没有,我平时最痛恨这种bug了。
不多说了,小bug一个,现在也不影响我干活,就算了。谢谢雅虎中国。
谢了