九月 30, 2006

一直想写点关于Second Life和虚拟世界的东西。最近看了keso的“虚拟或现实”,以及闾丘露薇的“网络世界会怎样”,终于打算一吐为快。

Second Life不是一般网游

第一次知道Second Life是在Google Video上偶然看到了一段Google TechTalks的录像。Second Life是总部在旧金山的Linden Lab提供的由玩家共建的真三维的虚拟世界。很多人都以为Second Life只不过是象“传奇”,“魔兽”那样的另一个网络游戏。其实不然。跟网游最大的区别,Second Life没有场景设置,没有情节设置,这里的“居民”{Second Life里的玩家不愿意被叫作“玩家”,而是“居民”--residents}一开始什么都没有,除了一个很强大的工具:脚本{scripting language}。只要你有足够的想象力,你可以用这个脚本工具创造任何东西,衣服,店面,寓所,就好像搭“乐高”玩具一样。跟“乐高”不一样的是,在这里连每一种积木的样子,功能,跟其他积木的接口,你都可以自己设计。前面提到的那段录像就有很多用这个脚本工具创建出来的酷玩意儿。

不光是造东西,“居民”们还可以用这个脚本工具构建起非物体的东西,比如,创建一个为人提供公证的服务,再比如,举办一个Thriller Dance舞会,邀请朋友来嘻哈一下。

Second Life是真正的商务

2003年11月,Linden Lab史无前例地宣布,所有在Second Life里创建的东西产权都属于创建者所有。 如果你是新手上路,刚登录到Second Life时一无所有,也不会使用这个脚本工具,唯一能做的就是四处逛逛。到处都有服装店,你可以溜达进去,用Linden币(跟美金以约300:1兑换)买身酷酷的衣裳。注意这些酷酷的以上衣裳都是拥有者或者买来,或者自己用脚本工具创建出来的。溜达累了,你可以买一块地住下来,这样你的“爱娃她”{avatar,指在虚拟空间里真三维的你}在你下线之后还有个地方住着。在Second Life里每天都有大量的交易以Linden币成交,光今年一月份一个月,就有420万笔买衣服,买房子的交易成交,总额达500万美金,真的绿花花的美金。

英格兰一位35岁的工人,赋闲在家,开始只是无聊才玩Second Life,很快他就用脚本工具创建了一个跳舞球, 这样,一对男女的“爱娃她”在一起,点击一下这个跳舞球,就可以拥抱在一起跳上一曲。很快这个跳舞球就变得非常流行,他每天可以卖掉300个左右,约300Linden币{合一个1美金}一个。这样他一个礼拜就有约1900美金的收入,养家是够了。

还有一位31岁的澳大利亚程序员Nathan Keir,在Second Life里创建了一个叫作Tringo的游戏,结合了“俄罗斯方块”和“宾果”游戏{Tringo = Tetris + Bingo},目前卖了226个,每个约15000Linden币{合50美金},以至于一家叫Donnerwood Media的真实世界里的游戏公司愿意付五位数来购买这个游戏的版权,然后把这个游戏发布到真实世界的游戏平台。

这样的例子不胜枚举。 根据网络游戏服务公司IGE的调查,2005年约有10亿美金的真钱花在购买虚拟空间里的虚拟物品{包括所有的网络游戏,不仅是Second Life},而今年则会达到15亿美金。

虚拟或现实

这里盗用了keso的题目。 据统计,Second Life里的居民花四分之一左右的在线时间来创建各种各样的东西。他们觉得自己在创建一个全新的世界--事实上他们是。Linden Lab的人说,这样大的一个世界,要花费4100人一年的工作量才能完成。假设一个程序员挣10万美金一年,那就是Linden Lab节省了4亿一千万美金的开销。而且你想,这些免费劳动力每个月倒贴6到几千美金来干活。更别说这些免费劳动力都是心甘情愿,乐此不疲--人们在游戏里总是津津有味地做一些非常琐碎的活,一般程序员哪儿做得到这点。

于是就有人提出,为什么不利用游戏心理,激励机制,社交性质,以及脑力激荡来完成一些真实的工作呢?事实上,一位斯坦福教授开设的小创投公司就在探索把真实世界的工作交给游戏世界的人来完成,寓作于乐,效果定是不错{恕在下神往下下,马上回来}。

真实世界里很多人瞄准了虚拟世界里的商机。英国的一间品牌推广行Rivers Run Red就在跟真实世界里的流行时装界以及媒体公司合作,通过三维展示把他们的品牌推广到Second Life里。

沃尔玛,American Express,Intel,以及另外200多家公司,也在Second Life里尝试使公司能更好合作学习的方法。

有人认为Second Life可以挑战微软成为更好的一个创建娱乐,商务软件以及提供服务的平台。甚至连微软的大极客Robert Scoble也表示Second Life就是下一代的操作系统

而当这一天到来,虚拟就是现实,现实亦是虚拟,恐怕很难截然分开了。

社会问题

这个社会,有好人就有坏人,在哪儿都一样。Second Life不可避免的,也有一定的社会问题。尽管Linden Lab规定不能在公共场所有过激行为,比如种族歧视,过度的性展示等等。 但在私人空间里,有些不检点的成年人就会做出一些在真实世界里会让他们坐牢的出格行为。目前,这样的问题有争议但没有答案。

注:材料大部分来源于“商业周刊”。

九月 29, 2006

先说个故事。我有个朋友,开车老迷路,迷了路就打电话问朋友。后来装了GPS,结果还是迷路,于是还是打电话向朋友问路。完了感叹,还是人肉GPS管用。我想你现在已经知道了”人肉叉叉”这个词组的意思了。
然后看到了麦田所说的人肉搜索,把社会化搜索和社区划了个等号。完了有人反驳 有人干脆拍,麦田也进一步阐述。我前段时间也在琢摩这事儿,没想人肉搜索这么远,只是想到人肉聚合什么的。想把自己平时阅读的文章中精彩而且自己感兴趣的部分撷趣下来,有相同兴趣的人也许会觉得这样的尝试有所裨益,而我也因此能认识同好,开阔视野。这似乎跟网摘没什么两样。但老实说,我看了一阵digg的新闻后,总觉得头昏脑涨,看了一上午,完了好像觉得什么也没看着似的。后来经朋友介绍发现了365key上的94smart,觉得比较对胃口。一来关心的东西差不多,二来爱看的博客及网站口味相近,三来有贴心的文章摘要什么的。于是就用94smart做我的人肉聚合器。当时就想,能够多几个94smart这样的活雷锋就好了。当然,自己也努力地回馈社区。
再回头想想我那个爱迷路的朋友。为什么有了GPS还会迷路呢?GPS是机器嘛,总是有可能出错嘛。如果GPS指错路了,我那朋友也就迷路了呀。再说,祖国日新月异,指不定今儿就改道,明儿就造一新路出来呢。GPS的数据库跟不上时代的发展嘛。还有一个可能,我那朋友可能没什么方向感,再加上跟GPS的磨合不好。就好像同样在Google上找东西,有的人总找到宝贝,有的人最后总是垂头丧气。因为跟Google这个工具磨合得不好。就象我,只会在Google的搜索框里打字,从不使用高级搜索,有时恨不得摁一下”手气不错”。那迷了路,为什么是打电话给朋友,而不是大街上随便问一个人呢?我想答案是”可信度”。朋友总比大街上随便一个人可信。这也是为什么口碑传播可以达到很好的效果。
让我试着来探索一下人肉搜索的几个要素:

  1. 如keso说的,更好的搜索算法。
  2. 发现和聚合人肉智慧的能力。这个太笼统,但我也说不清楚。Google Base把人肉信息结构化,为精确营销打开了方便之门,但还谈不上聚合人肉智慧。
  3. 衡量信息可信度的机制。也许可以是信息发布者在社区里的口碑。
  4. 大量的好公民。实名制备受争议,未必可取。但需要有某种机制能使社区成员珍惜自己的信用度和口碑。在人工智能解决不了问题的今天,我们还是倚靠一下“工人智能”吧。
  5. 简单实用的界面。最好是用提问的方式。回答的结果最好简洁。Google的搜索结果我几乎从不会翻到3页以后。

欢迎讨论。

4-yr-old2002

5-yr-old2003

6-yr-old2004

7-yr-old2005

8-yr-old2006

来源:G速客

九月 28, 2006

最近看了一篇关于相关性搜索广告和针对性品牌广告的探讨文章,觉得蛮有意思。现摘要如下:

  • 消费者注意力逐渐导向网上,以及臭名昭著{infamous,原文如此}的长尾/用户产生内容。
  • 品牌广告跟现有的传播模型{distribution model}不切合。
  • Google提供的核心是相关性--搜索结果的相关性,广告的相关性。
  • Google在”广告是内容的一部分,不是负面效应的外来者”这个概念上有所斩获。
  • Google提供的广告通过相关性也增加了发布者{publisher}内容的价值。
  • 相关性:增加了广告生态系统里所有成员的价值,无论是用户,发布者,还是广告商。
  • 品牌广告的传播方法总是脱不开站点靶向{site targeting}和人口统计分类靶向{demographic targeting}。
    • 站点靶向不是最终方案:
      • 站点靶向的可扩容性不好。
      • 在商务上很难横跨几百个电视频道来综合洽谈广告购买--更不要说要横跨几乎无穷无尽的长尾内容了。
      • 有人试验在eBay上创建一个可以横跨几百个电视频道购买广告的有效市场。
    • 人口统计分类靶向也不是最终方案:
      • 电视广告是内容之间的30秒空间,而网上广告是 内容的一部分。
      • 使用靶向既是太多控制又是控制不够:
        • 可能增强了用户体验,也可能减低了用户体验
        • 只有广告商瞄准的受众才能体会到广告商所期望的品牌形象提升和放大。
  • 需要有一个市场可以对所有库存的广告投标(无论品牌广告,或者交易型广告{transactional ad},或者其他形式的)。
  • 还需要另外一个市场来决定”在足以提高品牌形象的内容里传播品牌广告并到达特定受众”的市场价值。
  • 合并这两个市场来决定最有效的,可以横跨整个发布商网络的,品牌或者交易型广告的传播方式。
  • 对CPC和CPM的最优化结合,以及决定广告效果的可度量性。
  • 长尾的,尤其是社会性的内容,在决定发布什么时几乎从不考虑广告商的因素,而不是象商业机构产生的内容那样步步为营。
  • 什么是这几者之间缺少的环节呢:品牌广告商不断增加的染指网络广告的需求,电视广告的价值有所下降,搜索广告网络对于吸引品牌广告商网络广告预算的强烈渴望?
    • 全新的可以决定品牌广告相关性的系统!
    • 为品牌广告创建交易场所,并重新思考广告的生态系统。
    • 考虑品牌广告的标的,以及广告生态系统里各个参与者的目的和对广告生态的影响。

这里还有一些在阅读这篇文章时的额外发现(可能是旧闻了):

  • Google进入品牌广告:Google和Sony在今年5月达芬奇密码电影公映前 联合推出了24个每日迷题。其结果,可能Google倒是最后的赢家,因为这也是Google自己的产品推广。不光是Google搜索,还有Calendar,Mail,Talk,尤其是Google的ig。别的不说,你起码的有个Google帐号才能玩啊。
九月 27, 2006

5.3 子表服务

Bigtable_Figure5.jpg
图5:子表表示

子表的状态存放在GFS里,如图5所示。更新内容提交到存放redo记录的提交日志里{比较绕,看原文可能清楚点}。在这些更新中,最近提交的那些存放在内存里一个叫memtable的有序缓冲里;老一点的更新则存放在一系列SSTable里。若要恢复一个子表,子表服务器从METADATA表中读取元数据。元数据包括了由一个子表和一系列redo点{redo怎么翻好?}组成的SSTable列表,这些是指向可能含有该子表数据的提交日志的指针{烦死定语从句了}。 该服务器把这些SSTable的索引读进内存,并通过重复redo点之后提交的更新来重建memtable。

当一个写操作到达子表服务器时,该服务器检查确信这个操作完整无误,而且发送方有权执行所描述的变换。授权是通过从一个Chubby文件里读取具有写权限的操作者列表来进行的(几乎一定会存放在Chubby客户缓存里)。合法的变换会写到提交日志里。可以用成组提交来提高大量小变换的吞吐量[13,16]。写操作提交后,写的内容就插入到memtable里。

当一个读操作到达子表服务器时,会作类似的完整性和授权检查。合法的读操作在一个由SSTable系列和memtable合并的视图里执行。由于SSTable和memtable是字典序的数据结构,合并视图可以很有效地形成。

进来方向的{incoming}读写操作在子表分拆和合并时仍能继续。

5.4 紧缩{compaction}

在执行写操作时,memtable的大小不断增加。当memtable大小达到一定阈值时,memtable就会被冻结,然后创建一个新的memtable,冻结住的memtable则被转换成SSTable并写到GFS里。这种次要紧缩过程有两个目的:缩小了子表服务器的内存用度,以及减少了在服务器当机后恢复过程中必须从提交日志里读取的数据量。 进来方向的读写操作在紧缩进行当中仍能继续。

每一个次要紧缩会创建一个新的SSTable。如果这种行为一直继续没有停止的迹象,读操作可能需要合并来自任意多SSTable的更新。相反,我们通过定期在后台执行合并紧缩来限定这类文件的数量。合并紧缩读取一些SSTable和memtable的内容,并写成一个新的SSTable。一旦紧缩完成,作为输入的这些个SSTable和memtable就可以扔掉了。

把所有SSTable重写成唯一一个SSTable的合并紧缩叫作主要紧缩。 由非主要紧缩产生的SSTable可以含有特殊的删除条目,它们使得老一点但仍活跃的SSTable中已删除的数据不再出现。而主要紧缩则产生不包含删除信息或删除数据的SSTable。Bigtable在它所有的子表中循环,并且定期对它们执行主要紧缩。这些主要紧缩使得Bigtable可以回收已删除数据占有的资源,并且还能保证已删除数据及时从系统里小时,这对存放敏感数据的服务很重要。

{第六节待译

九月 26, 2006

大表(Bigtable):结构化数据的分布存储系统

http://labs.google.com/papers/bigtable-osdi06.pdf
{}中是译者评论
第一节 介绍

第二节 数据模型

BT是一个稀疏的,长期存储的{存在硬盘上},多维度的,排序的映射表.这张表的下标是行键,列键和时间戳.每个值是一个不解释的字符数组.{数据都是字符串,没类型,客户要解释就自力更生吧}.

(row:string, column:string,time:int64)->string {能编程序的都能读懂,不翻译了}

接着翻:

我们仔细查看过好些类似bigtable的系统之后定下了这个数据模型。举一个具体例子(它促使我们做出某些设计决定), 比如我们想要存储大量网页及相关信息,以用于很多不同的项目;我们姑且叫它Webtable。在Webtable里,我们将用URL作为行关键字,用网页的某些属性作为列名,把网页内容存在contents:列中并用获取该网页的时间戳作为标识,如图一所示。

Photobucket - Video and Image Hosting

图一:一个存储Web网页的范例列表片断。行名是一个反向URL{即com.cnn.www}。contents列族{原文用 family,译为族,详见列族}存放网页内容,anchor列族存放引用该网页的锚链接文本。CNN的主页被Sports Illustrated{即所谓SI,CNN的王牌体育节目}和MY-look的主页引用,因此该行包含了名叫“anchor:cnnsi.com”和 “anchhor:my.look.ca”的列。每个锚链接只有一个版本{由时间戳标识,如t9,t8};而contents列则有三个版本,分别由时间 戳t3,t5,和t6标识。

表中的行关键字可以是任意字符串(目前支持最多64KB,多数情况下10-100字节足够了)。在一个行关键字下的每一个读写操作都是原子操作(不管读写这一行里多少个不同列),这是一个设计决定,这样在对同一行进行并发操作时,用户对于系统行为更容易理解和掌控。

Bigtable通过行关键字的字典序来维护数据。一张表可以动态划分成多个连续行。连续行在这里叫做“子表”{tablet},是数据分布和负载均衡的单位。这样一来,读较少的连续行就比较有效率,通常只需要较少机器之间的通信即可。用户可以利用这个属性来选择行关键字,从而达到较好数据访问地域性{locality}。举例来说,在Webtable里,通过反转URL中主机名的方式,可以把同一个域名下的网页组织成连续行。具体来说,可以把maps.google.com/index.html中的数据存放在关键字com.google.maps/index.html下。按照相同或属性相近的域名来存放网页可以让基于主机和基于域名的分析更加有效。

列族

一组列关键字组成了“列族”,这是访问控制的基本单位。同一列族下存放的所有数据通常都是同一类型(同一列族下的数据可压缩在一起)。列族必须先创建,然后在能在其中的列关键字下存放数据;列族创建后,族中任何一个列关键字均可使用。我们希望,一张表中的不同列族不能太多(最多几百个),并且列族在运作中绝少改变。作为对比,一张表可以有无限列。

列关键字用如下语法命名:列族:限定词。 列族名必须是看得懂{printable}的字串,而限定词可以是任意字符串。比如,Webtable可以有个列族叫language,存放撰写网页的语言。我们在language列族中只用一个列关键字,用来存放每个网页的语言标识符。该表的另一个有用的列族是anchor;给列族的每一个列关键字代表一个锚链接,如图一所示。而这里的限定词则是引用该网页的站点名;表中一个表项存放的是链接文本。

访问控制,磁盘使用统计,内存使用统计,均可在列族这个层面进行。在Webtable举例中,我们可以用这些控制来管理不同应用:有的应用添加新的基本数据,有的读取基本数据并创建引申的列族,有的则只能浏览数据(甚至可能因为隐私权原因不能浏览所有数据)。

时间戳

Bigtable表中每一个表项都可以包含同一数据的多个版本,由时间戳来索引。Bigtable的时间戳是64位整型。可以由Bigtable来赋值,表示准确到毫秒的“实时”;或者由用户应用程序来赋值。需要避免冲突的应用程序必须自己产生具有唯一性的时间戳。不同版本的表项内容按时间戳倒序排列,即最新的排在前面。

为了简化对于不同数据版本的数据的管理,我们对每一个列族支持两个设定,以便于Bigtable对表项的版本自动进行垃圾清除。用户可以指明只保留表项的最后n个版本,或者只保留足够新的版本(比如,只保留最近7天的内容)。

在Webtable举例中,我们在contents:列中存放确切爬行一个网页的时间戳。如上所述的垃圾清除机制可以让我们只保留每个网页的最近三个版本。

{第二节完}

{美人他爹将翻译第三,四节}

九月 23, 2006

OneWebDay
看到报道说,今天,9月22日,是第一个OneWebDay(姑且叫它作“互联网日”)。这个全球性的推广活动的宗旨是“建立,维护,提高和推广一个用以庆祝网上生存的全球节日”。它由纽约Cardozo法学院的副教授Susan Crawford成立,并且得到了包括互联网创始人Tim Berners-Lee爵士,以及Craigslist创始人Craig Newmark等重量级人物的背书。届时会有Second Life虚拟世界的庆祝,也由全球各地真是世界里的庆祝。

OneWebDay的出发点是“讲述在世界各地互联网是怎样改变了我们的生活”。“我们正使互联网呈现在每个人面前,这样我们才不会认为这是理所当然的(而不去重视珍视它)。”

Fred Wilson打了个比喻:“互联网就想我们的行星-地球。它是一个我们需要珍视,尊重,保护,和庆祝的资源。”

建议的OneWebDay活动包括(但不局限于):

  • 在Flickr上贡献一张人们做OneWebDay手势的照片,最后做成幻灯。
  • 教你祖母如何建立自己的博客(很想用奶奶这个可亲一点的词,可是不知什么时候起,这个词一旦跟“你”,“他”在一起就成了不雅之词,这算是互联网的一个悲哀)。
  • 为你的俱乐部,沙龙,教堂,学校等等建立一个网站。
  • 打工仔:教你的老板如何用IM。
  • 医生:为你的病人设立网上的自助预约系统。
  • 我如何在网上找到了工作。
  • 我如何在网上找到志同道合的朋友。
  • 。。。

我觉得似乎还应该加上这些活动(作为另一类的思考):

  • 我如何在网上找到一夜情对象/How did I find one-night-stand online
  • 网游如何使我走上犯罪道路/How did the online game teach me to steal?
  • 我经常光顾的色情网站/My favorate porn sites
  • 我是如何黑掉某某网站的/How did I hack that site
  • 我的信用卡被盗用的故事/Tons of hassles after my credit card number got stolen online
  • 垃圾邮件的艺术/The art of spamming
  • 你封、封、封、封ID,我换、换、换、换马甲/The beauty of anonymity
  • 。。。
九月 22, 2006

昨晚在网上瞎逛荡,溜达到土豆,把早先的“清华夜话”复习了一遍。里面有个很搞笑的猛男,说帮人编了一年的程序,才只赚了几千块钱,平均每天才只有十块钱,还不如去筛沙呢~~台下顿时哄堂大笑(枪版的)。我也跟着笑笑,好笑是挺可乐的,心想他说的“筛沙”,恐怕指的是出卖纯体力,没什么技术含量的意思。

今天一早,看到小豆瓣踹背了一下我的一篇文章,就顺藤摸瓜过去看看,就看到了关于“筛沙子”这事儿,才明白台下为什么哄笑了。

厌倦了Web1.0信息饱和轰炸的我们,终于在Web2.0中找到了自我,用自己的鼠标,定义自己的网络人生。 然而我们每天在网上做的最多的事情,可不就是筛沙吗?有人帮你用大筛筛一遍,然后自己每天用小筛筛,偶尔能找到些发亮的东西,再仔细看,也可能是鱼鳞碎玻璃片什么的,不见得是金子。

人与人之间的距离,有时候就只隔着短短几下的点击,有时候却又被粗暴的搜索引擎排到不知道哪页去了。想要有用的信息,有时候挖来挖去都只是沙子和石头,而有时候,在你最不经意的时候,它飘然而至。这不挖而至的惊喜,冥冥中的,还是因着缘分吧?

Update:

九月 21, 2006
  • 报道说,Google正在跟Apple谈通过iTV来播放Google视频的可能。届时,Google在iTV上显示上下文相关的广告也是一个可能。
  • 雅虎跟Current.tv合作,在雅虎视频里播放Current.tv的内容。之前Current.tv跟Google有一项不太为人所知的类似合作,不同的是内容是由放在Current.tv的网站上。彼岸在雅虎Current上遛了一圈,看到对那个Numa Numa男孩的有趣采访
  • YouTube今天早晨宣布跟Cingular,ABC合作推出YouTube Underground节目,用以发掘美国最有才华的地下乐队。乐队可以在10月2日倒18日期间提交原声视频,然后YouTube用户可以从中票选自己最喜欢的乐队。入围决赛者可以参加ABC的Good Morning America节目。继YouTube两天前宣布跟华纳音乐合作后,这次进一步证明用它庞大的用户群来挣钱只是时间问题。之前跟NBC的合作已经让YouTube登上了Jay Leno节目
九月 20, 2006

今天,9月19日,是一年一度的Talk Like A Pirate Day。今天每个人都可以象海盗那样说话,世界各地的人们也以各种各样的方式庆祝这一特别的日子。那么海盗是怎么样说话的呢?我从这里摘录的一些:

  • “Ahoy, me hearties!” 相当于 “Hello, my friends!”
  • “Shiver me timbers!” 相当于 “Oh my!”,表示惊讶。
  • “Weigh anchor!” 就是 “Let’s go!”
  • “Yarr.” 就是 “Yes.”
  • “Savvy?” 意思是 “Do you understand?”
  • “I’m gonna make a kill!” 意思是 “I’m serious about it!”

找不到你想要表达的意思?这里有一个海盗语翻译器。 我正读着“How to use Digg to get traffic”,就随便让它翻译了一下:

Ahoy, how t’ Use Digg t’ Get Traffic A pence for an old man o’de sea?

还有一个有趣的网站可以为你产生一个海盗名号。这是彼岸咬牙切齿做了两整页选择题得到的名号:

Dirty John Rackham

以及对我个盗格分析:

You’re the pirate everyone else wants to throw in the ocean — not to get rid of you, you understand; just to get rid of the smell. You have the good fortune of having a good name, since Rackham (pronounced RACKem, not rack-ham) is one of the coolest sounding surnames for a pirate. Arr!

言下之意,我太臭了(跟那道洗澡题有关吗?),所以大家都想甩掉我,但很幸运我有一个好名字Rackham,是最酷的海盗姓之一。Aaaaaaaaaaaargh!

下一页 »