Home Contact

Kelvin Zhang

一秒以前的希望现在变成了现实 --- before1s.com

March 2007 Entries

亿万用户网站MySpace的成功秘密

亿万用户网站MySpace的成功秘密 ◎ 文 / David F. Carr   译 / 罗小平 高速增长的访问量给社区网络的技术体系带来了巨大挑战。MySpace的开发者多年来不断重构站点软件、数据库和存储系统,以期与自身的成长同步——目前,该站点月访问量已达400亿。绝大多数网站需要应对的流量都不及MySpace的一小部分,但那些指望迈入庞大在线市场的人,可以从MySpace的成长过程学到知识。 用户的烦恼 Drew,是个来自达拉斯的17岁小伙子,在他的MySpace个人资料页上,可以看到他的袒胸照,看样子是自己够着手拍的。他的好友栏全是漂亮姑娘和靓车的链接,另外还说自己参加了学校田径队,爱好吉他,开一辆蓝色福特野马。 不过在用户反映问题的论坛里,似乎他的火气很大。“赶紧弄好这该死的收件箱!”他大写了所有单词。使用MySpace的用户个人消息系统可以收发信息,但当他要查看一条消息时,页面却出现提示:“非常抱歉……消息错误”。 Drew的抱怨说明1.4亿用户非常重视在线交流系统,这对MySpace来说是个好消息。但也恰是这点让MySpace成了全世界最繁忙的站点之一。 11月,MySpace的美国国内互联网用户访问流量首次超过Yahoo。comScore Media Metrix公司提供的资料显示,MySpace当月访问量为387亿,而Yahoo是380.5亿。 显然,MySpace的成长太快了——从2003年11月正式上线到现在不过三年。这使它很早就要面对只有极少数公司才会遇到的高可扩展性问题的严峻挑战。 事实上,MySpace的Web服务器和数据库经常性超负荷,其用户频繁遭遇“意外错误”和“站点离线维护”等告示。包括Drew在内的MySpace用户经常无法收发消息、更新个人资料或处理其他日常事务,他们不得不在论坛抱怨不停。 尤其是最近,MySpace可能经常性超负荷。因为Keynote Systems公司性能监测服务机构负责人Shawn White说,“难以想象,在有些时候,我们发现20%的错误日志都来自MySpace,有时候甚至达到30%以至40%……而Yahoo、Salesforce.com和其他提供商用服务的站点,从来不会出现这样的数字。”他告诉我们,其他大型站点的日错误率一般就1%多点。 顺便提及,MySpace在2006年7月24号晚上开始了长达12小时的瘫痪,期间只有一个可访问页面——该页面解释说位于洛杉矶的主数据中心发生故障。为了让大家耐心等待服务恢复,该页面提供了用Flash开发的派克人(Pac-Man)游戏。Web站点跟踪服务研究公司总经理Bill Tancer说,尤其有趣的是,MySpace瘫痪期间,访问量不降反升,“这说明了人们对MySpace的痴迷——所有人都拥在它的门口等着放行”。 现Nielsen Norman Group 咨询公司负责人、原Sun Microsystems公司工程师,因在Web站点方面的评论而闻名的Jakob Nielsen说,MySpace的系统构建方法显然与Yahoo、eBay以及Google都不相同。和很多观察家一样,他相信MySpace对其成长速度始料未及。“虽然我不认为他们必须在计算机科学领域全面创新,但他们面对的的确是一个巨大的科学难题。”他说。 MySpace开发人员已经多次重构站点软件、数据库和存储系统,以满足爆炸性的成长需要,但此工作永不会停息。“就像粉刷金门大桥,工作完成之时,就是重新来过之日。”(译者注:意指工人从桥头开始粉刷,当到达桥尾时,桥头涂料已经剥落,必须重新开始)MySpace技术副总裁Jim Benedetto说。 既然如此,MySpace的技术还有何可学之处?因为MySpace事实上已经解决了很多系统扩展性问题,才能走到今天。 Benedetto说他的项目组有很多教训必须总结,他们仍在学习,路漫漫而修远。他们当前需要改进的工作包括实现更灵活的数据缓存系统,以及为避免再次出现类似7月瘫痪事件的地理上分布式架构。 背景知识 MySpace目前的努力方向是解决扩展性问题,但其领导人最初关注的是系统性能。 3年多前,一家叫做Intermix Media(早先叫eUniverse。这家公司从事各类电子邮件营销和网上商务)的公司推出了MySpace。而其创建人是Chris DeWolfe和Tom Anderson,他们原来也有一家叫做ResponseBase的电子邮件营销公司,后于2002年出售给Intermix。据Brad Greenspan(Intermix前CEO)运作的一个网站披露,ResponseBase团队为此获得2百万美金外加分红。Intermix是一家颇具侵略性的互联网商务公司——部分做法可能有点过头。2005年,纽约总检察长Eliot Spitzer——现在是纽约州长——起诉Intermix使用恶意广告软件推广业务,Intermix最后以790万美元的代价达成和解。 2003年,美国国会通过《反垃圾邮件法》(CAN-SPAM Act),意在控制滥发邮件的营销行为。Intermix领导人DeWolfe和Anderson意识到新法案将严重打击公司的电子邮件营销业务,“因此必须寻找新的方向。”受聘于Intermix负责重写公司邮件营销软件的Duc Chau说。 当时有个叫Friendster的交友网站,Anderson和DeWolfe很早就是它的会员。于是他们决定创建自己的网上社区。他们去除了Friendster在用户自我表述方面的诸多限制,并重点突出音乐(尤其是重金属乐),希望以此吸引用户。Chau使用Perl开发了最初的MySpace版本,运行于Apache Web服务器,后台使用MySQL数据库。但它没有通过终审,因为Intermix的多数开发人员对ColdFusion(一个Web应用程序环境,最初由Allaire开发,现为Adobe所有)更为熟悉。因此,最后发布的产品采用ColdFusion开发,运行在Windows上,并使用MS SQL Server作为数据库服务器。 Chau就在那时离开了公司,将开发工作交给其他人,包括Aber Whitcomb(Intermix的技术专家,现在是MySpace技术总监)和Benedetto(MySpace现技术副总裁,大概于MySpace上线一个月后加入)。 MySpace上线的2003年,恰恰是Friendster在满足日益增长的用户需求问题上遭遇麻烦的时期。在财富杂志最近的一次采访中,Friendster总裁Kent Lindstrom承认他们的服务出现问题选错了时候。那时,Friendster传输一个页面需要20到30秒,而MySpace只需2到3秒。 结果,Friendster用户开始转投MySpace,他们认为后者更为可靠。 今天,MySpace无疑已是社区网站之王。社区网站是指那些帮助用户彼此保持联系、通过介绍或搜索、基于共同爱好或教育经历交友的Web站点。在这个领域比较有名的还有最初面向大学生的Facebook、侧重职业交流的LinkedIn,当然还少不了Friendster。MySpace宣称自己是“下一代门户”,强调内容的丰富多彩(如音乐、趣事和视频等)。其运作方式颇似一个虚拟的夜总会——为未成年人在边上安排一个果汁吧,而显著位置则是以性为目的的约会,和寻找刺激派对气氛的年轻人的搜索服务。 用户注册时,需要提供个人基本信息,主要包括籍贯、性取向和婚姻状况。虽然MySpace屡遭批评,指其为网上性犯罪提供了温床,但对于未成年人,有些功能还是不予提供的。 MySpace的个人资料页上表述自己的方式很多,如文本式“关于本人”栏、选择加载入MySpace音乐播放器的歌曲,以及视频、交友要求等。它还允许用户使用CSS(一种Web标准格式语言,用户以此可设置页面元素的字体、颜色和页面背景图像)自由设计个人页面,这也提升了人气。不过结果是五花八门——很多用户的页面布局粗野、颜色迷乱,进去后找不到东南西北,不忍卒读;而有些人则使用了专业设计的模版(可阅读《Too Much of a Good Thing?》第49页),页面效果很好。 在网站上线8个月后,开始有大量用户邀请朋友注册MySpace,因此用户量大增。“这就是网络的力量,这种趋势一直没有停止。”Chau说。 拥有Fox电视网络和20th Century Fox影业公司的媒体帝国——新闻集团,看到了他们在互联网用户中的机会,于是在2005年斥资5.8亿美元收购了MySpace。新闻集团董事局主席Rupert Murdoch最近向一个投资团透露,他认为MySpace目前是世界主要Web门户之一,如果现在出售MySpace,那么可获60亿美元——这比2005年收购价格的10倍还多!新闻集团还惊人地宣称,MySpace在2006年7月结束的财政年度里总收入约2亿美元,而且预期在2007年度,Fox Interactive公司总收入将达到5亿美元,其中4亿来自MySpace。 然而MySpace还在继续成长。12月份,它的注册账户达到1.4亿,而2005年11月时不过4千万。当然,这个数字并不等于真实的用户个体数,因为有些人可能有多个帐号,而且个人资料也表明有些是乐队,或者是虚构的名字,如波拉特(译者注:喜剧电影《Borat》主角),还有像Burger King(译者注:美国最大的汉堡连锁集团)这样的品牌名。 当然,这么多的用户不停发布消息、撰写评论或者更新个人资料,甚至一些人整天都泡在Space上,必然给MySpace的技术工作带来前所未有的挑战。而传统新闻站点的绝大多数内容都是由编辑团队整理后主动提供给用户消费,它们的内容数据库通常可以优化为只读模式,因为用户评论等引起的增加和更新操作很少。而MySpace是由用户提供内容,数据库很大比例的操作都是插入和更新,而非读取。 浏览MySpace上的任何个人资料时,系统都必须先查询数据库,然后动态创建页面。当然,通过数据缓存,可以减轻数据库的压力,但这种方案必须解决原始数据被用户频繁更新带来的同步问题。 MySpace的站点架构已经历了5个版本——每次都是用户数达到一个里程碑后,必须做大量的调整和优化。Benedetto说,“但我们始终跟不上形势的发展速度。我们重构重构再重构,一步步挪到今天”。 尽管MySpace拒绝了正式采访,但Benedetto在参加11月于拉斯维加斯召开的SQL Server Connections会议时还是回答了Baseline的问题。本文的不少技术信息还来源于另一次重要会议——Benedetto和他的老板——技术总监Whitcomb今年3月出席的Microsoft MIX Web开发者大会。 据他们讲,MySpace很多大的架构变动都发生在2004和2005年早期——用户数在当时从几十万迅速攀升到了几百万。...

架构师书单 2nd Edition【转】

高效读书心得    刚好Head First系列开头都有一段教人如何读书的话,结合自己的经验整理如下: 1.尽量阅读中文版   虽然有人英文很强,有的翻译很差,但AnyWay 中文阅读与理解的时间,略读与快速定位感兴趣内容的速度还是要快一些。   2.即时批注、总结笔记与交流   虽然爱书,但发现最有效的读书方式还是不断的制造脂批本,读书时在重要的文字下划线,把自己的心得写在页旁。   读完后,把上面的划线与批注,用自己的语言重新整理表述。有人喜欢用MindManager,我还是习惯纯文本123。   最好在明天复习一次,或者拿来与人讨论。   3.大量思考或重复记忆   看书最郁闷的事情就是看完之后脑袋空空了。偏重技术的书还好点,虽然看的时候可能很辛苦,但就像学会了骑单车之后,再骑的时候总是会的;而偏重设计与管理的书,最容易的事情就是看的时候很快,看完没什么留下到项目实践中。   所以,我们不能以看小说的速度来看设计书,要寻找思考的机会,思考是最好的记忆。   如果实在没有思考的topic,就只有大量的重复记忆,重复多遍直到无意识的记忆。    4.人体工学   那些见缝插针的时间与地点不是看这个书单的好地方。   环境不要有电视,音乐等强输入源,而微风阳光鸟语等弱输入源则有助活跃大脑。   看书时大量的喝水。   如果发现自己的大脑已经疲累,已经在浮光掠影的翻看,就要休息。   留给大脑消化的时间,看完书不要接着看其他有难度的书或事情。    一、Software Architecture篇      这个领域没有什么"畅销书",可能读者中本来就是开发设计人员与项目经理占了多数,真正定位为架构师而且做的也是架构师工作的不多吧。    1.软件架构入门  《Large-Scale Software Architecture--大型软件体系结构:使用UML实践指南》    现代架构师的入行指南。    2. 软件架构理论  《The Art of Software Architecture--软件体系结构的艺术》     薄薄的一本,架构理论的抽象与提升。     3.软件架构编档与评估 《Documenting Software Architectures--软件构架编档》    第13届JOLT大奖作品,市面上介绍UML描述架构的书很多,但捕获架构的过程,为什么这样捕获的书籍就少了,所以它拿JOLT。 《Evaluating Software Architectures--软件构架评估》     SEI出品,正儿八经的ATAM、SAAM架构评估方法。   4.企业架构 《Guide to Enterprise IT Architecture --企业IT体系结构》    Open-Group的TOGAF(The Open Group Architecture Framework)的描述,企业架构是软件架构加上硬件架构,信息架构等的集合。   二、架构模式篇     GOF23属于开发人员的Pattern,架构师同样也有架构师的Pattern。 1. 设计模式  《Head First Design Patterns》   最好的GOF23经典设计模式讲解,中文版即将发行。  。 2. 企业应用架构模式  《Patterns of Enterprise Application Architecture--企业应用架构模式》     Martin Fowler经典,企业应用各分层上的模式。   3. 业务分析模式  《Analysis Patterns--分析模式》     Martin Fowler作品,业务信息建模的模式,但需要刚好有那个经验的人才看得进去。 《BUSINESS MODELING WITH UML:Business Patterns at Work --UML业务建模》     业务建模的UML扩展与商业模式。 4. 框架设计  《Domain-Specific Application Frameworks--特定领域应用框架:行业的框架体验》  介绍了特定领域特定框架的设计,我自己最喜欢看人家的设计与思考。      三、特定领域模式篇 1. Java EE领域     《Expert One-on-One J2EE Design and...

推荐服务(recommended serivce)

引自:http://www.maayee.com/article/32970.html 网页浏览模式一般分为两种分两种 ,搜索模式 & 浏览模式 搜索模式中,客户直接找到自己的所需要的产品,搞定拉倒,不在本文的论述范围 浏览模式中,客户在浏览过程中,并不确定自己的具体需求,只有一个大概的“痛点”范围,并希望在浏览的过程中找到解决自己潜在需求的途径。在这样的状况下,客户会希望服务商提供能解决自己模糊痛点的产品,同时服务商希望能了解客户的需求,给出相应的服务建议,适时推荐自己的产品。 基于此,推荐服务(recommended service)应运而生。服务商根据一系列的数据收集和算法手段,推断出顾客的喜好产品,并将产品对客户进行推荐。 在此,推荐产品的准确程度成为了推荐系统的主要评价标准。 在现有的web服务中,大概有以下几种推荐服务方式 1.根据过往行为的推荐 根据客户的往常行为,判断客户对产品的需求,并推荐给客户过往产品的相关产品。 例如在sina阅读体育新闻,服务商根据对客户行为的一段时间记录和分析,如果客户点击英超的比例较高,可以相应将英超新闻放置在主页更显著的位置,以提供更好的用户体验。 此推荐的准确度很大程度上依赖商家对产品的划分和评级,怎么把相应的产品分类聚合是推荐准确性的最大问题。 并且有相应的局限性——推荐的产品仅仅只能在顾客曾经关注过的门类之内,不能进行跨门类推荐。 2.根据相似用户的社会化推荐(social recommended service) social的观念正是web2.0中的核心部分,怎么能把social的力量发挥出来,为整个系统服务是web2.0的最大创新。 wiki,google翻译等产品均是利于这样的理念——不是机器为我选择了什么,而是大家都这样选。 不同于行为推荐的方式,社会化推荐并不单一的判断一个客户的行为,而是针对与客户有相似喜好的客户群体行为进行统计。根据大部分客户的行为为客户提供推荐。 这样的推荐方式完全不同于1.0模式中间的行为推荐,而是相信social的力量,推荐的内容可以跨门类,甚至可以推测出一个喜欢刘德华的音乐的人,大概会喜欢什么牌子的饼干。 这一类推荐的准确性很大程度上依赖足够大的用户群体,并且具有推荐非热门产品的能力,更容易发挥长尾的力量。 3.行为+社会化 推荐 douban是一个很好的例子。为客户的过往行为,以及social力量分配不同的权值,在两个方面同时计算排序。 现在看来,推荐的准确性比1,2方式好。(就我个人的使用体验,豆瓣的推荐是比较准确的)。 4.基因推荐(最special的推荐) 基因推荐在一定程度上也基于社会学的概念——人的喜好是大体相互联系的,并且是相对固定的。如果测定出客户某个方面喜好的“dna”,就能准确的推荐客户喜欢的产品 yobo是国内做的最有名气的基因推荐系统,通过对客户的音乐dna测试和长期体验中选择 喜欢音乐,不喜欢音乐 调整,会慢慢逼近用户的实际喜好。 基因推荐在现有阶段,依然显得单薄和幼稚。在我的体验中,找到喜欢的歌的几率依然很小。 对于每首歌的dna衡量是整个系统的难点,yobo的四维音乐理论也还需要具体商榷。 总结: 凡事可以从两个方向理解,一方面客户能否得到方便,另一个方面是否能为服务提供商创造利润。 在推荐系统这个问题上,两方利益是相似的。如何为用户找到自己最满意的产品,一方面能满足客户的要求,很方便的找到自己的潜在需求,在另一个方面为服务提供商创造了商机。 如果能在技术上和社会学上解决推荐中间的问题,下一波互联网的高潮体验不久就会到来。 Web2.0 ... 机器是(在利用)我们

网站要如何开展口碑推广

提到口碑推广,大部分人都觉得它比SEO还神秘,其实任何一种推广手段都是有规律和循的,今天和大家分享一部分网站口碑推广的经验。 口碑推广第一步:让用户记住你的网站 如果要让用户记住你的网站呢?你需要做到以下几点: 1、网站要有特色,特色包括定位、内容、设计等方面; 2、特别要很好的表现出来,让用户快速知道你的网站给其带来的好处; 3、网站域名特别容易记忆和传播、网站的名称也特别的容易记忆和传播。 口碑推广第二步:要让用户浏览你的网站的时候感觉非常好 如何让用户获得较好的感觉呢? 1、服务器速度一定要快, 这是非常重要的一条因素,给用户“快”感了,用户自然会喜欢上你的网站。 2、网站设计一定要人性化 网站的设计不要千篇一律的去模仿,要站到用户的角度来考虑,如何让用户方便就如何来设计。 3、把你的好处很直白的表现出来 很多网站有很多很好的东西,但是总是搞得很朦胧,很难让用户在上到你网站的第一眼就看到你的好处。做网站不是搞艺术,千万不要搞朦胧,越直接就越好。 比如:翰音网做人性化优化的时候,在其新用户注册页面加上以下几句话: ü 拥有了自己的音乐博客,把自己喜欢的音乐全部添加到音乐博客中,以后就不用每次上网都去找歌了。 ü 拥有了自己的音乐博客,你就可以把自己的音乐作品、flash作品、DV作品上传到网上与众多网友分享了 ü 拥有了音乐博客,你就成为一个新时代的新新人类了,你的生活将因为音乐博客将而变多的多彩! ü 拥有了音乐博客,你就和刀郎、东来东往成为了网络邻居,你有可能也会像他们一样出名哦! 只要进入注册页面的用户只要看了这几句好处说明,一定会迫不及待的赶快注册。 口碑推广第三步:在网页中关键位置暗示用户去口碑宣传 如果你不提醒用户,大部分用户都不会主动帮你宣传,但是一旦你在网页中的重 要位置暗示用户了,喜欢你网站,觉得你网站好的用户就会帮你口碑宣传。 还是以翰音网为例子:我们在其用户发表音乐博客成功之后加上了一句提示语言: “你好棒啊! 赶快把你的博客地址发给你的好友,和他们分享一下你的心情!” 有了这句暗示,大部分用户都会接受这句暗示,把自己的新发的页面发给自己的好友来看! 这里有一个小技巧:暗示语一定要先夸用户,然后再暗示用户做口碑推广,并且让用户感觉到这是在提醒他、帮他。而不是利用他。 要熟练掌握口碑推广,就需要多揣摩用户的心理,然后按照以上三个步骤,把这过程中的众多细节都一个个做好。 口碑推广是网络营销策略中最重要的策略之一,口碑推广做好了,不仅仅可以提升网站的流量,更重要的可以提升网站粘度,提升网站的品牌。 引自:http://home.donews.com/donews/forum/22/2007-03/01/626381.html