曾几何时,Yahoo 还是全球最顶级的技术公司之一。“唯一的例外是 Google,”曾负责 Yahoo 数据技术及产品的前资深副总裁 Bassel Ojjeh 在最近的一次采访中说:“……大数据出自这里……而不是由沃尔玛来指出纸尿片和啤酒之间的联系。”

的确,Yahoo 是帮助塑造了现代的、注重数据的 web。它率先发起了像 Hadoop 那样几乎已在所有 web 公司内部署的项目,它最终让 Google 把搜索发挥到了极致,并通过个性化的努力展示了未来的内容会是什么样子。如果没有 Yahoo,Twitter、Facebook 及 Netflix 也许也一样会出现,但他们的服务一定不会是现在这个样子。

但越来越大、也越来越坏的 Google 最终还是让 Yahoo 屈服了。Yahoo 还没有死,但它的躯体早已被试图诊断它出了什么毛病、下一个伟大 CEO 的遭遇如何的技术媒体人及分析师剖检过无数次了。“Yahoo 是大家不喜欢的公司里面最知名的一个,” Raymie Stata ,Yahoo 前 CTO,现在是一家 Hadoop 初创企业的创始人兼 CEO 给老东家下的结论是:“……一个著名的失败。”

Yahoo 的前执行副总裁兼 CDO(首席数据官)Usama Fayyad 认为,直到 2006 年 Yahoo 仍很有机会压倒 Google 等新兴 web 公司。技术、用户、数据、品牌、成熟的业务,这些 Yahoo 都不缺。再看看现在的 Yahoo,俱往矣,只能为自己的地位苦苦挣扎,他说:“我想说的是‘怎么会这样?’”

怎么会这样?我们来听听那些 Yahoo 为争取成为 Google、微软及 Facebook 的体面竞争对手做最后努力期间的前高管的答案。2004—2009 年是 Yahoo 巨大失望与机遇错失交织的几年,但也是它展示先见之明并给人留下深刻印象的技术创新的时光,后者也许可让 Yahoo 不至于沦落,甚至还有可能让它再度崛起。

 

把Yahoo的现金牛变成金矿

要说有一样东西是 Yahoo 永远不会拿不到,那这样东西就是用户。在公司全盛期,大量用户意味着许多人会看到网站上的展示广告;其中也许有些人还会点击进去。Yahoo 统治展示广告的收入及创新长达 10 年之久。对于 Yahoo 来说,这意味着大笔的金钱,同样重要的是,大量的数据。

Fayyad 用那一堆数据去引诱计算机科学家进入他新成立的 Yahoo 研究部门。但这件工作并不总是一帆风顺的—许多工程师认为,Yahoo 更像是一家广告运营公司而非关心真正技术之地,对计算机科学的研究就更少了—Fayyad 的工作就是改变这种印象。

*2007 年,Yahoo Research 的实习生

几年之后,“我们(对 Google 和微软)取得了系统性的胜利,” Fayyad 说,甚至即便 Yahoo 为研究人员提供的薪水远比对手低。(尽管他承认研究部门随后日渐衰落,他招到的人后来大部分都去了微软和 Google。)Yahoo 研究部门能吸引人才,是因为这里研究人员用来做实验的有趣数据比微软多得多,发表论文的机会也比 Google 多得多。

人才汇聚最终产生红利。2004 年 Fayyad 到了 Yahoo,这一年 Google 上市并成为世界主宰,但横幅广告仍然是 Yahoo 的现金牛,因此 Yahoo 花了许多时间通过定向广告来让它赚更多的钱。而传统的模式仅仅是出售广告位置,靠页面浏览总量来刺激笨蛋买家的兴奋。

Yahoo 用于定向广告的位置实际非常有限,但它通过向特定人口展示特定广告的方式说服了广告主支付额外费用,Fayyad 说:“那是一笔意外之财。”

Fayyad 到 Yahoo 时,定向广告的年收入大约为 2000 万美元。而到了他离开的时候,这个数字已经飙升至 5 亿美元。Bassel Ojjeh 的团队负责开发许多数据产品卖给广告商,他说到了他 2009 年离开 Yahoo 的时候,流经数据系统的大约是 7 亿美元。

“在许多情况下,我们被当作销售工具来使用,”他解释说。他的团队每周至少要为客户和合作伙伴解释一次,说明为什么他们的工作能带来更好的投资回报。“你只能多谈谈 Yahoo Mail 的新功能,”他补充道,暗示仅仅把广告摆在人们(及次佳产品)面前未必能带来点击。

 

克服搜索引擎冷淡症

表面上看,只要公司从中获得的现金流保持稳定,聚焦于展示广告不至于那么糟糕。然而,对 Yahoo 来说,要卖展示广告就得有媒体公司(唯一的另一种主要靠广告赚钱的公司)的样子。因此 Yahoo 的使命就是去创作更多的内容—文章、游戏、电子邮件、搜索引擎,靠这些是吸引用户,安放广告。

“我认为在执行层那里产生了认同危机,”David Ku 说。Ku 2004 至 2010 年间一直呆在 Yahoo(最后一个职位是负责广告产品的副总裁),现在是微软在线服务部的副总裁。Yahoo 到底是媒体公司还是搜索公司,抑或是技术公司?没人能够确定。这种反复折腾导致了团队凝聚力的缺失,最终引发认同危机。

现在当然许多人可以放马后炮说 Yahoo 应该早点把更多的资源投入到搜索上面。Yahoo 并不是不知道搜索 web 的价值—毕竟搜索引擎它一直都有,只是它不理解搜索的价值。“在 Yahoo,永远都是少数几个家伙对搜索满怀激情,而从 CEO 开始的另一些人则无法与之心意相通。”

*2001 年 Yahoo 网站的样子

好吧,至少 Yahoo 的第一位 CEO Timothy Koogle 不是这样的。Koogle 兄 自 1995 前就担任 Yahoo 的 CEO 直至 2001 年。实际上,他在 2000 年就曾把 Yahoo 的搜索外包给了 Google(注:希望他不是看在 Google 跟自己“同名”的份上)。Y Combinator 的创始人 Paul Graham 在 2010 年时曾写过一篇措辞严厉的博客,指出他看到的 Yahoo 当时存在的问题(1998 年 Paul Graham 的初创企业 Viaweb 被 Yahoo 收购,他也加盟了 Yahoo)。关于 Yahoo 对搜索的无动于衷,他是这么写的:

我记得在 1998 年末或 1999 年初的时候曾告诉(Yahoo 联合创始人)David Filo Yahoo 应该收购 Google,因为我和其他大多数的程序员都用 Google 而不是 Yahoo 来搜索。他告诉我说这不值得担心。搜索仅占我们流量的 6%,而我们每个月的增长率是 10%。没必要把搜索做得更好。

(2001—2007 年在 Yahoo 任职的 CEO Terry Semel,因两桩收购失败而出名,一桩是 2002 年未能以 30 亿美元买下 Google,然后 2006 年想以 10 亿美元收购 Facebook 未果)

从这往前推进几年就能看得很清楚,Google 追求的是把搜索当作产品。“我的天哪,门户未必就是主要焦点,”Ku 说,解释 Yahoo 对有人把搜索不仅仅当作日常功能来看时的反应。“他们渴望把搜索当作起点。”

因此,大概 2003 年的时候,Yahoo 确实像搜索敞开了怀抱,敞开了一点点。彼时的 CEO Semel 收购了另一家在苦苦挣扎的搜索公司 Inktomi,指定后者来开发 Yahoo 的搜索功能。到 2005 年,该公司的确开发出了一个非常令人尊敬的搜索引擎(后面会详细讨论),仅用时 2 年就实现了 Google 耗时将近 10 年才完成的事情,Usama Fayyad 说。

“我们并没有因为搜索产品令人讨厌而导致失去用户,”前 CTO Stata 说。

 

搜索业务难以捉摸

Yahoo 失去用户是因为它没有将其业务模式演进为拥抱真正的搜索体验。如果你要卖广告空间,搜索是赚钱的好办法,因为用户会告诉你他们想找什么。“(定向广告)最有价值的东西是理解用户的需求和意图,”Ku 解释说:“……意图就是金钱。”

广告进入搜索是从付费搜索开始的—即那些显示在顶部及侧栏的付费搜索结果。直到 2007 年以前,Yahoo 注入付费搜索的方法基本上都是价高者得(部分归功于其 16.3 亿美元对 Overture 的收购)。而 Google 不仅要看出价而且还要看用户点击率的办法,用 Stata 的话来说“就要好得多”。

Google 对付费搜索采取的算法提高了广告的点选连接率,其结果是用户满意,广告主高兴,Google 的广告收入也赚得盘满钵满。收入可以买来渠道,包括与 Dell 20 亿美元的工具栏推广订单,以及数亿美元资金注入 Mozilla Foundation 换来的成为 Firefox 默认搜索引擎的地位。那时候正是 Firefox 进入主流的时间,“他们也捎了 Google 一程,”Stata 说。

Yahoo 也意识到工具栏的重要性,因为它进行过研究,结果表明,不管面前的搜索条是什么用户都会用而不会在乎搜索结果的质量,Bassel Ojjeh 说。他的团队分享了自己的研究成果,但“高层却无动于衷,”他补充道:“……那时候游戏已经快结束了。”

更糟的是,Yahoo 的付费搜索往往运行在一个大规模的 Oracle 数据库上,宕机一次就要 36 个小时,每次都会给 Yahoo 造成数千万美元的损失,Ojjeh 说。“而且这样的事情发生得很频繁,”他补充道。

Semel 对 Google 的回应是一个史诗般的项目 Panama,其目的是按照 Google 的样子再造 Yahoo 的付费搜索。该系统最终在 2007 年推出,这个时间比预期要晚,尽管改善了搜索收入,但仍不足以削弱 Google 的规模领先优势。项目最紧张的时候还消耗了大约 2000 人的资源。

“有那么两三个系统耗尽了整个公司的所有精力……最终令其丧失了在其他地方的创新能力,” Ojjeh 说。

其中之一就是 Panama。回顾 Panama 时,Ojjeh 并没有因为它代表了 Yahoo 在一个自己显然是第 2 的领域发起追赶的尝试而像其他一些 Yahoo 老员工一样充满热忱。他认为 Yahoo 应该专注于继续扩大自己的展示广告领先优势上,这一块在 Google 收购了 DoubleClick (这是 Semel 担任 Yahoo CEO 时本该收购的另一家公司)之后,Yahoo 最终也被迫扮演追赶者的角色。Ojjeh 提到的另一个系统是 Apex,一个自动化展示广告系统,其技术部分来自以高昂价格收购的 Right Media,Yahoo 本打算用它来争取到跟 DoubleClick 平起平坐的位置。

 

微软,杨致远的愿景及本该发生的事情

有人可能会说 Ojjeh 是对的。2008 年微软出价 500 亿美元要买下 Yahoo 的事情众所周知,当时新上任的 CEO(及联合创始人)杨致远拒绝了这笔交易。但微软的报价“令大家大为分心,” Usama Fayyad 说:“公司为此几乎冻结了半年。”

而且还是在危难之秋。那时候 Fayyad 已经有了离开的打算。杨致远接手 Yahoo 后开展了“复兴”战略(乔布斯还给 Yahoo 的高管做过一次讲演)—即以用户和广告商为中心聚焦 Yahoo 的核心价值,把那些不符合核心价值观的业务剥离掉。搜索绝对是未来的一部分,也是发挥 Yahoo 数据专长的某些更新的尝试之一。

Fayyad 认为其结果本来应该是“不可思议的”,但公司被太多的其他事情干扰了—无数的义务,每天的股价,还有微软的出价。Yahoo 董事会拒绝微软的最终报价不久之后,他和其他几位 Yahoo 的关键高管,包括陆奇(现任微软应用及服务部的执行副总裁)及 Jeff Weiner(现任 LinkedIn CEO)等都纷纷出走。 有的一直都在做离职的打算,之所以不走是怕谈判期间会影响到公司的价值或形象,Fayyad 说。

2009 年,由于 Panama 未达公司预期,Yahoo 的搜索业务也因公司与微软签下声名狼藉的 10 年合同而就此销声匿迹,Bing 现在是 Yahoo 的搜索引擎。“一个业务从微软本来要花数十亿美元买沦落到免费使用,对于我来说这是无法想象的事情,” Fayyad 说。

 

Yahoo这一路曾经出过很多好技术

然而,任何人如果只是把 Yahoo 当作一家缺乏聚焦的企业来看也许忽视了公司内部的那些创新—偶尔甚至还有一些很好的产品创意。就拿搜索来说吧,我们说的不是付费搜索,而是指代表实际搜索结果的蓝色链接。Stata 在担任 CTO 之前曾做了很多年的搜索,他说 Google 曾告诉他,Google 对 Yahoo 相对小的团队(且人员大都不需要斯坦福的学位)能够跟住 Google,甚至在某些领域挑战极限是如何的吃惊。

大部分工作都是在他 2004 年到 Yahoo 之前完成的,是收购 Inktomi 的成果,但最令他感到自豪的时刻之一发生在他到 Yahoo 之后:Google 停止显示其索引的 URL 数量的那一刻,因为他宣称 Google 意识到在这方面自己无法拉开 Yahoo。跟微软的交易里面有一件事是大家都没注意到的,即 Yahoo 几乎也跟 Google 也达成了类似的交易,直到政府出面阻止。Stata 认为,要说 Google 交易有可能的话,其唯一的理由是 Yahoo 对搜索的态度是如此的无情。(他还指出,如果你看看现在 Yahoo 的搜索引擎就会发现,它仍然负责页面设计以及在侧栏展示的所有附加信息)

早在 2005 年的时候 Yahoo 就试图要成为社会化搜索的领导者,因此才收购了 Flickr 和 Delicio.us,并发布了像 Yahoo Answers 那样的新服务。该公司甚至还考虑过按照用户的社交网络来进行搜索结果排名,Stata 说,但最终还是无法摆脱内容,因为它从来都未能产生足够庞大的社交图谱来启动这项排名。(尽管要是 Yahoo 360 不是独立于搜索团队而建,并且能利用流行的 Yahoo Messenger 服务的话将会是另一个故事)

“如果没有维基百科的话,我们可能会过得更好,尤其是 Answers,”他补充说。

Yahoo 为用户对首页内容进行个性化的努力相当令人印象深刻—至少从理论上来说如此—哪怕是在他们低估了自己的媒体公司心态的情况下。那时候 Yahoo 已经收集了大量有关用户的数据,以及 Yahoo 上面哪些类型的文章受欢迎的数据。该公司的搜索专家推断 Yahoo 可以通过开发机器学习算法来预测哪些文章会受到哪一类读者的欢迎,然后定向针对这些来对首页内容进行自动定制。

然而,Stata 解释说,该公司最终不得不选定一种办法来让人类编辑及定向算法进行协作,一起来选出 Yahoo 首页的最佳页面,然后将其呈现给合适的读者。有时候,他们会对文章进行简单的 A/B 测试,然后让被测试受众点击的内容分发到更广的范围。

“我们对圣诞节试了 6 种办法,然后想创建内容分类器,但还是失败了,”Stata 说:“……流行的就是流行的(没有类别之分)。”

David Ku 认为内容优化的随意性结果是 Yahoo 在搜索方面的相对失败。内容个性化已经有一些已知的技术,但就像广告一样,这些技术有助于了解谁在特定时间在找什么,或者是带着目的的个性化,如 Facebook 关注于你的朋友那里流行些什么。

“如果是针对我的话,”Ku 说:“那么个性化最好要好点。”

 

不管怎样,一切以Hadoop为轴心

Yahoo 最成功,也是最出名的的一项技术努力也许要数 Hadoop,正是 Yahoo 帮助培育了这个开源大数据平台并让它在 2011 年时成长为成熟的企业平台。

Yahoo 投入了成百上千万美元(也可能高达数十亿)到 Hadoop 的开发当中,而后者也赢得了从定向内容到搜索的 Yahoo“每个点击背后”的使能者之荣誉,可以说基本上是这样的,至少从这些点击涉及到分析、定向内容或搜索结果这些方面来说是正确的。Yahoo 是在 2006 年引进 Hadoop 的,为的是帮助对页面进行索引,以便能与 Google 在搜索上进行竞争(Hadoop 终于在几年之后为搜索提供支撑),但后来它证明自己在 Panama(Yahoo 为广告商、内容优化、定向广告及许多其他用户提供的分析工具)的后期迭代升级方面也能提供足够的支持。

Hadoop 刺激了 Yahoo 基础设施的若干变化,引导打造富含数据和设计的在线体验的新方式,Ku 说。在整个公司范围内,有一个提供内容与分析数据之间的连续循环,从而能为用户、广告商及 Yahoo 带来更好的结果。

尽管如此,这并不保证得到广泛采用,因为 Yahoo 的部门之间往往是独立运作的,对于相同的技术会有不同的想法,Stata 说。实际上,他承认,搜索团队对此跟其他任何人一样难逃其咎—在集中精力与 Google 作战时搜索团队采取了一种“地堡心态”。Hadoop 是第一个出自搜索并流向各个方向且被认为有用的东西。

“它的确从技术上帮助将公司凝聚到了一起,”Stata 说。

Usama Fayyad 是在 Hadoop 尚未完全在 Yahoo 内部起势的 2008 年离职的。他承认从某些方面来说 Hadoop 是个救世主,完全适合于某些工作,但他也指出 Hadoop“肩负的担子过重”。“Hadoop 几乎就像是一种宗教信仰,”他说。

在他离开之前,Yahoo 在关系数据库、NoSQL 数据库,甚至一种名为 Everest 的列式数据库(为与定向广告相关的大数据查询而设计)上投入重金。Yahoo 决定把很多的负载全压到 Hadoop 身上,这部分是由于对该技术着迷,部分是因为要通力协作专注于更少的事情上,而他则把 Yahoo 的这种做法视为是用推土机去推一颗石子。

的确,Bassel Ojjeh 的新公司 nPario 就因为聚焦 Hadoop 的决定而受益,此举也让达到产品质量的时间比预期更长了一点。 nPario 利用了 Everest 技术作为其分析引擎的一部分(现在是在 Hadoop 上面跑 Everest),有一段时间把 Yahoo 当作自己的一个客户。

当你讨论的是这样一个大规模的系统时,Fayyad 解释说,它最终会变成一个与技术问题程度相当的业务问题:“维护(Hadoop 集群)的成本跟计算创造出来的价值相比是否值得?”对于 Yahoo 和许多其他公司遵循相同路径的特定负载来说,答案很有可能是否定的。

他暗示 Yahoo 因为 Hadoop 而失去了几位最好的数据科学家,这些人看到在其他地方针对更为合适的技术进行特定计算的机会。(也就是说,Yahoo 的投入可能为他人利用 Hadoop 技术做了嫁妆)

 

最后,想让用户浏览仍需要一个理由

无论是致力于 Hadoop 也好,投入重金到 Panama 上也罢,或者是 Yahoo 那些数不清的收购(包括新任 CEO Marissa Mayer 做出的那些),在公司不能早点认识到自己的处境并致力于门户以外的任何一件事情的情况下,讨论这些决定是否明智基本上是没有意义的。不管是做搜索的 Google,还是后面做社交的 Facebook 等,其他公司对于消费者会如何使用自己来访问 web 都有着一个更加清楚的愿景,然后成为了大家优先选择的接入点。

你需要“某个理由说明为什么你要让那个服务成为你生活的一部分,” David Ku 说。缺乏聚焦的 Yahoo 没有用信息或朋友来勾住你,而是提供(平庸的)服务及内容的融合,最终没法为吸引用户使用提供充分的理由。

“Yahoo 没有把下一代用户作为自己的定位,” Ojjeh 说:“真的,Yahoo 是给我这种年纪的人用的。”

Ku 认为新任的 CEO Mayer 迄今为止对于 Yahoo 是有好处的,至少她为一家一度停滞的公司注入了活力和动力,并且真心想要改善用户体验。然而,她仍需要为公司寻找核心业务(嘿,也许就是媒体也说不定呢!),并找到把它集成进用户生活中的方法。他指出,微软和 Google 早已根植到设备的世界里并利用这些设备作为消费者接入点了。

不过,即便这些年 Yahoo 误入歧途且排名已经大幅下挫,但 Mayer 并非无米下锅。该公司仍然有一些非常棒的技术、技术人员以及对数据的学院知识。还有着亿万用户和通过它的各种服务而来的访客。

“我仍在创业……一切都是白手起家,” Fayyad 说:“想象一下,要是你给我一个客户群然后说,‘OK,Usama,你可以拿这 700 万用户起步。你打算怎么做?’我会怎么做?我会告诉你,绝对会让你大吃一惊。”

原文: gigaom.com

 

 

参考推荐:

几位享誉全球的程序员大神

中国第一代程序员列传

求伯君:中国早期第一代程序员

求伯君:中国软件业的传奇人物

程序员的十楼层,看看自己在第几层

Twitter创始人:科技人文的继承者

Android之父:最初的梦想

2011年度十大最具技术影响力人物

2014年中国30位30岁以下创业者

专访杨刚:移动互联网是孕育下一代高科技企业的土壤

一个普通IT人的十年回顾

湖北伢的互联网公司

程序员思维

中关村风云40年

IT人常去的15个顶级开发社区

IT,互联网科技,技术博客网站推荐

全球著名互联网企业背后的开源力量

GitHub上各大公司的开源投入排名分析