搜索的实时年代

发布时间:2010-05-05
[导读]一批专业的实时搜索应运而生,它们通过抓取Twitter、Facebook、Digg、Flickr上用户随时发布的海量信息,给人们提供最新的搜索内容。 

就在谷歌戏剧性地退出中国之时,谷歌中文版出其不意地发布了一个新的功能——只要点击百宝箱中的“动态更新”,用户就可以搜索到在几秒前发布的信息,除非你点击暂停,搜索结果就会不断地实时滚动更新。

正是这项稍早些时候就已在其英文版中推出的功能,让谷歌的搜索跨入了实时搜索时代。就在去年3月,谷歌的首席执行官埃里克还讥讽Twitter是“穷人的电子邮件系统”,然而几个月之后,谷歌就迫不及待地与Twitter、Facebook 和MySpace结成伙伴关系,将来自这些社交网站用户的实时更新内容纳入自己的搜索结果之中。

对实时信息的搜索,正成为搜索引擎争夺的下一个制高点。在谷歌宣布与Twitter合作的同时,微软的搜索引擎——必应(Bing)也与Twitter 和Facebook 相继签订了合作协议。雅虎同样不甘落后,正紧锣密鼓地与实时搜索创业企业OneRiot谈判合作,酝酿推出类似的实时搜索服务。

实时搜索时代

这一切源于以Twitter、Facebook为代表的社交网络的兴起,与之相伴随的是,信息的集散地正在从传统的新闻网站向这些社交网络发生转移,互联网越来越变成一个实时网络。

2月15日,Facebook创始人兼首席执行官马克·扎克伯格在该公司的官方博客中撰文称,Facebook全球用户量会在那一周之内突破4亿。而Hitwise在今年3月16日发布的报告中更是历史性地将Facebook列为美国最大网站,因其访问量在美国网站总访问量中所占比例为7.07%,第一次超过了谷歌。

而在刚刚过去的3月21日,Twitter也度过了其4周岁的生日,并像磁场一样积聚了巨大的号召力。Twitter用户们平均每天发布的Tweets数量已经从2009年的250万条一路上涨到了2010年1月的500万条。甚至连比尔·盖茨都于今年1月12日正式加入了Twitter。据comScore今年1月预测,Twitter的全球独立访客人数约为7500万,这些用户通过不分昼夜地不断发布和转发,产生了以秒计的庞大信息流。

实时网络的快速传播和分享信息,是依靠编辑产生内容的互联网公司难以企及的。Twitter的用户比新闻媒体更早感知到旧金山地震,赶在各大新闻媒体报导迈克尔·杰克逊的死讯之前就已经开始为他哀悼了。实时信息不仅比传统网站的信息更加快捷,还能给人们带来实实在在的帮助。例如,堵车的时候,用户把堵车的具体地点发布到Twitter上,并不断地更新状况,便构成一个让其他人受益匪浅的路况报道。实时信息的增多,让人们对搜索有了新的要求。据统计,在40%的搜索请求中,人们更想寻找某个话题的最新情况,在实时网络之外的搜索引擎显然无法做到这一点。

这时,一批专业的实时搜索便应运而生,它们通过抓取Twitter、Facebook、Digg、Flickr上用户随时发布的海量信息,给人们提供最新的搜索内容。

2008年创立的OneRiot希望自己成为世界上最流行的实时搜索引擎。2009年5、6月之间,美国同时诞生了三家实时搜索引擎:Topsy、Scoopler和Collecta。这些搜索引擎最大的特点就在于能用可与即时通信工具相媲美的速度显示出真正的实时信息,而不是像传统搜索引擎一样只呈现“最近”的消息。这些“挖掘出正在进行的讨论”的公司引起了业界和风险投资商的关注。OneRiot已经获得2700万美元的风险投资,另外三家公司背后也都有风险投资的支持。

实时搜索引擎的出现很快让这些实时信息的发布平台们认识到自己的价值。2008 年 7 月 14 日,Twitter宣布收购实时搜索公司Summize,并很快推出了自己的搜索引擎Twitter Search。而Facebook也不甘示弱,在2009年8月也推出实时搜索引擎,不仅可以搜索用户的状态更新,还能够检索图片、笔记、视频等内容。

由于Twitter的微博特性,Twitter搜索很快便成为用户了解全球重大事件最常用的工具和实时搜索的领头羊。在2009年旧金山湾区发生里氏4.1级地震后的几秒钟内,Twitter上就能搜索到大量有关此次地震的消息。而谷歌在地震发生6分钟后才跟踪到此次地震,直到24分钟后,谷歌搜索结果中才给出美国地质调查局有关此次地震信息的链接。

捍卫传统优势

对于实时搜索领域的变化,搜索巨头们并非没有察觉。在谷歌2009年5月举行的Zeitgeist技术大会上,谷歌联合创始人拉里·佩奇(Larry Page)表示,在实时搜索业务领域,谷歌仍没有开发出多少真正有实用价值的产品和服务,谷歌实时搜索业务已落后于Twitter。

这时,速度成为谷歌要改善的第一要素。按照谷歌产品运营主席汤姆的说法,“搜索速度有两层含义:一是你获得信息的速度,二是我们更新信息的速度。”为了满足用户对最新信息的需求,微软和谷歌只有面临一个选择,那就是与Twitter和Facebook合作。“人们想要最前沿的信息,而且Twitter 等服务也为此提供了一个很好的平台。因此我们很乐意和他们合作,获得他们的信息,并把它巧妙地植入我们的搜索系统中。”

当然,与Twitter和Facebook的合作只能加快更新信息的速度,但仍然无法解决获得信息的速度问题。众所周知,传统的搜索引擎的工作原理是,搜索引擎派出爬虫,将网页收录进搜索引擎的索引数据库里;用户输入关键词进行搜索时,搜索引擎就从现有的索引数据库里返回相关的结果。

问题是,从信息的产生到搜索引擎爬虫抓取一轮信息是有一个时间差的,对于一些大型的重点网站,爬虫每隔几分钟抓取一次,对于一些小的网站,搜索引擎可能一个星期才光顾一回。因此,用户所得到的搜索结果始终不是最新的,最快也是几分钟之前的。面对实时信息的冲击,以爬虫抓取网页的模式正在面临挑战。

目前,谷歌正在开发一个类似RSS的新系统,允许内容发布者实时向谷歌提供内容进行索引。它采用由谷歌员工Brett Slatkin和Brad Fitzpatrick研发的PubSubHubbub (PuSH)协议,PuSH相当于一个信息中转站,在内容发布者发布新内容后会第一时间通知PuSH,这些新内容会在一秒钟之内出现在用户的搜索结果中。据业内人士分析,这将是谷歌的下一代搜索引擎,如果这个项目成功,谷歌的实时搜索将比Twitter更为强大。

在时效性之外,关联性成为实时搜索目前面临的最大问题。有分析人士认为,由于这些平台允许用户自行发布各种内容,导致真正重要的信息很快会淹没在大量毫无价值的垃圾信息当中。面对连续不断更新的各类实时信息,搜索引擎很难从中筛选出可靠、有实际价值的信息。

谷歌首席执行官埃里克·施密特表示,谷歌搜索引擎的核心在于,它能对不同等级网页的相对重要性进行排序。“你怎么对Twitter的实时信息进行相互之间的排序,并做出相对于其他搜索结果的排序?这是一个我们已经在做、并且要继续进行的工作。”而Twitter也正在尝试解决这些问题,Twitter首席执行官埃文·威廉姆斯表示,Twitter正在向自有搜索引擎中投入更多的研发力量,研究如何向用户展示更具相关性,而不仅仅是最新的Twitter消息。

更好的广告?

事实上,实时网络对人们的吸引力不光体现在突发新闻上。在寻找购物建议时,人们也越来越少从一般的网站里获取资讯和意见了,而是更加倾向于从由人组成的社区网站里找到更鲜活和真实的评论。而另一方面,搜索广告一直是目前最有效的市场营销途径。因为搜索条目体现了用户的具体意图,网络搜索公司就可以在适当的时刻向适当的人群发布最为相符的广告。

因此,融合了两者的实时搜索被人们赋予了极大的商业想象。大量的实时搜索都可以与广告相互匹配。

2月27日,Twitter宣布将在今年上半年推出实时搜索的广告业务。当用户输入关键字“笔记本”进行搜索时,搜索结果中可能会包括戴尔的广告。这些广告也将使用Twitter的格式,即不超过140个字,通过使用其API的第三方软件和服务分发;用户可选择是否显示广告,选择显示者则可与Twitter分享营收。人们相信Twitter的实时搜索广告会蚕食谷歌的搜索广告市场。

然而,就像传统的搜索市场一样,实时搜索的商业价值需要巨大的搜索流量作为支撑。作为一项新兴业务,目前实时搜索的搜索量远远不及常规搜索。而且,在实时搜索中更多的搜索是事件性的,只有极少数的话题具有广告潜力,在这片崭新的、充满无限潜力的市场上,必须找到更具创意的与实时搜索相结合的商业模式。