信息化 频道

人类最优秀Web软件排行榜

Craigslist与法拉利

  简洁是Web软件的一大特征。虽然国外很出名的在线分类广告系统Craigslist的底层Perl开发代码就有10万行,但是它的界面看起来非常的简单。

  在我想卖掉自己的Toyata Camry之前,对Craigslist了解并不多,直到我发现无需经过任何授权就可以在这上面方便地发布一则文本广告。但是,并没有任何买家信息进来。我弄清楚了,这就是Craigslist的错。接着我就开始观察其他卖家如何展示他们的汽车图片,我终于等到了机会。我的邻居阿方索从车库里开出了他的法拉利,于是,我把自己那辆破车开到了法拉利边上,拍了照,然后贴到了网上。在我关机之前,我的电话铃已经开始响了,卖家上门了。

  Craigslist看起来比报纸的分类广告要呆板一些,都是简单的文字标题。但就像分类一样,人们就算完全不懂网络也能够使用Craigslist。它是众多允许用户上传个人内容的网站之一。

  Craigslist粘性很高,Alexa的数据显示,Craigslist的浏览用户平均浏览20个页面才离开。Craigslist平均每月新增2,000万个广告,6,000万个论坛帖子。在Alexa的全球网站排名中,Craigslist名列第40位。其创始人克雷格·纽马克(Graig Newmark)说:“我们知道怎样让事情变得简单,而且我没有什么设计技巧。”

  由于网站的流量非常高,洛杉矶的一些雇主和招聘中介要求网站收费,来减少垃圾贴和恶意竞争。克雷格同意了,于是向旧金山的每位雇主和招聘公司收取75美元,洛杉矶的25美元,其他城市5美元。出于同样的理由,它还想纽约市在册的每位地产中介收取10美元。

  由于一系列的失误,尽管Craigslist并不情愿,但是eBay仍然拥有了其25%的股份。直到现在,互联网巨头仍然在向其抛出橄榄枝,并且非常关注其惊人的收入。Craigslist的广告覆盖到450个城市。但它只在7个城市收费。虽然像eBay、Google、微软和雅虎等都进入了在线分类广告系统领域,但Craigslist的商业模式使得它仍然一枝独秀,保持2,200万到2,300万美元的年收入,每个雇员差不多创造了100万美元的收入。

搜索者

  伟大的网络软件不只是吸引流量。其中一个决定性因素是它能带来创新、新功能,或者说会为数百万用户带来全新的服务。

  搜索就是这样,并且不少用户认为创新方面首推Google。但Google并没有发明搜索的关键特征,这些特征是:对整个网络进行索引,以并行方式进行访问并非常快速的把结果反馈给用户。虽然所有这些都与Google密切相关,但首先体验这些特征的是数字设备公司(Digital Equipment)的AltaVista搜索服务。

  该公司位于帕洛阿图实验室的搜索先锋路易斯·莫尼尔(Louis Monier,现在供职于Google)在1995年AltaVista推出之时,已经有若干搜索引擎,它们分别是Excite、Infoseek和 Lycos。当初,所有搜索引起都面对网络几乎不可预知的屏障:它究竟有多大?并且捕获某个网页内容的索引还与索引完成的时间息息相关。

  早期的搜索引擎利用网络爬虫程序来访问URL,通过它来抓取网页的页眉和标题,并把这些信息进行组织后存放到中央服务器。但网络爬虫在对某个站点发出请求后要等几秒才能收到响应。最理想的情况下,搜索引擎一天可以完成对数万个网站信息的收集。而12到14天之后,搜集到的信息一定程度上就会“过期”。此外,当爬虫访问后网页也有可能会改变,而且它也会错过部分网页。所以对于这时期的网络爬虫来说,百万级网页已经是极限。而该公司的研发人员知道, 1995年12月,那时的Web已经远远超出这个数字了。

  莫尼尔后来开发出了多线程Web爬虫Scooter,它运行在先进的64位Unix服务器上。Scooter在ping了某个站点后不必等它响应并继续ping其它站点,它会跟踪每个调用并作为一个独立的线程进行响应。其它的爬虫程序一次只能处理某个站点,而Scooter一次就能访问上千个站点并收集相应的信息。Scooter不但能收集到页眉和页面,还能够收集到完整的网页。莫尼尔表示,AltaVista对网页的索引首次覆盖到整个网络。

  Scooter首次爬行活动就找到了1,600万个网页,当时来说是个非常惊人的数字。而在两个月后的第二次爬行找到了2,500万个网页。从 AltaVista可以折射出网络的快速增长。据Netcraft 4月的调查显示,现在全球共有1.14亿个活动站点,并且每个站点都有成千上万个子网页。

0
相关文章