百度“阿拉丁”与谷歌“云计算”
大家一定很奇怪,为什么把百度的“阿拉丁”和谷歌的“云计算”摆在一起说,但是经过笔者的仔细分析,发现两者确有相似之处。 什么是百度“阿拉丁”? 李彦宏说:“在互联网上,有很多信息并没有被网页化,我们根本没有触及到,也就是所谓的‘暗网’,‘阿拉丁计划’正是瞄准这些未知世界。” 李一男说:“阿拉丁是一个开放的搜索引擎平台,它是百度的,更是面向所有人的。我们希望未来的搜索引擎,能像阿拉丁神灯那样,在瞬间满足用户所有的搜索需求。” 由此我们可以看到两个关键: 一、“阿拉丁”计划将大大增加百度的信息量,包括抓取“暗网”信息; 二、将整合百度庞大的信息数据库,满足所有的搜索需求。 什么是“暗网”( Hidden Web)? 百度并没有给出明确的答案。 笔者所能想到的“暗网”有四种情况: 一、网站在建设过程中由于代码不合理导致搜索爬虫无法检索的网页. 二、为了保护信息安全和隐私设置了robots协议屏蔽爬虫的站点; 三、大量存在于互联网但未被网页化的信息。 四、即时更新的互动类信息,如BBS的即时交流,垂直行业的供求信息,电子商务的商品信息等,百度无法第...