国产欧美日韩国产第一区，超碰免费在线播放，五月丁香精品久久女人精品，无码国产精品高清免费久，97免费公开无码视频，国内强伦姧人妻在线，中文无码在线a，国产丝袜足J在线视频播放

<ul id="toltr"><meter id="toltr"></meter></ul>

<b id="toltr"></b>

<strike id="toltr"></strike>

<b id="toltr"></b>

站內(nèi)公告： 　如果您有其它業(yè)務聯(lián)系，請發(fā)郵件至yaner@y1web.com郵箱，謝謝您的配合！

增值服務 | 網(wǎng)站備案 |

微信網(wǎng)站

現(xiàn)在的位置：首頁 > 發(fā)布營銷型網(wǎng)站建設 > 新聞資訊 > 搜索引擎收錄網(wǎng)站的原理

搜索引擎收錄網(wǎng)站的原理

信息來源：優(yōu)度網(wǎng)絡　發(fā)布日期：2009/3/17　瀏覽數(shù)量：1339次

文章導讀：

控錄蜘蛛和控尋機器人

搜索引擎要知道網(wǎng)上的新生事物，就是派人出去搜集。但是靠人工是不可能完成這個任務的。所以，搜索引擎的發(fā)明者就設計了計算機程序，派它們來執(zhí)行這個任務。

探測器有多種叫法，也叫crawler(爬行器)、spider(蜘蛛)、robot(機器人).這些形象的叫法是描繪搜索引擎派出的蜘蛛機器人爬行在互聯(lián)網(wǎng)上探測新的信息。Google把它的控測器叫做googlebot,百度就叫Baiduspider,MSN叫MSNbot,而Yahoo則稱為Slurp.這個控測器實際上是人們編制的計算機程序，由它不分晝夜地進入訪問各個網(wǎng)站，取回網(wǎng)站內(nèi)容、標簽、圖片等，然后依照搜索引擎的算法給它們制定成索引。所以，這可不是“爬行”而是以光速來訪問的。

一個搜索引擎會同時派出許多控測器。這些“機器人”或者從站主直接呈遞的網(wǎng)站URL去訪問，或者由一個網(wǎng)絡用戶所裝的搜索引擎工具欄（比如GOOgle工具欄）得知用戶去的網(wǎng)站，或者是從一個網(wǎng)站中指向另一個網(wǎng)站的鏈接過去�？販y器不一定是從網(wǎng)站的首頁進入訪問，所以，如果你要探測器訪問你其他的網(wǎng)頁，那么這個進入頁就需要和其他網(wǎng)頁相連。達到這個目的最容易的辦法就是在每一頁都加入指向首頁的鏈接。

但是，探測器對許多網(wǎng)站是不能完整取回信息的，這個大多是由于網(wǎng)站的設計沒有按照搜索引擎控測器的思路來進行優(yōu)化。比如，如果一個網(wǎng)頁比較大，控測器也只能截取網(wǎng)頁的首部，而且只能跟著少量的鏈接走。Google目前能夠吸收100KB的文件，Yahoo會多一點。這個可以通過實驗來檢驗。將一個搜索關鍵詞放在一個很長的網(wǎng)頁（約160KB）最后部分，然后看Google的緩存（cache）中顯現(xiàn)網(wǎng)頁的大小是多少。如果不出意料，Google的cache說這個網(wǎng)頁只有101KB。很顯然，一部分內(nèi)容沒被Google抓走。