我們先來想象一下一個游客搜索的場景:
“國慶前的一周,小明想要去廈門旅游,于是小明就坐在電腦前開始用百度搜索他想要的旅游信息,當他在百度搜索框輸入“十一廈門三日游”后,眨眼的功夫,百度就給小明返回了無數他想要尋找的信息……”
大家有沒有想過:百度是怎樣在不到一秒鐘的時間內,就快速從幾十萬幾百萬,甚至幾千萬包含搜索詞的頁面中,找到最合理、最相關的一千個頁面,并且按照相關性、權威性進行排序呢?
這表面最簡單的過程,實際上牽扯了非常復雜的后臺處理。搜索引擎(百度)的工作過程大致可以分成三個階段:爬行、索引、排序。而小明的搜索過程則主要涉及到了排序階段,前兩個階段在小明搜索前就已經早早地完成了。并且,這三個環節是緊緊相扣的:我們的線路網頁只有被百度蜘蛛爬行到了,才會有可能被百度收錄(注意:只是有可能);我們的線路只有被百度數據庫收錄了,才會有可能在百度獲得比較好的排名(注意:也是只是有可能)。所以,如果前面一環沒有實現的話,后面的環節也就無法實現。
下面將分成多個篇幅為大家介紹百度是如何收錄我們的旅游線路的。
首先是爬行階段!
那么,百度是如何爬到我們的旅游線路呢?
爬行,是搜索引擎(百度)工作的第一步,主要目的是發現新的網頁內容。
因為互聯網就像蜘蛛網似地四通八達,而百度那個負責尋覓網頁的程序就像蜘蛛似地沒日沒夜的在互聯網上爬來爬去,所以我們就很形象地將它稱為百度蜘蛛。百度蜘蛛能夠從一個網站爬到另一個網站、從一個網頁爬到另一個網頁,唯一的途徑就是——鏈接!鏈接,既是從一個網站到另一個網站的通道,也是從一個頁面到另一個頁面的通道。(什么是鏈接請點擊閱讀:http://m.htlh-bj.com/blog/6570)
比如,你朋友的網站上有一個鏈接向你的網站的一個鏈接,那么就相當于是有一個從外部來到你網站的通道,百度蜘蛛在你朋友的網站上爬行的時候,就會通過這個鏈接爬進你的網站里來,然后在你的網站里通過站內的內部鏈接爬行更多的頁面。如果你的網站有很多外鏈的話,也就等同于有更多進入你網站的入口,那么百度蜘蛛爬進你網站的次數也就多,這就會很有利于百度蜘蛛在你的網站內發現你新發布的內容。
當然了,外鏈并不見得非得是指向網站的首頁,也可以直接指向你的內頁(線路頁面),這樣百度蜘蛛就可以沿著外鏈直接爬到你的線路頁面上來,這就是我們為什么要去給具體的線路頁面做外鏈的原因。但是大部分的情況下,一個網站或網店都是首頁的外鏈數量比較多,所以首頁被爬行的次數也就最多,進而快照更新也快、權重也高!而內頁則相差很大!
沿著鏈接,從一個網站到另一個網站、從一個網頁到另一個網頁,既爬行新的頁面,也爬行舊的頁面,百度蜘蛛就是這樣實現了爬行的過程。在這個過程中當然還有更多更細的知識點,但是對于我們來說,只需要知道百度蜘蛛是通過鏈接在網頁間爬來爬去的就足夠了!
但是,網頁被百度蜘蛛爬行了,并不表示該網頁就被百度收錄了,能否被收錄,則要看索引階段!
2018湖南高速春節免費通行時間、春運避堵線路圖發布(2018-01-23)
湖南高速春節免費通行時間、春運避堵線路圖發布(2018-01-23)
好消息!桂三高速今日通車 湖南至廣西添新通道(2017-10-26)
暑期學生旅游成消費熱點 長沙旅游質監所發布六大提示(2017-06-27)
湖南預計暑運高鐵發客1200萬人次 去京滬車票緊張(2017-06-27)
湖南預計暑運高鐵發客1200萬人次 去京滬車票緊張(2017-06-27)
五一小長假預訂,周邊游走俏(2017-04-23)
發表評論
提示:請先登錄再進行評論,立即登錄