1,頁面制作完成后再放到spider可以發現的地方,這樣才能達到最好的抓取效果。
2,頁面未對外公開之前,千萬不要通過工具推送給百度呀。
接到站長反饋后,院長聯系了spider工程師,工程師在后臺查詢了這些未收錄的鏈接,發現均顯示為“死鏈”,然而這些所謂的死鏈現在訪問都是好好的。根據后臺顯示的抓取時間,院長反復和站點進行溝通,終于找到了根源:原來,站點為了搶新聞,提前制作了新聞稿并制作成鏈接并且發布,雖然沒有在首頁等重要頁面推送給用戶,但卻被BaiduSpider發現,更重要的是,這些鏈接向BaiduSpider返回的狀態碼是404。
舉個例子,中國女排進入決賽后,某網站做了A和B兩個頁面,分別為奪冠和摘銀,為了防止用戶在比賽結束之前閱讀到頁面內容,站點將兩個鏈接都設置為404!404!(等到比賽結束后,再將其中一個頁面的html返回碼改為200)。雖然頁面并沒有向用戶推送,但還是被聰明的BaiduSpider發現。然而這里的問題是,BaiduSpider發現頁面是404,又無法判斷出這是一個重要頁面,于是直接打入冷宮不再理睬。 所以,學院反復強調,確認頁面真的不需要被搜索引擎保留時可以使用404(臨時閉站可使用百度站長平臺的閉站保護工具),如果還希望和搜索引擎保持友好關系的話,請使用503,防止頁面被刪除。雖然Baidu有對高價值內容的“刪除保護”功能,但畢竟不是每個站點都可以享受到這個特權的。 |
- 07-19[網站運營] 網站運營,如何做好網站體驗優化
- 05-22[網站運營] 網站分析如何做?
- 03-21[網站運營] [媒體人的一天]新華網李洪雷:網站
- 03-16[人物訪談] 訪談李勇:SEO博客兩個多月快速提
- 02-06[人物訪談] SEO訪談:初入SEO的苦與樂!seo有沒有
- 02-04[自媒體] 內容創業時代來臨:機會、趨勢、
- 01-13[網站運營] 網站運營推廣成功的三大核心問題
- 01-10[自媒體] 內容創業:前景光明還是黑暗?
- 03-16[網站運營] 網站運營之變局-內容為王的時代已