在做SEO的過(guò)程中,我們總是會(huì )遇到各種莫名其妙的問(wèn)題,比如:某一天你的網(wǎng)站突然出現收錄緩慢的問(wèn)題,而平時(shí)都是秒收錄。
最開(kāi)始我們在做審查的時(shí)候,總是思考:
①是否搜索引擎算法在調整。
②是否自己的內容質(zhì)量不高。
③是否是普遍大眾的情況。
但很少有SEO從業(yè)者,嘗試去查看網(wǎng)站日志的相關(guān)情況。
那么,SEO排名優(yōu)化,為什么要?慈罩?
根據以往SEO網(wǎng)站診斷的經(jīng)驗,斌網(wǎng)網(wǎng)絡(luò )網(wǎng)爺,將通過(guò)如下內容闡述:
1、垃圾爬蟲(chóng)
如果你的網(wǎng)站運營(yíng)一段時(shí)間,在谷歌和百度的收錄情況還比較好,并且具備一定的流量與權重,這個(gè)時(shí)候就可能存在“垃圾爬蟲(chóng)”廣泛爬取的情況。
通常這類(lèi)爬蟲(chóng)主要分為如下幾種類(lèi)型:
①?lài)獾囊慌鶶EO推廣軟件的搜索爬蟲(chóng),主要用于提取網(wǎng)站的鏈接狀態(tài)。
②網(wǎng)站鏡像的代理爬蟲(chóng),通常都會(huì )進(jìn)行偽裝。
③極個(gè)別的數據分析爬蟲(chóng)。(網(wǎng)站比較優(yōu)秀,SEO研究者對你的分析)
這些爬蟲(chóng)除了鏡像,實(shí)際上并沒(méi)有從SEO的角度給我們帶來(lái)諸多問(wèn)題,但是它卻非常容易占用大量的服務(wù)器資源,特別是如果你還是一個(gè)非知名主機商的虛擬主機。
如果你想要快速檢索你的站點(diǎn)爬蟲(chóng)數量,我們可以通過(guò)一個(gè)小策略,查看robots.txt文件的訪(fǎng)問(wèn)情況,這只是一個(gè)小技巧。
2、站內搜索
我相信從目前來(lái)看,基本上除了單頁(yè)組合頁(yè)面之外,都會(huì )存在站內搜索框這個(gè)功能,畢竟大量的CMS系統都會(huì )配置這個(gè)功能,特別是一些模板建站的企業(yè)網(wǎng)站。
在很長(cháng)一段時(shí)間里,我們早前給大家解讀過(guò)一個(gè)偏灰帽的策略,雖然是老套路,而不經(jīng)常被提及,但還是仍然有人沿用至今,簡(jiǎn)要流程如下:
①尋找具備搜索框的高權重網(wǎng)站。
②在高權重網(wǎng)站搜索框中,輸入一段超鏈接代碼。
③基于一些搜索框的設計策略,部分的搜索結果頁(yè)面會(huì )直接反饋出具有錨文本鏈接的外鏈。
這樣一些習慣性利用系統漏洞的灰帽,就會(huì )這樣無(wú)形之中建立一個(gè)高權重的外鏈。
而之后,便有了多個(gè)類(lèi)似于該策略的變體版本,比如:在搜索框中輸入第三方網(wǎng)址等等。
實(shí)際上,這個(gè)問(wèn)題,如果你不去查看日志,是很難發(fā)現的,但由于對方操作的策略,都是利用軟件自動(dòng)檢索,這會(huì )直接影響網(wǎng)站加載速度。
因此,從SEO角度來(lái)講,我們第一時(shí)間就應該在robots.txt中屏蔽搜索結果頁(yè)面。
而后,從網(wǎng)站運營(yíng)來(lái)講,不是特別必須,我們可以采用第三方搜索框,比如:百度站內搜索。
3、漏洞掃描
網(wǎng)站安全漏洞掃描,這個(gè)是對于任何一個(gè)網(wǎng)站都可能會(huì )遇到的事情,比如:我們經(jīng)?梢栽谧约旱恼军c(diǎn)數據中,看到大量的404頁(yè)面的訪(fǎng)問(wèn)情況。
它可能會(huì )出現各種CMS系統后臺的登錄地址,以及一些容易出現漏洞的文件,通常這些情況都是基礎性的漏洞掃描。
如果出現長(cháng)期這樣的問(wèn)題,并且IP地址固定的話(huà),我們可以進(jìn)行有效的攔截,同時(shí),基于SEO的角度,我們還是建議大家建立404頁(yè)面。
4、惡意采集
對于惡意采集而言,如果我們不去刻意的分析,我們是很難發(fā)現這個(gè)問(wèn)題,除非你在百度搜索結果中看到大量的整站內容和你一樣的站點(diǎn)。
一般來(lái)講,我們在查看日志的時(shí)候,總是會(huì )調用一下IP訪(fǎng)問(wèn)的排行榜,你會(huì )發(fā)現某些特定的IP長(cháng)時(shí)間的停留在你的網(wǎng)站,并且大量的訪(fǎng)問(wèn)你的頁(yè)面。
這個(gè)時(shí)候我們需要排除它是不是CDN節點(diǎn),是不是正規的搜索引擎爬蟲(chóng),如果都不是,它很可能就是惡意采集或者鏡像的IP。
5、基礎狀態(tài)
審查日志相關(guān)性的數據判斷網(wǎng)站日常運營(yíng)的基礎狀態(tài),這已經(jīng)是一個(gè)常態(tài)的操作策略,但對于新手站長(cháng)而言,經(jīng)常會(huì )忽略這個(gè)問(wèn)題,比如:
①HTTPS和HTTP不進(jìn)行301重定向,二者反饋都是200狀態(tài)。
②大量的站內404頁(yè)面訪(fǎng)問(wèn),沒(méi)有進(jìn)行死鏈接提交等。
③我們是否需要針對一些304狀態(tài)的反饋,進(jìn)行改變。
④當你遭遇一些服務(wù)器500錯誤的時(shí)候,該如何處理的問(wèn)題。
6、站內情況
有的時(shí)候我們在做SEO的過(guò)程中,偶爾需要進(jìn)行網(wǎng)站改版,也偶爾會(huì )遇到服務(wù)器升級的情況,如果自己的相關(guān)性配置不到位經(jīng)常會(huì )遭遇一些非常隱晦的問(wèn)題,比如:頁(yè)面重復性的問(wèn)題。
有的時(shí)候,我們在配置網(wǎng)站偽靜態(tài)的時(shí)候,一些偽靜態(tài)規則,經(jīng)常會(huì )給出多個(gè)版本的策略,而只是讓我們在系統后臺篩選。
但并沒(méi)有在選定之后,而對其他的鏈接展現形式進(jìn)行301重定向到目標選定的URL形態(tài)上,這無(wú)形之中就會(huì )增加同內容,多個(gè)偽靜態(tài)規則不同URL地址收錄的情況。
一般日常運營(yíng)的過(guò)程中,我們是很難發(fā)現這個(gè)問(wèn)題的,除非你在site的時(shí)候,或者檢索標題的時(shí)候,出現多個(gè)結果的時(shí)候才會(huì )注意。
這里給大家的建議就是:當你遇到這個(gè)情況的時(shí)候,一定在配置文件中刪除沒(méi)有選定的偽靜態(tài)規則,以免造成不必要的麻煩。