1、分析搜索引擎的抓取日志
當咱們的頁(yè)面被錄入之前,首要是需要搜索引擎來(lái)爬行、抓取的,當搜索引擎抓取到你的頁(yè)面后,并且它覺(jué)得你的文章質(zhì)量契合它的錄入規范的時(shí)候,它就會(huì )把你的頁(yè)面錄入進(jìn)它的索引庫、然后經(jīng)過(guò)處理給予你的頁(yè)面相應的關(guān)鍵字的排行,而分析日志,能夠清楚的知道咱們哪些頁(yè)面被抓取了,哪些頁(yè)面沒(méi)有被抓取,網(wǎng)站的每個(gè)目錄的抓取狀況,這樣咱們能夠采納相應的辦法來(lái)推進(jìn)搜索引擎的錄入。
2、在主頁(yè)多展現未被抓取的頁(yè)面URL
首要,把未抓取的URL列表提取出來(lái),然后再把這些URL展現在主頁(yè),以增加被搜索引擎抓取的機會(huì )。許多網(wǎng)站之所以在主頁(yè)有最新文章版塊、隨機展現版塊,其實(shí)是為了增加被搜索引擎抓取的機會(huì )然后增加網(wǎng)站頁(yè)面的錄入。全部網(wǎng)站權重最高的是主頁(yè)的URL頁(yè)面,也是baidu蜘蛛最為活躍的頁(yè)面,所以在主頁(yè)展現通常能夠增加錄入。
3、多發(fā)布網(wǎng)站列表頁(yè)的外鏈
在SOSO的官方SEO指南中,從前提到過(guò)這一點(diǎn),也就是說(shuō)咱們能夠專(zhuān)注于列表頁(yè),多發(fā)一些列表頁(yè)的外鏈,因為列表頁(yè)里邊的有效URL比較多,當搜索引擎蜘蛛抓取到列表頁(yè)后,就會(huì )抓取列表頁(yè)中的所有URL,然后增加咱們的錄入。
4、利用robots.txt文件以及nofollow、noindex標簽幫忙搜索引擎錄入
搜索引擎的資本是有限的,搜索引擎每天只能抓取互聯(lián)網(wǎng)中的一有些頁(yè)面,并且在抓取的頁(yè)面中,也僅僅錄入一有些頁(yè)面,所以搜索引擎的資本很稀缺。在這種狀況下,咱們要把咱們最主要頁(yè)面的URL盡量的展現給搜索引擎,而對于一些沒(méi)有錄入價(jià)值的頁(yè)面,能夠阻撓錄入、盯梢。那么robots文件與nofollow標簽就能夠派上用場(chǎng)了,例如一些沒(méi)有錄入意義的聯(lián)系咱們、企業(yè)招聘、登錄、注冊等這些連接,咱們能夠直接用nofollow標簽來(lái)阻撓搜索引擎的盯梢,對于網(wǎng)站的模板目錄以及動(dòng)態(tài)URL,咱們能夠使用robots文件直接阻撓搜索引擎錄入,還能夠把noindex標簽添加到頁(yè)面的head有些阻撓搜索引擎錄入,當咱們把這些無(wú)意義的頁(yè)面都阻撓抓取后,搜索蜘蛛就會(huì )在網(wǎng)站抓取更多有意義的頁(yè)面,然后增加有效錄入。
5、調整搜索引擎的抓取頻率
在baidu的站長(cháng)東西中,baidu提供了調整搜索引擎的抓取頻率的東西。站長(cháng)能夠經(jīng)過(guò)此東西調節spider每天拜訪(fǎng)您網(wǎng)站的頻次,baidu也會(huì )根據服務(wù)器壓力主動(dòng)調整抓取頻率,同時(shí)建議您穩重調節此抓取壓力值,以避免網(wǎng)站抓取反常。因而,如果咱們想進(jìn)步它的抓取頻率,能夠在baidu的站長(cháng)東西后臺自行調整抓取速度。