第一:網(wǎng)站內容重復的情況一般有哪些
網(wǎng)站重復內容一般會(huì )有以下幾種情況:
1、同樣一篇文章出現多個(gè)URL,即使這篇文章屬于原創(chuàng ),也會(huì )被百度給予懲罰
2、網(wǎng)站內容多為采集,這種網(wǎng)站內容重復會(huì )被當做采集站直接被百度處理掉,百度新的綠蘿算法就是專(zhuān)門(mén)打擊采集站點(diǎn)的。
3、網(wǎng)站的固定版塊出現次數太多,很多網(wǎng)站的右側總是固定放一些版塊或欄目,這些欄目的內容從來(lái)不進(jìn)行更新,或者各個(gè)頁(yè)面的右側都是前篇一律的內容,就會(huì )造成頁(yè)面重復度高。
4、未設置404錯誤頁(yè)面,當我們刪除某一個(gè)頁(yè)面的時(shí)候,一定要用404狀態(tài)碼給予用戶(hù)和蜘蛛一定的提示,如果代碼設置錯誤,那么刪除的頁(yè)面在蜘蛛那里是假想存在的,由此一來(lái)就會(huì )多次收錄。
5、動(dòng)態(tài)頁(yè)面和靜態(tài)并存,百度爬去目錄時(shí)收錄了大量動(dòng)態(tài)頁(yè)面
6、網(wǎng)站內容以圖片為主,文字很少,很多圖片都是共用一個(gè)URL地址,這樣一來(lái)蜘蛛在索引的時(shí)候很難保證不被重復收錄。
第二:如何解決網(wǎng)站內容重復的問(wèn)題
1、增加原創(chuàng )內容,減少采集內容
對于網(wǎng)站內容多為采集或簡(jiǎn)單偽原創(chuàng )的網(wǎng)站,筆者建議增加原創(chuàng )文章的內容,寧可百度收錄少一些,也不要讓百度把之前收錄的文章吐出來(lái)。
2、采集內容,也有進(jìn)行低度的偽原創(chuàng )
這一點(diǎn)相信大家都用過(guò),把別人的文章搬過(guò)來(lái)稍加改動(dòng),蜘蛛最厭煩這樣的文章了。
3、每一個(gè)頁(yè)面都配上獨立的標題
為每一個(gè)頁(yè)面都配上獨立的標題,尤其是頻道頁(yè),這樣可以讓蜘蛛在檢索的時(shí)候注意到它的獨有性,從而得到更好地權重分配和優(yōu)化優(yōu)勢。
4、網(wǎng)站固定欄目?jì)热蓦S機展示
可以根據正文的關(guān)鍵詞,隨機調用右側欄目的文章內容,讓每一個(gè)頁(yè)面都有不一樣的內容,避免大量頁(yè)面相似度高的情況出現。
5、減少多重URL
也許你的程序即可實(shí)現動(dòng)態(tài)也可實(shí)現靜態(tài),或者之前是靜態(tài)現在變?yōu)閯?dòng)態(tài)等情況,出現一個(gè)網(wǎng)頁(yè)有多個(gè)URL。兩種都是指同一個(gè)網(wǎng)頁(yè),但卻被搜索引擎以不同的URL抓取,這種情況我們盡量使用一種URL格式。
6、修改meta標簽
一個(gè)好的描述對于蜘蛛的收錄判斷起著(zhù)重大的影響作用,但是現在很多站點(diǎn)采用的都是CMS程序,無(wú)論大規模的實(shí)現meta標簽獨立化,所以我個(gè)人建議大家手動(dòng)修改一部分meta標簽。
7、修改CSS樣式表
很多新手站長(cháng)為了減少自己建設網(wǎng)站的難度,有時(shí)候就會(huì )去下載別人的網(wǎng)站主頁(yè)或是內容頁(yè),然后稍微修改一下就放到自己的網(wǎng)站中了,但是新手站長(cháng)不要忘了,下載下來(lái)的樣本頁(yè)中有很多相似的CSS樣式表,如果不加修改必然會(huì )讓網(wǎng)站重復度升高。當然能自己做就自己坐,保持特色是王道。
8、設置404頁(yè)面
設置404頁(yè)面可以告知用戶(hù)和搜索引擎某些頁(yè)面不存在了,防止搜索引擎收錄大量死鏈。
9、減少無(wú)效內容之間的鏈接
很多時(shí)候我們會(huì )對之前的網(wǎng)站結構或是內容頁(yè)進(jìn)行修改,而那些被刪除的頁(yè)面一定要用管理員工具,以免蜘蛛重復抓取,謹防形成類(lèi)似于狀態(tài)碼200的情況。