?復制網頁(或者叫重復內容網頁)指的是兩個或多個網頁內容相同,或非常相似
一般來說,搜索引擎不喜歡復制內容網頁,他們會盡量判斷哪一個是原始版本,然后把其他的復制網頁忽略不計
有兩點值得注意
1)復制網頁的判斷并沒有一個比例
比如說一個網頁上有60%或80%的內容和其他網頁相同,就被列為復制網頁,如果真有一個比例那就簡單多了
2)復制網頁并不會帶來懲罰
搜索引擎會丟掉其他的復制網頁,但不會懲罰搜索引擎認為的原始出處
不過這就有可能對真正原始出處產生懲罰
比如搜索引擎判斷錯誤,把原始出處當成復制的,而把復制的當成原始出處
復制內容網頁的出現一般有這些可能性
1)網址規范化問題所產生的
2)代理商和零售商的網站經常從產品生產商的網站上抄下產品信息
這倒沒什么不對,一般產品生產商也都同意,但是絕大部分代理商,零售商,批發商都會直接copy,而不做改動
所以這些電子商務網站上充斥著大量復制內容網頁
3)打印版本
很多網站提供更適于打印的版本,如果沒有用robots.txt文件,那么這些打印版本網頁就可能會變成復制網頁
4)網頁內容由RSS生成
有很多網站,尤其是新聞類網站,都是用其他網站的RSS feed來生成網站內容的,這些內容在原始出處和很多其他網站上都已經出現了
5)電子商務網站使用Session ID
搜索引擎蜘蛛在不同時間訪問網頁的時候,被給了不同的Session ID,但實際上網頁內容是一樣的
不過由于Session ID的參數不同,就被當成了不同的網頁
6)網頁實質內容太少
每個網頁上都不可避免的有通用的部分,比如導航條,版權聲明等等
如果網頁的正文部分太少,數量還抵不上這些通用部分,就有可能被認為是復制內容網頁
7)文章抄襲轉載等
有的時候是其他人抄襲了你的網站內容,有的時候是善意的轉載,有的時候是作者自愿的向不同的網站發送文章,這些都有可能造成復制內容網頁
8)鏡象網站
鏡象網站曾經很流行,當一個網站太忙太慢的時候,用戶可以通過替代鏡象來看內容或下載,這也有造成復制內容網頁的風險
9)產品或服務類型之間區別比較小
比如有的網站把自己的產品或服務按地區進行分類,但實際上提供給每個地區的產品或服務都是一樣的
在這些按地區分類的網頁上,只是把地名改了改,其他內容全都一樣
來源
SEO每天一貼 Zac 昝輝
請立即點擊咨詢我們或撥打咨詢熱線: 18942620423,我們會詳細為你一一解答你心中的疑難。項目經理在線