如果回到我們的學(xué)生時代,老師會不厭其煩的為我們灌輸抄襲的嚴(yán)重性。忽想到了大學(xué)畢業(yè)論文一同學(xué)因為其中的一段論文與網(wǎng)絡(luò)上相同,從而被多次打回,修改了七八次,差點錯過了畢業(yè)。其實長期以來,這種態(tài)度已經(jīng)深入人心,因此我們中的許多人以類似的心態(tài)查看重復(fù)內(nèi)容也就不足為奇了。如果我們不理解它的含義,那么讓我們的網(wǎng)絡(luò)內(nèi)容匹配在不同URL中找到的文本的想法可能看起來很可怕。但是什么是重復(fù)內(nèi)容,它對我們的在線營銷意味著什么?下面的內(nèi)容筆者就和大家一起來深入探討這個問題,
重復(fù)內(nèi)容是搜索引擎用來描述出現(xiàn)在多個URL上的大量內(nèi)容的術(shù)語。很多東西都可以被視為重復(fù)內(nèi)容,有時是整個頁面是相同的,而其他時候是幾個相似的句子。需要注意的重要一點是,重復(fù)的內(nèi)容并不純粹涉及逐字復(fù)制。我們可以將一段內(nèi)容從一個URL復(fù)制到另一個URL,然后用同義詞替換幾個詞,但搜索引擎仍然經(jīng)常會識別出相似之處。
那么,是什么導(dǎo)致了重復(fù)的內(nèi)容呢?雖然重復(fù)內(nèi)容可能會讓我們想到故意復(fù)制或剽竊,但事實是,大多數(shù)重復(fù)內(nèi)容完全是良性和無意的。下面是一些最常見的原因:
URL變體:有時應(yīng)該是單個URL的內(nèi)容最終會變成多個URL,如,如果我們的站點使用會話ID并有效地為每個用戶創(chuàng)建不同版本的URL.
備用網(wǎng)站版本:如果我們在不同的域中創(chuàng)建新網(wǎng)站或制作HTTPS版本來替換原始HTTP版本,則最終可能會出現(xiàn)重復(fù)頁面。我們的重復(fù)內(nèi)容SEO檢查器可以檢查HTTP到HTTPS重定向的問題!
純屬巧合:有時可能會在不知情的情況下編寫重復(fù)的內(nèi)容。如果我們和另一個網(wǎng)站寫完全相同的主題,我們最終可能會在某處寫足夠相似的段落以算作重復(fù)內(nèi)容。
抓取的內(nèi)容:抓取是我們有效地將內(nèi)容直接從一個URL復(fù)制到另一個的地方。這有時會在沒有惡意的情況下發(fā)生,如果兩個頁面使用來自同一來源的大引用。
正如我們即將看到的,雖然通常是無意的,但重復(fù)的內(nèi)容會對我們的在線營銷產(chǎn)生可衡量的影響。如果我們認為重復(fù)的內(nèi)容會影響我們的SEO的成功,那我們是對的,但可能不是我們想的那樣。但,可能過程并不是我們想象的那樣。關(guān)于重復(fù)內(nèi)容懲罰的最普遍看法之一是,搜索引擎會直接懲罰我們在我們的網(wǎng)站上存在重復(fù)內(nèi)容。但這是真的嗎?簡而言之,沒有。搜索引擎試圖澄清但成功有限,他們不會直接懲罰排名中的重復(fù)內(nèi)容。搜索引擎知道重復(fù)內(nèi)容有時會發(fā)生,而且通常不是故意的。但是,有一個值得注意的例外——復(fù)制的內(nèi)容。
復(fù)制的內(nèi)容是重復(fù)內(nèi)容的特定子集,即重復(fù)內(nèi)容的一小部分是故意的并且具有欺騙性。復(fù)制的內(nèi)容是積極抄襲或試圖操縱搜索排名的內(nèi)容。在極少數(shù)情況下,搜索引擎會在重復(fù)內(nèi)容中識別出欺騙性意圖,會對違規(guī)者施加重復(fù)內(nèi)容懲罰,其形式是將其排名較低,甚至將其從搜索引擎的索引中完全刪除。不過,大多數(shù)重復(fù)內(nèi)容不屬于復(fù)制內(nèi)容,因此搜索引擎不會對其進行處罰。但僅僅因為搜索引擎沒有直接發(fā)布重復(fù)內(nèi)容處罰并不意味著重復(fù)內(nèi)容仍然不會損害我們的搜索引擎優(yōu)化。
當(dāng)搜索引擎對內(nèi)容進行排名時,它會確定哪些結(jié)果最相關(guān)并提供最佳用戶體驗。但是當(dāng)它遇到重復(fù)的內(nèi)容時,它很快就會變得混亂。在兩個頁面完全相同的情況下,哪個更值得排名呢?這種混淆經(jīng)常導(dǎo)致兩個頁面的排名較低,因為搜索引擎的算法對排名特別高的頁面沒有信心。如果我們想保持高排名,我們需要采取措施幫助搜索引擎確定哪個頁面是真實版本。
其實在許多情況下,重復(fù)的內(nèi)容沒有什么可強調(diào)的。但是,由于它有時會降低我們的排名,因此通過一些簡單的做法來抵消它的影響符合我們的最大利益,一些檢測工具可以提供幫助。下面是我們可以在我們的網(wǎng)站上處理重復(fù)內(nèi)容SEO的三種方法。
1、盡可能避免重復(fù)內(nèi)容
避免重復(fù)內(nèi)容問題的第一個也是最明顯的方法是完全避免重復(fù)內(nèi)容。這并不總是我們完全可以控制的,但我們?nèi)匀豢梢耘⑵渥钚』H绻覀冏⒁獾侥硞€特定產(chǎn)品頁面正在為同一條褲子的不同尺寸創(chuàng)建多個URL,我們可以將這些URL合并為一個。這意味著內(nèi)容只出現(xiàn)在一頁上,而不是兩頁上,因此沒有重復(fù)的內(nèi)容。不同腰圍和長度的褲子產(chǎn)品頁面。如果不解決這些問題,我們最終可能會遇到上圖中不同長度和腰圍按鈕的每個組合都會創(chuàng)建不同URL的情況。
2、使用重定向
在某些情況下,重復(fù)內(nèi)容是特定站點更改的自然結(jié)果,如從HTTP站點切換到HTTPS站點。在這些情況下,我們可以使用301重定向幫助搜索引擎避免混淆。重定向的工作方式是,當(dāng)搜索引擎嘗試訪問URLA時,重定向會將其發(fā)送到URLB。因此,如果我們有兩個包含重復(fù)內(nèi)容的URL,我們可以使用重定向?qū)⑺辛髁堪l(fā)送到首選頁面。
3、使用rel="canonical"
rel="canonical"屬性是一行代碼,我們可以將其插入頁面的HTML頭部。它本質(zhì)上告訴搜索引擎它出現(xiàn)的頁面是另一個頁面的副本并要求搜索引擎將另一個頁面視為原始頁面。如果我們的站點上有PDF版本的頁面,這是一個很好的做法。我們希望對頁面的原始HTML版本進行排名,但重復(fù)的內(nèi)容可能會使搜索引擎感到困惑。因此,我們將rel="canonical"屬性放在PDF頁面上,以告訴搜索引擎這不是原始的。