SEO | 搜尋引擎運算之Google Panda

     Google Panda 聽起來很可愛,但他可是很多SEO practitioners 的夢靨,就像熊貓一樣,處理得好,熊貓乖乖可愛可愛的可以增加網站的搜尋排名,處理不好可是會惹熊貓生氣,被熊貓攻擊,然後排名往下掉。這篇文章要介紹一些搜尋引擎的歷史和故事,介紹早期搜尋引擎的運算法則以及2011年第一次問世的Google Panda。

Google Algorithm 歷史

  追求SEO的人都知道,為了要提高網站排名,CTR,Relevancy,Page Loading Speed….等等一切可以帶給使用者更好經驗的部分都要盡力做到最好,但是Google 的搜尋引擎確切如何運作的始終是個謎,舉例來說: “bounce rate會不會影響排名”、”沒有mobile friendly會不會影響desktop的排名”…..很多問題都沒有一個正確的答案,現在SEO專家能回答的都是經驗累積來的結果,唯一一個可以回答且不會變的結論是,Google的搜尋運算方法超級複雜,而且會越來越複雜。
  在搜尋引擎剛問世的時候,Marketer可以很容易地告訴搜尋引擎自己的網站是跟甚麼有關,Meta Keywords Tag是其中一個辦法,這個meta tag會告訴搜尋引擎該網站的內容是跟那些Keywords有關,當query符合的時候就會提高網站的排名。
  但是不意外的,Google在2009就正式宣布他們的搜尋排名跟meta keywords tag完全沒有關係,主要原因就是太多人亂塞一些跟內容沒關的keywords進去要增加自己的曝光度,現在用這項tag只是在告訴你的對手那些是你的keywords。現在很多人的網站是用模板做成的,也許是這個原因,我發現即是現在2015年了還是有一些網站留有這個tag。
  早期的搜尋引擎更新也沒這麼的頻繁,所以如果你排名第一,你就可以坐穩這個寶座到下一次的algorithm update,也許是好幾個禮拜或好幾個月。但在2010年之後Google的更新就變得十分頻繁,每年會有超過600次的更新,大部分的更新Google不會宣布改了甚麼,但當有重大更新時,Google會給他一個名字,然後提那些地方是SEO專家 需要注意的,而其中一個就是2011年的 Google Panda。

什麼是Panda Algorithm?

  Panda 從2011/2/23第一次問世到最近的一次更新發生在2015/07/17總共有過28次的大更新,Panda並不是影響整個搜尋引擎的運算方法,而只是專注在”Quality”上,這項更新改變Google判斷一個網站品質高低的方法。Panda會懲罰一些所謂的content farms (網站上的內容都是從其他網站剽竊過來的,或是好幾個頁面都在討論同一個主題且內容大同小異,目的是增加網站內容卻沒品質可言的網站。)
  值得一提的是,Panda的懲罰是site-wide,而非只影響違反Panda Algorithm的幾個頁面。換句話說,如果你有幾個頁面被判定為Low Quality,Google會把整個網站都視為low quality。
  但甚麼是所謂的High Quality呢? Google的官方說法列出了下面幾點,雖然我個人認為Google的運算系統應該沒有厲害到可以判斷這些..
  • Would you trust the information presented in this article?
  • Is this article written by an expert or enthusiast who knows the topic well, or is it more shallow in nature?
  • Does the site have duplicate, overlapping, or redundant articles on the same or similar topics with slightly different keyword variations?
  • Would you be comfortable giving your credit card information to this site?
  • Does this article have spelling, stylistic, or factual errors?
  • Are the topics driven by genuine interests of readers of the site, or does the site generate content by attempting to guess what might rank well in search engines?
  • Does the article provide original content or information, original reporting, original research, or original analysis?
  • Does the page provide substantial value when compared to other pages in search results?
  • How much quality control is done on content?
  • Does the article describe both sides of a story?
  • Is the site a recognized authority on its topic?
  • Is the content mass-produced by or outsourced to a large number of creators, or spread across a large network of sites, so that individual pages or sites don’t get as much attention or care?
  • Was the article edited well, or does it appear sloppy or hastily produced?
  • For a health related query, would you trust information from this site?
  • Would you recognize this site as an authoritative source when mentioned by name?
  • Does this article provide a complete or comprehensive description of the topic?
  • Does this article contain insightful analysis or interesting information that is beyond obvious?
  • Is this the sort of page you’d want to bookmark, share with a friend, or recommend?
  • Does this article have an excessive amount of ads that distract from or interfere with the main content?
  • Would you expect to see this article in a printed magazine, encyclopedia or book?
  • Are the articles short, unsubstantial, or otherwise lacking in helpful specifics?
  • Are the pages produced with great care and attention to detail vs. less attention to detail?
  • Would users complain when they see pages from this site?

何謂Low Quality

  Google 列的這些有點老生常談,不過如果換個角度來看,甚麼是Low Quality的網站就會比較具體。

Thin Content

  在跑一些SEO工具的時候很常看到這個詞來形容一個網站不夠好,或是容易被判斷為spam,Thin Content主要就是形容一個網站對讀者沒有任何的幫助,看完以後不會得到有用的資訊。
  有時候網站本身對人類來說是可以得到很多資訊的,但在搜尋引擎的眼裡卻是thin,有可能是用了過多的圖片來取代文字,例如一個網站用了一張超級長的infographic來解釋某個東西,
但只用了一兩句的文字敘述,在搜尋引擎看來可能就會被判定成low quality。

Duplicate Content

  Duplicate Content分為兩種,一種是copy別人的內容,也就是說你的網站內容/文章是從別的網站上面複製貼上過來的,或者是做了些微修改,這樣的剽竊行為理所當然只要被Panda偵測到,就會受到很大的處罰。
  另外一種情形是自己網站內部的內容重複,舉例來說是個e-commerce的網站,有一款衣服有20個顏色和6種尺寸,如果網站架構者把每一件不同size, 顏色的衣服都弄成一個新的網頁,就會有總共120頁網頁,這個時候如果上面的product description, reviews, other information…..等等都一樣,就有極大可能被Panda判定成content farming而遭到懲罰。
(第二種情形的解決方法是用canonical tag,簡單說就是把這120個頁面都自動導向其中一頁。)

結論

  如果你的網站因為某些原因被Panda認定是low quality而失去大量的traffic,可以好好的檢查看看網站有沒有上面說的這些問題,通常Google會每個月重新檢測(refresh)所有的網站,如果你做了些改進,就可以看到排名的上升。
  再回到一開始說的,Google到底怎麼看待一個網站的品質高低沒有人確切的知道,但不變的是Google試著讓自己的運算系統越來越人性化,所以千萬不要想要愚弄Google,試著創造一個很Search Engine Optimized卻步Search Experience Optimized的網站!

筆者碎碎念:

這篇網站算是個半翻譯文章,參考很多Search Engine Land 和Moz上的文章,再加上自己的一點拙見,Google運算系統的還有另外兩隻有名的動物Penguin和Hummingbird,有機會再來和大家介紹!
Reference:

在〈SEO | 搜尋引擎運算之Google Panda〉中有 2 則留言

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *