工具: 下載Google搜尋自動完成關鍵字

Google自動完成關鍵字下載

Google搜尋的自動完成功能(Autocomplete),號稱每天幫使用者省下了的時間,預估加起來超過200年! 它幫助使用者省去輸入時間、幫助Google更了解你在找什麼、同時也讓SEO工作者在做關鍵字研究時多一個管道。

這篇文章,要示範怎麼把自動完成所預測的字,以及每個預測字的再下一層預測字,下載成CSV檔,方便後續整理,相信可以省去不少複製貼上時間,也祝大家可以從中洞察出更好的機會!


工具使用及須知

為了節省大家時間,下面直接把使用的方法和步驟列出,有興趣了解更多的話後面有更仔細的介紹。另外也歡迎轉發或以此工具做為基底更加擴張,但請著名出處來源~

1. 打開Google Colab檔案

點開這個連結,會看到一份「數位引擎 – Google自動完成關鍵字抓取.ipynb」的檔案,可以直接在上面操作,也可以像Google Doc一樣拷貝一份自己的版本。

2. 輸入待查詢搜尋字

在下圖紅色箭頭的地方輸入想查的字,一次輸入一個字。

3. 執行

點擊「執行階段」>「全部執行」,或者快捷鍵Ctrl(Cmd)+F9。

4. 下載生成CSV檔。

滾到下面會看到「完成」,之後到左邊導覽列的資料夾中找到「output.csv」然後下載。

5. 完成

用Excel打開就能看到所輸入的原始關鍵字,第一層和第二層的自動完成預測字詞。

這項工具免費分享給大家使用,但如果有其他的需求,例如跑大量關鍵字資料、更換語言or地區、自動化、或其他想法,歡迎繼續閱讀了解如何自行修改,或來信詢問商業上的合作。


自動完成關鍵字的資料從何而來?

Google搜尋的自動完成功能有一個較鮮為人知的API,這支API不需要金鑰也不需要驗證,相當的簡單。但是,這支API並沒有被Google所公開,是偏門的非正統途徑,在2015年的公告中,Google宣稱非授權的使用都可能有一天失效。

儘管如此,到現在這個API都還可以使用,且產出的資料相當準確。我認為可以把它當作一個額外的工具利用,但不要去過度仰賴,因為 (1.)這個API並不是Google所認可的方法,(2.)工具可能隨時失效 (屆時,還請留言告知~)

2015.07 Google對於自動完成API的公告

自動完成API簡介

Google自動完成API的結構非常簡單,發一個GET request到目標位置就可以拿回一個JSON檔案,裡面即含有搜尋時的自動完成的預測字詞。

  • API位置: http://suggestqueries.google.com/complete/search
  • 參數:
    • output = 必要,firefox or chrome
    • q = 必要,搜尋字,空格以加號相連(+)
    • hl = 非必要,語言設定 (例如 en, zh-TW, jp)
    • gl = 非必要,地區設定 (例如 us, tw, sg)

實例: 在網址列輸入 http://suggestqueries.google.com/complete/search?output=firefox&q=台積電&hl=zh-tw&gl=tw 就能看到回傳的檔案。


Google搜尋自動完成關鍵字下載工具介紹

這個小工具用的是Python,並佈署在Google Colab上讓大家都能使用,安裝的插件就是幾個常見的 requests, json, fake_useragent, pandas, time 。語言和地區預設是zh-TWTW,這部分可以自行修改。

這個script並不難,主要是因為API簡單,我認為很適合和Python入門者拿來練習,寫法的部分就不班門弄斧了,但應用方面,有幾個粗略的想法歡迎大家參考:

  1. 串接搜尋量資料庫,CSV中加入一欄秀出每個預測字的搜尋量
  2. 將搜尋結果中的「相關搜尋」預測字一併納入
  3. 抓回搜尋結果前10名的網頁,並判斷有多少比例的網頁在標題or描述中有出現該關鍵字
  4. 更好的視覺化呈現

歡迎大家一起討論,如果有成功做出來也歡迎在留言區分享你的代碼連結!


參考資料

在〈工具: 下載Google搜尋自動完成關鍵字〉中有 7 則留言

  1. 太感谢Darren Huang了,今天无意中发现了这么好用的关键词工具,希望一直都能用。另外这个小工具的连结好像在chrome上用出现了点问题,不过firefox上倒可以用。

    1. 對~ output的地方選chrome會跑出額外的資料,不確定代表什麼意思 (參考)。但就預測字來說,chrome跟firefox應該不會有太大差異才對~

  2. 感謝Darren Huang,我想請問一下,這個小工具所爬取的資料是以無痕的網頁為主還是以使用者目前使用的網頁為主?

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *