3 步驟獲取Google Play 中APP數據 - Python 爬蟲


圖片來源:flickr

本文重點結論:

1. 利用 Python、Selenium 獲取 Google play store 上 APP 資訊
2. 可針對 APP 做用戶反饋調查 ( 目前想到的 )
3. 附上程式碼:https://github.com/AlanSyue/google-play-crawler
※ 專案 forked from ranjeet867/google-play-crawler

專案緣起

前些日子在瀏覽 Google play store 上用戶的評論及回饋,有些功能建議或 UI / UX 反饋,都覺得還不錯 ( 雖然沒有到太多 )。

如果是自己 APP 的評論,Google Console 裡面也有提供不錯的評論通知,但如果是想研究其他相似的 APP 呢?

於是我 Google 了一下,想說是不是有套件或是第三方工具使用,但老實說,沒有找到太多的資訊 ( 其實我也還沒想到這些資料可以做什麼厲害的分析 ,目前想到就像上述了解用戶反饋)。

不過偶然間在 GitHub 發現 ranjeet867 大大用 Python 做了一個 Google play store 的 crawler。

仔細去看了一下 data example,剛好有我需要的評論內容,不過剛好發現以下 3 點,所以就 fork 回來調整一下:

1. 撈取內容的 class name 並非當前名稱,是以示意名稱做標示,有鑑於會需要實際去確認並修改,乾脆就一起更新,如:

原:expatistan_table = soup_expatistan.find(“div”, class_=”id-app-title”)
後:expatistan_table = soup_expatistan.find(“h1”, class_=”AHFaub”)
2. 部分內容經實際觀察,查無此項目數據,故先拿掉,如:評論標題

3. 因為讀取所有評論的頁面為瀑布式,不太確定對方處理方式,故調整為使用 Selenium 的 window.scrollTo 獲取更多評論

使用方式

1. 安裝下列套件:BeautifulSoup、Selenium
2. 在 urls 的 list 填入想爬取的 APP Google play store 網址
3. 開始執行


以上為此專案使用說明,若有任何問題或錯誤,歡迎指教及建議,謝謝!




如果喜歡我的文章,想隨時收到最新行銷、技術分享,歡迎按 fb 粉專讚

加入好友  或加入 LINE 官方帳號,即時接收最新文章通知

留言

這個網誌中的熱門文章

自動將 Blogger 文章發佈到 facebook 粉絲專頁 (上)

2021 年 1 月熱門電子書推薦 | 精選書籍推薦

使用 docker 部署 Python Flask | 心得分享