當前位置:首頁 » 觀影平台 » 怎麼爬豆瓣電影資料庫
擴展閱讀
怎麼爬豆瓣電影資料庫 2024-12-22 01:16:12
美國極端個人主義的電影 2024-12-22 01:10:45
韓國電影的特色 2024-12-22 00:57:58

怎麼爬豆瓣電影資料庫

發布時間: 2024-12-22 01:16:12

Ⅰ Python爬蟲實戰(1)requests爬取豆瓣電影TOP250

爬取時間:2020/11/25
系統環境:Windows 10
所用工具:Jupyter NotebookPython 3.0
涉及的庫:requestslxmlpandasmatplotlib umpy

蛋肥想法: 先將電影名稱、原名、評分、評價人數、分類信息從網站上爬取下來。

蛋肥想法: print數據列表後發現電影原名、分類信息等存在不需要的字元,需預先處理;同時因為後續想做一個豆瓣電影TOP250的維度分布圖,而同一電影存在多個發行國家、類型(如「法國 美國 / 劇情 動作 犯罪」),為了簡(偷)便(懶),這里均取第一個作為記入的數據;最後將數據保存為xlsx。

蛋肥想法: 蛋肥想知道在豆瓣電影TOP250中年份、國家、類型的維度數據,為了練手,使用剛才保存成xlsx的數據,並分別畫成雷達圖、柱形圖、扇形圖。