Python全攻略 Chapter 12 (151~158) | Notion

Web Scraping 網路爬蟲

自動從網站中抓取我們要的資訊

Untitled

Untitled

Web Scraping 注意事項：

總是嘗試得到網站擁有者的許可
發送過多HTTP request可能會造成你的IP被擋
有些網站會擋網路爬蟲軟體 (例如Amazon)
每個網站的HTML code都是不一樣的，我們可能需要寫不同的Python的程式碼去對應
當網站更新程式碼之後，我們的Python程式碼也許需要隨之更新

應用範例：

。可以至e-commerce網站抓取資料並傳至excel上

網路爬蟲語言：