Web Scraping 網路爬蟲

自動從網站中抓取我們要的資訊

Untitled

Untitled

Web Scraping 注意事項:

  1. 總是嘗試得到網站擁有者的許可
  2. 發送過多HTTP request可能會造成你的IP被擋
  3. 有些網站會擋網路爬蟲軟體 (例如Amazon)
  4. 每個網站的HTML code都是不一樣的,我們可能需要寫不同的Python的程式碼去對應
  5. 當網站更新程式碼之後,我們的Python程式碼也許需要隨之更新

應用範例:

。可以至e-commerce網站抓取資料並傳至excel上

網路爬蟲語言: