Skip to content
Permalink
master
Go to file
 
 
Cannot retrieve contributors at this time
54 lines (43 sloc) 2.66 KB

【Star Rocket】蟒蛇通 #P.03 - 第一次使用 Python 網路爬蟲不要怕

會卡關是正常的,但會解決問題才是重點

你正在用 Python 學習網路爬蟲嗎?那你是否曾經碰到以下問題?

  • 用 requests 去請求的時候,跑不出來該有的 JSON 資料?
  • 好不容易 request 通過,但 HTML 爬下來的資料都是亂碼?
  • 已經爬到資料了,但是到讀寫 write & open 就是不成功?
  • ..... 還有更多

本次蟒蛇通要帶你一一破解網路爬蟲常見問題,讓我們一起加速學習吧!

重點摘要

  1. 專題短講(一):初學網路爬蟲常見問題和解決方式:講師:楊鎮銘
    1. 摘要
      1. 環境操作與設定:開發環境的選擇建議
      2. 如何使用套件解決常見問題:
        1. 網址的判斷
        2. 網址的組合
        3. 網址的解析
        4. 如何透過請求下載檔案
        5. 目標網站需要登入狀況
        6. 如何偽裝自己不是爬蟲
      3. 遇到「反」爬蟲網站怎麼辦
        1. 反爬蟲概念是什麼?
        2. 反爬蟲與反反爬蟲
        3. 前端如何反爬蟲
      4. 其他常見問題
    2. 課程簡報:連結
  2. 專題短講(二):初學者學習網路爬蟲的方式與建議:講師:郭耀仁Datainpoint
    1. 摘要:
      1. 網路爬蟲在做什麼?(學習架構)
      2. 學習網路爬蟲之前應該要學什麼呢
      3. 碰到困難該怎麽解決
      4. 哪些好用的工具方法
        1. 網路爬蟲 Chrome 瀏覽器外掛
        2. 網路爬蟲 Python 模組套件
      5. End-to-end 簡單範例
    2. 課程簡報:連結

課程媒體紀錄


Star Rocket 三創育成基金會

我們是非營利的創新育成機構, 以「人」為核心,「科技」為養分,致力成為最開放的創新育成空間,提供創業者一同工作與腦力激盪的舒適環境,並透過自辦課程跟活動策展,活絡台灣創新與技術社群,並培育創新創業人才;同時,也透過內容產製跟資料庫的建立,追蹤紀錄創新故事,啟發人們踏入創新航道。

  • 追蹤我們的內容 @ Medium
  • 透視創新科技新訊 @ Twitter
  • 每週來份創新週報:連結
You can’t perform that action at this time.