R語言爬蟲簡單手把手教學 #119

emilyjyc · 2023-06-01T11:21:53Z

emilyjyc
Jun 1, 2023

網頁爬蟲流程

1.使用者依據網址(url)向某一網站伺服器送出請求(request)
2.接受請求之後，回應(response)網頁的原始碼回傳給你的瀏覽器
3.瀏覽器再將原始碼轉換成圖文頁面

以程式碼偽裝成一般的使用者，向對方伺服器送出請求，取得回應（原始碼）。再從原始碼中抽取出需要的資訊

步驟1 觀察網頁原始碼規則

步驟2 右鍵，拷貝路徑

步驟3 CHROME擴充-SELECTOR GADGET

或是CHROME擴充： XPATH HELPER

注意點

JY9150 · 2023-06-08T10:57:51Z

有點好奇，為什麼要用R語言做爬蟲呢? 是因為R有甚麼厲害的功能? 因為我對R語言完全沒有太深入的了解😅，只知道主要是用來作資料分析。而我通常聽到做網頁爬蟲都是用Python~
但是爬蟲真的是粉蔴藩，要處理一堆蔴藩事 (- _ -) (網站更新、Request Block、動態網頁 ...)

0 replies

Doreen331 · 2023-06-19T17:50:26Z

我認為用R語言做爬蟲還不如用Python，且Python也能做R語言主要的用途，也就是資料分析～如果是我的話我會選擇學Python，學一個語言除了能夠爬蟲、資料分析，還能架網站、做機器學習等其他很多功能，比起R語言cp值更高

0 replies