Replies: 2 comments
-
有點好奇,為什麼要用R語言做爬蟲呢? 是因為R有甚麼厲害的功能? 因為我對R語言完全沒有太深入的了解😅,只知道主要是用來作資料分析。而我通常聽到做網頁爬蟲都是用Python~ |
Beta Was this translation helpful? Give feedback.
0 replies
-
我認為用R語言做爬蟲還不如用Python,且Python也能做R語言主要的用途,也就是資料分析~如果是我的話我會選擇學Python,學一個語言除了能夠爬蟲、資料分析,還能架網站、做機器學習等其他很多功能,比起R語言cp值更高 |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
網頁爬蟲流程
1.使用者依據網址(url)向某一網站伺服器送出請求(request)
2.接受請求之後,回應(response)網頁的原始碼回傳給你的瀏覽器
3.瀏覽器再將原始碼轉換成圖文頁面
以程式碼偽裝成一般的使用者,向對方伺服器送出請求,取得回應(原始碼)。再從原始碼中抽取出需要的資訊
步驟1 觀察網頁原始碼規則
步驟2 右鍵,拷貝路徑
步驟3 CHROME擴充-SELECTOR GADGET
或是CHROME擴充: XPATH HELPER
注意點
右鍵複製&擴充的路徑都不一定100%正確,因此需搭配網頁原始碼的理解,才有辦法手動debug!
很多網頁你在爬時會發現瀏覽器顯示與程式爬到的數據不一樣,這可能有很多種原因: 網頁重新轉跳、網頁阻擋、JS動態網頁…之類的。
Beta Was this translation helpful? Give feedback.
All reactions