crawler for Node js (Telunyang after class)
crawl 104 info 先抓列表,再到個別頁面取得詳細資訊
crawl youtube info 先抓列表,再到個別頁面取得詳細資訊
取得youtube影片資訊
資料結構:
[
{
"img": "https://url-to-img.jpg",
"id": "imgId",
"title": "title for video",
"link": "https://www.youtube.com/watch?v=imgId",
"singer": "singer",
"pageView": 00000,
"likeCount": 00000,
"dislikeCount": 0000
}....
]
curl
curl
get 金庸 novels by book, volume and chapters
-
搜尋關鍵字,按下「插畫」分類
-
取得頁面作品資訊
執行的是
getImg(),若有找到下一頁的箭頭,則接著執行nextPage()
抵達下一頁再執行getImg()取得資訊以上循環直到沒有下一頁的箭頭
-
進入每個作品的連結,取得詳細資料
若有多張照片,則先點擊「查看全部」,接著執行
scroll()確定照片都有出來
scroll()內部判定,若最後一張照片已載好,則停止滾動