Skip to content
This repository was archived by the owner on May 10, 2024. It is now read-only.

livexia/requests_bs4

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

30 Commits
 
 
 
 
 
 

Repository files navigation

requests_bs4

一些利用requests+bs4写的python 脚本

结构目录

── NeteaseMusic
│   ├── album.py //爬取指定歌手的所有专辑
│   ├── artist.py //爬取所有歌手
│   ├── getinfo.py //爬取指定专辑、歌单、歌手的热门50单曲
│   ├── mysql.py //数据存入mysql
│   ├── general.py //本地文件操作处理,断点用
│   ├── get404.py //异常处理
│   ├── multithreading.py //多线程,待完成
│   └── urlparameter.py //连接参数,headers......
├── README.md
├── album_crawled.txt //完成爬取的专辑
├── album_queue.txt  //列队中的专辑
├── artist_crawled.txt  //完成爬取的歌手
├── artist_queue.txt //列队中的歌手
└── neteasemusic.py //入口程序

neteasemusic.py

获取网易云音乐歌单信息。必要参数歌单id

使用方式: $ python netease_music.py < playlist/artist_hot/artist_all/album > < 对应id >

$ python netease_music.py crawlall //爬取所有歌曲(不完全正常工作) 当第一个参数为artist_hot时第二个参数填写歌手id,会输出或者在数据库中保存该歌手热门50单曲

当第一个参数为artist_all时第二个参数填写歌手id,会输出或者在数据库中保存该歌手所有专辑中的歌曲

About

一些利用requests+bs4写的python 脚本

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages