Skip to content

alex1504/node-guita-spider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

24 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

聚合吉他谱API

  • 基于Node+Koa网络爬虫吉他谱接口,集合吉他社17吉他网虫虫吉他,更多网站等待更新。
  • 本API仅仅只是学习研究使用,请勿将以下接口用来商业推广以及其他获利用途,如有版权问题请告知删除

接口文档

http://gt-spider.huzerui.com

主要依赖

  • rollup: JavaScript 模块打包器,可以将小块代码编译成大块复杂的代码
  • Koa: 新一代web框架
  • async: 并发控制
  • cheerio: Nodejs页面解析模块
  • docsify: 快速生成文档工具

项目目录说明

.
|-- assets                           // 静态资源目录
|-- docs                             // docsify文档目录
|   |-- index.html                   // docsify入口
|   |-- README.md                    // 文档markdown
|-- servers                          // Koa服务端目录
|-- spiders                          // 爬虫脚本开发目录
|   |-- data                         // 本地数据文件
|       |-- proxy.json               // 爬虫代理ip地址json数据
|   |-- dist                         // 爬虫脚本输出目录
|       |-- main.js                  // 爬虫脚本入口输出
|   |-- src                          // 爬虫脚本逻辑
|       |-- main.js                  // 入口
|       |-- spider_17jita.js         // 17吉他网站爬虫
|       |-- spider_ccjita            // 虫虫吉他网站爬虫
|       |-- spider_jitashe.js        // 吉他社网站爬虫
|       |-- spider_proxy.js          // 代理IP爬虫
|       |-- test.js                  // 测试函数
|       |-- userAgent.js             // userAgent生成
|-- .gitignore                       // Git提交忽略文件规则
|-- README.md                        // 项目说明
|-- package.json                     // 配置项目相关信息
.

开发指南

安装

git clone https://github.com/alex1504/node-guita-spider.git
cd node-guita-spider
npm i
npm i docsify -g

开发

查看package.json有如下命令:

// 爬虫脚本开发
"crawler:dev": "rollup ./spiders/src/main.js --o ./spiders/dist/main.js --f cjs --w",
// 爬虫脚本打包(爬虫开发命令会自动监听并打包,此命令可忽略)
"crawler:build": "rollup ./spiders/src/main.js --o ./spiders/dist/main.js --f cjs",
// 开启Koa服务器,端口3000
"server:start": "node ./server/bin/www",
// Koa服务端开发,使用nodemon自动监听并重启
"server:dev": "./node_modules/.bin/nodemon ./server/bin/www",
// 开启docsify服务器,端口4000
"docs": "docsify serve docs --port 4000"

指南:

  • 开发爬虫脚本: npm run crawler:dev,修改/spiders/src/下的文件,/spider/dist/main.js会自动更新
  • 开发服务端: npm run server:dev,修改/server/下的文件,Koa会自动重载
  • 开启docsify服务器: npm run docs,浏览器打开http://locaohost:4000端口查看接口文档

About

API grabbing of the guitar spectrum web site 聚合吉他谱API

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages