PIXNET crawler

A crawler for PIXNET blog

Usage

.findAll()

@param {object} opts
@param {string} opts.url - 部落格首頁網址，該網址必須包含分頁連結。
@param {boolean} opts.fetchAll - 是否只取第一頁的文章。設為 true 則撈取全部分頁的文章清單。
@returns {promise<Article[]>}

import crawler from 'pixnet-posts-crawler'

let articles = await = crawler.findAll({ url: 'http://money9992.pixnet.net/blog' })

console.log(articles)
// [
//  {
//    url: String<Url>
//    title: String
//    published: String<ISO8601>
//  }
// ]

.find()

@param {string} opts
@param {string} opts.url - 文章的 URL。
@returns {promise<Article>}

import crawler from 'pixnet-posts-crawler'

let article = await crawler.find({ url: 'http://money9992.pixnet.net/blog/post/427735169' })

console.log(result)
// {
//   address: Array[String<臺灣地址>]
//   body: String<HTMLString>
//   published: String<ISO8601>
//   images: Array[String<URL>]
//   title: String
//   url: String<Url> # direct post url
// }

Interface

Article

@property {string[]} address - 正體中文，臺灣格式地址。採用內文分析，所以並非 100% 截取精確。
@property {string[]} images - 文章內所有 img 標籤的 URL。
@property {string} body - 文章內文。去頭去尾，只取 content。
@property {string} published - 文章公開時間。ISO8601 格式。
@property {string} title - 文章標題。
@property {string} url - 文章網址。

Development Flow

vi src/index.js
:wq
npm test
# once dev done
npm run build

Test

npm test

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
dist		dist
src		src
test		test
.eslintignore		.eslintignore
.eslintrc		.eslintrc
.gitignore		.gitignore
README.md		README.md
gulpfile.babel.js		gulpfile.babel.js
package.json		package.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

PIXNET crawler

Usage

.findAll()

.find()

Interface

Article

Development Flow

Test

About

Releases

Packages

Languages

aqzhyi/pixnet-posts-crawler

Folders and files

Latest commit

History

Repository files navigation

PIXNET crawler

Usage

.findAll()

.find()

Interface

Article

Development Flow

Test

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages