Extract

Extract is HTML Extractor. This extractor is based on wedata.

Acknowledgement

items.json is originally from http://wedata.net/databases/LDRFullFeed/items.json.
Currently, Extract only works for URLs which in wedata.

How to use

package main

import (
	"flag"
	"fmt"
	"log"
	"os"

	"github.com/suzuken/extract"
)

func main() {
	var (
		rawurl = flag.String("url", "http://example.com", "url for extract")
	)
	flag.Parse()
	ex := extract.New()
	if rule := ex.Match(*rawurl); rule == nil {
		log.Printf("%s doesn't match in rule", *rawurl)
		os.Exit(0)
	}
	c, err := ex.ExtractURL(*rawurl)
	if err != nil {
		log.Fatalf("extract failed: %s", err)
	}
	fmt.Printf("content: %v", c)
}

LICENSE

MIT

All data in wedata are in the public domain. see also: http://wedata.net/help/about .

Special Thanks

Wedata project and members.

Author

Kenta Suzuki (a.k.a. suzuken)

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
Godeps		Godeps
_example		_example
.gitignore		.gitignore
.travis.yml		.travis.yml
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
extract.go		extract.go
extract_test.go		extract_test.go
items.json		items.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Godeps

Godeps

_example

_example

.gitignore

.gitignore

.travis.yml

.travis.yml

LICENSE

LICENSE

Makefile

Makefile

README.md

README.md

extract.go

extract.go

extract_test.go

extract_test.go

items.json

items.json

Repository files navigation

Extract

Acknowledgement

How to use

LICENSE

Special Thanks

Author

About

Releases

Packages

Languages

License

suzuken/extract

Folders and files

Latest commit

History

Repository files navigation

Extract

Acknowledgement

How to use

LICENSE

Special Thanks

Author

About

Resources

License

Stars

Watchers

Forks

Languages