extractor

html extraction library, based on SimpleXML & nokogiri XpathSubquery.php

Benefits

Simple
Minimal code
Fast
Query results are SimpleXMLElement instances
Supports nested css/xpath queries

Installation

#Using packagist:
composer require 'fizzka/extractor'

Basic Usage

<?php
require_once 'vendor/autoload.php';

$html = gzdecode(file_get_contents('http://habrahabr.ru/'));

$ex = Extractor::fromHtml($html);
var_dump($ex->get('a.habracut'));

Advanced Usage

echo $ex->cssPathFirst('div.post')->xpathFirst('.//@href');

foreach ($ex->cssPath('div.post') as $post) {
	var_dump($post->cssPathFirst('a.post_title'));
}

Testing

Just run phpunit from the top of project

Contribute

Feel free to use & contribute ;)

License

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 36 Commits
src		src
tests		tests
.gitignore		.gitignore
.travis.yml		.travis.yml
README.md		README.md
composer.json		composer.json
phpunit.xml.dist		phpunit.xml.dist

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

src

src

tests

tests

.gitignore

.gitignore

.travis.yml

.travis.yml

README.md

README.md

composer.json

composer.json

phpunit.xml.dist

phpunit.xml.dist

Repository files navigation

extractor

Benefits

Installation

Basic Usage

Advanced Usage

Testing

Contribute

License

About

Releases 2

Packages

Languages

fizzka/extractor

Folders and files

Latest commit

History

Repository files navigation

extractor

Benefits

Installation

Basic Usage

Advanced Usage

Testing

Contribute

License

About

Resources

Stars

Watchers

Forks

Languages