Skip to content

Files

Latest commit

 

History

History
 
 

Grab

Модуль Grab

Содержит примеры использования модуля Grab.

Документация: http://docs.grablib.org/

Сайт: http://grablib.org/

Репозиторий: https://github.com/lorien/grab

Статьи:

Что такое grab?

Это библиотека для парсинга сайтов. Её основные функции:

  • Подготовка сетевого запроса (cookies, http-заголовки, POST/GET данные)
  • Запрос на сервер (возможно через HTTP/SOCKS прокси)
  • Получение ответа сервера и его первоначальная обработка (парсинг заголовков, парсинг cookies, определение кодировки документа, обработка редиректа (поддерживаются даже редирект в meta refresh тэге))
  • Работа с DOM-деревом ответа (если это HTML-документ)
  • Работа с формами (заполнение, автозаполнение)
  • Отладка: логирование процесса в консоль, сетевых запросов и ответов в файлы