Skip to content

Python-модуль для парсинга фото с Яндекс.Картинок

Notifications You must be signed in to change notification settings

Ulbwaa/YandexImagesParser

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Yandex Images Parser

Python-модуль для парсинга фото с Яндекс.Картинок

GitHub repo size GitHub Repo stars GitHub watchers GitHub last commit Codacy grade GitHub top language Yandex.Images Uptime

Навигация

Начало работы

Для работы Вам нужно установить или скачать модуль. Установить модуль можно двумя способами:

  • Установка в качестве подмодуля:
$ git submodule add https://github.com/Ulbwaa/YandexImagesParser
  • Клонирование репозитория в Ваш проект:
$ git clone https://github.com/Ulbwaa/YandexImagesParser

Для удобной работы рекомендуется использовать первый способ.

Установка зависимостей

$ pip install -r requirements.txt

Инициализация скрипта

from ImageParser import YandexImage

parser = YandexImage()

print(parser.about, parser.version)
>>> Yandex Images Parser 1.0-release

Поиск фото по ключевому слову

from ImageParser import YandexImage

parser = YandexImage()

for item in parser.search("Hello world!"):
    print(item.title)
    print(item.url)
    print(item.preview.url)
    print("(", item.size, ")", sep='')
>>> Hello world! - SYNDICATE
>>> https://access.viasyndicate.com/wp-content/uploads/helloworld.jpg
>>> https://im0-tub-ru.yandex.net/i?id=f4c8a1308fd44579344172c874f228a4&n=13
>>> (1900*800)

Полученное изображение

Возвращаемые параметры функцией YandexImage.search

YandexImage.search возвращает список элементов, имеющих следующие параметры:

  • Заголовок материнского сайта - self.title (Сокращается до определенного количества символов)
  • Описание материнского сайта - self.description (Сокращается до определенного количества символов)
  • Домен материнского сайта - self.domain
  • URL полноразмерного изображения - self.url
  • Ширина полноразмерного изображения - self.width (В пикселях)
  • Высота полноразмерного изображения - self.height (В пикселях)
  • Размер полноэкранного изображения - self.size (Вид: 1280*720)
  • URL сжатого изображения - self.preview.url
  • Ширина сжатого изображения - self.preview.width (В пикселях)
  • Высота сжатого изображения - self.preview.height (В пикселях)
  • Размер сжатого изображения - self.preview.size (Вид: 1280*720)

Для получения информации в формате dict используйте self.__dict__

Фильтры для поиска

Для фильтрации поиска вы можете использовать следующие функции:

Выборочный размер фото

from ImageParser import YandexImage

parser = YandexImage()

for item in parser.search("Hello world!", sizes=parser.size.large):
    print(item.title)
    print(item.url)
    print(item.preview.url)
    print("(", item.size, ")", sep='')

Возвращаемые параметры функцией YandexImage.size

  • Большие фото - self.large
  • Средние фото - self.medium
  • Маленькие фото - self.small

Для получения информации в формате dict используйте self.__dict__

В будущем будут добавлены и другие фильтры.

About

Python-модуль для парсинга фото с Яндекс.Картинок

Topics

Resources

Stars

Watchers

Forks

Languages