Skip to content

DUB1401/HentaiChanParser

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

50 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

HentaiChan Parser

HentaiChan Parser – это кроссплатформенный скрипт для получения данных с сайта HentaiChan в формате JSON. Он позволяет записать всю информацию о конкретной манге, а также её главах и содержании глав в формате DMP-V1.

Порядок установки и использования

  1. Загрузить последний релиз. Распаковать.
  2. Установить Python версии не старше 3.10. Рекомендуется добавить в PATH.
  3. В среду исполнения установить следующие пакеты: BeautifulSoup4, PyEnchant, dublib, Pillow.
pip install BeautifulSoup4
pip install PyEnchant
pip install dublib
pip install Pillow

Либо установить сразу все пакеты при помощи следующей команды, выполненной из директории скрипта.

pip install -r requirements.txt
  1. Настроить скрипт путём редактирования Settings.json.
  2. Открыть директорию со скриптом в терминале. Можно использовать метод cd и прописать путь к папке, либо запустить терминал из проводника.
  3. Указать для выполнения главный файл скрипта hcp.py, передать ему команду вместе с параметрами, нажать кнопку ввода и дождаться завершения работы.

Консольные команды

collect

Помещает список алиасов тайтлов, обновлённых на сайте за указанный в настройках период поиска обновлений, в файл Collection.txt.


getcov [MANGA_SLUG*] [FLAGS]

Загружает обложки конкретного тайтла.

Описание позиций:

  • MANGA_SLUG:
    • Аргумент – алиас тайтла. Обязательная позиция.

Список специфических флагов:

  • -f – включает перезапись уже загруженных обложек.

parce [MANGA_SLUG*] [FLAGS] [KEYS]

Проводит парсинг тайтла с указанным алиасом в JSON формат и загружает его обложки. В случае, если файл тайтла уже существует, дополнит его новыми данными.

Описание позиций:

  • MANGA_SLUG:
    • Аргумент – алиас тайтла. Обязательная позиция.
    • Флаги:
      • -collection – указывает на то, что список тайтлов для парсинга необходимо взять из файла Collection.txt.

Список специфических флагов:

  • -f – включает перезапись уже загруженных обложек и существующих JSON файлов.

Список специфических ключей:

  • --from – указывает, с момента обнаружение какого алиаса необходимо начать парсинг коллекции.

update [FLAGS] [KEYS]

Проводит парсинг тайтлов, обновлённых за интервал времени, указанный в Settings.json.

Список специфических флагов:

  • -f – включает перезапись уже загруженных обложек и существующих JSON файлов;
  • -local – обновляет все локальные файлы JSON.

Список специфических ключей:

  • --from – указывает алиас тайтла, с момента обнаружения которого в списке обновляемых тайтлов необходимо начать обработку обновлений, а eсли таковой не был обнаружен, скрипт пропустит все обновления.

Неспецифические флаги

Данный тип флагов работает при добавлении к любой команде и выполняет отдельную от оной функцию.

  • -s – выключает компьютер после завершения работы скрипта.

Settings.json

"sizing-covers": true

Указывает, нужно ли определять и записывать в JSON разрешение обложки.


"use-webp": false

Если включить, расширения изображений в ссылках на слайды будут заменены на *.webp.


"use-id-instead-slug": false

При включении данного параметра файлы JSON и директория обложек тайтла будут названы по ID произведения (коим считается ID первой главы тайтла), а не по алиасу.


"auto-branches-merging": false

Определяет режим распределения глав по ветвям. Если параметр отключён, то каждая ветвь будет соответствовать переводчику; при включении же оного в первую ветвь будут помещены все доступные главы, номера которых не дублируются, а дублирующиеся главы распределятся по другим ветвям согласно их переводчикам.


"check-updates-period": 2

Указывает, обновления за сколько дней необходимо получить.


"covers-directory": ""

Указывает, куда сохранять обложки тайтлов. При пустом значении будет создана папка Covers в исполняемой директории скрипта. Рекомендуется оформлять в соответствии с принципами путей в Linux, описанными здесь.


"titles-directory": ""

Указывает, куда сохранять JSON-файлы тайтлов. При пустом значении будет создана папка Titles в исполняемой директории скрипта. Рекомендуется оформлять в соответствии с принципами путей в Linux, описанными здесь.


"genres": {
	"название тега": "название жанра",
	"название тега": null
}

В данном разделе можно указать список тегов, которые будут помечены как жанры, а также, при необходимости, задать для них новые названия. Переопределённые теги удаляются из оригинального списка.

Copyright © DUB1401. 2022-2024.