Skip to content

sgzmd/at2epub

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

22 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Author Today Downloader

Использование для Author.Today

Очень примитивная качалка для Author.Today. Пока умеет просто скачивать HTML файлы с картинками.

Для использования требуется установить chromedriver - в зависимости от системы, это может быть просто скачивание .exe файла, или brew cask install chromedriver.

Создайте файл с названием login.properties в корневой директории проекта, с содержимым:

login=your_author_today_login@email.com
password=your_author_today_password
chromedriver=path to chromedriver
basedir=downloads

Соберите проект командой mvn package

Запускайте командой:

$ java -jar target/at2epub-1.0-SNAPSHOT-jar-with-dependencies.jar \
    https://author.today/reader/60379 result.epub

Поскольку используется Selenium, процесс может быть нестабильным - иногда по каким-то причинам скачивание падает и его приходится перезапускать.

После скачивания будет создан файл result.epub с получившейся книгой.

Использование для Zelluloza

С целлюлозой все к сожалению намного, намного сложнее. Текущий подход для их обычного формата такой:

  1. Делаются скриншоты всех страниц всех фрагментов
  2. Распознавание руками (Tesseract, FineReader, etc)

Для их OCR-proof формата принцип будет такой же, но:

  1. Нужны изменение в коде, потому что "авто-листалка" заточена на обычный формат
  2. Качество будет, увы, низким.

Поэтому пока сосредотачиваемся только на "стандартном" формате.

Разница в формате конфига:

zpassword=your_zelluloza_password

Все остальное идентично (главный класс - Zelluloza), запустить можно:

java -cp target/at2epub-1.0-SNAPSHOT-jar-with-dependencies.jar Zelluloza https://zelluloza.ru/books/10139

About

Hacking around with Selenium Webdriver

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages