Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Добавление возможности парсинга, скачивания и замены url картинок в HTML #24

Closed
b0rman opened this issue Oct 21, 2013 · 2 comments

Comments

@b0rman
Copy link

b0rman commented Oct 21, 2013

Возможно это уже реализовано, но в документации не нашел, а если этого нет - возможно интересно добавить.

Было бы неплохо реализовать скачивание картинок (само собой не всех, а только нужных) из полученных HTML с последующей автоматической заменой оригинальных ссылок на картинки на новые, которые указывают на картинки уже на нашем сервере.

@lorien
Copy link
Owner

lorien commented Oct 21, 2013

Это довольно специфичная задача, мне, например, такое ни разу не было нужно. То что вам нужно реализуется с помощью нескольких видов заданий (задание для html, задание для каждой картинки) и ряда ключевх моментов в программе типа 1) при скачивании картинки записать в память путь к ней 2) после скачивания всех картинок обновить все пути к картинкам в HTML файле на локальные и сохранить на диск.

Короче это обыкновенный паук на базе Spider, надо просто сесть и написать его для себя.

@b0rman
Copy link
Author

b0rman commented Oct 21, 2013

ОК, просто думал, что все часто с этим сталкиваются.

@b0rman b0rman closed this as completed Oct 21, 2013
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants