Jonmey
Advanced Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Придется скачать несколько сот тысяч страниц - это устраивает? (хотя картинок с указанным размером будет на порядок или порядки меньше) Можете попробовать такие настройки проекта https://www10.zippyshare.com/v/OO784D1S/file.html (Использование: Файл - Настройки проекта - Загрузить из текстового файла) Представленные настройки даны как образец. То есть, для понимния принципа решения задачи. Причин тому три: неизвестна конечная задача всей затеи; сайт содержит несколько сот тысяч страниц (более 400 000) и скачивать занчимую часть, чтобы убедиться, что лишнего не качает - геморрно; априори неизвестно, в каких каталогах могут быть желаемые вами картинки (он единственный или нет). Размеры картинок указаны в настройках, как пример фильтации по размеру (не менее 500x300). Вы можете изменить на свой вкус (но не советую слишком ограничивать размеры, т.к. можете лишиться части картинок, если они чуть меньше, чем вы указали, а потом придется перекачивать все заново). Расширения картинок можно ограничить парой-тройкой типов (сейчас список по умолчанию). Карталог в который скачиваются файлы определите самостоятельно. При таком подходе невозможно переименовать картинки в соответствии с какими-либо тегами, то есть они будут свалены в кучу по номерам. Для переименования нужно скачивать страницы, с которых на них ссылаются, и переименовывать с пом. пакетных редакторов типа powergrep, textpipe и аналогичных. Есть подозрение, что результат скачивания вас не устроит, но глядя на проект вы можете легко понять, как скачивать отдельные страницы (то есть, задавать список страниц для скачивания, а не сайт целиком), чтобы не качать лишнего. | Всего записей: 1385 | Зарегистр. 17-01-2011 | Отправлено: 05:03 09-12-2019 | Исправлено: Jonmey, 05:08 09-12-2019 |
|