Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » MetaProducts Offline Explorer / Portable Offline Browser

Модерирует : gyra, Maz

Maz (30-01-2018 13:46): http://forum.ru-board.com/topic.cgi?forum=5&topic=48211&start=0  Версия для печати • ПодписатьсяДобавить в закладки
На первую страницук этому сообщениюк последнему сообщению

   

Jonmey

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Во-первых, всегда стоит начать с прочтения справки к программе.
Во-вторых, стоит полистать данный топик (и его предыдущую часть), поскольку 9 из 10 вопросов тут повторяется по кругу, в том числе ваш.
В-третьих, скачивать (даже, частично) динамические сайты всегда труднее, чем статические, в силу многовариантности ссылок ведущих к одному и тому же контенту, а форумы, в этом смысле, самые сложные.
В-третьих, если уж приперло скачивать страницы форума, то нужно четко определиться, что именно вы хотите иметь в скачанном и, что не менее важно, в работающем виде.
Проще всего, если вам тупо нужен текстовый контент конкретной темы. При этом  полное оффлайн функционирование скачанных страниц вас не интересует, кроме ссылок на скачанные страницы.  
Если вы внимательно посмотрите на форум с вашим топиком, то обнаружите, что он может быть представлен в разном виде - версия для печати и обычная. Последняя, в свою очередь - в линейном, комбинированном или древовидном виде. Это уже четырехкратное повторение одного и того же контента. Но это только начало. Далее идут ссылки с самих страниц на страницы этой же темы, но с разными ключами, указывающими на конкретное сообщение или страницу. Скрипт сайта, который обрабатывает все это, как правило, один и тот же, но для браузера или для данной программы - это все разные урлы. Соответственно, если не принимать меры, сущности могут плодиться почти бесконечно, то есть, контент будет скачиваться вновь и вновь, сохраняясь как страницы с разными именами.
 
Допустим вам нужны тупо только 179 страниц вашего топика и все.
Тогда проект выглядит примерно так
 
Url для скачивания: http://autoprogs.ru/diagnostika-vag-audi-volkswagen-skoda-seat-remont-elektroniki-228/kodirovanie-vw-skoda-seat-vcds-vasya-diagnost-3607/index{:1..179}.html
Уровень: 0  (!!!! – прим.)
Все файлы загружать согласно фильтрам URL (кроме картинок
Фильтры URL: загружать с начального сервера.
Трансляция ссылок: онлайн трансляция.
 
Важно: для скриптовых сайтов (форумы, всякие новостные сайты, социальные сети и тд и тп – таких сайтов сейчас абсолютное большинство) включение опиции – Скачивать только измененные и новые файлы практически равносильно опиции Загружать все файлы, поскольку дата генерируемой скриптом страницы всегда является датай ее загрузки (этих страниц на сервере нет, они генерируются только в момент обращения браузера юзера к серверу). Поэтому при попытке обновления проекта все скачается по новой (за исключением картинок и тд, если они скачиваются как таковые, а не приаттачены потоком к другому файлу (тогда и они скачаются по новой) и выбрана соответствующая опция). Это важно знать, если речь идет о больших проектах.
 
В результате скачаете (если все правильно настроите) примерно 250 файлов (всех типов) объемом около 20 мб (если экспортируете, например, в chm, получите один файл размером 2.5 MB).
 
При этом будут работать (оффлайн) только ссылки на переходы между страницами. Остальные ссылки будут вести на онлайн версию.
 
Заметьте, если в настройках поставите не 0, а, например, 1, то скачанных файлов будет уже около 700 объемом 250 MB, хотя полезного там не добавится, за исключением некоторых работающих оффлайн бантиков и некоторых случайных страниц, на которые ведут ссылки с нужных вам страниц. Каждый шаг в увеличении уровней будет приводить к геометрическому росту числа скачиваемых страниц и объему. При этом, если скачивать форумы целиком, то объемы скачанного будут многократно превосходить объем реального контента этих сайтов, причем, порою, в сотни раз. Это к вопросу о бессмысленности бездумного "скачивания форумов целиком".
 
По уму вам стоит (при скачивании отдельных топиков с любого форума) воспользоваться  опцией Замена адресов, применяя ее только к скачиваемым страницам, чтобы в результате получить нормальную иерархию контента (html файлы находятся на одинаковом или более высоком уровне, по сравнению со вспомогательными файлами (картинки, скрипты)), поскольку в данном случае они оказываются довольно глубоко закопанными. Но это можете сделать самостоятельно, прочитав справку к программе.

Всего записей: 1320 | Зарегистр. 17-01-2011 | Отправлено: 18:57 04-12-2017
   

На первую страницук этому сообщениюк последнему сообщению

Компьютерный форум Ru.Board » Компьютеры » Программы » MetaProducts Offline Explorer / Portable Offline Browser
Maz (30-01-2018 13:46): http://forum.ru-board.com/topic.cgi?forum=5&topic=48211&start=0


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru