Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » HTTrack Website Copier

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11

Открыть новую тему     Написать ответ в эту тему

ShigaLex



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Рекурсивная загрузка веб-сайтов; оффлайн-браузеры — общая тема по вопросу; если вы еще не определились с выбором инструмента, то вам туда.

HTTrack Website Copier

 
HTTrack — свободное приложение для рекурсивной загрузки веб-сайтов, т.е. для той задачи, которую решают Wget в режиме зеркалирования (--mirror) и проприетарные Teleport Pro и Offline Explorer.
Основной интерфейс — неинтерактивный командный, но доступно и по меньшей мере две графические оболочки: виндовый WinHTTrack и браузерный WebHTTrack.

 

| Офсайт | Википедия | Фрешмит | Ман |

 
Документация:
Httrack Users Guide by Fred Cohen — довольно длинный учебник
FAQ & Troubleshooting — официальный FAQ
HTTrack Website Copier by Leto Kauler — годная смесь FAQ'а и мануала
 
Зачатки FAQ'а:
Q: Я хочу загрузить сайт, который требует авторизации. Что делать?
A: Кинуть в текущую директорию файл cookies.txt с нужными (но лишние не помешают) куками в нетскэйповском формате, HTTrack его подхватит. У Файрфокса куки в требуемом виде можно получить, воспользовавшись расширением «Export Cookies»; у Хрома — «Cookie.txt export».
 

Смело правьте и дополняйте шапку, однако не забывайте отписываться об исправлениях и сохранять исходный вариант.

Всего записей: 18 | Зарегистр. 30-07-2007 | Отправлено: 21:34 30-07-2007 | Исправлено: Maz, 15:54 01-04-2019
Frantishek



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Baltazar500
все это достаточно просто настроить в Offline Explorer, он тоже не идеален, но эта программа вообще мрак.

Всего записей: 1360 | Зарегистр. 02-05-2006 | Отправлено: 11:29 01-11-2023
AnTul

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Frantishek
- OE платная, демо версия ни о чём (мало скачивается страниц), стоит дорого, на вопросы о скидках даже не отвечают. Сабжем пользуюсь до сих пор. Да, не всегда всё нормально скачивает, как и все программы такого типа. Но в основном до сих пор свои задачи решает, хоть не поддерживается уже давно. Преимущество ОЕ в том, что на форуме есть разработчик, он быстро реагировал (не знаю, как сейчас) на изменениях в сайтах и правил программу. Также подсказывал, как правильно скачать сайт. Да, ОЕ лучше других хотя бы потому, что до сих пор не заброшена и развивается (есть ещё одна, которая теплится, но у меня ни разу ничего ею не получилось скачать), но я не хочу опускаться до воровства, а программа мне не по карману. Да мс офис дешевле купил, чем какая-то качалка сайтов стоит, которой я пользуюсь раз в два-три года!

----------
Василий Великий: «Кто смотрит на зло без отвращения, тот скоро будет смотреть на него с удовольствием».

Всего записей: 5775 | Зарегистр. 13-07-2004 | Отправлено: 11:52 01-11-2023
Baltazar500



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Frantishek, AnTul мне в данном случае не столь важен инструмент. Как мне слить, что OE, что (win)httrack, что wget'ом запрошенное не сливая сайт целиком ?

Всего записей: 2579 | Зарегистр. 19-09-2011 | Отправлено: 07:12 02-11-2023
AnTul

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Baltazar500
- попробуйте в фильтрах удалить всё (просто в окне всё выделить и стереть), ввести руками только нужные Вам типы, во вкладке MIME Types выбрать нужные типы. На худой конец можно и всё скачать, потом в Тотал Командере нажать Contrl+B, выделить нужные и переместить в свою папку. Остальное удалить.

----------
Василий Великий: «Кто смотрит на зло без отвращения, тот скоро будет смотреть на него с удовольствием».

Всего записей: 5775 | Зарегистр. 13-07-2004 | Отправлено: 09:04 02-11-2023
Baltazar500



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AnTul, поначалу пробовал с фильтром +*/mipsel/* (кажется так было), но что-то долго winhttrack сайт мурыжил (как мне тогда показалось) и я плюнул поставив на выкачку всё, исключив *.tar.gz и *.tgz. Контента в сумме там на 1.3 ГБ было, но данные выкачивались с черепашьей скоростью, даже при учёте того, что я убрал все ограничения на соотвествующей вкладке. На выкачку ушло порядка 2 - 3 часов. Это аообще нормально ? Там же всё совсем простенько. Никаких сложнопостроенных страниц с кучей элементов. Только контент.

Всего записей: 2579 | Зарегистр. 19-09-2011 | Отправлено: 09:55 04-11-2023
AnTul

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Нужно попробовать убрать галочку "толерантные запросы к серверам". Не знаю, как сейчас, но раньше сайты, когда определяли, что их скачивают - то есть повышают нагрузку на сервер - то отрубали связь. Поэтому в качалках есть такая опция - качать потихоничку, чтобы сайт не напугался. Ну и вкладку "ограничения" нужно было посмотреть и поставить по максимуму и количество соединений и скорость. Также я отключаю прокси. По-умолчанию вроде как включено. Да, эти программы нужно всегда настраивать, потому что к разным сайтам часто нужен разный подход.

----------
Василий Великий: «Кто смотрит на зло без отвращения, тот скоро будет смотреть на него с удовольствием».

Всего записей: 5775 | Зарегистр. 13-07-2004 | Отправлено: 10:11 04-11-2023
Baltazar500



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AnTul,
Цитата:
Нужно попробовать убрать галочку "толерантные запросы к серверам".
это в каком блоке настроек ? А то локализация там кривоватая. Есть ли для httptrack адекватная русификация ?
 
з.ы. В любом случае спасибо за совет. Попробую.

Всего записей: 2579 | Зарегистр. 19-09-2011 | Отправлено: 08:56 05-11-2023 | Исправлено: Baltazar500, 08:57 05-11-2023
AnTul

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
это в каком блоке настроек ?  

- на вкладке "качалка".

Цитата:
А то локализация там кривоватая. Есть ли для httptrack адекватная русификация ?  

- у меня сабж с офсайта. Всё основное переведено. Нашёл всего лишь две непереведённые фразы. Ну да, лучше бы назвать не "качалка", а "закачка" - так было бы грамотнее, но это не так существенно.

----------
Василий Великий: «Кто смотрит на зло без отвращения, тот скоро будет смотреть на него с удовольствием».

Всего записей: 5775 | Зарегистр. 13-07-2004 | Отправлено: 09:14 05-11-2023
Baltazar500



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Снова понадобилось поскачивать сайт (другой). Точнее его часть (раздел с прошивками плееров) и тулза хоть ты тресни не тянет больше ~250 кб/с в сумме при 10 соединениях. Даже при том что ограничение на скорость либо отключалось либо выставлялось сверхвысоким. Download Master при этом те же самые файлы в однопоток тянет на 1 - 2 мб/с. ХЗ что с этим делать.

Всего записей: 2579 | Зарегистр. 19-09-2011 | Отправлено: 07:54 05-08-2024 | Исправлено: Baltazar500, 07:56 05-08-2024
kvark484kvark484

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как сделать функцию поиска по оффлайн копии сайта, созданной с помощью программы HTTrack Website Copier (имеется ввиду поиск тоже в оффлайн режиме) ?

Всего записей: 543 | Зарегистр. 26-03-2016 | Отправлено: 09:45 16-09-2025
shveicar



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Перепробовал разные способы запуска последней версии 3.49.2 для Win через прокси. Как упомянал ранее, там не работает ключ
Код:
-P 127.0.0.1:port
 Поэтому стал эксперементировать  с запуском через Proxy софт. Перепробовал множество разных прог типа Proxifier и ему подобных (которые ненужно устанавливать). Ни одна из них не перехватывает трафик HTTrack. Единственное что работает и перехватывает трафик,  это прога ProxyCap. Но она требует установки в систему. Также интересно что на Linux версиях режим прокси работает напрямую, например в связке с TOR. Но на винде, остается только вариант, HTTrack + ProxyCap + TOR если вам нужно скачать что то с рутрекера.. Думал что автор этой софтины уже давно отошел от дел, но  судя по ресурсу github.com работа над Linux версиями продолжается. Как то это странно выглядит, на фоне  ущемление разработки для для Windows.

Всего записей: 350 | Зарегистр. 26-09-2010 | Отправлено: 12:05 23-09-2025 | Исправлено: shveicar, 12:07 23-09-2025
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11

Компьютерный форум Ru.Board » Компьютеры » Программы » HTTrack Website Copier


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

LiteCoin: LgY72v35StJhV2xbt8CpxbQ9gFY6jwZ67r

Рейтинг.ru