Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » WebSite-Watcher

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109

Открыть новую тему     Написать ответ в эту тему

Nep



Moderator
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Для вопросов о лечении - Варезник »
WebSite-Watcher
Текущая версия: 2024 (24.1)
(18.03.2024)
Производитель: Aignesberger Software GmbH, Австрия

Официальный сайт | Изменения версий
 

 
WebSite-Watcher - мощная программа для мониторинга сайтов на предмет их обновления. При обнаружении изменений обновлённые страницы сохраняются и на них цветом выделяются все изменения. Для более конкретного контроля за изменением определенной информации возможно использование хорошо настраиваемых фильтров. Программа поддерживает интеграцию с наиболее популярными браузерами - Internet Explorer, Firefox, Netscape и Opera.
 
Программа может быть установлена как стандартное приложение, так и в виде портабельной инсталляции - выбор делается при запуске штатного инсталлятора программы.
 
Поддерживаемые системы:
• Windows 11, 10, 8, 7
• Windows Server
• Windows XP до версии 18.3
включительно

  • Скриншоты
  • История версий
  • Скачать последнюю версию (174 МБ)
  • Бета версия
  • Русский help-файл для WebSite-Watcher
  • Manual на русском (PDF)

  • Всего записей: 41940 | Зарегистр. 24-06-2001 | Отправлено: 00:51 01-03-2002 | Исправлено: Komandor, 12:40 14-04-2024
    MrPerfect



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Html-тэгов там нет внутри вашего предложения (в исходном коде web-страницы)?

    Всего записей: 2342 | Зарегистр. 19-04-2002 | Отправлено: 22:24 03-12-2013 | Исправлено: MrPerfect, 22:27 03-12-2013
    darken665

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    нет вроде, я лучше покажу конкретный пример. вот доска объявлений,  слово при котором должен срабатывать фильтр "corolla"  
     
    http://sfbay.craigslist.org/search/cto?catAbb=cto&query=pilot%7Crx300%7C%28rx-300%29%7C%28rx+300%29%7Cmatrix%7Csequoia%7Cc240%7C%28c+240%29%7C%28c+240%29%7C%28corolla+2003%7C2004%7C2005%7C03%7C04%7C05%29%7C%28corola+2003%7C2004%7C2005%7C03%7C04%7C05%29%7C%28carola+2003%7C2004%7C2005%7C03%7C04%7C05%29%7C%28carolla+2003%7C2004%7C2005%7C03%7C04%7C05%29+-4matic&zoomToPosting=&minAsk=300&maxAsk=3800&autoMinYear=&autoMaxYear=&srchType=T

    Всего записей: 7 | Зарегистр. 22-07-2013 | Отправлено: 00:50 04-12-2013
    vahhabit

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    darken665
    Вообще прикольная задача. Только сейчас увидел что есть RegextoRegex - интересно. Обычно я решал задачу нежадным поиском. т.е. вместо regextoregex(начало, конец), тупо делал REgex(начало.+?конец)
     
    Вообще строка получается у тебя - aaa 11 bbb cccc ddddd eeee
    а регулярка примерно - Regex(\w{3}\s\d{1,2}\s(\w+\s)?cccc\s(\w+\s)?eeee)  
     
    Но у тебя это не сработает, потому как ты забыл указать как условие - там могут написать сколько угодно слов. т.е. это не конкретная маска, которую ты указал. Например вот это -  Nov 5 2005 Toyota Corolla, Black Sand, 46321 miles $399 уже длиннее указанного тобой. А еще универсальный шаблон не получилось написать, потому как может быть и очень коротким объявление и заканчиваться по разному и поэтому может захватить дофига лишних строк. Я выкрутился ограничением в 20 символов после даты. Т.е. после даты свыше 20 символов, допустим, до слова мерседес будет игнорится такая строка и поэтому лишнее не будет захватывать.  
    вот регулярка - regex(\s\w{3}\s\d{1,2}\s.{0,20}Mercedes.*?\$\d+)
    Вытаскивает вот такие строки -  
    #1:   Nov 27 Mercedes C240 $2560
    #2:   Dec 3 2002 Mercedes c240 $3500
    #3:   Nov 19 2002 c240 mercedes $3777
     
     Хотя может  это и не то, что ты хочешь. Первым постом ты некорректно сформулировал задачу, я тебе рекомендую на будущее  конкретно задачу писать, с регулярками 1 символ ошибся и все, это в 100 раз лучше, чем пытаться придумывать виртуальные примеры на пальцах. Кстати таким образом ты и сам можешь неправильно попросить+ люди на форуме, увидев непонятную задачу просто не захотят тебе отвечать. Поэтому пиши лучше конкретно что и как нужно тебе.
    Надеюсь помог.
    ЗЫ. с {0,20} - можешь поиграться. Я просто не знаю сколько там могут после даты, символов описания конкретной машины написать:) Если слишком много указать возьмет лишние строки.
    +Не забывай внести своё слово марки автомобиля(я так понял ты конкретную марку авто ищешь) в белый список - а то если вдруг у тебя не будет этой строки на странице, будет доканывать тебя тем, что заорет - фильтруется все содержимое.

    Всего записей: 119 | Зарегистр. 17-06-2008 | Отправлено: 05:54 04-12-2013 | Исправлено: vahhabit, 06:02 04-12-2013
    MrPerfect



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    darken665
    Используйте отслеживание обновления по ключевым словам. Свойства закладки > вкладка Ключевые слова. Ключевое слово - Corolla.

    Всего записей: 2342 | Зарегистр. 19-04-2002 | Отправлено: 09:09 04-12-2013
    darken665

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Благодарю за ответы, "regex(\s\w{3}\s\d{1,2}\s.{0,20}Mercedes.*?\$\d+)" работает отлично.
     
    Кроме этого, нужно отфильтровать определённые цифры цены. к примеру строчка из той же ссылки.  
     
    "Dec 5 2002 Lexus Daytime running lights RX300 AWD $2147 (san jose downtown) pic"  
     
    фильтр должен затрагивать последние две цифры цены , в данном случае "47". Третья и четвёртая цифра должна быть только "0,9 или 5", в случае появления других цифр должен срабатывать фильтр. цена так же может быть трёхзначным и пятизначным числом, но фильтр их касаться не должен. И этот фильтр не должен быть как то связан с предыдущим.

    Всего записей: 7 | Зарегистр. 22-07-2013 | Отправлено: 19:09 06-12-2013
    vahhabit

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    darken665
    Кроме этого, нужно отфильтровать определённые цифры цены. к примеру строчка из той же ссылки.

     
    Попробуй добавить тогда это - regex(\$\d{2}[059][059]) в свойствах закладки, в разделе ключевые слова - Отслеживание обновлений по ключевым словам.
    Вот картинка для наглядности:
       
     
    Вроде должно запахать.

    Всего записей: 119 | Зарегистр. 17-06-2008 | Отправлено: 22:21 07-12-2013 | Исправлено: vahhabit, 22:22 07-12-2013
    darken665

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    vahhabit Спасибо!
     
     Пришёл к выражению вида  
     
    regex(\s\w{3}\s\d{1,2}\s{0,20}.*?\$\d{2}[1234678][1234678])
     
    Только работает оно не корректно, и часто захватывает другие строки. как быть?

    Всего записей: 7 | Зарегистр. 22-07-2013 | Отправлено: 05:10 08-12-2013 | Исправлено: darken665, 05:50 08-12-2013
    MrPerfect



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Ваша задача неразрешима, так как любой фильтр должен иметь чёткие заданные метки начала и конца, в противном случае корректно работать никогда не будет. Невозможно отслеживать число, игнорируя в нём часть цифр.

    Всего записей: 2342 | Зарегистр. 19-04-2002 | Отправлено: 08:09 08-12-2013
    tungus1973

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Задачу можно решить через систему плагинов.
    Посмотрите в файле справки работу операторов Right, Left и Mid.

    Всего записей: 97 | Зарегистр. 28-05-2006 | Отправлено: 09:00 08-12-2013
    vahhabit

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    darken665

    Цитата:
    Пришёл к выражению вида:  
    regex(\s\w{3}\s\d{1,2}\s{0,20}.*?\$\d{2}[1234678][1234678])  

    Конечно захватит лишнее, ты же не вписал туда марку. В общем я понял, что моя задумка с ключевыми провалилась. Он делает так - вначале ищет обновление по отслеживаемым, затем проверяет ключевое слово. И даже если ключевое слово, т.е. нужная нам цена появляется не в отслеживаемых, он все равно считает, что все ок и оповещает. Ну в таком случае, если тебе не критично пропустить длинное объявление...
     
    Давай тогда так извратимся. Только я не понял - тебе объявления нужны с 0,5,9 - 3я или четверая цифра или со всеми остальными цифрами. Эта регулярка с 0,5,9 - отслеживанием.
    regex(\s\w{3}\s\d{1,2}\s.{0,20}(Mercedes.{0,30}\$\d{2}[059][059]\s)(?=\(|pic))
     
    Без такого дополнения - он захватывал лишнее и находил ненужные строки, сейчас находит только 1 строку с данными:
    #1:   Dec 2 2001 c240 Mercedes Benz 3700 odo !! $3700  
     
    Если тебе таки все остальные цифры нужны, кроме 0,5,9 - ну замени тогда [059][059] на те, что ты сам указал - [1234678][1234678], тогда он находит такую строку:
    #1:   Nov 19 2002 c240 mercedes $3777  
     
    Но тут есть один косяк, в случае, если человек накатает объяву очень длинную после слова с нужной тебе маркой и даже если цифры в цене подходят - эта регулярка пропустит его. Так что... Но я думаю большинство нужного найдет. Можешь поиграться с цифрами и установить нужную тебе длину объявления после слова Мерседес до цены - Mercedes.{0,30}. здесь установлена длина от 0 до 30 символов, включая пробелы.
     
    ЗЫ. удали ключевые слова. Используй фильтр остлеживаемые.

    Всего записей: 119 | Зарегистр. 17-06-2008 | Отправлено: 23:14 08-12-2013 | Исправлено: vahhabit, 02:34 09-12-2013
    darken665

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Работает отлично!!!

    Всего записей: 7 | Зарегистр. 22-07-2013 | Отправлено: 04:40 09-12-2013
    vahhabit

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    darken665
    Рад что помог. Задача была довольно интересная и непривычная.
    Кстати тут еще подойдет такого вида решение:) Я заметил, что там цена в начале и в конце пишется, поэтому можно ее сократить до -  
    regex(\$\d{2}[1234678][1234678]\s\w{3}\s\d{1,2}\s.{0,20}mercedes)  
    и тоже работает как надо. Причем эта регулярка должна точнее срабатывать, потому что у первой 2 раза разрыв может произойти, если удлиннят и в начале и в конце. А тут только пропустит если в вначале до марки машины длинное описание сделают - что кстати маловероятно. Так что рекомендую эту регулярку.
     
    Добавлено:
    В общем если я правильно разобрался, то фильтры, ключевые фразы, белый-черный список работают следующим образом:
    Вначале работает фильтр игнорируемые таким образом:
    Если в фильтре есть несколько строк, то он последовательно, в соотвествии с регуляркой в первой строке - вырезает внутри текста ненужное. Затем берет обработанный первой регуляркой текст и вырезает еще текст в соответсвии с регуляркой второй строки и.т.д. пока не обработает все строки в разделе игнорируемые фильтры.

    Пример:

    Допустим на странице есть только текст:
    Привет Леша у меня появилось бабло 300 рублей!
    Пойдем на прогулку! У меня есть 10 минут.
     
    А у нас фильтры настроены так.  
    Игнорируемые:
    1 строка Привет
    2 строка Привет Леша
     
    Произойдет вот что:  
    1строка фильтра удалит из текста - "Привет"
    2строка фильтра не найдет строку - "Привет Леша", потому что предидущая строка вырезала слово "Привет"
     
    Затем к работе приступает фильтр Отслеживаемые:
    Он работает с уже обработанным текстом из фильтра игнорируемые. т.е. используя предидущий пример это:
     Леша у меня появилось бабло 300 рублей!
    Пойдем на прогулку! У меня есть 10 минут.
    т.е. слово Привет - у нас вырезан!
     
    Фильтр отслеживаемые работает с текстом, в котором УЖЕ вырезаны фрагменты текста фильтром Игнорируемые. Если в фильтре отслеживаемые есть несколько строк, то вторая строка ЗАНОГО берет обработанный текст фильтра игнорируемые и с нуля добавляет еще кусок для ослеживания. Для втрой строки фильтра не существует поиска из первой строки.  
    Т.е. фильтр отслеживаемые не ищет внутри найденного. Он просто добавляет фрагменты, в которых будут отслеживаться изменения, учитывая уже вырезанное фильтром Игнорируемые.
     
    Далее Ключевые фразы или Белый-черный список:
    я думаю не важно какой из них начинает свою проверку раньше или позже, если мы включили оба, то пока оба не скажут - все ок, то уведомление об обновлении содержимого не выскочит.  
    Оба фильтра работают с ЧИСТОЙ СТРАНИЦЕЙ и им пофиг что там отфильтровалось в Отслеживаемых и в Игнорируемых.  
    Черный-Белый список отличается от фильтра по ключевым словам тем, что он будет срабатывать всегда при наличии в любом месте страницы указанной фразы или регулярки.  
    А Ключевые фразы будут срабатывать только при появлении новых указанных ключевых фраз или удалении со страницы тех, что были ранее на странице. т.е. если указанное в ключевых фразах слово уже один раз сработало при обновлении содержимого, то второй раз это ключевое слово не будет считаться. Но! При этом, если ключевое слово удалится со страницы, снова будет срабатывание этого фильтра.
    Но прицип у обоих фильтров один, они начинают проверять только тогда, когда сработало обновление в предидущей проверке - отслеживаемые. Пока в отслеживаемых нет изменений, они будут молчать, даже если на странице в неотслеживаемой области появляеются ключевые слова или слова из белого-черного списка.
     
    Я думаю, что неплохо было бы этот текст добавить в шапку, чтобы меньше вопросов возникало у людей. Как считаете? Сам только сейчас разобрался :)

    Всего записей: 119 | Зарегистр. 17-06-2008 | Отправлено: 05:05 09-12-2013 | Исправлено: vahhabit, 02:09 01-05-2015
    radnek

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Всем привет. Подскажите, пожалуйста. Есть много однотипных движков форума. На каждом форуме внизу есть строка "Сообщений: 72". Вот это число "72" постоянно изменяется. Как сделать так, чтобы при изменении этого числа было уведомление?
     
    Что надо вписать в графу "Отслеживание только указанных строк"?
    http://puu.sh/62hwR.png
     
    P.S. Плагина для моего движка форума - нет.

    Всего записей: 3 | Зарегистр. 14-06-2005 | Отправлено: 15:55 29-12-2013 | Исправлено: radnek, 15:56 29-12-2013
    vahhabit

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    radnek
    Ну ты уж совсем новичок, судя по написанному. Тебе не нужен никакой плагин для форума. Изучай регулярные выражения, или на крайняк  научись пользоваться мастером фильтров.  
     
    Просто создай закладку для начала, затем зайди в мастер фильтров в свойствах этой закладки, выделяй в тексте нужное место для отслеживания, затем щелкай добавить фильтр отслеживаемые. Далее выбираешь - выделенный текст, затем - текст с изменяющимися числами. И добавить фильтр. Все. И не нужно никаких плагинов. Так можно на любом сайте, форуме такого типа отслеживание сделать.
     
    Пошаговая инструкция в картинках...
     
    ЗЫ. А проще было бы знать регулярки и прописать сразу в фильтры regex(Сообщений:\s\d+) . Но рекомендую, раз ты не знаешь регулярок пользоватся мастером. Хотя мастером тоже быстро добавляется, если знать куда тыкать)
     
    Вообще наверно было бы клево мануалку как нить к этой проге сделать. Может как-нибудь руки дойдут...

    Всего записей: 119 | Зарегистр. 17-06-2008 | Отправлено: 16:37 29-12-2013 | Исправлено: vahhabit, 16:42 29-12-2013
    radnek

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Ну ты уж совсем новичок, судя по написанному

     
    Новичок. В регулярках ничего не понимаю.
     

    Цитата:
    Но рекомендую, раз ты не знаешь регулярок пользоватся мастером. Хотя мастером тоже быстро добавляется, если знать куда тыкать)  

     
    С мастером я разобрался. И я действительно смог отслеживать поле число сообщений. Спасибо. Но есть уже задача посложней...
     
    1. Вот я отслеживаю изменения числа сообщений - все ок.
     
    2. Но я бы хотел еще добавить такую фичу... Чтобы уведомление об изменении числа сообщений не срабатывало, в случае если сообщение появилось в определенной категории.
     
     
    P.S. Если кто поможет настроить такой фильтр - с меня пиво или что скажете
    Я могу вам выслать portable дистрибутив, если вы сможете настроить то было бы здоров. Уверен что для вас это дело 5 минут
     
    icq: 176244477
    skype: mezone
     
    Добавлено:
    vahhabit, спасибо за помощь!
     
    Вопрос не актуален, vahhabit'у респект

    Всего записей: 3 | Зарегистр. 14-06-2005 | Отправлено: 16:50 29-12-2013
    totnetot



    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Господа товарищи заседатели!!!
     
    Помогите решить такой вопрос. Мониторю один, сайт с периодичностью скажем 20 минут. Настроил кучу фильтров, разобрался с регулярками, и на выходе все работает. Каждые 20 минут я получаю новый Html файл со списком отфильтрованных новых URL, которые выделены желтым цветом. Все остальные URl в этом HTML зачеркнуты.
     
    Хочу автоматизировать еще несколько действий, поскольку объем этих URL достаточно большой, и вручную проверять каждую ссылку физически не хватит времени. Нужно сделать следующее:
     
    1. Из получаемого HTML файла нужно удалить все ссылки которые перечеркнуты, и оставить только новые, подсвеченные желтым цветом.
     
    2. Открыть каждую найденную новую ссылку, и искать на странице определенный текст. При нахождении определенного текста адрес этой страницы отправить на e-mail с отметкой например "важное", если в ссылке нужный текст не найден, то ее url тоже можно отправить на e-mail с отметкой "второстепенное".

    Всего записей: 410 | Зарегистр. 16-03-2013 | Отправлено: 20:31 29-12-2013
    vahhabit

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    totnetot
    Ох и нифигасебе задача) Печалька в том, что даже 1я часть задания с помощью WSW вроде как неосуществима. Есть вариант экспорта, но он всю новую вебстраницу тебе загрузит. Тебе придется по маске парсить нужные тебе ссылки и экспортированного хтмл или тхт, чтобы исключить зачеркнутые - ты же их по какому то правилу вычеркивал. (а если такого правила нет, то печалька).
    А вот вторая часть это вообще трындец)
    Короче я даже не знаю с какой стороны к этой задаче подступаться. Средствами WSW даже экспорт подсвеченного контента не осуществить, если не ошибаюсь.

    Всего записей: 119 | Зарегистр. 17-06-2008 | Отправлено: 21:26 29-12-2013
    totnetot



    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Спасибо. Я и был готов услышать примерно то что вы написали. Буду додумывать как расчленить Html каким нибудь текстовым процессором, наверняка участки с выделенными урл-ами каким то образом отмечены. И плюс ко всему видимо придется пристраивать какое нибудь средство автоматизации на скриптах. Просто для меня это не слишком легко - разбираться практически в программировании, потому как с примитивным программированием сталкивался уж очень давно, и мозги уже не такие свежие к восприятию новой информации.

    Всего записей: 410 | Зарегистр. 16-03-2013 | Отправлено: 22:11 29-12-2013
    tungus1973

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    totnetot
    Я такие задачки решал с помощью плагинов и скриптов WSW.
     
    Для хранения списков ссылок используем инфополя закладки (Инфо1, Инфо2, Инфо3).
     
    Алгоритм примерно такой:
    1. Открываем целевую страничку, собираем с неё все ссылки. Сохраняем ссылки в строковом списке.
    2. Если поле Инфо1 не пустое (т.е. в нём есть ссылки, собранные при прошлых проверках), то смотрим, какие из ссылок уже были в списке, а какие - новые. Все новые ссылки собираем в строковой список новых ссылок.
    3. По новым ссылкам выкачиваем странички встроенным менеджером закачек. (Если странички используют скрипты и проч., то есть менеджер закачек их не загружает, то для каждой ссылки создаём новую закладку, для которой потом запускаем проверку.)
    4. В собранных страничках ищем нужный контент, распределяем по рубрикам, рассылаем потребителям.

    Всего записей: 97 | Зарегистр. 28-05-2006 | Отправлено: 08:15 30-12-2013
    vahhabit

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    tungus1973
    Ого! Круто блин... а можешь вставить код из плагина с пояснениями? Было бы очень любопытно глянуть...

    Всего записей: 119 | Зарегистр. 17-06-2008 | Отправлено: 16:20 30-12-2013
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109

    Компьютерный форум Ru.Board » Компьютеры » Программы » WebSite-Watcher


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru