Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Интернет » В помощь вебмастеру » Активные темы » Скрипты поиска (site search)

Модерирует : Cheery

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10

Открыть новую тему     Написать ответ в эту тему

Erick Flatcher



Full Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
нужен скрипт CGI поиска для индексации паги с ~500 htm документов
есть возможность поставить хороший aka платный скрипт  
что посоветуете? какой получше?

Скрипты поиска

Для тех, у кого нет возможности установить скрипты на сайте - Службы для поиска по сайту (не скрипты)
 
В этой теме будут собраны скрипты и ссылки на коллекции скриптов поиска. Остальные темы по поиску скриптов подобного рода будут закрыты.
Разрешается:
- постить ссылки на фриварные (свободные к распространению, бесплатные) скрипты поиска или их коллекции, на платные скрипты и сервисы поиска только легальных версий. Напоминаю, что форум Варезник тут. Постить обязательно с описанием!
- оставлять мнения по личному опыту работы с тем или иным скриптом.
- редактировать первый пост полезной информацией по сабжу (участникам со статусом мембер и выше).

 
Файловый архив форума содержит полезные скрипты. Можете принять участие в его пополнении.

Начинаем.



  • RiSearchPro [Perl]
    http://risearch.org/rus/index.html
    установка и настройка скрипта RiSearchPro

    Цитата:
    Поисковый скрипт, написанный на Перле и не требующий внешней базы данных.
    Нa странице производителя есть всевозможные разновидности скрипта - с базой данных, на PHP и т.д.

     
  • RiSearch PHP - не требует MySQL
    http://risearch.org/rus/risearch_php/index.html

    Цитата:
    RiSearch PHP - бесплатный поисковый скрипт, предназначенный для небольших сайтов. Данный скрипт является клоном скрипта RiSearch, хотя пока еще не полностью дублирует его.  

     
  • siteIndexer [PHP и MySQL]
    http://carline.ru/programm/index.php?action=viewlink&id=16
    http://sourceforge.net/projects/siteindexer/files/
    Цитата:
    Неплохой скрипт системы индексации и поиска для сайтов. Этот скрипт позволяет индексировать страницы вашего сайта и помещать их в базу данных. Для работы Морд - английский.

     
  • K.I.S.S. Site Search Engine [Perl]
    Сайт разработчика: http://moskalyuk.com/software/perl/search/kissru.htm

    Цитата:
    Небольшой по размеру и легкий в настройке поисковик для сайта обслужаивает до 300 HTML-документов. Возможность настройки страницы результатов, также возможно исключение отдельных папок или файлов из индекса.
    Лицензия: Бесплатный
    Автор: Александр Москалюк
     

     
  • Fluid Dynamics Search Engine [Perl]
    http://www.xav.com/scripts/search/

    Цитата:
    Вот это поисковик!!! В этой программе есть ф-ции админа, ищет быстро, не пожалеете, это я вам обещаю, есть раздел на категории, то есть, например, искать отдельно в категории ДОКУМЕНТАЦИЯ, СКРИПТЫ, ну в общем всё что надо для поиска по серверу...

     
  • dummySearch [Perl]
    http://easyip.ru/free/
    Простой и неоптимальный скртипт поиска по сайту. Впрочем каждый может доработать под себя...
    Лицензия: GPL
     
  • mnoGoSearch (бывший UdmSearch) [С]
    http://search.mnogo.ru/
    обсуждение mnoGoSearch: установка, проблемы...
    юниксовая версия бесплатна, для виндовз-- русская версия бесплатна для некомерческого использования
    Цитата:
     универсальная поисковая система для Intranet и Internet серверов. Пригодна для индексации как небольших сайтов, так и крупных порталов. Документы можно индексировать по протоколам HTTP, FTP, NNTP и на локальных дисках. Индексирует документы в формате HTML, plain text, а так же pdf, doc и другие при помощи внешних парсеров. Настраиваемая важность (вес) для заголовков, ключевых слов, тела документа. Форму отображения результатов поиска можно настраивать с помощью шаблонов.  

     
  • FTPSearch/Agent [Java/PHP]
    http://sourceforge.net/projects/ftpsearchagent/
    FTPSearch/Agent — полнофункциональный скрипт для индексации ftp и поиска по средним локальным сетям(20-200 серверов)
     
  • FTP SEARCH [PHP]
    http://codewalkers.com/seecode/157.html
    Система для индексации FTP сервера и поиска по нему
     
  • Manlix Search [PHP]
    http://manlix.ru/zipped/manlix_search_v1_3.zip
     
  • iSearch [PHP]
    http://www.isearchthenet.com/isearch/download.php
     
    шаблон:
    [*][b][/b] [PHP]
     
    [s][/s]

     



В розыске:
бесплатные морфологические модули/библиотеки русского и украинского языков.
 

<!-- Коллекции скриптов поиска: -->
http://pro.lookanswer.com/scripts/search.html
http://ancient.dax.ru/scripts.php?lang=php&group=search  
http://webscript.ru/scripts/index.php?sid=620531966&t=sub_pages&cat=21  
http://www.cgi-resources.com/Programs_and_Scripts/Perl/Searching/
http://www.allscripts.bip.ru/pcgi/search.htm  
http://cgid.al.ru/cgi-bin/news/list.cgi?show=group&l=search  
http://webportal.fud.ru/scripts/cgi/search/search2.htm


 
Другие темы по скриптам на руборде:
 
Клиентские скрипты
Серверные скрипты

 
Скрипты счетчиков посещений
Скрипты обмена файлами
Скрипты чатов
Скрипты фотогалерей
Скрипты новостей
Скрипты подписки/рассылки
Интернет-магазины
Дневники (блоги)
Гостевые книги
Скрипты голосований
Редактирование в браузере HTML-кода и веб-страниц
Скрипты служб знакомств
Баннерообменные скрипты
Whois-скрипты
Доски объявлений
Создание карты сайта

Всего записей: 581 | Зарегистр. 12-10-2001 | Отправлено: 19:33 11-12-2001 | Исправлено: loosingar, 12:20 01-08-2009
drPeps

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как сделать поиск для локальных веб-страниц подобно поиску в CHM-файлах?
 
Привет! Извиняюсь, если вопрос несколько не в тему. Все знают такую фигню как скомпилированные CHM-файлы, в них (в левой панели) есть вкладка с поиском. Я не очень люблю CHM-файлы, так как их невозможно редактировать (надо декомпилировать, потом опять компилировать итп.) и по возможности предпочитаю Справки, книги итп. в виде набора веб-страниц (связанных между собой ссылками).
 
Так вот — можно ли как-нибудь прикрутить к таким страницам поиск? При этом имеется в виду, что этот набор страниц не является "сайтом" (пусть и локальным), т.е. он не работает из-под какого-то сервера (Апач, IIS итд.) со всякими фичами (PHP, ASP, CGI итп. итд.), а это просто папка с веб-страницами (ну или папка с некоей структурой под-папок с веб-страницами).
 
Извиняюсь, если объяснил сумбурно, просто я в этом деле мало что соображаю :)

Всего записей: 156 | Зарегистр. 16-12-2004 | Отправлено: 20:43 28-01-2012
danyamb

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
не подскажите, как здесь организован поиск? http://www.prohq.ru/
Либо же это просто каталоги, то есть раздел и подразделы или поиск такой удобный. попробуйте, по проектам очень удобно ориентироваться.

Всего записей: 5 | Зарегистр. 23-01-2012 | Отправлено: 21:20 30-01-2012
genafonchik



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Добрый день.
Нужен api готовый, filesearch для ftp и http для поиска файлов на сервере.
Использоваться будет здесь в топике для форумчан.  
П.С. Microsoft Windows Server 2012

Всего записей: 2457 | Зарегистр. 11-08-2008 | Отправлено: 17:06 18-08-2012
Cheery



.:МордератоР:.
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
genafonchik
так все же - вы ищете скрипт или отдельное приложение?

----------
Away/DND

Всего записей: 52737 | Зарегистр. 04-04-2002 | Отправлено: 20:18 18-08-2012
root0



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
to Cheery
 
Есть ftp-http server для раздачи 0day релизов нужно организовать поиск файлов через браузер на этом сервере

Всего записей: 3965 | Зарегистр. 26-09-2008 | Отправлено: 09:42 19-08-2012
Cheery



.:МордератоР:.
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
root0
я не совсем понимаю в чем проблема с ftp.
если у вас есть доступ к локальной файловой системе, то получить структуру файлов на ftp довольно просто.
вы же не собираетесь индексировать содержимое файлов на ftp?
а для http - полно скриптов, выбирайте какой больше понравится
 
либо посмотрите сюда
http://www.mnogosearch.org/winrus.html
но это не скрипт и вообще не для данного раздела

----------
Away/DND

Всего записей: 52737 | Зарегистр. 04-04-2002 | Отправлено: 08:13 22-08-2012 | Исправлено: Cheery, 08:15 22-08-2012
genafonchik



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Cheery
Надо что-то наподобие такого поиска (можно с дополнительными функциями, расширенный поиск), http и ftp через браузер.
http://img840.imageshack.us/img840/7162/20120822072749.png

Всего записей: 2457 | Зарегистр. 11-08-2008 | Отправлено: 08:30 22-08-2012
Cheery



.:МордератоР:.
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
genafonchik

Цитата:
Надо что-то наподобие такого поиска

этот поиск - всего лишь модификация шаблона генерации списка файлов в папке (форма поиска вставляется в верхнюю часть страницы).
вставляется туда любой

----------
Away/DND

Всего записей: 52737 | Зарегистр. 04-04-2002 | Отправлено: 08:36 22-08-2012
Mancoffee

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Хорошо бы скриншоты к поискам

Всего записей: 50 | Зарегистр. 14-04-2007 | Отправлено: 00:24 25-02-2013
Cheery



.:МордератоР:.
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Mancoffee

Цитата:
Хорошо бы скриншоты к поискам

в каком смысле? к результатам работы скрипта или чтобы поисковик делал скриншоты?

----------
Away/DND

Всего записей: 52737 | Зарегистр. 04-04-2002 | Отправлено: 10:17 25-02-2013
Talay



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
PHP Search Engine v1.5
как в использовании?

Всего записей: 482 | Зарегистр. 07-08-2008 | Отправлено: 20:58 21-07-2013
GeRUb



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Доброго времени суток.
Воскрешаю тему, т.к. она ближе всех к моему вопросу.
Предыстория.
Много лет юзал скрипт Risearch_v02 без проблем.
Но вот настало время перейти на UTF-8 (а был CP1251).
Все нормально перевел и теперь начались проблемы с поисковым скриптом.
Описание траблы.
На английском ищет без проблем, а вот на русском...
Рвет слова, вставляя ромбики с вопросом, и выдаёт в результате эти рванные слова.
Например слово "журнал" разбивает на Ж и НАЛ (вместо УР вставляя два ромбика). В результате поиска выдает количество найденных "Ж" и "НАЛ" как отдельных слов.
Вычислил, что на "ромбики" заменяются буквы от Р до Ю (по алфавиту).
Понимаю, что дело в перекодировке, но куда, и что вставить не понимаю .
Уж извините , не силён в РНР.
Может кто помочь?
P.S.
Другие скрипты пробовал, там либо аналогичная картина, либо вообще не работают, или сложные в настройке. Мне нужно попроще, т.к. сайтик маленький, всего до 50-ти страниц.
Да, и ссылки в шапке "Коллекции скриптов поиска" - сдохли. (Старые стали, вот и сдохли )

Всего записей: 233 | Зарегистр. 08-02-2009 | Отправлено: 10:52 25-03-2017
Mavrikii

Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
GeRUb

Цитата:
Рвет слова, вставляя ромбики с вопросом, и выдаёт в результате эти рванные слова.  

видимо не все нормально перевели, нужно видеть хотя бы код, а то непонятно о чем вы.
 

Цитата:
Другие скрипты пробовал,

я использую mnoGoSearch - http://www.mnogosearch.org/
и Sphinx Search - http://sphinxsearch.com/

Всего записей: 15040 | Зарегистр. 20-09-2014 | Отправлено: 19:11 25-03-2017
GeRUb



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Mavrikii
...нужно видеть хотя бы код, а то непонятно о чем вы.  

Уточните, плз, какой именно кусок хотите увидеть.
Не выкладывать же тут "простыни" на 5 экранов ...

Всего записей: 233 | Зарегистр. 08-02-2009 | Отправлено: 12:24 26-03-2017
Mavrikii

Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
GeRUb

Цитата:
Не выкладывать же тут "простыни" на 5 экрано

тут не нужно, можно выложить на обменник и дать ссылку.

Цитата:
Например слово "журнал" разбивает на Ж и НАЛ (вместо УР вставляя два ромбика).

сравните в каком виде в базе. если нормально, то проблема возникает во время генерации вывода результатов.

Всего записей: 15040 | Зарегистр. 20-09-2014 | Отправлено: 22:33 26-03-2017 | Исправлено: Mavrikii, 22:33 26-03-2017
GeRUb



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Mavrikii  
...сравните в каком виде в базе. если нормально, то проблема возникает во время генерации вывода результатов.

В файлах базы слова нормальные, только у некоторых последняя буква из другой кодировки. Т.е. если нормальный код буквы (русская кодировка) начинается с D0 то последняя = D1 (HEX).
Вечером сделаю примеры и скрины, упакую и скину.

Всего записей: 233 | Зарегистр. 08-02-2009 | Отправлено: 08:58 27-03-2017
GeRUb



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот пакет с файлами поисковика. #
Посмотреть результат работы можно на сайте.

Всего записей: 233 | Зарегистр. 08-02-2009 | Отправлено: 19:28 27-03-2017
Mavrikii

Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
GeRUb
начнем с простого - если переходите на уникод, то и содержимое php файлов должно быть в нем (в том числе и spider.php, если пользуетесь).  и без BOM (он создает лишние проблемы) - https://ru.wikipedia.org/wiki/Маркер_последовательности_байтов
 
ну и для регулярок, раз используете кириллицу, то лучше указать флаг u, который говорит об использовании уникода.
 
по нормальному, нужно выводить результаты каждого шага при индексации и смотреть где начинает "придумывать". пока не хочу запускать и смотреть, может чуть позже.  
 
ps: добавлю еще кое-что..
 
1) используйте <?php, а не <?
2) добавьте
Код:
fwrite($fp_FINFO, pack("CCC", 0xef,0xbb,0xbf));
fwrite($fp_SITEWORDS, pack("CCC", 0xef,0xbb,0xbf));
fwrite($fp_WORD_IND, pack("CCC", 0xef,0xbb,0xbf));

после открытия в spider, чтобы создавать уникод файлы.
3) измените
Код:
    $html_text = preg_replace("/[^a-zA-Zа-яА-Я$numbers -]/u"," ",$html_text);
    $html_text = preg_replace("/\s+/us"," ",$html_text);
    $html_text = mb_strtolower($html_text, 'UTF-8');

в common_lib
 
по крайней мере это приведет к нормальной записи в файлы. и, в принципе, при работе с уникодом нужно использовать не стандартные функции работы с текстом, а их mbstring аналоги. это если старый php )

Всего записей: 15040 | Зарегистр. 20-09-2014 | Отправлено: 22:56 27-03-2017 | Исправлено: Mavrikii, 03:57 28-03-2017
GeRUb



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Mavrikii
...начнем с простого - если переходите на уникод, то и содержимое php файлов должно быть в нем...

Спасибо за информацию.  
Файлы все переведены в UTF-8 сразу. Про ВОМ знаю.
Внесу исправления/изменения, согласно вашим рекомендациям, и отпишусь по результатам.

Всего записей: 233 | Зарегистр. 08-02-2009 | Отправлено: 14:50 28-03-2017
GeRUb



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Результаты после внесенных изменений:
по п.1. - заменил во всех файлах.
по п.2. не совсем уверен туда ли я вставил этот блок в файле spider.
Воткнул сразу после строк:  

Код:
include "config.php";
include "common_lib.php";
print "Start indexing<BR>\n";
............

по п.3. в common_lib заменил существующие на указанные вами.
 
Проверил. (естественно переиндексировался после того как)
Резюме:
файл 0_sitewords создан изумительно, чисто, как должон .
файл 0_finfo в основном без ошибок, изредка встречается подмена типа  
до&#208;  отк&#209;  значительны&#208;  разрядно&#208;
все кривые знаки стоят в конце строки, вместо последней буквы.
При поиске видимых изменений нет. Т.е. как было, так и осталось. .
Ищу "журнал" получаю в ответ это:
По запросу:   ж&#65533; &#65533; нал  
Ничего не найдено.    
 
P.S.

Цитата:
...раз используете кириллицу, то лучше указать флаг u,..  

мне осталось только узнать, где и когда его указывать .

Цитата:
....не стандартные функции работы с текстом, а их mbstring аналоги.

Тут для меня темный лес. .

Цитата:
это если старый php

Я понятия не имею, чем отличается старый от нового и как узнать какой у меня .

Цитата:
по нормальному, нужно выводить результаты каждого шага при индексации и смотреть где начинает "придумывать".

если расскажете как это сделать , то попробую.
Заменил в архиве файлы на исправленные, архив на месте.

Цитата:
Mavrikii

Благодарю за помощь.
 
Добавлено:

Цитата:
&#65533; &#65533;

Это следует понимать как "ромбики". Тут они выглядят по другому .

Всего записей: 233 | Зарегистр. 08-02-2009 | Отправлено: 22:50 28-03-2017
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10

Компьютерный форум Ru.Board » Интернет » В помощь вебмастеру » Активные темы » Скрипты поиска (site search)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru