Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » dtSearch

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12

Открыть новую тему     Написать ответ в эту тему

MrPerfect



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Варезник » dtSearch
 
dtSearch
www.dtsearch.com
 
 

dtSearch Engine — надежный и эффективный поисковый движок с поддержкой баз данных, предназначенный для встраивания в состав веб-сайтов и приложений. Поддерживает программное управление встроенным текстовым парсером с функциями подсветки искомых фрагментов, а также встроенными файловыми конверторами, которые обеспечивают преобразование в формат HTML документов, созданных в OpenOffice, MS Office и целом ряде других популярных приложений. Программа содержит эталонный код и поддержку для ADO, SQL, C++, C++.NET, Java, VB, VB.NET, C#, Delphi, ASP и ASP.NET. Обеспечивает более двух дюжин опций индексированного и неиндексированного текстового поиска для всех популярных типов файлов. Поддерживает полнотекстовый поиск во всех типах поддерживаемых файлов. Имеется также поиск с многократным ранжированием и другие опции сортировки при поиске.
 
dtSearch Desktop — программа, позволяющая искать гигабайты текста за считанные секунды на локальном компьютере, путем создания индекса, хранящего расположение слов в ваших файлах. Программа предлагает функции подсветки искомых фрагментов в найденных документах и поддерживает обширный перечень баз данных почтовых сообщений и файловых форматов. Штатные возможности программы включают более двух десятков функций индексированного, неиндексированного, полнотекстового и структурированного поиска, включая настраиваемый нечеткий поиск, поиск с использованием синонимов, терминов и словарей, логические операторы, ранжирование по релевантности, ранжирование по местоположению, поиск фраз и созвучий, поиск по маске, поиск с учетом порядка следования и взаимного расположения искомых единиц, морфологический поиск, поиск в заданном диапазоне числовых значений, настраиваемые веса искомых единиц. Кроме того, благодаря поддержке Юникода, программа обеспечивает поиск информации на самых разных национальных языках.
 
Возможности программы:
• Прокрутка списка слов для мгновенного отклика после введения поискового запроса
• Функции индексированного, неиндексированного, полнотекстового и структурированного поиска
• Обзор и настройка параметров тезауруса
• Показ всех проиндексированных полей документа с помощью специальной кнопки
• Отображение истории поиска
• Поиск сообщений, показывая хиты в полученных документах
• Опции буфера обмена, запуск файлов и другие инструменты для работы с извлечением данных
• Экспорт результата поиска в различные форматы данных
 
Особенности программы:
• Поиск с использованием морфологии
• Поиск с использованием синонимов
• Нечеткий поиск
• Фонетический поиск
• Поиск в базах данных (через ODBC)
• Поддержка сообщений Outlook
• Поддержка различных кодировок
• Работа в локальной сети
• Индексация веб страниц на заданную глубину

Всего записей: 2342 | Зарегистр. 19-04-2002 | Отправлено: 06:09 09-02-2003 | Исправлено: Komandor, 15:29 16-11-2022
Arech

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Признаю, обзоры старые, но полезную информацию при желании почерпнуть можно... И про DTSeach почитать. Если Архиваруис в них не упоминается, это не даёт повода обсерать их и мою помощь =)

 
Дорогой Falanster, если Вы посмотрите на мои формулировки немного менее эмоционально, то заметите, что я так отзывался не о Вашей помощи, а о конретно этих обзорах. Они, к сожалению, не просто старые, а очень старые. Человеческий мозг хитрая штука, и может найти много полезного даже в старом чулане на даче, но если всерьёз, то читать такие старые обзоры для выбора сегодняшней программы это как выбирать между Win95 и OS/2, чтобы потом обнаружить, что первая проэволюционировала уже с десяток важных этапов, а вторая и вовсе сгинула в небытие. Хотя, безусловно, что-то полезное из их обзора при желании подчерпнуть можно
 

Цитата:
сотни поддерживаемых форматов/расширений архивов у архивариуса вызывают огромнейшее уважение к программерам, которые все это впихнули в 6-метровый инстал

 
У меня есть ощущение, что там всё чуть более, чем просто и большого уважения, увы, не достойно - каждый формат, если надо, распаковывается до вида, где есть открытые строки (как, например, PDF, где строки закодированы), а методов упаковки обычно немного, а затем всё они там тупо индексируются без учёта всякой внутренней структуры. Только таким лобовым методом можно объяснить и поддержку в одном небольшом бинарнике сотен форматов, в то время как иногда один формат сам по себе у производителя имеет и больший размер "читалок", и сам факт крайне низкого качества поиска и некоторые артефакты поиска.
В любом случае, меня как пользователя интересует в первую очередь выполнение главной функции программы - поиска. А будет ли это достигаться 6 или 600 мегабайтным бинарником дело уже настолько стодвадцать пятое, что и вспоминать неудобно.
 

Цитата:
что не нравится у обеих - платные, заразы, но и тут, порядок цен ОЧЕНЬ отличается, соотношение фичастость/цена, имхо, не в пользу DtSearch

Да, согласен.
Причём, цена - это, по моему, увы, единственное достоинство Архивариуса (у меня честно купленная версия).
 

Цитата:
Вот неплохое сравнение поисковых программ:
 
http://forum.ru-board.com/topic.cgi?forum=5&topic=7321&start=100
 
и более развёрнутое - http://filospecan.easyforum.ru/viewtopic.php?id=61

Большое спасибо! Буду изучать!
 

Цитата:
Это можно прочувствовать при поиске лица с такой очень распространённой фамилией, как Иванов, но именем Григорий.
Архивариус выдал мне 85 документов, DTSearch - 3 (проверялось на небольшом индексе).  
При рассмотрении результатов выбранных Архивариусом, оказалось, что он нашёл все документы, в которых встречаются оба эти слова, но только в одном упоминалось искомое лицо. Т.е. в результаты поиска он выдал и те документы, в которых два поисковых слова были сильно разбросаны. В начале текста стояла фамилия Иванов, а в конце текста Григорий, речь шла о разных людях.
DTSearch выдал 3 документа, в одном из которых шло упоминание о нужном лице.  

 
Вооо!!! Урааа!!!! Это именно та главная причина, которая меня бесит в Архивариусе - ищещь определение какого-нить составного термина, а он выдаёт тебе 100500 результатов, где первое слово термина есть в начале 600 страничной книги, второе где-нить к концу, а третье - посередине. И ищи потом среди них...
Falanster, огромное Вам спасибо за этот последний пост, который содержит как раз большинство того, что я и хотел узнать про различия)
 

Цитата:
Сначала очень интересной показалась возможность Архивариуса извлекать из текстовых массивов разные данные, особенно номера телефонов.

 
Ага, я тоже на этом попадался. Никакого реального применения тем возможностям, что у них зашиты я тоже не нашёл. Это только спамерам базы собирать
 
Я, кстати, как-то хотел сделать  (да и ща хочу сделать или найти) софтину для сбора ISBN книг и статей своей библиотеки для поиска дубликатов и каталогизации, и думал воспользоваться архивариусом для этой цели - ну, он же типа ISBN собирать умеет. Ага, умеет. Собирает абсолютно всё, что тупо подходит под шаблон ISBN, например, весь список литературы в конце каждой статьи) И чо с этим делать?
Я тогда, как зарегленный пользователь, обратился к ним в суппорт с предложением открыть и задокументировать API для работы с индексом Архивариуса - тогда люди смогут на его основе много чего полезного и интересного сделать, типа вот такой вот софтины. Это сделать дешево и совершенно безопасно для них, а вот результат может быть очень сильным, т.к. софт становится сильно более популярен при наличии вокруг него богатой экосистемы. Но они даже не ответили, хотя раньше на какие-то вопросы отвечали... Ну, да и фиг с ними.
 
У dtSearch, кстати, вроде бы судя по описанию, какой-то API доступа есть... Но цена кусается...

Всего записей: 169 | Зарегистр. 28-12-2005 | Отправлено: 15:42 09-12-2012
laprad

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Привлекала внимание возможность выбора нескольких поисковых операторов и их комбинация. Особенно порадовало то, что можно было задавать расстояние между поисковыми словами (такая фишка реализована в Яндексе и отсутствует в Google).  

 
ну, при применении булевого языка запросов в архивариусе можно заюзать "Квадратные скобки по своему действию похожи на двойные кавычки, но при этом позволяют искать документы, в которых введенные слова могут находиться в любом порядке и на расстоянии не более чем 10 слов друг от друга. Например, по запросу [спорт новости] будут найдены только те документы, в которых оба слова расположены на расстоянии не более 10 слов."  судя по всему "10 слов" - на 11 поменять нельзя, к тому же, например, союз "и" уже считается за 1 слово, но хоть что-то...  также не нашел у архивариуса оператора "искать слова в одном предложении"(строке/записи, если речь идет про csv, xls, dbf и т.д.) - было бы тоже весьма полезно

Всего записей: 392 | Зарегистр. 19-01-2009 | Отправлено: 16:59 09-12-2012
Falanster



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Например, по запросу [спорт новости] будут найдены только те документы, в которых оба слова расположены на расстоянии не более 10 слов.

laprad, это другое дело. Спасибо за разъяснения!!! Думаю, мне надо пересмотреть своё отношение к Архивариусу.
В дополнение:  
1.В Архивариусе не совсем удобно перемещение между результатами поиска. Когда в одном документе несколько вхождений, то перемещаться по ним можно клавишей пробел (как в большинстве программ). Но перемещаться между документами приходится с помощью мышки, что совсем не удобно, т.к. в среднем в поисковую выдачу попадает порядка 25-30 файлов.
2.Архивариус отображает сохранённые веб-страницы (*.mht) в виде простого текста. DTSearch отображает их как в браузере. Иногда это происходит некорректно, но вероятно потому, что сохранялись они не должным образом. Также DTSearch умеет отображать фото и картинки, внедрённые в документы MS Word. Хотя считать это преимуществом пока не следует, т.к. отображает он их кривовато.
 
Arech, всё понял =) Исправлюсь!

Всего записей: 113 | Зарегистр. 12-04-2008 | Отправлено: 19:17 09-12-2012
yanko12



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
dtSearch Desktop 7.66 (7928) какая-то нестабильная - у меня валится на каком-то рядовом вордовском файлике через полчаса вроде стабильной работы (и нескольких гигов проиндексированных) причём если убрать галку индексации названий файлов - не валится вроде, но экспериментировать уже неохота
 
Какая версия самая стабильная сейчас ? (Для хрюши SP3 со всеми обновл)
 
DjVu IFilter подключен единственный - этот -  
 
http://www.djvu-soft.narod.ru/soft/
DjVu IFilter v1.1 (для Win NT / 2000 / XP) - Celartem - Самая свежая версия поискового плагина  
http://www.celartem.com/en/download/data/DjVuIFilter11.exe

она действительно самая свежая ?
 

Всего записей: 477 | Зарегистр. 18-01-2005 | Отправлено: 14:13 25-01-2013 | Исправлено: yanko12, 20:01 25-01-2013
Ax0n

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кто может что-то сказать о эффективности Архивариуса?

Всего записей: 3 | Зарегистр. 08-02-2007 | Отправлено: 18:37 09-03-2013
cuneiform

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Важная родственная тема здесь:
 
http://forum.ru-board.com/topic.cgi?forum=5&topic=7321&start=180#lt
 
(могут быть ответы на ваши вопросы)

Всего записей: 2062 | Зарегистр. 27-04-2006 | Отправлено: 23:51 31-03-2013
UNHELPMAN



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мучает вопрос. Есть некий набор HTML файлов. Копия сайта.  Корректно  отображается в 8  браузерах.  Попробовал сделать лив dvd.  
Оказалось , что  файлы  отображаться не верно .   генерируемые ссылки  - наполовину  ошибочны. Часто  вся  эта конструкция  замирает . Версия  7.72  Пробовал  3  варианта  -  со встроенным  браузером ,  микровебом  и  сервером их. еже  документы -  десктоп энджине  отображаются корректно, Но  навигация  зачастую  не работает  - так как  на  джава скрипте.
Собственно  вопрос
как можно  обойти  с минимальными потерями  нервов  и  контента эти  трудности .  
Спасибо .

Всего записей: 209 | Зарегистр. 28-11-2004 | Отправлено: 12:36 19-05-2013
bookserg

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вопрос к знатокам dtSearch.
К примеру существует сайт http://dc.lib.unc.edu/cdm/customhome/collection/rbr/,
нужно проиндексировать страницы определенного типа: http://dc.lib.unc.edu/cdm/item/collection/rbr/index.php?id=23349
Как это можно сделать? Использую dtSearch 7.73 (Build 8126).

Всего записей: 91 | Зарегистр. 27-04-2009 | Отправлено: 10:52 11-09-2013
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bookserg
При создании индекса нажимаете кнопку Add Web... Задаете все нужные параметры. Все.

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 23:34 11-09-2013
bookserg

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Задаете все нужные параметры.

ghosty, так в этих самых параметрах и загвоздка...
Как правильно задать "Filename Filters" в данном случае,
чтобы индексировались только страницы типа _http://dc.lib.unc.edu/cdm/item/collection/rbr/index.php?id=23349
Задание такого фильтра _http://dc.lib.unc.edu/cdm/item/collection/rbr/index.php?id=*
не дает нужного результата...

Всего записей: 91 | Зарегистр. 27-04-2009 | Отправлено: 08:54 12-09-2013 | Исправлено: bookserg, 08:55 12-09-2013
Falanster



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
чтобы индексировались только страницы типа _http://dc.lib.unc.edu/cdm/item/collection/rbr/index.php?id=23349

Дружище bookserg, обрати внимание на тип файла - ...collection/rbr/index.php...  
index.php - это и есть название файла и его тип. Всё остальное - это переменные (id) и их значения (23349), они передаются в адресной строке.

Всего записей: 113 | Зарегистр. 12-04-2008 | Отправлено: 22:11 12-09-2013
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите, почему у абсолютного большинства слов из списка проиндексированных DJVU-файлов отсутствуют пробелы, т.е. представлено множество слитных слов, хотя в OCR-слое этих DJVU-файлов такого нет (как и при их индексации "Архивариусом 3000")?

Всего записей: 1365 | Зарегистр. 05-04-2010 | Отправлено: 14:32 22-09-2013
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D
А Вы пользуетесь iFilter от Caminova?

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 19:49 22-09-2013
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
Наустанавливал всяких -- ну и от Caminova тоже.
Это об этой несовместимости Вы писали выше?
 
А CHM, кстати, вообще не индексируется.

Всего записей: 1365 | Зарегистр. 05-04-2010 | Отправлено: 21:39 22-09-2013 | Исправлено: D1D1D1D, 21:42 22-09-2013
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Наустанавливал всяких -- ну и от Caminova тоже.  
Это об этой несовместимости Вы писали выше?  

Раньше было больше проблем. Эта хоть  не такая страшная - все ведь находит правильно...
 

Цитата:
А CHM, кстати, вообще не индексируется.

А для него тоже iFilter нужен: http://www.citeknet.com/Products/IFilters/CHMIFilter/tabid/64/Default.aspx

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 21:47 22-09-2013
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Спасибо!
 
Добавлено:
Всё-таки с CHM что-то не ладится. Прошу взглянуть на настройки, всё ли правильно?
 
http://i59.fastpic.ru/big/2013/0922/dc/66f5b099d1935810587b36b445daebdc.png
http://i59.fastpic.ru/big/2013/0922/fe/149431d96479e32c7ef6c25b3ab8f9fe.png
http://i58.fastpic.ru/big/2013/0922/81/34a4b3c04da5e66ab361eed045efac81.png
 
Из общего списка исключаемых, как и из полей создаваемых индексов, расширение CHM убрано.

Всего записей: 1365 | Зарегистр. 05-04-2010 | Отправлено: 21:56 22-09-2013 | Исправлено: D1D1D1D, 22:03 22-09-2013
yanko12



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
2ALL
 
Как научить его искать-показывать слова в pdf-ках ?  
 
А то приходится каждый документ открывать в акробате и искать там слово, а интервальные словосочетания - уже фигвам

Всего записей: 477 | Зарегистр. 18-01-2005 | Отправлено: 17:59 30-11-2013
Arech

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
yanko12, вроде бы нужен спец. плагин с download.dtsearch.com/pdfhl/
Я не пробовал его, руки не доходят никак. Если затестите, отпишитесь плс, как оно.

Всего записей: 169 | Зарегистр. 28-12-2005 | Отправлено: 20:31 30-11-2013
yanko12



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arech
этот http://download.dtsearch.com/pdfhl/  ?
 
так он вроде не для сабжа а для акробата получается, попробую на днях

Всего записей: 477 | Зарегистр. 18-01-2005 | Отправлено: 22:16 30-11-2013
evoroz



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
yanko12
Через Web Search, как вариант. Демо:http://support.dtsearch.com/Support/demos/forms/BooleanSearch/dtsearch.html

Всего записей: 3487 | Зарегистр. 30-03-2002 | Отправлено: 23:09 30-11-2013
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12

Компьютерный форум Ru.Board » Компьютеры » Программы » dtSearch


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru