Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Office Document Finder

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5

Открыть новую тему     Написать ответ в эту тему

odf

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Office Document Finder


Программа для быстрого поиска документов и писем на компьютере. Аналог Архивариус 3000, dtSearch, docFetcher, X1 Search, Copernic.
 
Основные преимущества:
• Работает из браузера
• Показывает документы со всем оформлением
• Поддерживает морфологию русского языка
• Индексирует в несколько раз быстрее аналогов, при более компактном индексе.
• Показывает цитаты в результатах поиска (сниппеты).
• Многопользовательский доступ с авторизацией и правами (Business версия)
 
Лицензия: полнофункциональная пробная версия на 20 дней. бессрочная полная лицензия


Выпущена обновленная personal сборка.  
• Уменьшен индекс на 10%
• Добавлена индексация почтовых ящиков Thunderbird (MBox)
• Добавлена кнопка Показать в папке
• Добавлено отображения общего числа найденных документов
• Улучшено распознавание кодировок в текстовых файлах
• Добавлено индексирование CFG файлов

Всего записей: 49 | Зарегистр. 03-12-2022 | Отправлено: 14:07 05-12-2022 | Исправлено: Komandor, 22:34 10-10-2023
odf

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Спасибо
 
1. Браузеру не очень просто загрузить 96 мегабайт текста с подсветкой синтаксиса. Тут что-то сложно улучшить, кроме как выдавать не весь документ а только куски с цитатами.
2. Программа не знает что это телефон, она записывает комплексное слово убирая все разделители. Соответственно тире в середине значения не имеют, а вот убрать первую цифру она самовольно не может. Нужно искать в нескольких вариантах.
3. Пробел относится к жестким разделителям, его убирать нельзя иначе вообще будет не определить где заканчивается слово. Выбирать только цифры тоже не вариант, бывают артикулы с комбинацией буквы - цифры.
4. Да, только текстовые файлы с SQL кодом.
5. В /indexlogs/ поиском по IDX_ERROR

Всего записей: 49 | Зарегистр. 03-12-2022 | Отправлено: 12:34 15-03-2023
maxxx562

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Разработчик не поделится планами? Будет ли расширение функционала? )))))

Всего записей: 3 | Зарегистр. 15-03-2023 | Отправлено: 08:41 16-03-2023
odf

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Расширение и улучшения идут каждый день. Следите за анонсами версий.

Всего записей: 49 | Зарегистр. 03-12-2022 | Отправлено: 13:13 16-03-2023
ogenry

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
del

Всего записей: 961 | Зарегистр. 17-04-2003 | Отправлено: 13:30 18-03-2023 | Исправлено: ogenry, 13:46 18-03-2023
maxxx562

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Проблема просмотра результата в больших файлах решена конечно через одно место, перевод JSON в txt, далее разбивка большого TXT на маленькие TXT размером до 10 мб. Ищет быстро, отображает с задержкой сек 3, что приемлемо. Неудобно, дольше, но пока так.

Всего записей: 3 | Зарегистр. 15-03-2023 | Отправлено: 23:37 18-03-2023
ogenry

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
odf

Цитата:
Расширение и улучшения идут каждый день. Следите за анонсами версий.

1. Возможность выбора каталога для индекса не рассматриваете?
2. Приложение (служба) автономно запускается вместе с загрузкой Windows. Возможно это рабочее решение, если им пользоваться постоянно. Нормальное решение, к примеру, для сервера... А если раз в неделю или периодически? Получается, что программа привязана к определённой системе. Или есть возможность запустить её с ключом в загруженной системе?
 
Спасибо!

Всего записей: 961 | Зарегистр. 17-04-2003 | Отправлено: 19:18 19-03-2023 | Исправлено: ogenry, 20:47 19-03-2023
odf

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
1. Да, настройка будет.
2. Вопрос не совсем понятен.  Если он про регистрацию, то да, регистрация привязывается к системе, иначе какой в ней смысл вообще. А сам сервер можете запускать и вручную, поставьте в сервисах тип запуска - ручной.  

Всего записей: 49 | Зарегистр. 03-12-2022 | Отправлено: 21:57 19-03-2023
ogenry

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
odf

Цитата:
поставьте в сервисах тип запуска - ручной

Я имею в виду запуск сервиса OfficeSrv.exe "традиционным методом" - кнопкой мыши или Enter в загруженной системе, (или батником с ключом).  
Зачем он постоянно должен "висеть" в службах?
 
Спасибо!

Всего записей: 961 | Зарегистр. 17-04-2003 | Отправлено: 09:42 20-03-2023 | Исправлено: ogenry, 09:43 20-03-2023
odf

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В этом и смысл, что когда поиск понадобится, не надо будет ничего запускать и данные будут актуальными. Иначе нужно будет запустить программу, обновить индекс и только потом искать.
Чем именно мешает то что он висит в службах? Там еще примерно сотня служб постоянно запущена.

Всего записей: 49 | Зарегистр. 03-12-2022 | Отправлено: 11:37 20-03-2023
ogenry

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
odf
 

Цитата:
нужно будет запустить программу, обновить индекс и только потом искать.

Это "серверная" логика. Когда постоянно обновляются какие-то данные.
А зачем это обычному пользователю, который пользуется программой от случая к случаю и обновляет индекс раз в месяц?

Цитата:
Чем именно мешает то что он висит в службах? Там еще примерно сотня служб постоянно запущена.

На вкус и цвет... Чем новей винда, тем больше служб... У меня на 11-й в среднем 65 - 75 процессов.
 
Спасибо!
 

Всего записей: 961 | Зарегистр. 17-04-2003 | Отправлено: 15:04 20-03-2023
odf

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Это пользовательская логика. Когда инструмент понадобился, он должен быть под рукой сразу и без лишних действий.  
Впрочем, если вопрос принципиальный, можете просто переключить службу в ручной режим и сделать на рабочем столе .bat файл  
 
net start OfficeDocumentFinder
 

Всего записей: 49 | Зарегистр. 03-12-2022 | Отправлено: 15:17 20-03-2023
odf

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Выложена версия 2.5. Значительно улучшена работа с PDF

Всего записей: 49 | Зарегистр. 03-12-2022 | Отправлено: 21:47 29-07-2023
presentRU

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
версия 2.5.

Не юзал вашу прогу до сих пор. Пробую ставить. Какой-то фэйл с шоткатом
скрин
 
 
 

Всего записей: 821 | Зарегистр. 16-10-2006 | Отправлено: 13:25 18-08-2023
odf

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Возможно у вас дефолтный браузер некорректно прописан. Или система блокирует. Бывает.

Всего записей: 49 | Зарегистр. 03-12-2022 | Отправлено: 16:43 18-08-2023
presentRU

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
odf
Скачал с сайта v2.5, а в интерфейсе отображается 2.4
 

Всего записей: 821 | Зарегистр. 16-10-2006 | Отправлено: 10:26 19-08-2023
presentRU

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Память начала куда-то деваться. Решил посмотреть кто сожрал. И вот
   
 
Снёс нафиг это глюкоделие. За что автор деньги просит? За возможность потестировать?
----------
К слову, при попытке удаления вылазит это

Всего записей: 821 | Зарегистр. 16-10-2006 | Отправлено: 09:34 24-08-2023 | Исправлено: presentRU, 10:02 24-08-2023
odf

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Есть способы выяснить из-за каких файлов было потребление памяти и исправить это, но так как вы программу все равно снесли то описывать смысла нет, видимо не очень нужна была.

Всего записей: 49 | Зарегистр. 03-12-2022 | Отправлено: 07:51 25-08-2023
presentRU

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
odf

Цитата:
Есть способы выяснить из-за каких файлов было потребление памяти и исправить это, но так как вы программу все равно снесли то описывать смысла нет, видимо не очень нужна была.

Ну ок. Давайте лицензию, как вы это обещали в одном из своих месседжей, тогда будем выяснять.
 

Всего записей: 821 | Зарегистр. 16-10-2006 | Отправлено: 08:18 25-08-2023
ogenry

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Давайте лицензию, как вы это обещали в одном из своих месседжей

Надо бы держать слово...

Всего записей: 961 | Зарегистр. 17-04-2003 | Отправлено: 09:43 25-08-2023
mikmik888

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Для индексации личной электронной библиотеки вещь конечно суперская! 5 баллов!
 
Что не хватило мне:
1. Индексация djvu с текстовым слоем – без этого никуда. Один из основных форматов у нас. У того же Архивариуса3000 это есть.
 
2. Распознавание документов djvu и pdf - не знаю насколько это сложно сделать, но если бы можно было сразу распознавать документы без текстового слоя, то было бы очень здорово.
 
3. Удобный вывод всех найденных результатов на одной странице с настраиваемым пейджингом. То есть чтобы не листать по каждому документу все что нашло, а сразу просмотреть на одной странице все цитаты из документов с данным словосочетанием, конечно со ссылкой на документ первичный.  
 
Также в этом выводе результатов надо настраивать размер снипета вокруг найденного слова.
Сейчас в левой колонке только очень краткий снипет. Когда результатов много надо чтобы можно было сразу прочитать побольше текста вокруг слова в одном месте.
 
В идеале чтобы можно было настраивать на странице вывода снипетов их размер (причем повторюсь выводить все снипеты в правой колонке, где много места):  
a.    одно предложение, где встречается искомое слово или словосочетание
b.    абзац, где встречается слово или словосочетание
c.    количество символов до и после найденного слова или словосочетания
 
4. Выгрузка данного списка снипетов поисковых результатов (выгрузка в разных форматах doc, txt, pdf) с цитатами (ссылками на документы) того, что нашло.  
 
5. В левой колонке когда больше 300 результатов надо сделать пейджинг чтобы можно было посмотреть следующие 300 результатов. Сейчас можно смотреть только первые 300. Ну или я не нашел как это сделать.
 
6. Выбор конкретных папок по которым производить поиск и сохранение их в фильтры. Так как нужно искать чаще всего не по каталогам, которые представляют собой верхний уровень, а по нижележащим папкам в разных каталогах.  
 
Сейчас есть возможность указать в поиске location: каталог (а на самом деле можно указывать любую папку, с этим путаница в описании), но чаще всего надо искать по набору папок. Отчасти это решается с помощью упорядочивания по расположению, но там выдаются все папки и надо лазить по ним.  
 
7. Требуется удобный вывод информации по индексации файлов – то есть чтобы можно было открыть на некоторой странице информацию по индексированным файлам в каждой папке и увидеть какие файлы проиндексировались, какие нет, какие частично и часть текста там была не распознана. Тут же надо делать возможность отправить конкретную папку и даже группу выбранных файлов на повторную индексацию. Те файлы, которые не проиндексировались, чтобы можно было скопировать в подпапку noindex выбрав по одному или всем скопом. Чтобы можно было потом другим софтом распознать эти файлы.  
В данный момент это темный мешок (в логах это видно, но с ними не удобно работать), что в конкретной директории проиндесировалось, а что нет. И не удобно с этим дальше работать, то есть отправить на распознавание текста.
 
8. Когда файл огромный и не загружается в браузере (это не такая уж и редкость для книг быть по 100-200Мб), а его хочется открыть отдельно в Адобе, то надо переносить меню открытия файла по местоположению наверх страницы, а не поверх документа. Так как документ не грузится, а соответственно не грузится и меню, и в результате и в браузере не посмотришь и отдельно не откроешь.
 
9. Кодировки в результатах вывода надо править. Часто файлы со сломанной кодировкой идут. Хотя ищет по ним нормально (что кстати не понятно как так получается - снипет нормально отображается, а результат вывода кривой).  
 
10. Логи ошибок индексации надо писать в отдельный файл дополнительно, помимо основных логов. Лучше всего разбивать по классам ошибок. Потом это можно использовать в интерфейсе.
 
Это прямо вот что действительно мне нужно. Буду очень благодарен, если это удастся реализовать.
 

Всего записей: 2 | Зарегистр. 17-02-2023 | Отправлено: 06:37 12-09-2023 | Исправлено: mikmik888, 06:38 12-09-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5

Компьютерный форум Ru.Board » Компьютеры » Программы » Office Document Finder


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru