Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Archivarius 3000 | Архивариус 3000

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Открыть новую тему     Написать ответ в эту тему

Foss

Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Archivarius 3000 (Архивариус 3000)
Текущая версия: 4.79 (30.09.2018)
Производитель: Likasoft
Официальный сайт

Кликните на рисунке чтобы увеличить


Архивариус 3000 - это программа для поиска документов и почтовых сообщений на компьютере, в локальной сети и съёмных дисках (CD, DVD и др.). Поиск документов может производиться по ключевым словам или используя язык запросов, аналогично тому, как это делается в поисковых системах Интернета. Поддерживает многие популярные форматы от DOC и PDF до NG (Norton Guide) и W&D (Слово и дело) (всего более 40 форматов). Ищет в архивах ZIP, RAR, ARJ (и многих других), базах Outlook, Outlook Express, MS Exchange и The Bat!. Можно производить поиск по базам сообщений ICQ, Odigo IM и Miranda IM. С помощью серверного режима можно осуществлять удалённый поиск и удалённый доступ к документам через любой обозреватель. Программа имеет многоязычный интерфейс включающий русский, украинский и беларусский языки. Поддерживается смысловой поиск на русском, украинском, белорусском, английском, немецком, испанском, французском, португальском и т.д. (всего 18) языках.
Более подробное описание возможностей
Archivarius 3000 – is a full-featured application to search documents and e-mail on computer, local network and removable drives (CD, DVD). Documents can be searched by keyword or using query language, the same as in Internet search engines. The program has multilingual interface which includes 10 European languages.

Триал-версия:
  • All languages (все языки) x32
  • All languages (все языки) x64
     
    Тема в «Варезнике».

  • Всего записей: 1316 | Зарегистр. 15-04-2003 | Отправлено: 10:07 31-08-2005 | Исправлено: Maz, 08:59 24-08-2020
    adada

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Да, Вы правы, Архивариус тоже не смог раскодировать тот мусор, который под видом реальных шрифтов запихнули в этот файл.
     
    И это не единственный случай.
    Есть у меня книга Корсини, Ауэрбах(ред) "Психологическая энциклопедия", 2006.
    PDF создан в Jaws PDF Creator, Word macro v4.0.28 -- и тоже текст исковеркан и не читается в перечисленных выше программах.
    Справедливости ради -- не рекодируется он также и Архивариусом.
     
    Других вариантов под рукой у меня пока нет, я их все исправил повторным OCR.
     
     
     

    Всего записей: 102 | Зарегистр. 11-12-2003 | Отправлено: 13:35 11-06-2020
    Jonmey

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    adada
    Часто бывает проще найти соответствующую книжку в нормальном читабельном исполнении, чем искать, чем "раскодировать нераскодируемое", например, для упомянутой энциклопедии
    http://yanko.lib.ru/books/psycho/psych-enc.htm
    или среди книжек на странице
    https://vk.com/wall-26587681?q=%23psychojournal_books
    Или, как вы (очевидно, основательный и неленивый человек):

    Цитата:
    я их все исправил повторным OCR

    А если вы еще и выкладываете свои труды (речь об OCR), то цены вам нет.
     
    Добавлено:
    Кстати, упомянутые вами две книжки вполне нормально экспортировались в формат Word (без кракозябров) штатными средствами Adobe, то есть без OCR:
    https://www41.zippyshare.com/v/zVuLCGIz/file.html
    https://www90.zippyshare.com/v/OWmXJyPE/file.html

    Всего записей: 1319 | Зарегистр. 17-01-2011 | Отправлено: 01:31 14-06-2020 | Исправлено: Jonmey, 02:30 14-06-2020
    adada

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Jonmey, спасибо за полезную рекомендацию!
     
    Да, при экспорте pdf в doc из-под Acrobat DC включается режим распознавания - но это явно не то распознавание, что в FineReader (и по скорости, и по результатам), это все-таки более смахивает на перекодирование. Но надо будет понаблюдать еще.
     
    И второе весьма полезное следствие: в целях цитирования можно не делать экспорт всего файла в doc. Достаточно в Acrobat DC выделить необходимую часть текста и выбрать режим сохранения с форматированием (то есть с перекодированием или "распознаванием") -- и текст в буфере обмена преображается, становится правильным, без "кракозябров"!
     
     
     
     
     
     
     

    Всего записей: 102 | Зарегистр. 11-12-2003 | Отправлено: 10:03 14-06-2020
    Jonmey

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    adada
    Копирование с форматированием требует наличия и запуска монстра как Асробат (Acrobate Reader не имеет такой возможности), выполняется довольно медленно и порой глотает буквы.
    Проще один раз переконвертировать проблемные книги и забыть о проблеме, тем более, что конвертация PDF (проблемный) -> DOC -> PDF осуществляется в рамках одного и того же Акробата.

    Всего записей: 1319 | Зарегистр. 17-01-2011 | Отправлено: 20:26 14-06-2020
    adada

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Я Вашу полезную рекомендацию уже опробовал и искренне поблагодарил за нее.
     
    И для себя определил, что преобразование текущих проблемных PDF-файлов средствами Acrobat DC в формат DOC, осуществляется значительно быстрее, чем перераспознавание средствами FineReader с последующей вычиткой и корректурой неизбежных ошибок OCR.
    Кроме того, если в установках Acrobat DC выбрать режим "Сохранить макет страницы" -- это устраняет эффект "проглатывания" букв, что тоже немаловажно.
     
    Практически, я ввел в настройки своего "штатного" редактора PDF-XChange Editor кнопку, запускающую в необходимых случаях Acrobat DC, что позволяет теперь копировать требуемую часть текста в читабельном виде. (В идеале было бы ввести такую кнопку в "штатном" PDF-XChange Viewer -- но, увы, в нем такая возможность не предусмотрена.)
     
    Что касается радикального решения "один раз переконвертировать проблемные книги и забыть о проблеме" -- радикальным оно могло бы считаться,  только если сохранять текстовый слой под остающимся оптически неизменным лицевым слоем, что позволило бы контролировать ошибки OCR.  Но такой вариант приводит к существенному возрастанию объема выходного файла и считать его идеальным я пока не готов.
    Иногда показан в таких случаях вывод в формат DJVU, но это тоже вариант кривоватый.
     
    Собственно, вопрос был задан в теме Архивариуса-3000 в связи с тем, что эта программа обычно весьма неплохо раскодирует неудачно закодированные PDF-файлы, из чего следует, что программные решения проблемы существуют.
    И Вы, Jonmey, дали практический совет, за что Вам еще раз большое спасибо!  
     
    В идеале меня, конечно, устроило бы что-то вроде мода классического вьюера view64 -- да где ж это взять... )

    Всего записей: 102 | Зарегистр. 11-12-2003 | Отправлено: 21:14 14-06-2020
    BolgarchukR

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    У меня почему то портативная версия Архивариус 3000 в виндовс 10 не запускается. В хр и 7 работала нормально. А сейчас нажимаю на экзешник и ничего не происходит. Кто-то сталкивался с подобной проблемой? Может в курсе как её решить?

    Всего записей: 26 | Зарегистр. 27-03-2016 | Отправлено: 22:53 01-07-2020
    niccolo

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    И для себя определил, что преобразование текущих проблемных PDF-файлов средствами Acrobat DC в формат DOC, осуществляется значительно быстрее, чем перераспознавание средствами FineReader с последующей вычиткой и корректурой неизбежных ошибок OCR.
    Кроме того, если в установках Acrobat DC выбрать режим "Сохранить макет страницы" -- это устраняет эффект "проглатывания" букв, что тоже немаловажно.

     
    Заблуждение... Попробуйте провернуть такое на PDF c диаграммами, сложными таблицами, нестандартными символами (греческими, например), с файлами, содержащими глифы fi fl и т.п.
     
    Про формулы в технической литературе, особенно дробные, вообще молчу, как в принципе и про проблемы с разпознаванием тонколинейного курсива в таких формулах.....

    Всего записей: 3677 | Зарегистр. 17-09-2001 | Отправлено: 11:12 02-07-2020
    1dxb1

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Товарищи, подскажите.
     
    1. Есть у меня большой заархивированный файл на много гигабайт. Проиндексировал его Архивариусом3000. Могу я теперь перенести сам архив на внешний жесткий диск, чтобы не занимал место на компе? Т.е. достаточно ли архивариусу только сделанного индекса архива для поиска по содержимому архива?
     
    2. Есть ли у Архивариуса3000 ограничение по размеру архива, который он сможет проиндексировать и искать по нему инфу? Например если архив будет 1терабайт или 2 терабайта или 3... Потянет архивариус?

    Всего записей: 41 | Зарегистр. 05-02-2009 | Отправлено: 08:26 24-08-2020 | Исправлено: 1dxb1, 08:37 24-08-2020
    AntikillerPM

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    1. Есть у меня большой заархивированный файл на много гигабайт. Проиндексировал его Архивариусом3000. Могу я теперь перенести сам архив на внешний жесткий диск, чтобы не занимал место на компе? Т.е. достаточно ли архивариусу только сделанного индекса архива для поиска по содержимому архива?

    достаточно.  

    Всего записей: 301 | Зарегистр. 01-05-2009 | Отправлено: 09:14 24-08-2020
    adada

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Попробуйте провернуть такое на PDF c диаграммами, сложными таблицами, нестандартными символами (греческими, например), с файлами, содержащими глифы fi fl и т.п.

     
    Да, согласен. Описанная мной кустарная "технология" предназначена только для "выхватывания" текстовых компонентов с целью предварительного поиска по ним -- если Архивариус самостоятельно не справляется с декодированием.

    Всего записей: 102 | Зарегистр. 11-12-2003 | Отправлено: 15:36 24-08-2020
    asku



    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Добрый вечер!
    Прошу подсказать.
     
    1) Можно ли в программе Архивариус 3000 использовать регулярные выражения?
     
    2) Поиск — Введите запрос — ЧАСТИ слов: ...
    Здесь можно вписать, например, "сцилл" и А3000 выдаст — Сцилла, Сциллой и т.д.
    А можно ли там в поле вписать не часть слова, а фразу? Например, "сциллой и хар" (то есть буквенные символы + пробелы) ?
     
    Спасибо.

    Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 19:31 25-08-2020
    1dxb1

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Знающие люди, подскажите, пожалуйста
     
    Есть архив с множеством файлов .txt с данными типа "Название товара. Категория"
     
    Поставил Архивариус3000 и проиндексировал им архив.
    Архив размером 10Гб
    А индекс получается 30Гб и индексируется несколько часов (часов 8)
     
    Какие настройки поставить, чтобы индекс был меньшего размера?
     
    Нужно чтобы можно было искать по индексу по точному слову, т.е. нахождение вариантов слова в разных падежах не нужно. И при этом чтобы в окне показывалась строчка с найденым значением а не просто ссылка на файл
     
    Какие настройки поставить, чтобы индекс был меньшего размера?
     
     
     
     

    Всего записей: 41 | Зарегистр. 05-02-2009 | Отправлено: 03:42 26-08-2020
    1dxb1

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    И еще вопрос
     
    В настройках индексирования есть параметр "глубина обработки архивов" и стоит 0 по умолчанию
     
    Если у меня архив с множеством вложеных архивов, какое число нужно поставить, чтобы обработка шла на максимальную глубину. 0? или 999 например?

    Всего записей: 41 | Зарегистр. 05-02-2009 | Отправлено: 11:18 26-08-2020
    adada

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    1dxb1
     
    Для сопоставительного анализа (или аналитического сопоставления):
     
    Название            : архив прессы РФ-1995-2005
    Размер индекса      : 8,35 ГБ
    Документов          : 3 176 031
    Слов в словаре      : 2 912 278
    Обработанных слов   : 1 158 835 705
    Количество архивов  : 2
    Размер файлов       : 8,41 ГБ  
    Размер текстов      : 16,83 ГБ  
    Время индексирования: 03:49:36

    Всего записей: 102 | Зарегистр. 11-12-2003 | Отправлено: 20:33 26-08-2020
    hypn0

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    adada
    Размер текстов больше размера файлов из за того, что текст в файлах Архивариуса сохраняется в Unicode.

    Всего записей: 27 | Зарегистр. 23-06-2018 | Отправлено: 20:44 26-08-2020
    1dxb1

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    А как посмотреть список документов или архивов которые вошли в индекс?

    Всего записей: 41 | Зарегистр. 05-02-2009 | Отправлено: 03:51 04-09-2020
    classics09

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    1dxb1

    Цитата:
    А как посмотреть список документов или архивов которые вошли в индекс?

    Идёте на панель "Индекс", где у Вас списком все индексы стоят. Правой мышкой нажимате на любой из индексов, который Вас интересует, потом кликаете на "Статистика". Там содержится вся основная информация по индексу. Список папок индекса, напр., можно посмотреть.

    Всего записей: 379 | Зарегистр. 12-04-2009 | Отправлено: 13:27 05-11-2020
    Alekskhv

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    1dxb1

    Цитата:
    Нужно чтобы можно было искать по индексу по точному слову, т.е. нахождение вариантов слова в разных падежах не нужно.

    Поддерживаю вопрос. Кто знает, возможно ли осуществлять поиск по точному слову, без падежей, склонений?

    Всего записей: 346 | Зарегистр. 22-03-2008 | Отправлено: 10:40 10-03-2021
    niccolo

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
     Кто знает, возможно ли осуществлять поиск по точному слову, без падежей, склонений?

     
    Можно
    1. Попробуйте окавычить слово
    2. Перестройте индексы без морфологии. Тогда будет только точный поиск.

    Всего записей: 3677 | Зарегистр. 17-09-2001 | Отправлено: 11:13 10-03-2021
    Alekskhv

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    niccolo
    1. Пробовал окавычить, не работает.
    2. Перестроить индекс не вариант, потому что когда-то нужны варианты поиска, когда-то нужен поиск по точному слову. Можно наверное сделать 2-ой индекс без морфологии. Но, я считаю, это тоже не лучший вариант, потому что в 2 раза больше места, в 2-раза больше времени на переиндексирование. Да и потребность в точном соответствии возникает редко. Но время от времени она появляется.
     
    Неужели разработчики не предусмотрели такой простой вариант, как по точному совпадению?
    Кавычки и скобки в разных вариантах "" [] () результата не дают.

    Всего записей: 346 | Зарегистр. 22-03-2008 | Отправлено: 11:29 10-03-2021 | Исправлено: Alekskhv, 17:50 10-03-2021
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

    Компьютерный форум Ru.Board » Компьютеры » Программы » Archivarius 3000 | Архивариус 3000


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru