Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)

Модерирует : gyra, Maz

Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

JediMaster_Dragon



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ABBYY FineReader
7, 8, 9, 10 (Pro, Corp, Home), 11 (Pro, Corp), 12 (Pro, Corp) и 14 (Pro, Corp, Ent)

 

 
Полный список языков распознавания для FR15
 

Русский интерфейс
 
Ответ на вопрос о сохранении проекта смотрим тут


Если  хотите, чтобы ваша проблема была рассмотрена, (решение не гарантируется), необходимо представить такие сведения:
1. Версия FineReader.
2. Версия Windows, версию пакета обновлений (SP), разрядность (для Vista и выше).
3. Если проблемы со сканированием, то называем ещё и модель сканера. Обновите драйвера своего сканера, до последней версии имеющейся на сайте поддержки вашего сканера.


Как можно получить церковнославянские тексты при помощи сканирования FineReader'ом
Как отключить "искусственный интеллект" FineReader
Как выбрать опции, чтобы FR10 распознавал простейшие формулы
FineReader не распознает сложные формулы и рукописный текст, не задавайте вопросов на эту тему.  
Версии FR для Linux пока не существует, только Engine, который вам явно не нужен.

Для понимания формата XPS программой FineReader нужен Framework 3.0. Только для XP и 2000.
Совет по распознаванию файлов DjVu Читать
Электронные текстовые книги - OCR, вычитка, оформление

Всего записей: 354 | Зарегистр. 18-01-2002 | Отправлено: 09:07 26-01-2003 | Исправлено: Maz, 19:24 26-01-2020
Victor_VG



Tracker Mod
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Если программа сообщает об ошибке поиска msxml6.dll, то просто положите её  рядом с бинарником FR. Подробнее смотрите MSDN.

----------
Жив курилка! (Р. Ролан, "Кола Брюньон")
Xeon E5 2697v2/C602/128 GB PC3-14900L/GTX 1660 Ti, Xeon E5-2697v2/C602J/128 Gb PC3-14900L/GTX 1660 Ti

Всего записей: 34389 | Зарегистр. 31-07-2002 | Отправлено: 14:50 07-10-2014 | Исправлено: Victor_VG, 15:07 07-10-2014
kastellan



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Victor_VG
Просто положить msxml6.dll рядом с портабл-версиями (как и в систем32) проблему не решило - только установкой.
да и сообщает fr об этом непредметно - какой-то "Сlass not registered" (а причастность к этому msxml6 нагуглилась в факе офсайта).

Всего записей: 53 | Зарегистр. 05-01-2014 | Отправлено: 17:25 08-10-2014
PetrasK

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
maxvlas

Цитата:
что-то новое он понял, а что-то забыл

Все-таки, как кажется, больше забыл старое, чем понял новое, к сожалению...

Всего записей: 804 | Зарегистр. 02-06-2004 | Отправлено: 18:52 08-10-2014
soliduz



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Задача, сделать из PDF без текста, PDF с текстом под картинкой. Пробую разные настройки в FR12, PDF на выходе всегда хуже качеством с размытым текстом.

Всего записей: 132 | Зарегистр. 18-08-2005 | Отправлено: 04:31 14-10-2014
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
soliduz

Цитата:
...PDF на выходе всегда хуже качеством с размытым текстом

  Извлечь OCR-текст из документа PDF сделанного FineReader с помощью Callas PDF Toolbox v5.0 (портабельную версию легко найти в сети), или с помощью Acrobat.
  Вставить OCR-текст в оригинальный PDF c помощью PDF-XChange Tools 4.0 или Callas PDF Toolbox v5.0

Всего записей: 2797 | Зарегистр. 31-05-2010 | Отправлено: 21:36 15-10-2014 | Исправлено: ComboFZ, 06:53 31-12-2014
edelvice



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Доброго времени суток! Не знаю, было ли тут в форумах, но в гугле не нашла решение проблемы: на ХР SP2 не стает ни одна версия FR (пробовала 10, 11, 12). Пишет: "Ошибка при запуске службы Abbyy FineReader 11 PE Licensing Service (ABBYY.Licensing.FineReader.Professional.11.0). Убедитесь, что у вас имеются разрешения на запуск системных служб". Запуск от имени админа не помогает.

Всего записей: 1 | Зарегистр. 25-08-2011 | Отправлено: 14:51 29-10-2014
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Жадаев А. Г.
Сканирование и распознавание текстов.
Самоучитель по работе с ABBYY FineReader 10.

 
   
 
М.: ДМК Пресс | 2010 | ISBN: 978-5-94074-595-2 | 250 стр. | PDF | 19.3 MB
 
Сделал наследуемое увеличение (масштаб) в закладках.
Добавил линки в Содержание для удобной навигации по книге (sendfile.su)
 
https://yadi.sk/

Всего записей: 2797 | Зарегистр. 31-05-2010 | Отправлено: 11:12 04-11-2014 | Исправлено: ComboFZ, 12:23 24-01-2016
coherent

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ
Очень кстати! Как говорится, просто на блюдечке...

Цитата:
Добавил линки в Содержание для удобной навигации по книге

Действительно, очень удобно!

Всего записей: 3883 | Зарегистр. 20-02-2007 | Отправлено: 15:10 04-11-2014
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ
Цитата:
Сделал наследуемое увеличение(масштаб) в закладках.  
Добавил линки в Содержание для удобной навигации по книге (sendfile.su)  

В каком просмотрщике и как это увидеть?
STDU не видит

Всего записей: 1453 | Зарегистр. 02-08-2008 | Отправлено: 18:16 04-11-2014 | Исправлено: alpopo, 18:17 04-11-2014
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
edelvice
 
Вам же ответили на другом форуме. Попробуйте отлючить встроенный фаервол.

Всего записей: 3729 | Зарегистр. 17-09-2001 | Отправлено: 19:09 04-11-2014
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как же хочется ругаться матом на разрабов. Нужно было обработать около 14000 PDF. Понятно, что использовать для этого можно только Hot Folder. Загружаю в Hot Folder в 12-й версии, начинаются немыслимые тормоза -- примерно один файл в 10 мин. Пробую 11-ю версию -- примерно то же самое. Сколько я всего перепробовал. Наконец, пошел искать по форумам. И что бы вы думали -- начиная с 10-й версии идет ограничение по числу ядер -- в 11-й версии на одно ядро, в 12-й -- на два. Еще ограничили 5000 стр. в месяц. Какой облом для тех, кто покупает корпоративки
 
ЗАЧЕМ??? Единственная гипотеза -- чтобы вынудить предприятия переходить на Recognition Server
 
 
Короче, пришлось ставить 10-ю -- 10 файлов в минуту, все прекрасно... Вот только странно -- в 11-12-й все же должно было бы быть побыстрее: 1 файл в 10 минут -- это как-то совсем жестко.

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 20:13 10-11-2014 | Исправлено: ghosty, 20:14 10-11-2014
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
Именно по причине этого идиотизма (скорее всего и впрямь коммерческой природы) и приходится до сих пор жить на FR 10 CE.  
Хвала Аллаху, у нас им успели обзавестись еще до появления 11-й версии, так что поточное распознавание пока что, тьфу-тьфу, не проблема. А с учетом того, что с сайта ABBYY можно скачать относительно свежий релиз 10-й версии, в которой вычищено немало ошибок, так и совсем приличная жизнь.  
 
Кстати, этот релиз помечен 2013-м годом (даты файлов - конец сентября). Похоже не у нас одних он такой вот долгожитель, все еще присылают баг-репорты и все еще чистят от багов.  
 
Что же до 12-й версии, то есть интересная идея по приведению ее в нормально дееспособный вид. Покупаем FR 12 CE, ставим, регистрируем, активируем и т.д. Затем применяем лекарство от жадности.
 
Результаты:
 - за программу честно уплачено, значит у производителя претензий быть не должно;
 - при любой проверке она будет выглядеть, как нормальная лицензионная программа;
 - работать можно совершенно нормально, безо всяких надуманных ограничений.
 

Цитата:
ЗАЧЕМ??? Единственная гипотеза -- чтобы вынудить предприятия переходить на Recognition Server  

Это было вполне очевидно с самого начала. Видимо у двух отделов ABBYY - который занимается Recognition Server и который занимается обычным FR - в какой-то момент произошла нестыковка планов. И вторые не сообразили, что их новая выдумка, HotFolder - потенциальный конкурент первых.
 
Основное здесь недоумение - а зачем тогда вообще оставили HotFolder?  
Убрали бы вообще к чертям собачьим и закрыли бы тем самым проблему. Но нет, оставили, однако всего лишь на уровне демонстрации возможностей пакетной обработки и не более того.
 

Цитата:
Вот только странно -- в 11-12-й все же должно было бы быть побыстрее: 1 файл в 10 минут -- это как-то совсем жестко.

Ну так сами же сказали - ограничитель по процессорному ресурсу. Убрать его - и пакетная обработка начинает работать заметно быстрее, чем в "десятке".
 
Правда может появиться другая проблема.  
В 10-й версии HotFolder обрабатывал PDF поштучно - открыл, распознал, закрыл, открыл следующий и т.д. В 11-й и 12-й сделано по другому - сначала открывает в свой пакет _все_ PDF, лежащие в папке для обработки и только потом начинает их обрабатывать.
 
С этого обычно возникают две головных боли. Во-первых, место под TMP-файлы - его нужно иметь в размере всей кучки исходных PDF (причем не в объеме самих PDF, а в объеме их содержимого, пересчитанного в TIFF - открываются сканы в несжатом растре). Во-вторых, если по ходу работы HotFolder программа вдруг отрубилась (или Windows на перезагрузку вылетело),  то после запуска FR обработка с места обрыва не продолжается, надо все заново.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 12:31 11-11-2014 | Исправлено: Shangry, 12:36 11-11-2014
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Что же до 12-й версии, то есть интересная идея по приведению ее в нормально дееспособный вид. Покупаем FR 12 CE, ставим, регистрируем, активируем и т.д. Затем применяем лекарство от жадности.  
 
Результаты:  
 - за программу честно уплачено, значит у производителя претензий быть не должно;  
 - при любой проверке она будет выглядеть, как нормальная лицензионная программа;  
 - работать можно совершенно нормально, безо всяких надуманных ограничений.  

Т.е. Вы хотите сказать, что 12-ю можно избавить от ограничения по числу страниц и ядер процессора? Даже если бы это было возможно, ее в принципе нельзя избавить от этого нового изуверского способа работы с дисковым кэшем -- я уже через это прошел все -- сутки убил на это.
 

Цитата:
если по ходу работы HotFolder программа вдруг отрубилась (или Windows на перезагрузку вылетело),  то после запуска FR обработка с места обрыва не продолжается, надо все заново.

Теоретически можно заставить ее складывать обработанные файлы в отельную папку. Тогда при новой "итерации" она уже не будет их обрабатывать вновь. Но вот в 10-ке почему-то эта функция просто не работает
 

Цитата:
Основное здесь недоумение - а зачем тогда вообще оставили HotFolder?  
Убрали бы вообще к чертям собачьим и закрыли бы тем самым проблему. Но нет, оставили, однако всего лишь на уровне демонстрации возможностей пакетной обработки и не более того.  

Если б Вы знали, какой там феерический бардак творится! У меня опыт и общения с ними, и инсайдерская инфа. Недавно, в качестве представителя немаленькой такой корпорации, заинтересовался их супер-новым продуктом -- искусственным их интеллектом, так сказать. Казалось бы, новый продукт, перспективный покупатель -- можно уделить ему хоть чуточку внимания. Неа, промежуток между моими вопросами и их ответами исчислялся неделями. При этом ответы были настолько мало вразумительными, что я вообще усомнился, что они знают о своем продукте хоть что-то. Что у них вообще хоть кто-то хоть что-то об этом знает. Продуктом занималась команда физтеховцев, но она, похоже, решала какие-то свои проблемы. И они, уходя, не оставили никаких инструкций
 

Цитата:
Ну так сами же сказали - ограничитель по процессорному ресурсу. Убрать его - и пакетная обработка начинает работать заметно быстрее, чем в "десятке".  

Я имею в виду, что это ненормально даже для одного ядра -- кстати разницы в быстродействии 11-й и 12-й не увидел, несмотря на то, что в последней, вроде как, должны были два ядра разлочить. С таким быстродействием Hot Folder в принципе бесполезен.

----------
пропадет-растает

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 14:21 11-11-2014 | Исправлено: ghosty, 14:24 11-11-2014
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty

Цитата:
Т.е. Вы хотите сказать, что 12-ю можно избавить от ограничения по числу страниц и ядер процессора?  

CE-вариант 12-й версии я еще не смотрел, но ее же Prof-вариант работал в полную силу, Диспетчер задач показывал полную загрузку процессора (4 ядра). В Prof правда нет HotFolder, так что приходится запускать пакетное распознавание через "Задачи". Но работает вполне толково.
 

Цитата:
Даже если бы это было возможно, ее в принципе нельзя избавить от этого нового изуверского способа работы с дисковым кэшем

В смысле от изряднейших размеров TMP-папки?
Здесь уже действительно ничего не сделаешь, раз заложили такую технологию обработки. Впрочем при сегодняшних объемах жестких дисков это хоть со скрипом, но решаемо. Я у себя на распознавательной машине сделал под TMP-папки отдельный раздел в пол-терабайта - пока что вполне хватает.
 

Цитата:
Теоретически можно заставить ее складывать обработанные файлы в отельную папку. Тогда при новой "итерации" она уже не будет их обрабатывать вновь.

Так "обработанные файлы", в смысле отдельные PDF у 11-й и 12-й HotFolder похоже появляются только в самый последний момент. Когда распознаны все страницы всех файлов и начинается их поштучное сохранение.
 
А до этого просто огромная куча страниц в виде FR-пакета. Он конечно при рестарте FR подхватывается, но где в этой куче границы между отдельными файлами - после перезагрузки похоже и сам FR уже не знает.  
По крайней мере в "Задачах" Prof-версии выглядит именно так. Как это же организовано в 12-м HotFolder я еще не смотрел.
 

Цитата:
Но вот в 10-ке почему-то эта функция просто не работает  

Так в 10-ке она не особо-то и требуется.  
Распознавание идет поштучно, если с программой и происходит облом, то в пределах одного PDF, не более. Смотрим на каком файле случился обвал, перемещаем все уже сделанное в выходную папку, продолжаем дальше.
 
 
Цитата:
заинтересовался их супер-новым продуктом -- искусственным их интеллектом, так сказать.  

Что за зверь таков?
Какие-то слухи о нем уже давно пробегали, но работающего продукта пока еще не видел.
 

Цитата:
Неа, промежуток между моими вопросами и их ответами исчислялся неделями. При этом ответы были настолько мало вразумительными, что я вообще усомнился, что они знают о своем продукте хоть что-то.  

Это-то как раз вполне понятная ситуация. Видимо вас в самом начале по ошибке связали не со специалистом именно по тамошнему ИИ, а с барышней уровня "ответим на все ваши вопросы". Которая к тому же и загружена была изрядно.
В таких случаях, как только понимаешь, что разговариваешь не с тем, с кем требуется, сразу же просишь переключить общение на нужного человека.
 

Цитата:
Я имею в виду, что это ненормально даже для одного ядра

Для одного-то IMHO вполне нормально . Тем более, там идет не столько полная загрузка одного ядра, сколько одновременная загрузка всех ядер, но в сумме дающая ресурс одного ядра - я по Диспетчеру задач смотрел.
 

Цитата:
 С таким быстродействием Hot Folder в принципе бесполезен.

Почему и удивляет на кой леший его вообще оставили. 5 000 страниц в месяц плюс ограниченный процессорный ресурс - демонстрашка и не более.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 15:58 11-11-2014 | Исправлено: Shangry, 17:11 11-11-2014
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
CE-вариант 12-й версии я еще не смотрел, но ее же Prof-вариант работал в полную силу, Диспетчер задач показывал полную загрузку процессора (4 ядра). В Prof правда нет HotFolder, так что приходится запускать пакетное распознавание через "Задачи". Но работает вполне толково.  

Речь именно о потоковой обработке. Короче, настроил я десятку на потоковую обработку -- более-менее стабильно идет. Учитывая, что качество меня не интересует (нужен именно текстовый массив), все нормально -- просто из-за идиотских ограничений долго провозился.
 

Цитата:
Что за зверь таков?  
Какие-то слухи о нем уже давно пробегали, но работающего продукта пока еще не видел.  

То, что у них разрабатывалось в течение лет 10 под кодовым названием Compreno. Они умудрились засунуть туда целую языковую онтологию... А зачем? А они сами не знают. Ищут (довольно лениво), вот, богатых покупателей, которым ЭТО можно было впарить, чтобы получить возможность доработать продукт, используя идиота-покупателя в качестве бета-тестера. И чтобы понять, кому и зачем ОНО может понадобиться.
 
Пришлось плюнуть на этого сферического коня и уйти к австрийцам -- у этих все конкретно, умно и по полочкам разложено. Приятно работать. Пусть глобальных онтологий они не создают, но у них все работает, как нужно.
В общем, как у Гераклита: многознание уму не научает. Огромные онтологии могут лишь внести кучу ненужного шума.  
 
А вот чтобы понять, что же в ABBYY действительно происходит, мне пришлось обращаться к инсайду -- к тем, кто непосредственно принимал участие в разработке этого монстра. По-другому у нас никак.
 
Извините за оффтоп, но может, кому-нибудь пригодится эта информация

----------
пропадет-растает

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 19:00 11-11-2014 | Исправлено: ghosty, 19:03 11-11-2014
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty

Цитата:
Речь именно о потоковой обработке.  

В смысле о пакетной?
 
В 10-ке это заложено изначально - запускаешь HotFolder, ставишь настройки, получаешь требуемое. Основной ее минус - хронически виснет по непонятно какой причине с окошком "Распознавание выполнено на 99%". Может в таком виде хоть сутки провисеть, пока не прибьешь и не запустишь заново.
Но это вполне лечится, если поставить самый последний дистрибутив 10-ки (тот, который датирован осенью прошлого года). С ним обрабатывает практически без проблем.
 
Если не считать дурных объемов под TMP, то в 12-й пакетную обработку все-таки лучше делать - интерфейс более удобно организован, чем в 10-ке. Мы сейчас как раз закупаемся 12-й, если все пойдет без проблем, то можно будет на нее переехать.
 

Цитата:
То, что у них разрабатывалось в течение лет 10 под кодовым названием Compreno.  

Вполне полезная зверюшка для того, что сейчас обозначается как "Big Data". Сколько я представляю, основные интересанты здесь большие и очень большие компании с грудами плохо упорядоченных документов.
Но этим же сейчас занимаются все крупные поисковики. Уже далеко не первый год и с вполне приличными результатами на выходе. Что к уже у них сделанному может добавить Compreno - что-то не очень понятно.
 

Цитата:
А зачем? А они сами не знают.

Скорее всего именно так и есть. Приходилось слышать, что началось все с идеи отца-основателя ABBYY "а почему бы не попробовать заняться вот таким перспективным направлением - благо средства имеются".

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 13:09 12-11-2014 | Исправлено: Shangry, 13:11 12-11-2014
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В смысле о пакетной?

Да, да.
Цитата:
В 10-ке это заложено изначально - запускаешь HotFolder, ставишь настройки, получаешь требуемое. Основной ее минус - хронически виснет по непонятно какой причине с окошком "Распознавание выполнено на 99%". Может в таком виде хоть сутки провисеть, пока не прибьешь и не запустишь заново.  

Да, у меня это один раз произошло, я убил ту пдфку, и теперь уже... третий день работает без остановок

Цитата:
Если не считать дурных объемов под TMP, то в 12-й пакетную обработку все-таки лучше делать - интерфейс более удобно организован, чем в 10-ке.

Ну да, просто ограничение по ядрам там убрать все же нельзя, или я не прав?
 

Цитата:
Вполне полезная зверюшка для того, что сейчас обозначается как "Big Data". Сколько я представляю, основные интересанты здесь большие и очень большие компании с грудами плохо упорядоченных документов.  
Но этим же сейчас занимаются все крупные поисковики. Уже далеко не первый год и с вполне приличными результатами на выходе. Что к уже у них сделанному может добавить Compreno - что-то не очень понятно.  

Там не все так однозначно. Поисковики -- это по-прежнему именно универсальные индексаторы. Compreno -- это система "извлечения сущностей". Для того, чтобы сущности извлекались правильно, должны быть определенные правила, семантика. В Compreno я могу лишь с очень большим трудом -- по большей части через их инженеров -- править эти самые правила (они видимо, считают, что так им будет выгоднее -- клиент всегда зависим и привязан к ним). А по-хорошему, я должен быть полностью независим в построении онтологий. Вот к такой системе я и дрейфую сейчас. Кстати, в Австрии со мной изначально общаются исключительно менеджеры высшего звена, а не "деффачки", которых посадили на телефон. Это при том, что компания -- один из лидеров в области. Вот такое разительное отличие в подходах

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 21:41 12-11-2014
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty

Цитата:
Ну да, просто ограничение по ядрам там убрать все же нельзя, или я не прав?  

Можно конечно, я же об этом и говорил. Применяете лекарство и оба ограничителя (на процессорный ресурс и на количество страниц) исчезают.  
Пока проверял в этом смысле только Prof-версию, надо будет и Corp тоже посмотреть.
 
А если программа при этом еще и честно куплена, так вообще никаких проблем.
 

Цитата:
Compreno -- это система "извлечения сущностей". Для того, чтобы сущности извлекались правильно, должны быть определенные правила, семантика.  

Которые, как правило, надо долго и нудно настраивать и подстраивать под именно свою конкретику, доводить до нормальной работоспособности и т.д.
От производителя в этом смысле обычно приходит только движок с умолчательным набором настроек, а всю рабочую доводку делает пользователь. И именно поэтому гибкость и удобство управления настройками здесь можно считать одним из ключевых требований к программе.
 

Цитата:
В Compreno я могу лишь с очень большим трудом -- по большей части через их инженеров -- править эти самые правила (они видимо, считают, что так им будет выгоднее -- клиент всегда зависим и привязан к ним).  

Подозреваю, что это не столько чей-то умысел, сколько нормальное состояние только что слепленной программы.  
Большая часть управления - чуть ли не через правку кода , более или менее нормальный интерфейс только планируется, удобное управление и хорошая настраиваемость - что-то вроде светлого коммунистического будущего.
В общем версия 1.0, альфа-релиз.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 12:17 13-11-2014 | Исправлено: Shangry, 12:18 13-11-2014
Ves

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
 
 
Обучаю эталон, а некоторые символы полностью помещаются в рамку только вместе с частью соседнего символа. Сейчас, такие символы добавляю в эталон целыми кластерами, создавая новые лигатуры. Есть ли лучший вариант? Ведь, сочетаний букв гораздо больше чем самих букв.
 
При просмотре эталона, некоторые символы (фонетические) не отображаются. Однако, многие из них отображаются при просмотре алфавита языка. Можно ли настроить отображение этих символов и в эталоне?
 
   
 
 

Всего записей: 36 | Зарегистр. 13-02-2003 | Отправлено: 12:04 14-11-2014
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ves

Цитата:
Есть ли лучший вариант?

Когда перекрытие не очень большое, то FineReader иногда подправляет сам себя - прилегающий кусочек соседнего символа в текущий символ не включает.  
Но если перекрывается так основательно, как у вас на примере, то боюсь, что здесь ничего не сделаешь, кроме как лигатуру сооружать.
 

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 16:26 14-11-2014
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)
Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru