ABBYY FineReader (Часть 1) - [128] :: Программы :: Компьютерный форум Ru.Board

Frantishek

Цитата:

... мои задачки можно будет разрешить при помощи лишь ABBYY Recognition Server 3.5

Как-то полистал немного его Help и вспомнилась фраза из русской классики "Чудовище обло, огромно, озорно и лаяй".

Других слов, чтобы описать это чудо программистики просто в голову не приходит.

Но до 10-й версии ничего другого для пакетизации заданий, увы, не водилось

Цитата:

Остается лишь дилемма как срастить возможности FR11 и Hot Folder.. видимо зарезали функционал чтобы почетче позиционировать под сервер автоматизацию (сценарии и пр.)

Здесь такое впечатление, что сначала сделали толковый инструмент, а потом сами испугались сделанного. И начали его всеми силами до мизера доводить.

Что же до HotFolder в 11-версии, то мои знакомые нашли вполне работающий способ обходить процессорный ограничитель (с остальными в варезной ветке уже справились).
Берется какой-нибудь "антиквариат" времен Pentium 4, на него ставится Corporate-вариант 11-й версии и запускается в режиме 24*7. Техники этих времен по чуланам все еще немало валяется, а производительность получается примерно 1 к 5-6 (за один час работы сегодняшнего четырехпроцессорника надо отдать 5-6 часов работы на Р4). Если найдется несколько штук таких "старичков", то в сумме можно получить вполне приемлемые темпы.

VitRom

Цитата:

Хотя ЕМНИП в тех решениях, что видел я, юзались вообще какие-то "3-пати" тулзы, вроде даже что-то открытое.

Если это были времена прошлых версий, то примерно так и должно было быть. Собрали с бору по сосенке, где что нашлось и попытались соорудить из найденного нечто дееспособное.

Цитата:

Тогда получается, что для 9/10 задач хватит "чистого" ФР-11...

У разработчиков сейчас надо думать период освоения нового инструментария, так что к результатам работы FineReader с DjVu некоторое время надо относиться по правилу "Доверяй, но присматривайся".
Наткнулся как-то на оф. форуме на интересное обсуждение. Оказывается где-то год назад тамошний народ еще и не подозревал, что деление на слои - это только для цветных сканов, а в ч/б оно изначально без надобности. В результате первый релиз генерил жутко перетяжеленные ч/б DjVu. К счастью эту ошибку уже давно убрали.

Цитата:

Или в обрезке/кадрировании/чистке ФР-11 тоже переплюнул уже спецтулзы вроде БукРесторер-а или СканКромсатор-а?

В том, что касается разрезания разворотов на две страницы, IMHO очень и очень неплох. Я ему скармливал совершеннейшие безнадеги вроде хреново отсканированных газет довоенных времен, на которых не всегда сам мог понять - где одна страница, а где другая. Так он резал их с процентом выхода около 95.
Выравнивание делает плюс-минус прилично, но оставляет после себя клинья серого цвета. Если в конечном итоге требуется PDF, то приходится отключать.
Обрезкой IMHO не занимается вообще. Точнее может обрезать по фиксированному размеру (столько-то пикселей на столько-то пикселей), но так чтобы самому определить участок с фоном и отрезать только его - этого пока нет.

Так что на ближайшие годы BookRestorer скорее всего так и останется инструментом №1. ScanKromsator тоже хорош, спору нет, но отсутствие документации, но необходимость за ним постоянно присматривать и подкручивать...

Модерирует : gyra, Maz
Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)	Версия для печати • Подписаться • Добавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200