Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)

Модерирует : gyra, Maz

Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

JediMaster_Dragon



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ABBYY FineReader
7, 8, 9, 10 (Pro, Corp, Home), 11 (Pro, Corp), 12 (Pro, Corp) и 14 (Pro, Corp, Ent)

 

 
Полный список языков распознавания для FR15
 

Русский интерфейс
 
Ответ на вопрос о сохранении проекта смотрим тут


Если  хотите, чтобы ваша проблема была рассмотрена, (решение не гарантируется), необходимо представить такие сведения:
1. Версия FineReader.
2. Версия Windows, версию пакета обновлений (SP), разрядность (для Vista и выше).
3. Если проблемы со сканированием, то называем ещё и модель сканера. Обновите драйвера своего сканера, до последней версии имеющейся на сайте поддержки вашего сканера.


Как можно получить церковнославянские тексты при помощи сканирования FineReader'ом
Как отключить "искусственный интеллект" FineReader
Как выбрать опции, чтобы FR10 распознавал простейшие формулы
FineReader не распознает сложные формулы и рукописный текст, не задавайте вопросов на эту тему.  
Версии FR для Linux пока не существует, только Engine, который вам явно не нужен.

Для понимания формата XPS программой FineReader нужен Framework 3.0. Только для XP и 2000.
Совет по распознаванию файлов DjVu Читать
Электронные текстовые книги - OCR, вычитка, оформление

Всего записей: 354 | Зарегистр. 18-01-2002 | Отправлено: 09:07 26-01-2003 | Исправлено: Maz, 19:24 26-01-2020
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
orstin

Цитата:
Все оказалось проще. Нужно в настройках сохранения переключить формат с A4 (по умолчанию) на "использовать размер оригинала".  
И качество тоже надо переключать на "максимальное (разрешение исходника)".

C такими настройками всё равно p0237.png получается огромным после FR12.
 
Если часто занимаетесь сканированием - пользуйтесь растровыми форматами поддерживающими EXIF, т.к. дополнительная информация о DPI (и, соответственно, о размере mm x mm) явно будет не лишней.
Такой солидный софт, как последний ACDSee Pro 2018, к примеру, не видит DPI в ваших PNG.
 
TIF и его разновидности (TIF G4FAX для ч/б и сжатый беспотерьный TIF LZW для цвета и серого) для обработки сканов предпочтительней, чем PNG и BMP.
Хотя, часто, TIF и получается большим размером, чем PNG и TIF LZW декодируется дольше, но стабильность результата обработки важнее.
 

Всего записей: 2797 | Зарегистр. 31-05-2010 | Отправлено: 15:31 02-06-2018 | Исправлено: ComboFZ, 17:29 02-06-2018
orstin

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ

Цитата:
Такой солидный софт, как последний ACDSee Pro 2018, к примеру, не видит DPI в ваших PNG.

Это уже проблемы "солидного" ACDSee Pro 2018. Потому что простой как рельса, Paint.NET видит DPI в этих PNG очень отчетливо.
 
   
 
После исправления разрешения p0237.png и сохранении в .TFF он получается размером в 352 Kb., а при сохранении в .PNG - в 370 Kb., я не ощущаю принципиальной разницы; а после создания PDF из этих изображений они вообще имеют одинаковый размер в 36 Kb.
 
 

Всего записей: 484 | Зарегистр. 14-03-2018 | Отправлено: 19:10 02-06-2018
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
а при сохранении в .PNG - в 370 Kb., я не ощущаю принципиальной разницы

 
Как это не ощущаете?
p0237.png у вас вышел корявым, а если тысяча сканов пойдёт на обработку в FR и дальше в PDF-книгу и среди них попадутся такие единичные png (у меня такое бывало много лет назад).
Нет уж. Предсказуемость результатов должна стоять на первом месте.
Какие-то программы видят DPI в PNG, другие - нет, а в TIF видят все.
 
ACDSee я привёл для примера, чтобы показать, что PNG формат имеет проблемы для сканировщиков.
 
Добавлено:
см. п.3
http://forum.ru-board.com/topic.cgi?forum=93&topic=1615&start=1280#15

Всего записей: 2797 | Зарегистр. 31-05-2010 | Отправлено: 21:23 02-06-2018 | Исправлено: ComboFZ, 22:21 02-06-2018
Sjoe



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
indifirent

Цитата:
Использовал Tesseract-OCR в программе gImageReader. Очень не плохо.

Большое спасибо за ценную наводку! Я вам в личку написал.  

Всего записей: 679 | Зарегистр. 09-07-2009 | Отправлено: 22:59 02-06-2018
indifirent

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подробнее...

Всего записей: 197 | Зарегистр. 02-06-2018 | Отправлено: 12:05 03-06-2018 | Исправлено: indifirent, 12:13 03-06-2018
glavsnab

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подробнее... [/more]

Всего записей: 3 | Зарегистр. 17-06-2018 | Отправлено: 14:33 17-06-2018 | Исправлено: glavsnab, 14:34 17-06-2018
VIP9N



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
glavsnab
 
 
Посмотрел вашу картинку.  Вроде неплохо всё так распознано.
 
Объяснения про разделитель – не понял.  
Такие вещи я, обычно, кидаю сразу в Эксель, там снимаю всё форматирование, назначаю одинаковый шрифт и размер, удаляю лишние пробелы, опять назначаю границы и копи-пащу в Ворд.  Всё всегда работает.  Полного перфекционизма тут не получится в принципе, как мне кажется.
 
Если вы думаете, что на вашей картинке плохо распознано, то вы не видели реально плохих сканов/фотографий телефоном.

Всего записей: 642 | Зарегистр. 13-12-2002 | Отправлено: 16:26 17-06-2018
glavsnab

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подробнее...

Всего записей: 3 | Зарегистр. 17-06-2018 | Отправлено: 21:44 17-06-2018
Sjoe



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
glavsnab
На автоанализ и авторазметку таблицы полагаться нельзя (кстати, было нельзя ни в одной предыдущей версии). ФР Размечает -- вот как вы описали -- как попало. Мои коллеги пробовали уже. Так они плюнули и с тех пор размечают таблицы вручную. Единственный результат, к которому они пришли -- распознавать  
не весь файл, а по 5...3...2.. 1 странице (чем хуже, тем меньше страниц за проход).

Всего записей: 679 | Зарегистр. 09-07-2009 | Отправлено: 22:46 17-06-2018
glavsnab

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Sjoe, спасибо за ответ.  
Может, в последующих версиях анализ таблиц улучшен или поддается настройке? Я пользователь малоопытный, поэтому и спрашиваю. Или, может, для этого лучше подходит еще какой-то софт?
Пытался разметить вручную одну таблицу и потом применять ее как шаблон, но при этом все равно следующие таблицы получаются с вышеописанными ошибками (хотя искажения не такие, как при анализе каждой таблицы, но объем работы по ручной правке примерно одинаковый для обоих способов). А после ручной правки, хоть одну распознавай, хоть несколько - без разницы.

Всего записей: 3 | Зарегистр. 17-06-2018 | Отправлено: 22:59 17-06-2018
VIP9N



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
glavsnab
 
Теперь понял.  Нет, никаких улучшений в рамках ваших задач в ФР я не нашёл.  Можно, конечно, мучиться разметкой вручную, но по времени это будет так же, как если после распознавания на чистовую делать.  Только делая начисто вы уже получаете предсказуемый результат, а с разметкой всё равно ещё лотерея.
 
К этому я давно пришёл, поэтому особо не возмущает.  Максимум с чего начинаю работу в свежеустановленном факридере, так это настраиваю автоматическую предобработку изображения после закидывания в него графики: выравнивание рисунка и строк, нахождение и применение подходящего разрешения, удаление муаров и шумов.  Т.е., на этом время экономится.  Всё остальное руками довожу уже после распознавания.
 
Про более точные инструменты мне не известно, хотя софта перепробовал много.  Как убедился на практике, у всех программописателей механика процесса примерно одинаковая (плюс-минус) и никто ничего революционно нового не предлагает.  
 
Возможно, в каких-нибудь американских библиотеках или университетах и есть какой-нибудь продвинутый закрытый частный софт, который они сами допилили для своих нужд, но он явно в мировых варезниках не предлагается.

Всего записей: 642 | Зарегистр. 13-12-2002 | Отправлено: 07:46 18-06-2018
Sjoe



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
glavsnab
Я думаю, Аббии вообще забили на улучшение этой функции после 8-й или 9-й версии. Предполагаю, что пожеланий, а тем более рекламаций в этой части было мало, вот и решили, что хватит. Большинство пользователей распознаёт всё-таки нетабличные тексты, с небольшими включениями таблиц (по себе сужу).  
Относительно других софтов -- не знаю, не интересовался. Меня (для целей перевода) при распознавании небольшого кол-ва таблиц и ручная разметка устраивает.  

Всего записей: 679 | Зарегистр. 09-07-2009 | Отправлено: 11:29 18-06-2018
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите пожалуйста, где скачать пакет распознования старой орфографии для 7-й версии.

Всего записей: 3398 | Зарегистр. 22-03-2005 | Отправлено: 01:55 09-07-2018
indifirent

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT
Могу вордлист подкинуть, если надо.
https://dropmefiles.com/3RRLT
http://rgho.st/8KV2dYkV7

Всего записей: 197 | Зарегистр. 02-06-2018 | Отправлено: 18:54 09-07-2018 | Исправлено: indifirent, 18:58 09-07-2018
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ребята, может ли кто подтвердить, что в лицензионной последней 14-й версии цвет шрифта ocr-слоя при экспорте в pdf (изображение и текстовый слой под ним) белый?
В 12-й у меня (лицензионной) он черный, а в 14-й крякнутой — белый. Это можно увидеть, если в акробате разделить документ на слои.
Стало любопытно — это новая фича или издержки кряка.

Всего записей: 3145 | Зарегистр. 29-09-2005 | Отправлено: 10:03 17-07-2018 | Исправлено: DmitryKz, 10:03 17-07-2018
VIP9N



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DmitryKz
 
У меня лажа с цветами шрифт-фон творилась в 12-й версии для Винды. Т.е., в Маковой было всё нормально, а вот в Виндовой шла какая-то выворотка (фон чёрный, а шрифты белые становились).  Уже не помню, но избавился ползая по опциям и меняя галки.  После какой-то настройки всё стало нормально.

Всего записей: 642 | Зарегистр. 13-12-2002 | Отправлено: 10:33 17-07-2018
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
фон чёрный, а шрифты белые становились

А у меня с 14-й в ocr-слое и фон и шрифт белые — причем, сразу, в установленной с нуля программе — несколько раз протестировал в виртуалке. В настройках тоже поползал, но что-то ничего подходящего не обнаружил пока..
Кряк, вероятно, ни при чем, так как в демо-режиме то же самое..

Всего записей: 3145 | Зарегистр. 29-09-2005 | Отправлено: 10:55 17-07-2018 | Исправлено: DmitryKz, 10:56 17-07-2018
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DmitryKz

Цитата:
(изображение и текстовый слой под ним) белый?

 
Шрифт не белый, шрифт с отключенной векторной заливкой (прозрачный). И в сохранённом pdf нет встроенного подмножества шрифтов, как это было в FR12. Всё это относится к документам сохранённым как "Текст под изображением".
 
Векторную заливку шрифтов во всём документе, за раз, можно потом включить в акробатовском плагине PitStop.
Подмножества шрифтов можно встроить в Акробате пересохранив документ как PDF/A.

Всего записей: 2797 | Зарегистр. 31-05-2010 | Отправлено: 07:04 18-07-2018
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Шрифт не белый, шрифт с отключенной векторной заливкой (прозрачный). И в сохранённом pdf нет встроенного подмножества шрифтов, как это было в FR12. Всё это относится к документам сохранённым как "Текст под изображением".  

Огромное спасибо за исчерпывающий ответ — я предположил нечто подобное, что эта ситуация касается только документов с "текст под изображением", особенно когда проверил с последней триальной версией, качающейся с оффсайта. Но о таком техническом нюансе, как отключенная векторная заливка, и представления не имел — "сюрприз".

Всего записей: 3145 | Зарегистр. 29-09-2005 | Отправлено: 07:27 18-07-2018
Masutin



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Перестал работать Screenshot Reader (бонус в FR8) в XP. Есть ли он в других версиях FineReader? Или, пожалуйста, посоветуйте ещё программу для OCR частей интерфейса и др.

Всего записей: 429 | Зарегистр. 23-02-2007 | Отправлено: 22:59 09-09-2018
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)
Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru