Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)

Модерирует : gyra, Maz

Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

JediMaster_Dragon



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ABBYY FineReader
7, 8, 9, 10 (Pro, Corp, Home), 11 (Pro, Corp), 12 (Pro, Corp) и 14 (Pro, Corp, Ent)

 

 
Полный список языков распознавания для FR15
 

Русский интерфейс
 
Ответ на вопрос о сохранении проекта смотрим тут


Если  хотите, чтобы ваша проблема была рассмотрена, (решение не гарантируется), необходимо представить такие сведения:
1. Версия FineReader.
2. Версия Windows, версию пакета обновлений (SP), разрядность (для Vista и выше).
3. Если проблемы со сканированием, то называем ещё и модель сканера. Обновите драйвера своего сканера, до последней версии имеющейся на сайте поддержки вашего сканера.


Как можно получить церковнославянские тексты при помощи сканирования FineReader'ом
Как отключить "искусственный интеллект" FineReader
Как выбрать опции, чтобы FR10 распознавал простейшие формулы
FineReader не распознает сложные формулы и рукописный текст, не задавайте вопросов на эту тему.  
Версии FR для Linux пока не существует, только Engine, который вам явно не нужен.

Для понимания формата XPS программой FineReader нужен Framework 3.0. Только для XP и 2000.
Совет по распознаванию файлов DjVu Читать
Электронные текстовые книги - OCR, вычитка, оформление

Всего записей: 354 | Зарегистр. 18-01-2002 | Отправлено: 09:07 26-01-2003 | Исправлено: Maz, 19:24 26-01-2020
IamDimulya



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku

Цитата:
ставил не дефисы, а знак мягкого переноса.  

Так он и ставит в тех, что знает. Он ставит дефисы в словах, которых не знает. И в сложных словах вместо разбиения слова на составляющие он упрямо ставит дефисы.
Он мог бы вести себя умнее, но не будет по определению. У них есть Finereader Server с ограничением на количество страниц в лицензии, там скорее всего все очевидные косяки устранены.
Понятно, вы хотите, чтобы всё работало как удобно вам и я тоже хочу. А деньги кто будет платить?
Потому если вы хотите автоматизировать процесс - распознайте часть текста, прогоните его проверкой ошибок, добавьте в словарь важные для вас слова и распознайте заново. От слов, находящихся в словаре, он отпереться не может и потому в них поставит знаки переносов.
Автоматизировать процесс макросом тоже было бы хорошо, только кто покупать серверную платформу будет?
Наша задача - приспособиться к его капризам с минимальными усилиями с нашей стороны и мне это удалось... Думаю, сделать обучающий курс, не знаю, на сколько это актуально...  
 

Всего записей: 396 | Зарегистр. 01-09-2003 | Отправлено: 11:38 06-09-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
IamDimulya
а как можно добавить в ФР словарную поддержку языка?

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 14:43 06-09-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый вечер. Продублирую вопрос. Насущный, на самом деле )
 
Есть ли такая возможность добавлять словарную поддержку в FR? Сейчас она есть только для крупных языков. Может можно как-то приспособить словари формата Hunspell к FR.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 18:45 12-09-2022
AKazak



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Привет всем!
 
Использую FineReader 12 с последними обновленями. При распознавании многострочного текста в распознанном тексте отсутствуют символы абзаца или новой строки:
   
 
Как настроить автоматическое распознавание символа абзаца или новой строки?
 
Спасибо.
 
P. S. Официальная техническая поддержка (сейчас от contentai.ru) нагло послала: "Обращаем ваше внимание, что версия, которую вы используете, больше не поддерживается."

Всего записей: 625 | Зарегистр. 24-12-2005 | Отправлено: 05:55 23-09-2022 | Исправлено: AKazak, 05:56 23-09-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Как настроить автоматическое распознавание символа абзаца или новой строки?

 
В свойствах сохранения текста - сохранять деление на строки
 
В окне распознавания - через переключение на вид - формат оригинала.... (где plain text)
И кстати именно с этим в последней версии FR беда - не переключает...

Всего записей: 3673 | Зарегистр. 17-09-2001 | Отправлено: 10:28 23-09-2022
AKazak



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo
Спасибо!
Сработало:
   
 
 
Можно как-нибудь при распознавании заменить символ line break на paragraph break?

Всего записей: 625 | Зарегистр. 24-12-2005 | Отправлено: 21:04 23-09-2022
ixet

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вопрос. Кто-нибудь сталкивался с ситуациями, когда FineReader придумывает слова при распознавании? Т.е. на входе совершенно ясный скан с идеальным шрифтом, но при распознавании буквы заменяются на другие по какому-то внутреннему словарю.  
Из недавнего. Сканировал архивную выписку, где был Александр Чевский - FR15 его заменил на Александра Невского. Рядом аналогичная замена: "Оп. 38. Т. 1. Д. 193" заменено на "Оп. 38. Т. ЕД. 193".
Повторюсь, на входе идеальный скан свежей выписки 300 dpi с Times New Roman 12, "Ч" и "1." читаются абсолютно ясно.
Проверил на FR12, там Чевский остался сам собой (хотя мелкие вопросы есть и по этой версии).
Я так понимаю, что с внедрением в FR9 технологии адаптивного распознавания документов (ADRT), в каждой новой версии эту технологию постоянно дорабатывают и, видимо, не всегда удачно. В справке объяснения не нашел.

Всего записей: 67 | Зарегистр. 17-10-2008 | Отправлено: 08:06 29-09-2022 | Исправлено: ixet, 08:14 29-09-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Кто-нибудь сталкивался с ситуациями, когда FineReader придумывает слова при распознавании?

 
У Абби есть привычка считать себя умнее пользователей.  
Для данной конкретной ситуации попробуйте добавить в языки распознавания цифры.
 
Для таких исправлений типа Невский - Чевский - будь у Абби мозг - добавили бы либо функцию замены, либо анализа, проверки и автоисправления/пополнения словарей новыми словами после распознавания.....
 
Но мозгов там нет давно...

Всего записей: 3673 | Зарегистр. 17-09-2001 | Отправлено: 09:32 29-09-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Доброе утро.
Скажите пожалуйста, есть ли какие-нибудь маленькие хитрости при распознавании текста напечатанного пишущей машинкой?
Я знаю про функцию ФР — «Пишущая машинка» в опциях.
Результат, к сожалению, совершенно неудовлетворительный. А набирать несколько десятков страниц очень не хочется.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 09:40 29-09-2022
ixet

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
У Абби есть привычка считать себя умнее пользователей

Понятно ) Значит, толком ничего не сделать. Вот была-бы опция "отключить Т9"...
Буду, пожалуй, сканировать на FR12 или вообще на FR8
 
Добавлено:

Цитата:
есть ли какие-нибудь маленькие хитрости при распознавании текста напечатанного пишущей машинкой

Я бы попробовал Фотошоп. Увеличить разрешение в 2-4 раза, потом поиграться Уровнями и Фильтрами, чтобы контур букв стал более слитой.

Всего записей: 67 | Зарегистр. 17-10-2008 | Отправлено: 10:03 29-09-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
О новом Abbyy FinePDF 16 - чисто об OCR редакторе
 
Поставил посмотреть, устранили ли они хоть одно замечание по интерфейсу....
 
1!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! (на целую версию) устранили — теперь при обработке изображений в редакторе изображений если страница кардинально не меняется (напр. не поворачивается) блоки не слетают.
Т.е. для тех, кто работает с сильно замусоренными сканами новая версия даёт облегчение
 
Информация о блоках в табличном виде не появилась. Объединение столбцов в таблице тоже нет. Работает чуть быстрее 15. Языки всё также из неудобных выпадающих списков. Повторное открытие изображения всё также вызывает окно открытия файлов с непонятной исходной папкой...
 
Никаких подвижек в сторону вертикального интерфейса для моников-амбразур тоже не заметил....
 
Сам интерфейс - из красивого для XP-версий скатился в некрасивый плоский а-ля W10-11.  
 
Зато сразу баг нашёл — на странице с 2-мя текстовыми блоками и табличкой в двух режимах вывода - простой текст и точная копия - в окне текста текстовые блоки были чёрными (с чёрным фоном) и текста в них не было видно.... ППЦ....В настройках ничего нового - всё так же включена дебильная предобработка.  
При импорте пакета из 8 и 15 распознанный текст всё также не импортирует....
 
Из ухудшений
Поменяли местами цвета блоков - в 16 версии текстовый блок синего цвета, таблица - зелёного.... До этого было наоборот.— ЗАЧЕМ??? Полигональных блоков не появилось....
 
Им бы около офиса цвета на светофорах поменять - от было бы здорово....
 
Импортировал для примера 1-й том шломана - покрутил страничку в редакторе изображений - снёс блоки - жму перераспознать — и кукиш ImagePreProcessing.cpp 171 error... Без всяких комментариев....
 
 
Короче - х/з чем занимались. Неужели в Америках так потребности пользователей отличаются???

Всего записей: 3673 | Зарегистр. 17-09-2001 | Отправлено: 12:10 29-09-2022
ixet

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
теперь при обработке изображений в редакторе изображений если страница кардинально не меняется (напр. не поворачивается) блоки не слетают.

Это круто, наконец-то! Но если это единственный плюс, то я по-прежнему изображения перед распознаванием буду готовить в Фотошопе

Всего записей: 67 | Зарегистр. 17-10-2008 | Отправлено: 12:18 29-09-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ixet (пост)
Цитата:
Но если это единственный плюс, то я по-прежнему изображения перед распознаванием буду готовить в Фотошопе  

 
Посоветую освоить ScanKromsator или ScanTailor.
 
PS. Заслал свой пост в ContentAI - может к выходу FR16 в России пофиксят хоть черноту в текстовом окне.....
 
Вот так теперь выглядит FR 16

 

Всего записей: 3673 | Зарегистр. 17-09-2001 | Отправлено: 12:45 29-09-2022
73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ixet
Цитата:
Вот была-бы опция "отключить Т9"...
Создаешь новый русский (или другой) язык на основе существующего, не задействуешь словарь, будет тебе чистый OCR без их гребаного интеллекта, отключение от слова "напрочь".

Всего записей: 1147 | Зарегистр. 18-08-2012 | Отправлено: 12:53 29-09-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Для этого
 

Цитата:
Рядом аналогичная замена: "Оп. 38. Т. 1. Д. 193" заменено на "Оп. 38. Т. ЕД. 193"

 
я бы посоветовал первым языком поставить «Цифры», а потом уже пытаться отказываться от словарной поддержки

Всего записей: 3673 | Зарегистр. 17-09-2001 | Отправлено: 12:58 29-09-2022
ixet

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Посоветую освоить ScanKromsator или ScanTailor

Первый когда-то пробовал, Фотошоп оказался привычнее и удобнее для редких работ. Но при больших объемах конечно нужен специализированный софт
 
Добавлено:

Цитата:
Создаешь новый русский (или другой) язык на основе существующего, не задействуешь словарь

Вот спасибо! Для меня сей момент открытие просто!
 
Добавлено:

Цитата:
я бы посоветовал первым языком поставить «Цифры»

спасибо тоже, попробую

Всего записей: 67 | Зарегистр. 17-10-2008 | Отправлено: 15:34 29-09-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Повеселил сегодня ответ из ContentAI
 

Цитата:
Мы, как технологический партнер ABBYY, оказываем поддержку программы только до версии FineReader PDF 15 включительно.  
 
Версия FineReader PDF 16 не распространяется на территории ряда стран, включая Россию. Поэтому по вопросам поддержки, предложений и пожеланий вам нужно обращаться в поддержку ABBYY через https://support.abbyy.com/  

 

Всего записей: 3673 | Зарегистр. 17-09-2001 | Отправлено: 17:42 29-09-2022
indifirent

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
niccolo
Вот так теперь выглядит FR 16

Нда, перенос OCR в оригинальный DjVu так и не реализован. Зато цвета зон распознавания поменяли и чёрные полосы добавили. Борьба с умом продолжается.

Всего записей: 176 | Зарегистр. 02-06-2018 | Отправлено: 15:49 01-10-2022
Darth_Max

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Нужно отсканировать двухсторонний документ, размером как половина A4, но разместить обе стороны на одной стороне листа, для копии. И сохранить изображение для использования позже.  
Распознавание не нужно, только картинка, черно-белая.
FineReader 15 это может?

Всего записей: 1196 | Зарегистр. 02-10-2014 | Отправлено: 17:37 20-12-2022
oldof

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Darth_Max

Цитата:
Распознавание не нужно, только картинка, черно-белая.
FineReader 15 это может?

Зачем вам для этого FineReader? WinScan2PDF бесплатен, состоит из одного файла и не требует установки.

Всего записей: 489 | Зарегистр. 12-07-2018 | Отправлено: 18:32 20-12-2022
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)
Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru