Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)

Модерирует : gyra, Maz

Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

JediMaster_Dragon



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ABBYY FineReader
7, 8, 9, 10 (Pro, Corp, Home), 11 (Pro, Corp), 12 (Pro, Corp) и 14 (Pro, Corp, Ent)

 

 
Полный список языков распознавания для FR15
 

Русский интерфейс
 
Ответ на вопрос о сохранении проекта смотрим тут


Если  хотите, чтобы ваша проблема была рассмотрена, (решение не гарантируется), необходимо представить такие сведения:
1. Версия FineReader.
2. Версия Windows, версию пакета обновлений (SP), разрядность (для Vista и выше).
3. Если проблемы со сканированием, то называем ещё и модель сканера. Обновите драйвера своего сканера, до последней версии имеющейся на сайте поддержки вашего сканера.


Как можно получить церковнославянские тексты при помощи сканирования FineReader'ом
Как отключить "искусственный интеллект" FineReader
Как выбрать опции, чтобы FR10 распознавал простейшие формулы
FineReader не распознает сложные формулы и рукописный текст, не задавайте вопросов на эту тему.  
Версии FR для Linux пока не существует, только Engine, который вам явно не нужен.

Для понимания формата XPS программой FineReader нужен Framework 3.0. Только для XP и 2000.
Совет по распознаванию файлов DjVu Читать
Электронные текстовые книги - OCR, вычитка, оформление

Всего записей: 354 | Зарегистр. 18-01-2002 | Отправлено: 09:07 26-01-2003 | Исправлено: Maz, 19:24 26-01-2020
logmaster



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo
 

Цитата:
Что мешает вам сохранить 4 текстовых блока для каждой из страниц, где они отличаются и наложить их на каждую 1,2,3,4-ю остальные страницы?
 
При сохранении выбирайте простой текст и получите то, что кажется вы хотите....

 
 
Спасибо за идею. Я сделал примитивно просто, но вроде получается.
Открыл четырехколоночную страницу, она автоматически распозналась и в правой части экрана появился распознанный текст. Замаркировал этот текст полностью, забрал в карман, открыл пустую страницу  в текстовом редакторе (но можно и Word), и восстановил текст из кармана.
Все сразу получилось - колонки автоматически исчезли и вместо них сформировался непрерывный текст.
Мало того, на странице была ненужная мне картинка, рассекающая посередине вторую, третью и четвертую колонки, но она не помешала правильному размещению частей колонок и просто исчезла при восстановлении текста.
 

Всего записей: 648 | Зарегистр. 22-04-2002 | Отправлено: 23:17 02-10-2020 | Исправлено: logmaster, 23:20 02-10-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VIP9N
 
Оставьте. Видно после очередной пачки злобных писем в адрес Абби (по результатам пробы) кто-то из них завернул сюда.
 
Сейчас как раз подвернулась интересная задача, требующая версии с поддержкой дореформенного написания с ерями и ятями - попробовал 15 более детально. Мама милая.....
 
Честно говоря этим аббийско-физтеховским мальчикам перед выпуском новой версии надо брать пачку разносортного материала, перелопатить её вручную недели за две - сразу бы масса полезных мыслей пришла. Но судя по тому, что в русском фейсе есть даже строки, не влязащие на свои места — тестирование в Абби такое же мёртвое, как и в MS.
 
 
logmaster - теперь точно вижу, что вам достаточно было в настройках сохранения выбрать простой текст.

Всего записей: 3729 | Зарегистр. 17-09-2001 | Отправлено: 02:35 03-10-2020
VIP9N



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Оставьте. Видно после очередной пачки злобных писем в адрес Абби (по результатам пробы) кто-то из них завернул сюда.

 
Солидарен с Вами, niccolo.  Очень соответствует тренду нынешнего времени: вместо исправления причин борются со следствием. Пользуют на форме "консерву", чтобы затеять изначально проигрышный для них спор. Мда.

Всего записей: 642 | Зарегистр. 13-12-2002 | Отправлено: 16:48 03-10-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот еще пару примеров кривой работы 15 Версии
 
https://www.upload.ee/files/12414138/FR15.rar.html
 
P.S. - Для ответственных задач годится с натяжкой. Поскольку версию особо не использую (это первая и, надеюсь, последняя задача для данной версии), то о причинах такого поведения могу только гадать....
Потиху бомблю Абби косяками.

Всего записей: 3729 | Зарегистр. 17-09-2001 | Отправлено: 23:18 20-10-2020
svs123456789

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
а какая из версий - получше распознает русский текст (сфотографированный на смарт) ?

Всего записей: 2941 | Зарегистр. 10-04-2003 | Отправлено: 18:04 11-11-2020
Finereader14

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мне нужна ссылка на последнюю портативную версию FR15.  
 
огромное спасибо

Всего записей: 104 | Зарегистр. 18-12-2018 | Отправлено: 13:41 15-11-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Дополнительно выявленные косяки FR15  
 
могут быть критичными для кого-то
 
1. Не импортирует атрибут ячейки - считать картинкой из пакетов FR8.
2, Серьёзно портит картинки, имеющие вертикальные белые поля в тексте (например таблицы с пустым столбцом посередине) при включении опции - устранение трапециевидных искажений (для фотографий) - при предобработке (при отключении предобработки достаёт предупреждениями). До разумной проверки расширения импортируемых изображений или Exif записей в файлах разработчики додуматься не смогли, как не сделали и функцию восстановления исходного изображения, несмотря на выросший в разы размер пакета. (в новом пакете нельзя просто подменить картинку, как в FR8 и перераспознать с сохранением блоков)
3. При исправлении табличных блоков в распознанном пакете вместо анализа структуры таблицы распознаёт её, что может длиться до 1 минуты. То же самое при перераспознавании страницы.
Чтобы просто проанализировать таблицу - надо удалить со страницы все блоки.
4. Удобство работы с блоками стало хуже, чем в 8 версии. Достаёт панель инструментов таблицы появляющаяся то на верхнем, то на нижнем крае таблицы. При этом если таблица была наложена импортом блоков - панель еще может закрывать, не захваченный таблицей текст.
5. В случае предупреждений - окошко будет вылазить после перераспознавания каждой страницы - отключить его возможности нет...
6. Любые манипуляции с изображениями приводят к полной утрате информации о наложенных блоках.!!!!! (сравните с ластиком в версии 8, когда надо быстро подтереть дефект на изображении)
7. Функция перезагрузки изображения не работает - если пакет создавался из многостраничного ПДФ/DJVU. Что не позволило додуматься о таком - не знаю. Понятия о том, чтобы перезагружать без допзапросов изображение из исходного места тоже нет.
 
Никаких улучшений в плане повышения качества распознавания более тщательным лингвистическим анализом или объявленным ИИ — НЕТ!!!!!!!!!!!!!!!!!
Улучшения есть только для языков, для которых появилась словарная поддержка...
Все многочисленные баги и недоделки и ухудшения, о которых я постоянно писал Абби на их старом форуме по FR так и остались....
 
Если тут случайно появляется кто-то, у кого по работе имеются законные пути воздействия на АББИ по устранению косяков, повоздействуйте на них хотя бы в плане устранения косяка 3, 6, 7. Для пункта 6 желательна вообще функция экспорта блоков в формат более старых версий для сохранения своего труда и возможности его использования в старых версиях (не покупать же постоянно новые версии, в которых мало что улучшается, а обратной совместимости никакой).
 
 
а какая из версий - получше распознает русский текст (сфотографированный на смарт) ?
 
Если руки не из задницы (при фотографировании) - и речь просто о правильности текста без оформления (Ж.К) и блоки сами правильно наложите  - все последние примерно одинаковы

Всего записей: 3729 | Зарегистр. 17-09-2001 | Отправлено: 14:58 15-11-2020
stokber3

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Попытка искать ошибки OCR с помощью регулярных выражений:
Ссылка устарела.
В стадии тестирования. Скрипт Autohotkey.
Может кому пригодится.

Всего записей: 60 | Зарегистр. 31-01-2015 | Отправлено: 12:17 17-11-2020 | Исправлено: stokber3, 08:53 30-08-2023
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
stokber3
 
 
А прикрутить к нему поиск замену слов по списку можно?

Всего записей: 3729 | Зарегистр. 17-09-2001 | Отправлено: 17:23 21-11-2020
stokber3

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А сколько в списке таких пар слов?

Всего записей: 60 | Зарегистр. 31-01-2015 | Отправлено: 21:05 21-11-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А сколько в списке таких пар слов?

 
 
Может и тысяча быть.  Ведь проще допустим сохранить результат распознавания в текст, проверить на несловарные слова, а затем ошибочные просто исправить по списку.....
Тут только один момент - контроль границы слов, чтобы не заменялись слова, являющиеся частью других слов...

Всего записей: 3729 | Зарегистр. 17-09-2001 | Отправлено: 21:38 21-11-2020
stokber3

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мой скрипт только указывает на возможные типичные ошибки распознавания. Работа в FineReader хороша тем, что сразу можно свериться с оригиналом изображения. Исправление на автомате наверное лучше делать уже в готовом конвертированном из FR документе.  Да и составление таких списков (если это список пар неправильное-исправленное) может занять больше времени чем исправление вручную. Уточните, это будут списки неправильных слов или пар неправильное-исправленное. Если первое, и если я правильно понял вы из результата распознавания с помощью некоего софта создаёте список неправильных слов и вам нужно, чтобы мой скрипт выделял эти слова, то да, это можно сделать. Если их тысяча, то надо проверять, сразу не могу сказать, есть некоторые ограничения.

Цитата:
контроль границы слов, чтобы не заменялись слова, являющиеся частью других слов...

Для этого существуют регулярные выражения. А если это части переносимых и перенесенных слов на стыках страниц,  то тут нужно подумать.  
Если же это пары неправильное-исправленное, тоже можно, но если таких пар не очень много.
 
 

Всего записей: 60 | Зарегистр. 31-01-2015 | Отправлено: 22:47 21-11-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
это пары неправильное-исправленное, тоже можно, но если таких пар не очень много.

 
ФР не исправляет однотипные ошибки по всем страницам пакета......
 
Эта функция нужна только для оцифровки книг, чтобы более и менее уверенный поиск был.

Всего записей: 3729 | Зарегистр. 17-09-2001 | Отправлено: 22:53 21-11-2020
stokber3

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo

Цитата:
ФР не исправляет однотипные ошибки по всем страницам пакета......

Здесь не совсем понял, что вы имеете ввиду, уточните. Если не трудно приведите пример.

Всего записей: 60 | Зарегистр. 31-01-2015 | Отправлено: 23:06 21-11-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Здесь не совсем понял, что вы имеете ввиду, уточните.  

 
Вы видите кнопку - «исправить везде/на всех страницах»?  
Судя по тому, что и поиск там работает не по кругу а в двух направлениях по отдельности, сомневаюсь, что данная функция там есть.

Всего записей: 3729 | Зарегистр. 17-09-2001 | Отправлено: 00:41 22-11-2020
stokber3

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да, здесь этот алгоритм не подойдёт.  

Всего записей: 60 | Зарегистр. 31-01-2015 | Отправлено: 10:58 22-11-2020
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день. Некоторое время задавал вопрос здесь, но ответа не получил.
 
Повторяю вопрос в надежде на ответ и разъяснение.
 
Подскажите пожалуйста, как можно использовать регулярные выражения в поиске в FineReader?
Не могу в интернете ничего путного по этой теме найти. (

Всего записей: 599 | Зарегистр. 04-05-2016 | Отправлено: 12:55 22-11-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Подскажите пожалуйста, как можно использовать регулярные выражения в поиске в FineReader?

 
По сути только так, как реализовал stokber3....
 
Второй вариант - вы представитель организации, имеющей хороший договор с Абби, и по этому договору право что-то требовать. Вы просто начинаете требовать от Абби это что-то .....

Всего записей: 3729 | Зарегистр. 17-09-2001 | Отправлено: 14:00 22-11-2020
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
как реализовал stokber3

 
А как он реализовал? Где можно об этом прочитать?

Всего записей: 599 | Зарегистр. 04-05-2016 | Отправлено: 16:44 22-11-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А как он реализовал? Где можно об этом прочитать?

 
Несколько постов выше. Не ленитесь читать топик, прежде чем задавать вопросы.

Всего записей: 3729 | Зарегистр. 17-09-2001 | Отправлено: 16:52 22-11-2020
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)
Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru