Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 2)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: Часть 1


ABBYY FineReader
7, 8, 9, 10 (Pro, Corp, Home), 11, 12 (Pro, Corp), 14 (Pro, Corp, Ent), 15, 16 (Pro, Corp)

 

 
Полный список языков распознавания для FR15
 

Русский интерфейс
 
Ответ на вопрос о сохранении проекта смотрим тут


Если  хотите, чтобы ваша проблема была рассмотрена, (решение не гарантируется), необходимо представить такие сведения:
1. Версия FineReader.
2. Версия Windows, версию пакета обновлений (SP), разрядность (для Vista и выше).
3. Если проблемы со сканированием, то называем ещё и модель сканера. Обновите драйвера своего сканера, до последней версии имеющейся на сайте поддержки вашего сканера.


Как можно получить церковнославянские тексты при помощи сканирования FineReader'ом
Как отключить "искусственный интеллект" FineReader
Как выбрать опции, чтобы FR10 распознавал простейшие формулы
FineReader не распознает сложные формулы и рукописный текст, не задавайте вопросов на эту тему.  
Версии FR для Linux пока не существует, только Engine, который вам явно не нужен.

Для понимания формата XPS программой FineReader нужен Framework 3.0. Только для XP и 2000.
Совет по распознаванию файлов DjVu Читать
Электронные текстовые книги - OCR, вычитка, оформление

Всего записей: 39180 | Зарегистр. 26-02-2002 | Отправлено: 09:12 20-12-2023 | Исправлено: ULer, 03:24 07-11-2024
vasevase

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Highlander_2
На 12-м пробовал. Нормально всё было.
 
Можно [нужно] попробовать разбить книжку на части.
Для обработки сотен страниц требуется много
ресурсов ПК [память, процессор].

Всего записей: 3420 | Зарегистр. 28-08-2010 | Отправлено: 23:49 25-11-2024
Highlander_2



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ULer

Цитата:
В какой версии пробовали?
Если файл не секретный, загрузите на upload.ee, и тоже попробую на 16-й Corporate.

vasevase

Цитата:
На 12-м пробовал. Нормально всё было.
Можно [нужно] попробовать разбить книжку на части.
Для обработки сотен страниц требуется много
ресурсов ПК [память, процессор].

Спасибо за ответ.  
Моя любимая версия - 15. В ней работаю. 16-я на моей Win 7 х32 не заведется. А на старые релизы... уже не вернусь после 15-й. Интерфейс на 15-й более удобен.  
Книгу загрузил на WD, так как на upload - лимит в 100 МБ. https://wdfiles.ru/1tyzq
Может попробывать перевести скан из цвета в grayscale. Или банально система не вывозит с 4 ГБ ОЗУ. Но... с остальными книгами у меня такой проблемы нет.
 
 
 
 

Всего записей: 224 | Зарегистр. 19-05-2017 | Отправлено: 16:54 01-12-2024
ULer



Moderator
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Highlander_2

Цитата:
Книгу загрузил

Получилось не ахти — https://www.upload.ee/files/17462907/book.7z.html

----------
http://dc.ru-board.com/ — Anime, Books, Cartoons, Clips, Databases and Maps, Games, Misc, Music, Movies, Scripts and Templates, Series, Soft, Training Courses, XXX.

Всего записей: 7492 | Зарегистр. 18-10-2007 | Отправлено: 20:22 02-12-2024
l0cky



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
кто нибудь сравнивал по скорости работы 14 и 15 версии?
у меня стоит 14, всем устраивает, но хотелось бы чтобы работала пошустрее.
 
заметки по поводу прочитанного на последних страницах
 
* чтобы "почистить хвосты от старой установки FineReader" можно воспользоваться RegOrganiser
* программа использует системную папку для временных файлов
чтобы изменить  система - дополнительные параметры - переменные среды    
* про ресурсы  
на многоядерном процессоре при загрузке / разметке страниц активно грузится только одно ядро и 12/8 Gb  на 4Gb  (5000) загруженных PDF страниц , при распознавании грузит все ядра , а потом долго о чем-то думает
* про нейронки
лама 3.1 отлично работает с готовым pdf , но не видит содержимого tiff файлов,  
в т.ч. и после конвертации в pdf, какое уж тут распознавание рукописного текста    
 

Всего записей: 148 | Зарегистр. 28-10-2003 | Отправлено: 02:24 10-12-2024 | Исправлено: l0cky, 02:48 10-12-2024
pressF



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
l0cky

Цитата:
программа использует системную папку для временных файлов
чтобы изменить  система - дополнительные параметры - переменные среды  

что тут сказатi,

Всего записей: 1406 | Зарегистр. 29-03-2023 | Отправлено: 05:25 10-12-2024
Highlander_2



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ULer, спасибо за труды и потраченное время. Японский явно не конек FR. Но самое главное, у Вас получилось все распознать. Получается проблема у меня.
 

Всего записей: 224 | Зарегистр. 19-05-2017 | Отправлено: 14:25 20-12-2024
l0cky



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Японский явно не конек FR

может надо использовать обучение?
и в дополнение
https://static1.abbyy.com/abbyycommedia/22861/users_guide_fr15_ru.pdf
322 стр. Особенности работы с языками со сложным письмом

Всего записей: 148 | Зарегистр. 28-10-2003 | Отправлено: 16:11 20-12-2024 | Исправлено: l0cky, 17:32 21-12-2024
l0cky



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Коллеги, а кто-нибудь пробывал в сабже распознавать на японском? Есть книга на 500 с гаком страниц. Прога долго пыжилась, распознавание вроде идёт. А в итоге, не даёт сохранить, пишет надо распознать все страницы.  

посмотрел эту книгу
 
* размер страниц огромный, а разрешение то ли 72, то ли 140 dpi
 Finereader распознает, но  хочет 400 dpi ( старым версиям хватала 300 ), сам FR изменять разрешение не умеет.  Не знаю насколько это сказывается на конечном результате, но ошибку выдаёт.
 
* чтобы сохранить результат, надо выделить страницы диапазона, на который FR не ругается, сохранить результат, удалить. Затем добить остальные страницы.
* чтобы не тратить время и не мучить себя, софт и железо, лучше предварительно сделать  сплит файла в Acrobat Pro или отключить распознавание при загрузке и затем использовать схему, которую я описал выше, обрабатывая по 100 страниц (или подберете сколько ваша машина может разово переварить)  
 
Замечу, что хотя ограничение частично и связано с железом, но и сам софт упирается в 4000 страниц, даже когда ресурсов как воды в море.

Всего записей: 148 | Зарегистр. 28-10-2003 | Отправлено: 21:37 22-12-2024 | Исправлено: l0cky, 22:17 22-12-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Дело было вечером, делать было нечего
Highlander_2

Цитата:
кто-нибудь пробывал в сабже распознавать на японском?
Японский явно не конек FR

Попробовал на исходнике. FineReader распознает, но лажает, особенно в таблицах, которые почти вся книга, особенно 16-я версия, 15-я у меня распознавала в таблицах лучше.
Из чистого интереса обработал на скорую руку в СканТейлоре и снова распознал в FR15. Распознал только первые 34 страницы, потому что жарить свой процессор час-полтора нет желания. Распознал, конечно, с ошибками, но лучше чем ничего.
Вот результат
Как правильно заметил l0cky, ФайнРидер любит разрешение 300-400 dpi, если будет как в исходнике 72 dpi, то распознавание будет лажать. Кроме того, сам pdf с какими-то ошибками и ещё больше половины страниц в jpeg2000, которые обрабатывать намного сложнее, чем обычный jpg.
 
Вопрос, если не секрет, а для чего вам поименный список офицеров японской армии и флота 1868-1945 годов?
List of Japanese Army and Navy Officers, compiled by Furukawa Toshiaki
—From the Meiji Era Establishment to the End of the War—
 
P,S, файл по ссылке имеет внутри изображения в jbig2. Такое впечатление, что при перекодировании jbig2 в zip скорость распознавания ФайнРидером увеличилась в 2 раза, но и размер файла вырос в 2 раза. Кроме того, есть ощущение, что обычного распознавание японского текста достаточно быстрое, а вот распознавание японского текста в таблицах весьма тормознутое.

Всего записей: 886 | Зарегистр. 04-11-2019 | Отправлено: 02:19 23-12-2024 | Исправлено: jourmager, 03:14 23-12-2024
fobosvgrunt

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
16 FR при распознавании JPG и сохранении в PDF с возможностью поиска  искажает(искривляет) строчки текста. Получается что-то типа синусоиды да еще с переменным размером шрифта. Происходит это в местах бочкообразных и пр. подобных  искажений исходного изображения.  Проблема в том, что попытки впоследствии преобразовать такие куски созданного PDF в простой текст с передачей в ворд приводят к большим ошибкам.  В 15-ом такие места просто не распознавались и передавались исходной картинкой.  
 
Можно в 16 как-то ограничить старания Ридера в борьбе с искажениями в исходных изображениях? Пусть меньше распознает в сложных местах , но передает в PDF без добавления туда еще и своих искажений.
 
и еще.  
что сильнее сокращает время преобразования картинок в текст: число ядер процессора,  тактовая частота  или кеш?  Что лучше для ускорения работы FR: размер оперативки и ее частота или наращивание мощности камня?  
Т.е. что лучше наращивать при апгрейте железа для ускорения работы Ридера?

Всего записей: 37 | Зарегистр. 14-01-2012 | Отправлено: 13:43 28-12-2024 | Исправлено: fobosvgrunt, 13:44 28-12-2024
l0cky



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
fobosvgrunt
 
если в 15 пометить эту картинку как текст, он её тоже не распознает?  

Всего записей: 148 | Зарегистр. 28-10-2003 | Отправлено: 06:51 09-01-2025
karst

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как в ABBYY 16 включить распознавание длинной немецкой S  - „ſ“?
https://de.wikipedia.org/wiki/Langes_s
Сканер гугля судя по пдф их распознает без проблем.

Всего записей: 348 | Зарегистр. 05-07-2008 | Отправлено: 16:54 10-01-2025
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4

Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru

Рейтинг.ru