jourmager
Advanced Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Дело было вечером, делать было нечего Highlander_2 Цитата: кто-нибудь пробывал в сабже распознавать на японском? Японский явно не конек FR | Попробовал на исходнике. FineReader распознает, но лажает, особенно в таблицах, которые почти вся книга, особенно 16-я версия, 15-я у меня распознавала в таблицах лучше. Из чистого интереса обработал на скорую руку в СканТейлоре и снова распознал в FR15. Распознал только первые 34 страницы, потому что жарить свой процессор час-полтора нет желания. Распознал, конечно, с ошибками, но лучше чем ничего. Вот результат Как правильно заметил l0cky, ФайнРидер любит разрешение 300-400 dpi, если будет как в исходнике 72 dpi, то распознавание будет лажать. Кроме того, сам pdf с какими-то ошибками и ещё больше половины страниц в jpeg2000, которые обрабатывать намного сложнее, чем обычный jpg. Вопрос, если не секрет, а для чего вам поименный список офицеров японской армии и флота 1868-1945 годов? List of Japanese Army and Navy Officers, compiled by Furukawa Toshiaki —From the Meiji Era Establishment to the End of the War— P,S, файл по ссылке имеет внутри изображения в jbig2. Такое впечатление, что при перекодировании jbig2 в zip скорость распознавания ФайнРидером увеличилась в 2 раза, но и размер файла вырос в 2 раза. Кроме того, есть ощущение, что обычного распознавание японского текста достаточно быстрое, а вот распознавание японского текста в таблицах весьма тормознутое. | Всего записей: 886 | Зарегистр. 04-11-2019 | Отправлено: 02:19 23-12-2024 | Исправлено: jourmager, 03:14 23-12-2024 |
|