Shulhan
Advanced Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Цитата: Shangry Shulhan Цитата:Как вариант, могу предложить попробовать сохранять PDF в формате Text and pictures only с опцией Replace uncertain words with images Есть еще один момент, который здесь надо учесть. У FineReader есть дурная привычка распознавать символы одного языка, как символы другого языка и, притом, делать это со стопроцентной уверенностью. Тогда не спасает даже упомянутая установка "Заместить неуверенно распознанные символы их изображениями". Так что, если и в PDF, сделанном по совету Goul, все равно пойдет мусор, то придется вручную размечать проблемные места с ивритом, как картинки. Геморрой, конечно, но что поделаешь . | Я хорошо побился об стены в поисках решения и пришёл к выводу, что натыкаюсь именно на эти грабли -"привычка распознавать символы одного языка, как символы другого языка и, притом, делать это со стопроцентной уверенностью". При этом парочка конкурирующих программ распознавания текста оказалась вообще несравненно хуже, как и несколько перепробованных конвертеров. Пришлось идею временно похоронить, но поскольку это всё было средством решения проблемы,а не целью полиграфического уровня, то я это пережил. Видимо, дело движется к постраничной обработке. Два формата документа, Word and PDF, требовались потому, что изначально скан был в формате DJVU, и в этом конкретном скане качество русских текстов хромало на одну ногу. Распознавание и сохранение результата в документ PDF решило проблему. Преобразование в формат word требовалось потому, что с книгами желательно было долго и серьёзно поработать, причём на разных мониторах, к тому же исходный формат книги несколько неудобен для механического его переноса на монитор. Я очень благодарен тем, кто попытался мне помочь - как минимум, благодаря вам я не заработал комплекса неполноценности, обзывая себя круглым идиотом, неспособным даже с такой ерундой справиться. Как максимум - я начал кое-что понимать. ВСЕМ СПАСИБА |