PDF с нестандартными шрифтами - [1] :: Программы

эту проблему я решаю следующим способом:

1 этап: весь pdf закидываю в finereader. Не важно как (это я к тому, что иногда простое открытие pdf-а в finereader-е приводит к ошибке), главное чтоб качество распознания не пострадало и размеры страницы и поля остались те же что и в исходном пдф (потом поймете почему это важно).

2 этап: распознаем и сохраняем в пдф так чтобы текст был за картинкой (см. в опциях сохранения в пдф). Тут мне было удобно сохранять каждую страницу в отдельный файл (потом будет ясно зачем).

3 этап: открываем исходный пдф акробатом (не ридером, а полной версией). открываем вкладку "page" и правой кнопкой мыши нажимаем на первой странице -> "insert pages. Выбираем первых страниц 15 из тех что распознаны и вставляем. Далее добиваемся того, чтоб каждая распознанная страница следовала за соответствующей страницы оригинала (все это можно сделать простым перетаскиванием во вкладке "page"). Далее вставить таким же образом и остальные страницы.

4 этап: инструмент TouchUp Reading Order Tool (Tools->Advanced Editing) -> Show Order Panel -> Content. Далее открываете 1 и 2 страницы во вкладке "Content" и находите на второй странице "Text". Выделяете и перетаскиваете мышкой на первую станицу. Таким образом, вы получите на первой странице весь распознанный текст вместе с оригиналом, а на второй только картинку. И такие же манипуляции со 3-4, 5-6, 7-8 и т.д. (Если бы вы сохранили распознанный текст в один файл, то было бы трудней манипулировать страницами) пока рука не отсохнет.

5 этап: если рука не отсохла, то удаляете 2,4,6,8 и т.д. страницы с рисунком.

6 этап: File->Save as и все

в новом пдф будет работать поиск и его размер увеличится всего в двое-трое в зависимости от процентного соотношения текста к рисункам.
можно даже выделять и копировать куски (но тут нужно присобачиться)
Если в finereader вы загоните картинку страницы с другими полями, то в конечном счете у вас распознанный текст и текст оригинал не будут совпадать, из-за различного расположения на странице.

Модерирует : gyra, Maz
Версия для печати • Подписаться • Добавить в закладки
Страницы: 1 2