andrewbobjiljov
Newbie | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору feuerloescher Было бы время, можно было бы самому алгоритм парсинга разработать, что бы все отлично было. Astra55 pdf2txt (VeryPDF) вполне нормальная утилита, лучше только ее sdk вариант, но он стоит дорого. А может быть сразу и подсказал бы, что может именно дать пароль владельца, а не просто снять защиту. На счет изучения вопроса мог бы и подкинуть ссылочку, а не бросаться словами. Проблема не в том, что не был разработан алгоритм выцепливания. Он как раз был, сперва определение что это именно этот PDF, потом снятие защиты, потом распечатывание на виртуальном принтере в temp, конвертация в txt, а в конце удаление временного pdf. Проблема в другом, то что недавно создатели pdf опять поменяли верстку, или что-то еще, и опять надо подстраивать процесс определения pdf. К тому же, надеюсь, каждый понимает, что с точки зрения затрачиваемых ресурсов и времени на обработку pdf, подобный алгоритм не очень то выгоден. Что же, я рассчитывал на какие то креативные идеи, предложения и рекомендации. В частности, в чем там дело и как можно легко это исправить. Или где можно найти хорошее и полное описание всего пакета Acrobat и в частности Distiller. Или как работать с PostScript. В общем извините за причиненные неудобства. Спасибо за ответы. |