aar
Gold Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору beeruser Тут я покумекал малость по вопросу извлечения шрифтов из представленного вами ранее PDF файла. Файлик не простой, с защитой, но вот pdftops на раз-два-три преобразовала его. Ради интереса декриптовал его Advanced PDF Password Recovery Pro, и еще разок преобразовал в PostScript файл с помощью той же pdftops. Размер файлов совпал, содержимое не проверял, но полагаю, что оно так же синонимично. Из этого, думаю, можно сделать абсолютно неправдоподобный вывод: pdftops перед преобразованием расшифровывает PDF! Потом взял, да и сделал ход конём :=) Запустил Distiller, и получил из этих двух PS файлов два PDF файла. Размер файлов различается на 1 байт (что — тьфу, такая малость). Следом за этим еще раз преобразовал полученные из Distillerа PDF файлы в PS файлы с помощью pdftops. Размер совпал, содержимое не проверял, но вряд ли оно разнится. Ну вот, потом с помощью FontExtract_0_05.exe извлек шрифты соответственно из PS файлов, которые были получены сразу, и из PS файлов, сделанные после Distillerа. Вот во втором случае CID шрифты были получены по отдельности, не в одном файле два шрифта, как ранее, и на что вы обратили внимание, а по одному, что и требовалось. Но этим дело не закончилось. Открыл исходный PDF файл в Acrobat, напечатал его на PS принтер в файл, и затем хотел заново слепить PDF через Distiller. Ага, не тут-то было! Distiller обломился с сообщением, что поданный ему PS файл был получен из зашифрованного PDF, и он отказывается его обрабатываться. Ну, думаю, и черт с тобой, я тоже не лыком шит :=) Открыл полученный ранее через тот же Distiller декриптованный PDF, напечатал его на PS принтер в файл, установив, что TrueType шрифты преобразовывать в Outline, то есть в Type1. Сразу следом за этим продистиллил файл, без проблем получил PDF, в котором все шрифты уже имеют формат Type1, который преобразовал в PS с помощью pdftops. Так как TrueType также CID, то этот PS еще раз преобразовал в PDF, который опять перевел в PS с помощью pdftops, и наконец извлек-таки все встроенные в него шрифты в Type1 формате. Кернинга в извлеченных CID шрифтах нет и не будет, потому что это просто невозможно. Итак, процедура извлечения любых типов шрифтов, каждый по отдельности. I) Если в 1.pdf присутствуют CID шрифты в формате Type1, то его надо преобразовать в 1.ps с помощью pdftops, затем из 1.ps создать 1-2.pdf с помощью Distillerа (в котором части CID шрифта будут представлены по отдельности), и получить 1-2.ps, из которого и извлекать шрифты с помощью FontExtract v0.05, которые и будут извлечены каждый по отдельности. II) Если в 2.pdf присутствуют CID шрифты в формате TrueType, то его надо открыть в Acrobat, напечатать в 2.ps как в файл PostScript принтера, установив конвертировать TT в T1, получить 2-2.pdf с помощью Distillerа (в котором уже все шрифты будут в формате Type1), преобразовать его в 2-2.ps с помощью pdftops, получить 2-3.pdf из 2-2.ps с помощью Distillerа (в котором части CID шрифта будут представлены по отдельности), преобразовать его в 2-4.ps с помощью pdftops, и извлекать шрифты с помощью FontExtract v0.05, которые будут извлечены каждый по отдельности. III) Если в 3.pdf присутствуют CID шрифты как в формате Type1, так и в формате TrueType, то процедура аналогична II).
|