Общие вопросы шрифтов и PS- и PDF-файлов - [2] :: Графика

beeruser

Тут я покумекал малость по вопросу извлечения шрифтов из представленного вами ранее PDF файла. Файлик не простой, с защитой, но вот pdftops на раз-два-три преобразовала его. Ради интереса декриптовал его Advanced PDF Password Recovery Pro, и еще разок преобразовал в PostScript файл с помощью той же pdftops. Размер файлов совпал, содержимое не проверял, но полагаю, что оно так же синонимично. Из этого, думаю, можно сделать абсолютно неправдоподобный вывод: pdftops перед преобразованием расшифровывает PDF!

Потом взял, да и сделал ход конём :=) Запустил Distiller, и получил из этих двух PS файлов два PDF файла. Размер файлов различается на 1 байт (что — тьфу, такая малость).

Следом за этим еще раз преобразовал полученные из Distiller’а PDF файлы в PS файлы с помощью pdftops. Размер совпал, содержимое не проверял, но вряд ли оно разнится.

Ну вот, потом с помощью FontExtract_0_05.exe извлек шрифты соответственно из PS файлов, которые были получены сразу, и из PS файлов, сделанные после Distiller’а. Вот во втором случае CID шрифты были получены по отдельности, не в одном файле два шрифта, как ранее, и на что вы обратили внимание, а по одному, что и требовалось.

Но этим дело не закончилось. Открыл исходный PDF файл в Acrobat, напечатал его на PS принтер в файл, и затем хотел заново слепить PDF через Distiller. Ага, не тут-то было! Distiller обломился с сообщением, что поданный ему PS файл был получен из зашифрованного PDF, и он отказывается его обрабатываться. Ну, думаю, и черт с тобой, я тоже не лыком шит :=)

Открыл полученный ранее через тот же Distiller декриптованный PDF, напечатал его на PS принтер в файл, установив, что TrueType шрифты преобразовывать в Outline, то есть в Type1. Сразу следом за этим продистиллил файл, без проблем получил PDF, в котором все шрифты уже имеют формат Type1, который преобразовал в PS с помощью pdftops. Так как TrueType также CID, то этот PS еще раз преобразовал в PDF, который опять перевел в PS с помощью pdftops, и наконец извлек-таки все встроенные в него шрифты в Type1 формате.

Кернинга в извлеченных CID шрифтах нет и не будет, потому что это просто невозможно.

Итак, процедура извлечения любых типов шрифтов, каждый по отдельности.

I) Если в 1.pdf присутствуют CID шрифты в формате Type1, то его надо преобразовать в 1.ps с помощью pdftops, затем из 1.ps создать 1-2.pdf с помощью Distiller’а (в котором части CID шрифта будут представлены по отдельности), и получить 1-2.ps, из которого и извлекать шрифты с помощью FontExtract v0.05, которые и будут извлечены каждый по отдельности.

II) Если в 2.pdf присутствуют CID шрифты в формате TrueType, то его надо открыть в Acrobat, напечатать в 2.ps как в файл PostScript принтера, установив конвертировать TT в T1, получить 2-2.pdf с помощью Distiller’а (в котором уже все шрифты будут в формате Type1), преобразовать его в 2-2.ps с помощью pdftops, получить 2-3.pdf из 2-2.ps с помощью Distiller’а (в котором части CID шрифта будут представлены по отдельности), преобразовать его в 2-4.ps с помощью pdftops, и извлекать шрифты с помощью FontExtract v0.05, которые будут извлечены каждый по отдельности.

III) Если в 3.pdf присутствуют CID шрифты как в формате Type1, так и в формате TrueType, то процедура аналогична II).

----------
* * *

Модерирует : Ausw
Версия для печати • Подписаться • Добавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9