Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
vasyosuol 24

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Разобрался! Ваша строчка верная, а вот я старый пень а вот файло я взял изначально "не то" - в этом-то и вся была беда. Под Windows 2000 у меня заработало только это, т.е. версия 9.22. Всё, что "выше" - "не win32 без всяких" ((.
Благодарю!
 
73
Ваш экскрИмент, не говоря о том, что является здесь офтопиком, ещё и не умеет вообще ничего; не может, в частности, выводить в растр определённые страницы, да и вообще возможностей там - НИКАКИХ!  

Всего записей: 1101 | Зарегистр. 16-01-2013 | Отправлено: 22:03 02-06-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kot666

Цитата:
Дело в том, что эта информация просто хранится в PDF файле. Её можно попытаться извлечь SEDом.  

если вы знаете что извлекать - не вижу проблем.
sed $option $pattern file.pdf | uniq | wc -l

Всего записей: 7336 | Зарегистр. 08-09-2001 | Отправлено: 22:23 02-06-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vasyosuol 24 say:

Цитата:
 
Под Windows 2000 у меня заработало только это, т.е. версия 9.22. Всё, что "выше" - "не win32 без всяких"
 

 
Смотрите ecm-pecompat из ECM. Определённые проблемы совместимости "давит", но не все.
 
 
Добавлено:
los say:

Цитата:
 
если вы знаете что извлекать - не вижу проблем.  
 

 
zlib-flate в этой цепочке забыл. Вектор обычно во Flate кодирован.

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 22:29 02-06-2023
kot666



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
Цитата:
если вы знаете что извлекать - не вижу проблем.
Дьявол кроется в деталях. =)
Зачастую эту информацию, вместо перезаписи, просто дописывают дополнительным объектом. А вот понять, какой объект актуален, не вижу возможности.
Если он только один, то проблем нет.
Вот, как пример:
Старая запись
Код:
1187 0 obj
<< /Type 13 0 R /Frequency 124 /TransferFunction 20 0 R /Angle 82 /HalftoneType 1 /SpotFunction /SimpleDot /Esko_ExtHT
<< /DotName /C
>>
>>
endobj
Новая запись
Код:
15 0 obj
<< /Type 13 0 R /Frequency 124 /TransferFunction 20 0 R /Angle 82 /HalftoneType 1 /SpotFunction /SimpleDot /Esko_ExtHT
<< /DotName /HD05
>>
>>
endobj

Обе находятся в одном файле. =/

Всего записей: 406 | Зарегистр. 06-02-2006 | Отправлено: 00:12 03-06-2023 | Исправлено: kot666, 00:23 03-06-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kot666
мне попадались примитивные (учебные, наверное) программки которые показывают в консоли дерево объектов. В том числе с фильтрацией по номеру объекта. Типа, покажи где расположен объект 15 - и прожка построчно вырисовывает от оглавления и до 15го объекта всю структурку, кто кому родитель кто потомок. Но за давностью лет не припомню никаких подробностей. гуглил и пробовал заюзать чего только ни попадя, когда изучал стандарт пдф. Я думаю, подобные программки не редкость.
 
UPD
кстати, а неиспользуемый объект нельзя выкинуть оптимизацией?

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 06:33 03-06-2023 | Исправлено: TelecomUral, 07:08 03-06-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
 
неиспользуемый объект нельзя выкинуть оптимизацией?
 

 
 
Qpdf в помощь. Но не на 100%.
Можно попробовать также jPdf Tweak

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 09:40 03-06-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kot666, не особенно разбираюсь в формате pdf, но как мне кажется вы смотрите не туда:
q Q q 0 256 m 256 256 l 256 0 l 0 0 l h W* n 0.6 i /Cs1 cs 0 0 0 sc -1 257
Это для одного black
При изменении одинарного цвета меняются цифровые значения
cs 0 0 0 sc
А вот если изменить на градиент то будут изменены и другие значения
q Q q 0 256 m 256 256 l 256 0 l 0 0 l h W* n /Perceptual ri /Gs1 gs q 1 0 0 -1 0 256
 
 
TelecomUral

Цитата:
мне попадались примитивные (учебные, наверное) программки которые показывают в консоли дерево объектов.

Есть и консольные и графические.
 
 

Цитата:
кстати, а неиспользуемый объект нельзя выкинуть оптимизацией?

TelecomUral, zvezdochiot,
cpdf -squeeze in.pdf -o out.pdf
 

Всего записей: 7336 | Зарегистр. 08-09-2001 | Отправлено: 10:06 03-06-2023
vasyosuol 24

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Есть небольшой косячок, вылезло вот это:

Код:
Processing pages 1 through 1.
 
Page 1
 
Can't find CID font "Arial".
 
Attempting to substitute CID font /Adobe-Identity for /Arial, see doc/Use.htm#CIDFontSubstitution.
 
The substitute CID font "Adobe-Identity" is not provided either. attempting to use fallback CIDFont.See doc/Use.htm#CIDFontSubstitution.
 
Loading a TT font from %rom%Resource/CIDFSubst/DroidSansFallback.ttf to emulate a CID font Adobe-Identity ... Done.
 
Can't find CID font "Arial".
 
Attempting to substitute CID font /Adobe-Identity for /Arial, see doc/Use.htm#CIDFontSubstitution.

Шрифтов он не находит при преобразовании; картинка, соответственно, "ломается" ((.  
Как это лечить?

Всего записей: 1101 | Зарегистр. 16-01-2013 | Отправлено: 14:29 03-06-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vasyosuol 24

Цитата:
Шрифтов он не находит

заменой шрифта в редакторе пдф.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 15:19 03-06-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
 
заменой шрифта в редакторе пдф.
 

 
Зачем какой то дополнительный pdf-редактор, ежели в доке GhotScript прописано как делать подмену с примерами?:
 
https://ghostscript.readthedocs.io/en/latest/Use.html#explicit-cidfont-substitution

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 15:37 03-06-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ага. человек в пробелах путается, а вы ему предлагаете конфиги править, да параметры запуска настраивать. Нет уж, редактор проще и надёжнее.
 
Добавлено:
vasyosuol 24
и хорошо бы посмотреть на такой проблемный файлик.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 16:04 03-06-2023
vasyosuol 24

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
заменой шрифта в редакторе пдф.

Эт как?
 
zvezdochiot

Цитата:
Зачем какой то дополнительный pdf-редактор, ежели в доке GhotScript прописано как делать подмену с примерами?:  

Благодарю! Попытаюсь "вкурить". Спрошу, если что
 
TelecomUral

Цитата:
ага. человек в пробелах путается, а вы ему предлагаете конфиги править, да параметры запуска настраивать.

Даже если я один раз где-то запутался в пробелах (в конце дня, "задёрганный до усрачки"), это ещё не повод считать меня идиотом. Все мы люди, все мы ошибаемся...
Что до редактирования пдф... Я же писал раньше: мой вопрос представляет из себя часть большой задачи; по-русски говоря, вызов функции из другой программы. И пдф-ки там - разные, кто их править-то будет? Нет, не выход.

Цитата:
и хорошо бы посмотреть на такой проблемный файлик.

Да любой! Я взял вообще "первый попавшийся", доку от старого монитора:
https://www.upload.ee/files/15300450/200w6cs_00_dfu_eng.pdf.html
Потом брал другие файлы (уже для тех. задания) - тоже проблемы со шрифтами... Нет, проблему надо именно решать глобально, а не над конкретным файлом "измываться"...

Всего записей: 1101 | Зарегистр. 16-01-2013 | Отправлено: 16:57 03-06-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Даже если я один раз где-то запутался в пробелах (в конце дня, "задёрганный до усрачки"), это ещё не повод считать меня идиотом. Все мы люди, все мы ошибаемся...

да я и не считаю.
Просто когда-то аналогичные грабли со шрифтами я победить не сумел. Именно в GS. Запутался в особенностях шрифтовых файлов PostScript, потом не пошли русские буквы, потом растр вообще стал отображать фигню не с тем кеглем и не с той разрядкой. Я не разобрался в логике подстановок, а когда оказалось что замен нужно генерить свыше десятка - плюнул. Но у меня был один файл. Растеризовал экспортом из вьювера. Это было, конечно, очень давно.
 
Буду рад, если вы победите эту проблему системно, и здесь расскажете.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 17:22 03-06-2023
vasyosuol 24

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Просто когда-то аналогичные грабли со шрифтами я победить не сумел. Именно в GS.

О! Помните моё предыдущее сообщение? Вот это:

Цитата:
А GhostScript, IMHO, "болото". Или я готовить его не умею...

Просто где-то 20 лет назад... Был у меня в роте один х...

Цитата:
Буду рад, если вы победите эту проблему системно, и здесь расскажете.

Это вряд ли, к сожалению. Если только помогут. Здесь, или где ещё...

Всего записей: 1101 | Зарегистр. 16-01-2013 | Отправлено: 17:46 03-06-2023 | Исправлено: vasyosuol 24, 17:47 03-06-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
удолил

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 21:34 03-06-2023 | Исправлено: jourmager, 21:46 03-06-2023
useretail



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
jourmager
скорее всего поможет imagemagick

Всего записей: 4630 | Зарегистр. 14-09-2007 | Отправлено: 21:42 03-06-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
jourmager
скорее всего поможет

Помогает много всего.
А по теме - вот тут pdf-файл, сделанный из jpeg-ов, которые получены растеризацией исходного файла 200w6cs_00_dfu_eng.pdf с помощью GhostScript версии 8.54.
Подстава была сразу как минимум в 2 местах:
1) ГостСкрипты бывают разные, с разной комплектацией
2) исходный файл хотя и валидировался, но какой-то хитросделанный
P.S. на кой ляд я потратил час своего времени на абсолютно мне не нужную фигню?
Никаких новых знаний или умений я не получил, даже ЧСВ почесать не могу, ибо всё просто как двери.
 
TelecomUral

Цитата:
Буду рад, если вы победите эту проблему системно, и здесь расскажете.

Не знаю победил или нет, не знаю системно или нет.
Но расскажу ход действий.
Вспомнив с помощью гугла, что в 2000 году был такой себе GhostScript, я тут же нагуглил командную строку конвертирования pdf -> images. С трудом отыскал старую версию ГостСкрипта, и вот тут мне "повезло". Я скачал версию, с которой получилось. Но не сразу. ГостСкрипт вываливался с ошибками. Пришлось вспомнить command.com и команду cd чтобы увидеть ошибки. Не хватало какого-то файла ps. Тупо переписал его из соседнего с bin каталога. Ясен пень тут же стало не хватать другого ps файла. Плюнул и скопировал все файлы из lib. Заработало. Подсунул пару своих файлов и узбакоился.
И тут увидел ссылку на 200w6cs_00_dfu_eng.pdf. Конвертнул - пошло-поехало. Ура! Рано радовался - ехало только до 18 страницы. Подсовывал десяток своих самых разных true pdf - всё конвертировало без проблем. А этот обламывается. На каком-то этапе заметил, что шрифтов просют. А в моей инсталяшке ГостСкрипта как раз был каталог fonts. Ну вы понели. В конечном результате и этот файл сконвертировало в изображения - проверил face to face - вроде все на месте. Хотя у PDF-Xchange отвратительный параллельный просмотр.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 23:53 03-06-2023 | Исправлено: jourmager, 00:44 04-06-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
спасибо!  
Да, я примерно этим же путём тогда давно и шёл. Но восхотел чтоб применялся именно исходный шрифт, без подстановок.  
А подмена в gs.10, свежем, работает - там папка Resource/Font есть. И если скопировать весь Resource в gs.9, тоже начинает работать.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 03:31 04-06-2023
vasyosuol 24

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
С трудом отыскал старую версию ГостСкрипта,

Можно поделиться?
 
TelecomUral

Цитата:
А подмена в gs.10, свежем, работает - там папка Resource/Font есть.

В 9.22, который работает на Windows 2000, никакой папки Resource/Font нету ((.
 
useretail

Цитата:
скорее всего поможет imagemagick

У меня не сработало. Имеется ввиду что-то типа:

Код:
convert -density 400 file.pdf -scale 2000x1000 file.jpg
or
convert -density 600 file.pdf file.jpg

Не взлетело. Хотя и imagemagick, работающий под Windows 2000, в моих "запасах" нашёлся
Вы его сейчас в инетах найдите, ога!

Всего записей: 1101 | Зарегистр. 16-01-2013 | Отправлено: 08:59 04-06-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В 9.22, который работает на Windows 2000, никакой папки Resource/Font нету

https://disk.yandex.ru/d/QcCz28zsaCDfbA

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 10:29 04-06-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru