Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
papaVlad

Цитата:
Не понимаю, как собираетесь извлечь оригинал из пдф, если он уже изменён при попадании в пдф?

Программа китайца не изменяет оригиналы, чем и ценна. Формат PDF тут выступает контейнером и позволяет много чего виртуально делать с картинками (масштабирование, обрезка, поворот на произвольный угол итд). Специально для вас детально сравнил предоставленные входные и экспортированные (с помощью pdfimages) из PDF жпеги, совпадает вся информация от размера в байтах и dpi до контрольной суммы MD5.
 

Цитата:
значит опять не подойдёт

Тогда замените в батнике вызов jpeg2pdf на ту программу, к которой привыкли, с соответствующими параметрами.
 
Когда в следующий раз будете переделывать документы Антона, просто извлекайте оригинальные 300dpi жпеги (батник для этого приведен в сообщении чуть выше) и пересобирайте по своему вкусу без перекодирования. А если с перекодированием, то заодно с приведением страниц к общему размеру, цветокором и прочей обработкой - тогда точно все будет в лучшем виде

Всего записей: 326 | Зарегистр. 10-08-2018 | Отправлено: 09:28 16-12-2022
papaVlad



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
в пдф не существует "dpi"

Хорошо, называйте любым термином, я имею ввиду те значения, которые PDF-XChange называет "dpi", на которые ориентируется и которые считывает FineReader, тоже называя "dpi" и которые предлагает исправить на более правильные цифры, если обработчик или его программа накосячили, иначе распознавание будет менее точным.

Цитата:
и выловите правильные настройки (ключи).

Возможно, что нужного ключа просто нет, иначе бы уже показали.
 
MBK2

Цитата:
В PDF же, как было сказано выше, разрешение выставляется извне, путем привязки к растровому изображению матрицы трансформации, которая берется от балды или из командной строки.

Всё грамотно написали, только мне не нужно объяснять, объясните это тем программам и тем людям, которые не могут или не хотят сохранить заложенные "dpi" (здесь можно использовать любую понятную терминологию), чтоб при просмотре пдф можно было видеть настоящие размеры, как это показывают к примеру Акробат, XChange, Foxit,... опустив мышь в левый нижний угол.
Например, у нашего знакомого towik'а, все страницы во всех файлах всегда одинаковой ширины 209,91 мм, хоть газета, хоть книжечка, видимо у него такой специальный ключ, и я всего лишь хочу рассказать или, выражаясь Вашими словами, понятно объяснить, что существуют альтернативные способы создания пдф, где "dpi" (здесь можно использовать любую понятную терминологию) не искажён, и размеры страниц соответствуют бумажным размерам издания. Пусть размеры слегка пляшут из-за неровной обрезки, но газеты должны быть около формата а2-а3, журналы а4, книги а5.
 
Archivist

Цитата:
Специально для вас детально сравнил предоставленные входные и экспортированные (с помощью pdfimages) из PDF жпеги, совпадает вся информация от размера в байтах и dpi до контрольной суммы MD5.

Искренне рад, что существует такая программа, у меня такой нет, но всё-равно на душе легче стало
 
На доп.обработку сканов забил, завален по уши, отдать бы хоть в каком виде.

Всего записей: 161 | Зарегистр. 22-04-2012 | Отправлено: 10:47 16-12-2022
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
papaVlad,
$ jpeg2pdf -o out.pdf in.jpg
$ pdfimages -all out.pdf out
 
$ sha256 in.jpg out-000.jpg
SHA256 (in.jpg) = 550fe7e38ffd082183ae9f341ced29fe7b49a0ed56f4c108f7759b18a3962331
SHA256 (out-000.jpg) = 550fe7e38ffd082183ae9f341ced29fe7b49a0ed56f4c108f7759b18a3962331

 
jpeg2pdf - не единственная программа подобного типа.

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 11:06 16-12-2022 | Исправлено: los, 11:07 16-12-2022
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 
Всё грамотно написали, только мне не нужно объяснять, объясните это тем программам и тем людям, которые не могут или не хотят сохранить заложенные "dpi" (здесь можно использовать любую понятную терминологию), чтоб при просмотре пдф можно было видеть настоящие размеры, как это показывают к примеру Акробат, XChange, Foxit,... опустив мышь в левый нижний угол.

Настоящие размеры чего? Если в исходной растровой картинке разрешение dpi вообще не задано? (к слову говоря, это вовсе не обязательный параметр для растровых графических форматов)

Всего записей: 4548 | Зарегистр. 18-09-2018 | Отправлено: 12:06 16-12-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MBK2

Цитата:
Если в исходной растровой картинке разрешение dpi вообще не задано?

не надо усложнять

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 12:20 16-12-2022
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Вы просто, ради интереса, возьмите любую jpeg картинку, в т.ч. извлеченную из PDF и посмотрите, какое dpi у нее встроено и встроено ли вообще. А потом пересчитайте реальные размеры этой картинки исходя из данного значения.

Всего записей: 4548 | Зарегистр. 18-09-2018 | Отправлено: 13:50 16-12-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MBK2
не раз делал.
Я просто к тому, что вряд ли у papaVlad сканы без вписанного dpi. Они же со сканера.  

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 14:13 16-12-2022
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Судя по его посту выше, он не особо четко представляет собой, что вообще означают три веселых буквы "DPI"

Цитата:
 
Хорошо, называйте любым термином, я имею ввиду те значения, которые PDF-XChange называет "dpi", на которые ориентируется и которые считывает FineReader, тоже называя "dpi" и которые предлагает исправить на более правильные цифры, если обработчик или его программа накосячили, иначе распознавание будет менее точным.
 


Всего записей: 4548 | Зарегистр. 18-09-2018 | Отправлено: 15:14 16-12-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MBK2

Цитата:
что вообще означают три веселых буквы "DPI"

 
ну, это да. Пассаж про "объясните программам" вне конкуренции.
 
papaVlad
у Dmitry7 на форуме ершовки шикарная подпись под сообщениями: "хочешь сделать хорошо - сделай сам".
Вам придётся научиться разбираться и с ключами и с программами. Такова специфика термина "dpi".
 
Заинтересовали, повозюкаюсь тоже, вечерком.
 
UPD
программка от 2005 года от davince.com прекрасно отрабатывает через GUI разнообразные джипеги. У меня нет претензий к её логике, физические размеры в акробате отображаются такими, какие они в реальности были при сканировании. Даже вариант без вписанного дпи учелся адекватно - как 72dpi.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 15:56 16-12-2022 | Исправлено: TelecomUral, 17:22 16-12-2022
papaVlad



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Спасибо за поддержку, но мне новые ключи не понадобятся, как-нибудь по старинке, в проверенных программах, с сохранением dpi.
Конечно слегка офигел, что отменили термин "dpi" для пдф, но спасибо хоть не запретили.
В общем, я и так уже не настаиваю на соблюдении тех норм, о которых лет 15 пеклись оцифровщики, просто обидно, что всё перечёркнуто в одно мгновение и наступил новый период "делай как хочу, лишь бы делалось", ну чтож пусть так, палки не ставлю, ещё бы поменьше болтовни и понимания задачи с полуслова, этим на руборде отличается ComboFZ, ни одного лишнего слова, всё в точку и по делу.

Всего записей: 161 | Зарегистр. 22-04-2012 | Отправлено: 17:36 16-12-2022
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот же упрямый какой попался, ему - "бритое", а он "нет, стриженное!"

Цитата:
Конечно слегка офигел, что отменили термин "dpi" для пдф, но спасибо хоть не запретили.

Никто его не отменял, как вы не понимаете, что для векторного формата хранения информации, коим PDF является, термин "DPI" ни малейшего смысла не имеет. Ну например, в PDF рядом (возможно и один поверх другого" может быть два растрового изображения с разными DPI. А может быть еще веселее - растровая картинка, у которой встроенное DPI не совпадает с фактическим или вообще трансформированная так, что само понятие "DPI"  cмысл теряет ибо точка не прямоугольная становится.

Всего записей: 4548 | Зарегистр. 18-09-2018 | Отправлено: 17:45 16-12-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
papaVlad
к слову - да, ваше первоначальное желание я и позабыл. Сорри. Кучу джипегов в кучу папок.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 17:54 16-12-2022
lyolik r

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los

Цитата:
jpeg2pdf - не единственная программа подобного типа.

 
А какие еще консольные, к примеру nconvert так не умеет, без изменений

Всего записей: 459 | Зарегистр. 26-05-2012 | Отправлено: 18:23 16-12-2022
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
lyolik r

Цитата:
А какие еще консольные, к примеру nconvert так не умеет, без изменений

DocPub от pdftron _www.pdftron.com, jpegtopdf _https://github.com/sgerwk/jpegtopdf, есть еще программы на python и perl, названия сейчас не упомню.
 
Добавлено:
P.S.
Сейчас проверил тоже нормально справляются
_https://github.com/aarzilli/convert2pdf
_https://github.com/Quantaly/jpeg-to-pdf

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 20:33 16-12-2022
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
lyolik r
los
Есть еще любопытный проект img2pdf - https://gitlab.mister-muffin.de/josch/img2pdf
Умеет паковать в PDF без потерь не только JPEG, но и JPEG2000, PNG (без альфа-канала), TIFF (CCITT Group 4).
Долгое время не было релиза под винду, теперь смотрю появился. Завтра буду изучать.

Всего записей: 326 | Зарегистр. 10-08-2018 | Отправлено: 00:44 17-12-2022
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Тут сейчас обсуждают разные программы для "конвертирования" изображений без преобразования в pdf. При этом разные программы делают pdf разных версий.  
PDF-XChange - 1.7, jpeg2pdf - 1.4, img2pdf - 1.3.
Может ли кто-то сказать, насколько критична версия pdf, если использовать pdf просто как контейнер для jpg-ов?
 
И ещё. Может ли кто-то сказать, где реально на практике заметно наличие или отсутствие у pdf свойства линеаризации Fast Web Page. Только без rtfm, пожалуйста. Теорию я и так знаю.

Всего записей: 715 | Зарегистр. 04-11-2019 | Отправлено: 01:45 17-12-2022
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
papaVlad
Вариант с img2pdf вроде бы дает нужный результат. В батнике меняете путь к программе и строку вызова:
 
%JPDF% --output "%%~ni.pdf" *.jpg
 

 
Мануал по параметрам - https://manpages.ubuntu.com/manpages/bionic/man1/img2pdf.1.html

Всего записей: 326 | Зарегистр. 10-08-2018 | Отправлено: 10:11 17-12-2022 | Исправлено: Archivist, 10:11 17-12-2022
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Archivist

Цитата:
Есть еще любопытный проект img2pdf - https://gitlab.mister-muffin.de/josch/img2pdf

Ее я и имел ввиду говоря о программе на python.

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 10:20 17-12-2022
papaVlad



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Archivist
Да, тоже посмотрел на паре журналов, пока без ошибок.
Спасибо!
 
Ещё бы разобраться с извлечением в jpg, о чём выше писали про файлы towik'а, чтоб dpi вернулся к исходным значениям внутри jpg, на примере https://dropmefiles.com/onaHk
 

Всего записей: 161 | Зарегистр. 22-04-2012 | Отправлено: 13:48 17-12-2022
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Ещё бы разобраться с извлечением в jpg, о чём выше писали

 
Нужна программа pdfimages.exe из сборника Xpdf Tools - https://dl.xpdfreader.com/xpdf-tools-win-4.04.zip
Батник для нее:
 

Код:
for %%i in (*.pdf) do (md "%%~ni"
pdfimages.exe -j "%%i" "%%~ni\out")  

 
В папку с батником помещаете программу и набор PDF, которые будут разбраны на картинки по папкам.
 
Добавлено:
papaVlad
По сборке в PDF. Благодаря примеру с файлом, содержащим точки в названии, нашел ошибку.
Вместо префикса ~n переменной нужно использовать ~nx, тогда будет работать с точками:
 

Код:
%JPDF% --output "%%~nxi.pdf" *.jpg
move "%%~nxi.pdf" %PDFolder%

 
Для разбора PDF это не нужно. Пользуйтесь.

Всего записей: 326 | Зарегистр. 10-08-2018 | Отправлено: 14:02 17-12-2022 | Исправлено: Archivist, 14:47 17-12-2022
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru