Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
feuerloescher



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вообще 1 потому, что обрезают просто меняя page boxes и дублируя страницы если нужно, о полиграфии в 90% случаев думают врядли, и даже там желание что-то исправлять в 90% обычно не норма.
2. Непонятно откуда изображение и почему разжимается, может его вообще нет?

Всего записей: 7353 | Зарегистр. 29-06-2004 | Отправлено: 08:43 26-02-2023
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrea
-Просто банально - уменьшить размер страницы это поправить пару цифр в боксах, а корректно обрезать их содержимое под новый формат - невероятно сложный матан, необратимо деструктивный и, вдобавок, не всегда корректно отрабатывающий.
-Возможно, пострадает, см. выше.
-Скорее всего, нет, чаще всего, разделение страниц тоже достаточно простая операция, хотя, возможны определенные нюансы, когда страницы взаимозависимы.

Всего записей: 4570 | Зарегистр. 18-09-2018 | Отправлено: 09:27 26-02-2023 | Исправлено: MBK2, 09:30 26-02-2023
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
2. Непонятно откуда изображение и почему разжимается, может его вообще нет?

Когда лезешь в уже готовый файл, где всё пожато в JPEG2000 на максимальном сжатии, то при попытке "порезать" изображение (из каких-нибудь соображений) просто распаковывается и вместо 1 мегабайта получаешь мегов 20-30.
Это не про полиграфию, а про оцифровку книг и журналов и попытке всё сделать однокнопочной технологией.
Обычно из-за этого возникают такие вопросы.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4309 | Зарегистр. 18-09-2003 | Отправлено: 09:58 26-02-2023
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
slava_kry
Так вы и уточняйте характер содержимого PDF файла.
Если содержимое - сканированный растр, завернутый в JPEG, то операция обрезки технически гораздо проще, чем обрезка разнородного векторного содержимого. Однако, в этом случае она однозначно деструктивна и необратимо теряет качество изображения по понятной причине (еще одно пережатие с потерями) Что касается "разжатия", то, полагаю, дело в кривизне рук, ибо сжатие результирующего изображение должно настраиваться (к сожалению, за счет качества) Sad but true

Всего записей: 4570 | Зарегистр. 18-09-2018 | Отправлено: 10:34 26-02-2023
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Так вы и уточняйте характер содержимого PDF файла.

Зачем?
Это должен был делать задающий Andrea

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4309 | Зарегистр. 18-09-2003 | Отправлено: 10:44 26-02-2023
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
slava_kry
Тогда не надо навязываться ему в секретари и множить сущности, ибо, возможно, у него другой случай.

Всего записей: 4570 | Зарегистр. 18-09-2018 | Отправлено: 10:52 26-02-2023
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ваши выводы меня изумляют... Ну да ладно.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4309 | Зарегистр. 18-09-2003 | Отправлено: 11:48 26-02-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MBK2
это конечно всё оффтоп. Сорри.
Но slava_kry ни на миллиметр не вышел за заданные рамки вопроса. Вопрос был ни о чём, и следует это признать.  
У меня вообще была мысль ответить "а вас не интересует заодно, есть ли жизнь на Марсе? А то как-то широко копаете тему. По типу "а не повлияет ли нажатие кнопки клавиатуры на что-нибудь?" - вероятно да, но может быть и нет... "
 
Andrea, вам невозможно ответить адекватно, нет конкретики, сужающей вопрос до однозначности.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 11:49 26-02-2023
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
1. Вопрос изначально был лишен конкретики, поэтому и мой ответ был для общего случая.
2. slava_kry высказал опасения по своей собственной конкретике (возможно, отличной от исходного вопроса), при том, ЧСХ, не озвучив ее.
3. Озвучил он ее после последовавшего всеобщего недоумения, после чего ответ был дан касаемо уже его озвученного кейса
4. На что он технично сьехал с базара, мол, мапед не мой и я никакого отношения к исходному вопросу не имею, а просто мимокрокодил
...
 

Всего записей: 4570 | Зарегистр. 18-09-2018 | Отправлено: 12:08 26-02-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
нда... формальной логикой нынче мало кто владеет... видать, неспроста AlVaKo хороший учебник недавно оцифровал.
ОК! Учту.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 12:16 26-02-2023
Andrea



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
slava_kry

Цитата:
Это должен был делать задающий Andrea

TelecomUral

Цитата:
вам невозможно ответить адекватно, нет конкретики, сужающей вопрос до однозначности

Разбираю коллекцию техлитературы, содержимое разное. Если попадаются сдвоенные страницы (содержащие 2 объединённые в одну), разделяю их по вертикали. Поля обрезаю в редких случаях. Действительно - заметил, что после удаления обрезанного содержимого из отсканированных книг/журналов (экспериментировал на копиях), размер файлов увеличивался, поэтому отказался от идеи удаления из них обрезанного содержимого, появившегося, как я понял, в результате разделения страниц. Но также попадаются PDF книги изначально E-Book, содержимое которых представляет собой полностью сдвоенные страницы (как эта, например). При этом в "свойствах файла" в редакторе "начальный просмотр - макет страницы" всё стоит "по умолчанию". Приходится тогда все страницы пополам разделять по вертикали, в результате файл увеличивается в размере. Но после удаления из такого файла обрезанного содержимого, его размер уменьшался. Визуально, качество схем и рисунков не страдало, но не всё ведь заметишь... В основном интересует, можно ли без опасений потери качества удалять обрезанное содержимое, появившееся в результате разделения страниц, из таких (E-Book) файлов (полиграфия не интересует, только отображение на экране)

Всего записей: 1094 | Зарегистр. 24-12-2015 | Отправлено: 12:41 26-02-2023 | Исправлено: Andrea, 13:02 26-02-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrea

Цитата:
- Для чего после обрезки страниц в большинстве программ-редакторов (напр., в PDFXCEditor) по умолчанию сохраняется обрезанное содержимое (что в частности приводит к увеличению размера файла после обрезки)?

1) Пользователь может передумать. Это аналог Undo Ctrl+Z
2) Обрезанная часть страницы может нести дополнительную информацию, не нужную для обычного просмотра, но важную для других целей (например, копирайт)
3) Чтобы избежать ухудшения качества при повторном сжимании изображений типа jpg

Цитата:
- Не пострадает ли качество/отображение pdf-документа после удаления из него обрезанного содержимого?

4) Если pdf используется как контейнер для изображений типа jpg, то - да, качество пострадает, т.к. jpg - это формат изображений со сжатием с потерей качества, т.е. каждое изменение исходного изображения ведет к пересжиманию и, соответственно, к ухудшению качества изображения. Насколько пострадает качество - может определить человек визуально или можно программным путем с помощью метрик типа PSNR или MS-SSIM.
5) Если pdf используется как контейнер для изображений, где формат не предусматривает сжатие с потерями (BMP, PNG, TIFF, CCITT Group 4 и 3, RLE (Run length), LZW, ZIP), то - нет, не пострадает
5а) Сложно с форматами, которые допускают сжатие как с потерями, так и без - JPEG2000, WebP, JBIG2
6) Если pdf основан на векторных шрифтах и изображениях, то - нет, не пострадает

Цитата:
Сохраняется ли в pdf-файле обрезанное содержимое или иная избыточная информация после разделения страниц документа?

7) Это зависит от настроек программы и выбора пользователя (в нормальных программах).
А вообще-то вопрос некорректный. "Обрезанное содержимое" - это вторая половина разворота, т.е. она должна сохранятся в любом случае - как левая и правая страницы.
7а) Ненужная часть разворота просто не отображается, т.е. обрезанная часть сохраняется. В таком случае в pdf вообще могут быть 2 копии одного разворота - одна с отображаемой левой частью и "обрезанной" правой, другая - наоборот. В этом случае размер файла pdf может вырасти до 2 раз.
7б) Разворот физически разделяется на 2 части. См. п.4-6
8) А ещё есть pdf с MRC ...

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 12:56 26-02-2023 | Исправлено: jourmager, 13:54 26-02-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrea

Цитата:
(как эта, например).

 
Морган Д. Ламповые усилители (2007).pdf - 9,059,444 bytes
Разбивка постранично с помощью программы mutool(MuPDF)
mutool poster -x 2 Морган\ Д.\ Ламповые\ усилители\ \(2007\).pdf out.pdf
 
out.pdf - 9,202,795 bytes
затем можно выполнить
cpdf -squeeze out.pdf -o new.pdf
получите
new.pdf - 8,744,475 bytes

Всего записей: 7336 | Зарегистр. 08-09-2001 | Отправлено: 13:09 26-02-2023
73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrea
Цитата:
Но также попадаются PDF книги изначально E-Book, содержимое которых представляет собой полностью сдвоенные страницы (как эта, например)
Просю, проверяй, размер почти в два раза меньше, хотя никаких сжатий и прочего не было. Всего лишь стандартные операции в Акробате с плагином.
https://www64.zippyshare.com/v/6ibau0dP/file.html

Всего записей: 1150 | Зарегистр. 18-08-2012 | Отправлено: 14:18 26-02-2023
Andrea



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
73
При анализе этого оригинального файла в PDFXCEditor (там, где функция оптимизации -> проверка использованного места) выводится информация, что издержки данного документа составляют целых 4,57 мб - т.е свыше 50% от объёма файла. Вот как бывает с PDF E-Book. Кстати, что такое по-научному "издержки PDF документа" (лично я по-простому понимаю это как избыточные, не несущие абсолютно никакой полезной информации, данные)?

Всего записей: 1094 | Зарегистр. 24-12-2015 | Отправлено: 15:03 26-02-2023 | Исправлено: Andrea, 15:28 26-02-2023
73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrea
Цитата:
"издержки PDF документа"
Не понимаю русский язык в исполнении русефекализаторов. Мне бы примитивный английский, без выеживаний. Вот поэтому серьезные программы обязаны быть на английском, из переводчиков 99% не знают свой родной язык, не говоря уже об иностранном в части терминов.
 

Всего записей: 1150 | Зарегистр. 18-08-2012 | Отправлено: 15:38 26-02-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
73

Цитата:
Всего лишь стандартные операции в Акробате с плагином.

Результат впечатляет. Удалены Document overhead на 4 МБ при исходном размере файла 9 МБ.
Поделитесь, пожалуйста, какой версии Акробат, какой плагин и какой версии, и в 2 словах какие кнопочки нажимать.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 15:40 26-02-2023
73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
 
Портабельный Акробат 10.1.7, плагин Evermap AutoPagex, резка пополам (2-я строка), удаление двух пустых страниц, сохранение в PostScript, передача в акробатовский Дистиллер. Все.
 

Всего записей: 1150 | Зарегистр. 18-08-2012 | Отправлено: 15:50 26-02-2023 | Исправлено: 73, 15:52 26-02-2023
Andrea



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Результат впечатляет
Точно такой же результат (за исключением обрезки сдвоенных страниц пополам, что можно сделать отдельно в другой опции) позволяет получить PDFXCEditor, которым я пользуюсь ("Файл -> Сохранить оптимизированную копию"). В настройках выбираете необходимое, перед операцией можно запустить анализ файла, чтобы увидеть, сколько в нём места занимают изображения, потоки, издержки и т.д.
Добавлено:
73

Цитата:
Не понимаю русский язык в исполнении русефекализаторов
По-английски, это "Document Overhead" - дословно "Накладные расходы документа". Но что же это означает, по-русски?

Всего записей: 1094 | Зарегистр. 24-12-2015 | Отправлено: 15:56 26-02-2023 | Исправлено: Andrea, 16:27 26-02-2023
73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrea
https://acrobatusers.com/forum/pdf-creation/reducing-pdf-file-size-what-document-overhead/

Всего записей: 1150 | Зарегистр. 18-08-2012 | Отправлено: 16:39 26-02-2023 | Исправлено: 73, 16:49 26-02-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru