Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
73
Спасибо за ответ.

Цитата:
сохранение в PostScript, передача в акробатовский Дистиллер

Ага. Насколько я понимаю, было проведено "возвращение к истокам" для pdf, так сказать. И при этом всё лишнее отпало как шелуха.
При более тщательном рассмотрении увидел непонятные проблемы после такого переконвертирования через PostScript:
1) цвет шрифта поменялся с 0,0,0 на 35,31,32, т.е. стал более блеклым, т.е. читабельность ухудшилась.
2) качество картинок визуально ухудшилось, хотя dpi, размеры в пикселях, тип сжатия (CCITT Group 4) не поменялось. Размер отличается на один байт. Взял для примера страницу 743 (по книжной нумерации) - на примере формул это хорошо видно.
Andrea

Цитата:
Точно такой же результат ... позволяет получить PDFXCEditor, ("Файл -> Сохранить оптимизированную копию").

Пробовал. Включил всё, кроме изображений и шрифтов. Удалило 200 килобайт из Document overhead, а не 4 МБ как у 73

Цитата:
что такое по-научному "издержки PDF документа"

Первая же ссылка в гугле, перевод тоже его:
Накладные расходы документа — это все, что не попадает ни в одну из других категорий. Не анализируя ваш документ на уровне элементов PDF, невозможно сказать, что это такое.
 
Я очень сомневаюсь, что такое "научное" пояснение прояснило хоть что-то.

Всего записей: 715 | Зарегистр. 04-11-2019 | Отправлено: 17:27 26-02-2023 | Исправлено: jourmager, 17:32 26-02-2023
Andrea



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Удалило 200 килобайт

Не знаю, какие у вас настройки - у меня удалила все (пользуюсь версией 8.xx PDFXCE, т.к 9-я версия постоянно с ошибками). Если программа отображает 4,57 мб "Document Overhead" при анализе данного pdf-файла, значит сможет удалить все

Всего записей: 1087 | Зарегистр. 24-12-2015 | Отправлено: 17:51 26-02-2023 | Исправлено: Andrea, 18:00 26-02-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrea
Чудеса в решете. И какой у вас выходной размер и сколько осталось "Издержек"?

Цитата:
Не знаю, какие у вас настройки

Я же написал - "Включил всё, кроме изображений и шрифтов." - т.е. поставил 24 птички.
Пробовал 8-ю версию PDF-XChange - такой же результат - на выходе 9 МБ.


А вот Foxit PDF Editor Pro 12 удалил Document overhead почти весь - оставил 260 кбайт (в варианте через PostScript оставалось 300 кбайт) при таком же полном включении всех опций на удаление (набор опций несколько отлчается у Foxit и PDF-XChange). В Foxit-е на удаление Document overhead конкретно в этом файле повлияло включение опций Discard User Data -> Discard document information and metadata и Cleanup -> Optimize page content.

Всего записей: 715 | Зарегистр. 04-11-2019 | Отправлено: 18:06 26-02-2023 | Исправлено: jourmager, 19:21 26-02-2023
Andrea



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
читабельность ухудшилась

Цитата:
качество картинок визуально ухудшилось

Тоже заметил это, поэтому в своей коллекции оставил файл, оптимизированный в PDFXCE

Всего записей: 1087 | Зарегистр. 24-12-2015 | Отправлено: 18:07 26-02-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrea, проверьте этот
_https://workupload.com/file/RzRpv7cRJcq

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 18:34 26-02-2023
Andrea



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager, ошибся я, напутал, не ругайте строго - голову себе забил за последние 2 дня. Примерно такой результат получался в PDFXCE, когда стояла галка и на оптимизации изображений. Вначале разделил все страницы исходного дока пополам, затем две пустые страницы удалил и сохранил изменения. Полученный файл стал весить 11,2 Мб. Потом удалил обрезанное содержимое - файл стал весить 9,35 МБ. Затем запустил оптимизацию с настройками по умолчанию. Но также, оптимизацию этого файла ещё я проводил в Orpalis PDF Reducer - он позволял добиться ещё меньшего размера файла без видимых потерь кач-ва. Но почему PDFXCE не удаляет из этого файла "издержки" - непонятно, т.к. во многих других случаях "Document Overhead" им благополучно удалялись. Также были случаи с PDF E-Book файлами, когда все издержки из них удалялись, стоило лишь удалить из свойств дока сведения об авторе, заглавие, тему и ключевые слова. В общем, бывают разные заморочки

Цитата:
А вот Foxit PDF Editor Pro 12 удалил Document overhead почти весь
Качество отображения текста и картинок не пострадало?
los

Цитата:
проверьте этот
Этот тоже содержит "Document Overhead" (4,36 Мб). Плюс, PDFXCE выдал: "Обнаружена ошибка в таблице XREF", и предложил исправить файл. Но при визуальном просмотре всё отображалось нормально

Всего записей: 1087 | Зарегистр. 24-12-2015 | Отправлено: 19:36 26-02-2023 | Исправлено: Andrea, 20:20 26-02-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrea

Цитата:
ошибся я, напутал, не ругайте строго

Не буду ОК, повторяемость результата - тоже важно.

Цитата:
Качество отображения текста и картинок не пострадало?

После оптимизации Foxit-ом сначала визуально не увидел. Но потом сравнил 2 файла - исходный после разрезки в PDF-XChange и оптимизированный в Foxit и увидел мелкие различия почти на всех страницах. Сравнивал с помощью DiffPDF 2.1.3. Т.е. надо подбирать опции оптимизации, чтобы было 100%-совпадение. Сейчас на это, к сожалению, нет времени.
P.S. Попробовал разобраться почему Фоксит при любой оптимизации (в этом конкретном файле) и даже при её отсутствии что-то меняет в векторных шрифтах и картинках, но проблема оказалась настолько хитроумно воспроизводимой, что отложил это до лучших времен.

Всего записей: 715 | Зарегистр. 04-11-2019 | Отправлено: 20:40 26-02-2023 | Исправлено: jourmager, 00:55 27-02-2023
Andrea



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Непоняток с pdf-e-book-файлами порой встречается немало: сейчас вот попался файл, который почему-то распух в размере в несколько раз после удаления из его свойств имени автора. "Оптимизировал" его путём извлечения всех страниц в редакторе PDFXCEdit в новый файл

Всего записей: 1087 | Зарегистр. 24-12-2015 | Отправлено: 02:21 27-02-2023 | Исправлено: Andrea, 03:20 27-02-2023
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrea
Цитата:
...попался файл, который почему-то распух в размере в несколько раз после удаления из его свойств имени автора. "Оптимизировал" его путём извлечения всех страниц в редакторе PDFXCEdit в новый файл

 
Лучше, наверное, удалить автора в Акробате -> Сохранить как, размер не увеличится.
 
В предыдущем файле: Морган Д. Ламповые усилители (2007) испорчен шрифт Futura Condense в колонтитулах. Нужно, по возможности, исправить этот косяк.
 

Всего записей: 2791 | Зарегистр. 31-05-2010 | Отправлено: 06:32 27-02-2023 | Исправлено: ComboFZ, 06:34 27-02-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrea

Цитата:
сейчас вот попался файл

файл изначально раздутый, но и увеличение размера после удаления метаданных быть не должно, видимо программа в которой вы работаете не совсем хороша.

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 10:00 27-02-2023
Andrea



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
программа в которой вы работаете не совсем хороша
Да, похоже PDFXCEdit тупит - сейчас попробовал сделать то же в Акробате - файл после удаления из него метаданных не раздулся. Чудеса да и только!

Цитата:
Сохранить как, размер не увеличится
В Акробате он не увеличился, когда просто вышел из него, сохранив изменения

Всего записей: 1087 | Зарегистр. 24-12-2015 | Отправлено: 11:50 27-02-2023 | Исправлено: Andrea, 11:55 27-02-2023
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В Акробате он не увеличился, когда просто вышел из него, сохранив изменения

Вы, наверное, будете сильно удивлены, сохранив в другой файл

Всего записей: 4548 | Зарегистр. 18-09-2018 | Отправлено: 12:53 27-02-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrea
никаких чудес нет. пдф внутренне сложный формат, и нагородить у него внутри труднопонимаемых конструкций очень просто. Особенно при смене автора-создателя-редактора. Оптимизаторы не справляются.
Я бы на вашем месте вообще не заморачивался ужатием. Трудно контролировать потери, последствия неизвестны, выигрыш вообще непонять в чём. Один пдф, исходный, оставил бы оригиналом, а для полнотекстового поиска применил или внешний поисковик-индексатор (архивариус 3000, я слыхал, хорош) или предельно упрощенный дубль-пдф с голым текстом.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 12:56 27-02-2023
Andrea



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Я бы на вашем месте вообще не заморачивался ужатием
Иногда приходится заниматься оптимизацией. Например, сканы-исходники журналов "Радио", сохранённые в формате PDF и выложенные на торрентах, мало того, что имеют неадекватные размеры, ещё жутко тормозят при открытии и навигации по страницам - порой каждая страница загружается по минуте, и читать такую литературу становится невозможным. Но после оптимизации, файл приобретает приемлемые размеры и скорость его просмотра увеличивается - файл открывается почти мгновенно. В этом и состоит польза

Всего записей: 1087 | Зарегистр. 24-12-2015 | Отправлено: 14:01 27-02-2023 | Исправлено: Andrea, 14:05 27-02-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrea
аа! ну, это известная тема, malshin там перемудрил с компрессией. Я дежавюшки листаю, если надо.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 14:07 27-02-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Особенно при смене автора-создателя-редактора. Оптимизаторы не справляются.  

есть пример подобного файла у которого проблемы со сменой автора-создателя-редактора?

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 18:20 27-02-2023
Andrea



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
пример подобного файла у которого проблемы со сменой автора
Пример привёл я (см. выше). Данная проблема была замечена при использовании для удаления из него метаданных конкретно посредством PDFEXEdit v.8.0.340. Но эта проблема при использовании Acrobat отсутствовала. О чём это говорит? Видимо о том, что программы-редакторы с некоторыми файлами определённой структуры и особенностями поступают по-разному.
 
Так при анализе того файла становится очевидным, что
- Информация о его структуре занимает 21,87% от общего размера
- Издержки (Document Overhead) - 35,22%
- Потоки содержания - 31,22%
- Полезная информация - менее 4%
Такое, согласитесь, не часто встретишь

Цитата:
Вы, наверное, будете сильно удивлены, сохранив в другой файл
Вовсе не удивлён. Но когда всё окей, размер pdf-файла после удаления из него метаданных не увеличивается, независимо от того, просто ли выходишь из редактора с согласием внести изменения в файл, или же если сохраняешь его как..

Всего записей: 1087 | Зарегистр. 24-12-2015 | Отправлено: 18:47 27-02-2023 | Исправлено: Andrea, 19:28 27-02-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrea

Цитата:
О чём это говорит?

О том что именно та программа с которой вы работаете имеет проблемы, но никак не подтверждает высказанное мнение о том что со сменой "автора-создателя-редактора" возникают какие-то сложности в целом.

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 19:40 27-02-2023
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вовсе не удивлён. Но когда всё окей, размер pdf-файла после удаления из него метаданных не увеличивается, независимо от того, просто ли выходишь из редактора с согласием внести изменения в файл, или же если сохраняешь его как..

"Когда все окей" в переводе на суровый технический язык - файл только что создан и шаловливые ручки редакторов еще не лишили его девственности внесением всевозможных изменений. В этом случае метаданные находятся в конце файла и спокойно удаляются простым обрезанием.
Если же метаданные находятся в середине файла, то лишенный проблесков искусственного интеллекта акробат при очередном сохранении в тот же файл тупо копирует код без метаданных в конец. Это самое логичное обьяснение

Всего записей: 4548 | Зарегистр. 18-09-2018 | Отправлено: 19:53 27-02-2023
Andrea



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los, но при удалении метаданных этой же программой из множества других файлов, они не увеличивались в размере. Это факт, уж поверьте на слово. Но, как говорится, всё бывает однажды и впервые. И сегодня успешно удалял метаданные (бывает, что они отображаются кракозябрами, незачем они в техлитературе, а ещё бывают с рекламой от автора-распространителя посетить несуществующий уже сайт). Неужели Акробат безглючен и лишён каких бы то ни было ошибок?

Всего записей: 1087 | Зарегистр. 24-12-2015 | Отправлено: 20:06 27-02-2023 | Исправлено: Andrea, 20:17 27-02-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru