Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Archivist

Цитата:
Нужно удалить картинки размером 2049x2907, будет летать.

Супер! Работает! Спасибо!
Но пока что не могу понять как это работает. Т.к. с теорией не совпадает. Пробую разобраться.
 
pdfimages извлекает 4 картинки из взятой наугад страницы - 3 jpx и 1 jb2
jb2 - по теории должен быть буковками - маска - прорези ? Его вообще можно посмотреть отдельно?
jpx на сотню килобайт - это иллюстрация (единственное что однозначно понятно)
jpx как бы белого цвета - это подложка под текст (тоже вроде понятно)
jpx как бы черного цвета - это цвет самого текста - ?
Текст, который остается после удаления белого и черного JPEG2000 - это текстовый слой после OCR?
 
Пока замечу только, что некоторые изменения в тексте могут быть сюрпризом.
 


Никому верить нельзя. "jpx как бы черного цвета" - это то, что показывает XnView. А если этот JPEG2000 извлечь с преобразованием в png - получим эти самые буковки.
 



Цитата:
Текстовый слой здесь выглядит самодостаточным

Текстовый слой здесь имеет несовпадения с оригиналом. Сколько их и насколько они критичны - хз. Чтобы это узнать надо вычитать весь текст в сравнении с оригиналом.

Всего записей: 728 | Зарегистр. 04-11-2019 | Отправлено: 20:04 05-02-2023 | Исправлено: jourmager, 20:38 05-02-2023
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Удаляю в этом файле картинку и текст, размер практически не меняется, как его ужать, что там занимает размер?
https://wdfiles.ru/7b96894

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 00:11 06-02-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan

Цитата:
Удаляю в этом файле картинку и текст, размер практически не меняется, как его ужать, что там занимает размер?

Этот pdf-файл имеет размер 2,206,911 байт.
pdfimages извлекает из него jpg-файл размером 2,117,500 байт.
Если при удалении картинки размер не меняется, значит картинка не удаляется, а просто перестает отображаться.
 

Всего записей: 728 | Зарегистр. 04-11-2019 | Отправлено: 00:48 06-02-2023
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Если при удалении картинки размер не меняется, значит картинка не удаляется, а просто перестает отображаться

 
А как удалить?
Удалял в PDF-XChange Editor - параметры - контент, удалил и текст и картинку.

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 01:33 06-02-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan
Не понял. Вам удалить надо или уменьшить размер?
Если уменьшить размер, то в PDF-XChange Editor -> save as optimized ->  
-> Make compatible with version 1.7
-> Grayscale Images -> Compression jpeg или jpeg2000 medium
dpi не трогать
 
Размер уменьшится до 1,391,781 джипег или 895,678 джипег2000

Всего записей: 728 | Зарегистр. 04-11-2019 | Отправлено: 01:52 06-02-2023
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
Удалить что бы наложить текст на оригинальный файл, этот сжатый, я "пустой" файл попытался уменьшить, он не уменьшился.
 
 

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 02:04 06-02-2023
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Обычно редакторы PDF при удалении/изменении контента, для скорости, не удаляют старый контент, а просто дописывают новый в конец PDF файла и переставляют ссылку на него. Таким образом, при наличии большого числа мелких правок, файл может непомерно раздуваться. Помогает, как сказано выше, оптимизация, или простое пересохранение с другим именем, например, в акробате.

Всего записей: 4556 | Зарегистр. 18-09-2018 | Отправлено: 09:18 06-02-2023 | Исправлено: MBK2, 09:19 06-02-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan, у меня при удалении изображения размер файла уменьшается - 88,333 bytes
 
MBK2, есть даже специальная программа которая показывает эти изменения.
 

Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 10:38 06-02-2023
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
fc ?

Всего записей: 4556 | Зарегистр. 18-09-2018 | Отправлено: 10:58 06-02-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan
0) PDF_XChange Editor именно на этом файле при удалении картинки не выкидывает нафиг изображение из файла, а перемещает его в Document Overheadsю Почему - хз.
Если нельзя в лоб, идем в обход.
1) В PDF-XChange создаем новый pdf-файл с размерами, идентичными размерам файла донора.
В новый файл копируем изображение и текст из старого файла.
Сохраняем новый.
Удаляем из нового картинку.
Вуаля.
2) Применяем пробегавший в этой теме портативный PDF Watermark Remover. Он выкидывает картинку, но оставляет изображение в 1 пиксел. Это изображение удаляем с помощью PDF-XChange, пара лишних байт в Document Overhead погоды не сделают
3) можно заморочиться с консольной cpdf, но зачем?
4) можно подождать пока кто-то предложит Acrobat + PitStop или ещё десяток вариантов другого софта
 
los
У вас за 12 часов 2-й абсолютно бесполезный пост. Лень написать какими программами и как именно добились того или иного эффекта? А ведь раньше так и сыпали cpdf, pdf-tools, pdftron, xpdf, qpdf, ghostscript и не просто так, а с примерами. Особенно умилял pdftron с pdf-tools которые платные и фиг где ломаные достанешь.

Всего записей: 728 | Зарегистр. 04-11-2019 | Отправлено: 12:13 06-02-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Лень написать какими программами и как именно добились того или иного эффекта?

pdfoptimize -ri 7b96894.pdf out.pdf
но можно и другими программами.
 
P.S.
pdfoptimize от pdf-tools
 
Добавлено:
Если дополнительно обработать 'cpdf -squeeze' размер уменьшится еще процентов на 20.

Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 12:31 06-02-2023
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Archivist

Цитата:
Если документ жутко тормозит, значит он активно использует jpeg2000.  
Нужно удалить картинки размером 2049x2907, будет летать.

В данном случае, в документе от antobog https://dropmefiles.com/jmGNY, тормоза при просмотре от маски JBIG2 (с прорезями символов) с явно завышенным разрешением 12297x17439 px (1800 dpi). В чуть меньшей степени - от цв. иллюстраций (фото) в jpeg2000 600 dpi.

Всего записей: 2794 | Зарегистр. 31-05-2010 | Отправлено: 19:05 06-02-2023 | Исправлено: ComboFZ, 14:30 10-02-2023
Meer



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
 
Этот файл 420 страниц. Какой тулзой можно сделать его легче?

Всего записей: 1103 | Зарегистр. 12-08-2007 | Отправлено: 22:23 06-02-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
тулзой можно сделать его легче?

не тулзой. просто Delete на клавиатуре.

Всего записей: 3048 | Зарегистр. 15-07-2010 | Отправлено: 22:27 06-02-2023
Meer



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
не тулзой. просто Delete на клавиатуре.
Ладно... это самое простое!
PDF Optimizer-ом можно?

Всего записей: 1103 | Зарегистр. 12-08-2007 | Отправлено: 22:31 06-02-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Meer

Цитата:
Какой тулзой можно сделать его легче?

1) ИМХО лучший редактор pdf, имеющий мощные функции сжатия файлов - PDF-XChange Editor - ищем в варезнике портативную версию
2) ИМХО лучшая специализированная программа сжатия pdf-файлов - Orpalis PDF Reducer - ищем в варезнике портативную версию
3) Софт с названием просто только "PDF Optimizer"
а) не заслуживает доверия в принципе, также как блоки питания фирмы Super Power
б) вообще непонятно о чем речь, потому что весь софт этой направленности имеет названия типа Optimizer, Reducer, Resizer, Compressor с указанием фирмы производителя  
4) Приведенные выше программы - это не однокнопочные решения и требуют понимания процесса
5) однокнопочное решение Free PDF Compressor

Всего записей: 728 | Зарегистр. 04-11-2019 | Отправлено: 22:49 06-02-2023 | Исправлено: jourmager, 22:53 06-02-2023
Meer



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager Спасибо!
Файл 444 Мб
Сжал Free PDF Compressor-ом - 225 Мб
Онлайн pdf2go.com в среднее качество - 144Мб
минимальное качество - 58 Мб
Для .pdf:
27 инструментов онлайн https://www.pdf2go.com/ru
75 инструментов онлайн https://tools.pdf24.org/ru/all-tools
 
 
Добавлено:
Free PDF Compressor-ом выбрал:
   
Онлайн pdf2go.com выбрал:
 

Всего записей: 1103 | Зарегистр. 12-08-2007 | Отправлено: 05:57 07-02-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ

Цитата:
маски JBIG2 (с прорезями символов) с явно завышенным разрешением 12297x17439 px (1800 dpi)

А какие программы вы использовали, чтобы это найти?

Всего записей: 728 | Зарегистр. 04-11-2019 | Отправлено: 09:41 07-02-2023
antobog

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Это MRC с подложенным OCR - проще переделать, чем поправить, но кому это надо?.. ))

slava_kry Как именно переделать? Имеется в виду разобрать книгу на изображения, заново обработать в Scan Tailor и пересобрать в djvu/pdf?
 

Цитата:
Нужно удалить картинки размером 2049x2907, будет летать. При этом иллюстрации останутся. PitStop (или форумчане с этим плагином) в помощь.
Как более простой, но сомнительный вариант - удалить вообще все картинки одной кнопкой. Получится шустрый документ на 1.5 мегабайта

Archivist Подскажите, пожалуйста, на примере XChange, на какие кнопки надо нажимать, чтобы удалить картинки одной кнопкой, но чтобы все иллюстрации при этом остались на месте. Ну или как в XChange можно быстро обнаружить эти тяжёлые картинки? Я попробовал через контекстное меню выделить все изображения, затем Del. Остался только текстовый слой (с многочисленными ошибками распознавания разумеется) без иллюстраций. А эта медицинская книга без иллюстраций и с кривым текстовым слоем превращается в мусор. Там смысл как раз в иллюстрациях.  
 

Всего записей: 92 | Зарегистр. 26-08-2012 | Отправлено: 09:53 07-02-2023
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Как именно переделать? Имеется в виду разобрать книгу на изображения, заново обработать в Scan Tailor и пересобрать в djvu/pdf?

Да, нормально сделать книгу с самого начала, т.к. тут применяли MRC, а после неё хрен разберёшься со всеми вывертами технологии.
 
...Это всё сделали ради "однокнопочной" технологии создания приемлемого ПДФ из скана... Как и CS - ClearScan.
Но там такие грабли в обоих технологиях, что от них пришлось отказаться.
 
Самая большая проблема - это нормальный сегментатор. И его до сих пор нет, хотя возможность есть.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4308 | Зарегистр. 18-09-2003 | Отправлено: 10:46 07-02-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru