Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов (часть 1)

Модерирует : gyra, Maz

Maz (05-04-2025 09:00): Редактирование PDF файлов (часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Заменить/удалить текст (batch есть), в т.ч. кириллицу (не панацея!) - PDF Replacer
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, SoftMaker FlexiPDF, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: 73, 07:30 20-03-2025
Mavrikii

Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Greyleon

Цитата:
есть специфическая литература и на 600 с лишним страниц по диагонали расположена надпись. Хотелось бы понять - как её лучше убрать (если это возможн

у вас особенность в том, что это не текст, а картинка. и обычный текст и водяной знак - плохая картинка.

Всего записей: 16389 | Зарегистр. 20-09-2014 | Отправлено: 03:58 29-05-2024
Greyleon

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Jonmey
Большое вам спасибо!
 
 
Mavrikii
А как же там со слоями дела обстоят? - хочу всё-таки для себя потом научиться. Если бы было в углу, то справился бы. А на этом примере есть возможность или вряд ли? Распознавать и потом собрать заново столько страниц не так и просто. Поэтому такой вариант был бы самый сложным

Всего записей: 8297 | Зарегистр. 03-12-2016 | Отправлено: 04:03 29-05-2024 | Исправлено: Greyleon, 04:13 29-05-2024
MBK2

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Greyleon
У тебя просто отвратительного качества оригинал - текст сплющен с ватермаркой в растр низкого разрешения и дрянного качества. По хорошему, выкинуть нахрен или распознать, в противном случае, с сохранением растра и разрешения на автомате получится примерно такое дерьмо https://www.sendspace.com/file/pjkmn1

Всего записей: 5421 | Зарегистр. 18-09-2018 | Отправлено: 07:57 29-05-2024
Greyleon

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MBK2

Цитата:
У тебя просто отвратительного качества оригинал

Понял - сколько не мудри, но результат будет не очень. - там необходимо будет "дорабатывать" текст
А почему же он так изначально много весил этот файл? И тот файл, что скинул Jonmey можно сказать, что в 10 раз меньше - визуально качество не хуже

Всего записей: 8297 | Зарегистр. 03-12-2016 | Отправлено: 08:19 29-05-2024
MBK2

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Greyleon
Jomney тебе скинул векторный оригинал, а у тебя страница из изнасилованного, сплющенного и пережатого растрового римейка

Всего записей: 5421 | Зарегистр. 18-09-2018 | Отправлено: 08:27 29-05-2024
Greyleon

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MBK2
Понял так, что размер увеличен специально
 
Добавлено:
MBK2

Цитата:
текст сплющен с ватермаркой в растр низкого разрешения и дрянного качества

А слоёв то получается нет или есть?

Всего записей: 8297 | Зарегистр. 03-12-2016 | Отправлено: 08:29 29-05-2024
MBK2

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Greyleon

Цитата:
Понял так, что размер увеличен специально

При растрировании размер обычно увеличивается, но бывают исключения (очень сложная векторная графика).

Цитата:
А слоёв то получается нет или есть?

Какие слои? Плоский jpeg низкого разрешения до упора зашакаленный: https://i2.paste.pics/44beeb16b1ce5af52aac5fd2dd434b71.png?rand=PhzfjXi8Q7

Всего записей: 5421 | Зарегистр. 18-09-2018 | Отправлено: 09:17 29-05-2024 | Исправлено: MBK2, 09:18 29-05-2024
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Greyleon

Цитата:
А слоёв то получается нет или есть?

В твоем файле нет.

Всего записей: 7934 | Зарегистр. 08-09-2001 | Отправлено: 10:05 29-05-2024
Greyleon

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MBK2
los
Нужно будет подтянуть знания по "данному предмету"

Всего записей: 8297 | Зарегистр. 03-12-2016 | Отправлено: 20:25 29-05-2024 | Исправлено: Greyleon, 20:27 29-05-2024
LonerD



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Можно ли чем-то удалить (чем, как?) всякую лишнюю информацию, добавляемую в файл программой FineReader? Например, размер PDF до распознавания - 13 Мб, после - 28 Мб. Из полезной информации добавлено 700 Кб текстового слоя, изображения остаются не пережаты, просто раздут размер непонятно чем.

Всего записей: 900 | Зарегистр. 27-06-2006 | Отправлено: 19:17 19-06-2024
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LonerD, файл можете выложить?

Всего записей: 7934 | Зарегистр. 08-09-2001 | Отправлено: 20:25 19-06-2024
www_world

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LonerD

Цитата:
Можно ли чем-то удалить (чем, как?) всякую лишнюю информацию, добавляемую в файл программой FineReader? Например, размер PDF до распознавания - 13 Мб, после - 28 Мб. Из полезной информации добавлено 700 Кб текстового слоя, изображения остаются не пережаты, просто раздут размер непонятно чем.

Текстовый слой - это не только текст, но и его форматирование, которое малость сложнее, текста в DOS, а соответственно занимает, как правило, побольше места, чем сам текст.
Например, на данной странице, которую вы видите до моего сообщения, самого текста 11.4 килобайта, тогда как вся страница, с форматированием, чтобы вы ее видели такой, какова она есть, весит уже 64.2 килобайта, а в Doc формате она уже весит ~250 килобайт (а текста в ней по прежнему ~11 килобайт).
Хотите малый размер - отформатируйте текст в Офисе и распечатайте в пдф. Получите мегабайта полтора или меньше (при оптимальных настройках).

Всего записей: 626 | Зарегистр. 04-11-2018 | Отправлено: 20:34 19-06-2024 | Исправлено: www_world, 20:35 19-06-2024
MBK2

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LonerD
Теоретически, Adobe Acrobat (не Reader) умеет оптимизировать PDF, причем, прямо говоря, за счет чего именно.
На практике этим инструментом нужно пользоваться чрезвычайно осторожно, особенно, на распознанных документах.

Всего записей: 5421 | Зарегистр. 18-09-2018 | Отправлено: 20:44 19-06-2024
LonerD



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
los
Распознан в FineReader 15.
https://www.upload.ee/files/16769429/1941.zip.html
Попробовал в PDF Transformer, размер увеличивается в пределах нормы (на 600 Кб примерно), при примерно том же качестве OCR. В локальном случае проблема решена, но всё-равно интересно, чем чистить лишнюю информацию в PDF. Акробат может удалять, но только всё скопом (включая текстовый слой, авторов, обрезку и т.д.).
 
los
Спасибо, интересная утилитка.

Всего записей: 900 | Зарегистр. 27-06-2006 | Отправлено: 20:48 19-06-2024 | Исправлено: LonerD, 03:43 21-06-2024
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LonerD,
cpdf -squeeze 'Наука и жизнь 1941-01_.pdf' -o out.pdf
out.pdf - 16,642,832 bytes
 
mutool clean -gggg  'Наука и жизнь 1941-01_.pdf' out.pdf
out.pdf - 16,891,017 bytes
 
текстовый слой  и т.д. сохраняются.

Всего записей: 7934 | Зарегистр. 08-09-2001 | Отправлено: 22:18 19-06-2024
Spectr



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LonerD
 

Цитата:
чем чистить лишнюю информацию в PDF. Акробат может удалять, но только всё скопом (включая текстовый слой, авторов, обрезку и т.д.).  

 
Я пользуюсь Foxit PDF Editor (Файл => Оптимизация PDF).
Преимущество перед другими утилитами возможность тонкой настройки оптимизации.

Всего записей: 636 | Зарегистр. 03-03-2002 | Отправлено: 15:31 23-06-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LonerD

Цитата:
изображения остаются не пережаты, просто раздут размер непонятно чем.

Audit Space Usage Report из PDF-XChange Editor показывает до распознавания 132 Images 13255218 bytes. После распознавания 132 Images 26247282 bytes.

Цитата:
Можно ли чем-то удалить (чем, как?) всякую лишнюю информацию, добавляемую в файл программой FineReader?

В данном конкретном случае лишняя информация была удалена в PDF-XChange Editor 10
File -> Save as Optimized -> Cleanup -> Optimize Page Content
 
P.S. страницы в этом файле имеют хитровыделанный формат: Byte Per Channel - 2, Color Space - Indexed, Compression - ZIP + Generated Mask (By Color Key) с нераспознанными dpi, bpc, compression. Глубже копаться лень. Результат достигнут и ладненько.

Всего записей: 1005 | Зарегистр. 04-11-2019 | Отправлено: 19:09 23-06-2024 | Исправлено: jourmager, 19:22 23-06-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:

Цитата:
Результат достигнут и ладненько.

Печатать на бумагу свою "поделку" не пробовали?

Всего записей: 973 | Зарегистр. 18-05-2023 | Отправлено: 20:15 23-06-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
Печатать на бумагу свою "поделку" не пробовали?

?

Всего записей: 1005 | Зарегистр. 04-11-2019 | Отправлено: 20:47 23-06-2024
LonerD



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Спасибо. Действительно, я не заметил, что в PDF-XChange есть такая опция для детальной оптимизации всего.

Всего записей: 900 | Зарегистр. 27-06-2006 | Отправлено: 00:32 24-06-2024
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов (часть 1)
Maz (05-04-2025 09:00): Редактирование PDF файлов (часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru