Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
jourmager
Много г..на, и никакой конкретики.
Я за пять минут обстучал эту страницу в Сканкромсаторе и получил ваш вариант с сохранением  даже остатков в конце водяного знака и белых пятен в середине рисунка. Теперь стоит умножить 5 на количество страниц в книге и получим
Цитата:
Потом вас ждет огромный объем работы по исправлению текста, но это же мелочи, правда?

А в случае цветного рисунка этот трюк не прокатит, т.к. цвет под водяным знаком будет меняться плавно, что вы не восстановите никакими фокусами.
А вопрос здесь поднимался о массовом, АВТОМАТИЧЕСКОМ, а не постраничном вручную удалении.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 00:15 31-01-2023 | Исправлено: shch_vg, 00:27 31-01-2023
73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А вопрос здесь поднимался о массовом, АВТОМАТИЧЕСКОМ, а не постраничном вручную удалении.
Пока что нет, и не предвидится без астрономических затрат, даже ИИ, как можно увидеть собссными глазами, не слишком помогает. Резюме такое: цветные фото обрабатываются ИИ без проблем, но в единичных количествах и без контрастного текста. В остальных случаях, когда фото или рисунок сочетается с текстом, разумных способов не видно. Поэтому, как уже говорилось - забудьте про растр на растре. Может быть, если будет создан более совершенный алгоритм ИИ, в перспективе такое станет возможным. Но вот что массовая обработка будет бесплатной, сильно сомневаюсь. А за деньги можно сделать практически все.

Всего записей: 1142 | Зарегистр. 18-08-2012 | Отправлено: 07:10 31-01-2023 | Исправлено: 73, 07:11 31-01-2023
snch

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день! Подскажите, пожалуйста, как решить такую задачу: есть ряд PDF-файлов, сгенерированных неким браузерным плагином из 32-битных цветных PNG-файлов. Как можно конвертировать эти цветные 32-битные изображения в цветные же 8-битные, не разбирая при этом PDF на отдельные файлы и не обрабатывая каждый из них по отдельности (пусть и пакетным методом)? Если есть какой-то софт, то очень бы хотелось не CLI, а имеющий GUI. (С софтиной imagemagick и рекомендациями из шапки "Acrobat Pro + Preflight" и "Acrobat Pro + ImageWorks из Crackerjack", увы, совсем не разобрался.) Заранее спасибо!

Всего записей: 69 | Зарегистр. 11-08-2006 | Отправлено: 18:32 31-01-2023
Darth_Max

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
PDF файл с договором, места для данных выглядят так "_____________", нужно вписать, напечатать, данные в файл. Чем лучше всего это сделать?
Функция Typwriter из Foxit Reader подойдет?
 

Всего записей: 1194 | Зарегистр. 02-10-2014 | Отправлено: 16:56 01-02-2023 | Исправлено: Darth_Max, 16:57 01-02-2023
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
snch
 
Задаёте вопрос - выкладывайте небольшие примеры этих PDF полученных из браузера.
 

Цитата:
Как можно конвертировать эти цветные 32-битные изображения в цветные же 8-битные

Может имелось ввиду преобразовать в 24 bit (RGB, 8 bit на канал)?

Всего записей: 2791 | Зарегистр. 31-05-2010 | Отправлено: 13:48 02-02-2023 | Исправлено: ComboFZ, 15:30 02-02-2023
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ
В PNG еще 8 бит под альфа канал, если что.

Всего записей: 326 | Зарегистр. 10-08-2018 | Отправлено: 16:35 02-02-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ

Цитата:
Задаёте вопрос - выкладывайте небольшие примеры этих PDF полученных из браузера.

Не понял. А зачем?
Речь идет о принципиальной возможности рекомпрессии png-файлов внутри множества pdf-файлов с использованием GUI программы.
А теперь очень простой вопрос, какая программа (все равно CLI или GUI) вообще знает о существовании формата png в контексте его преобразования без изменения формата?
Я такой не знаю, но я не всеведущ. Кто-то знает?

Всего записей: 715 | Зарегистр. 04-11-2019 | Отправлено: 17:13 02-02-2023
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
PNG (как и TIFF) внутрь PDF напрямую не засунуть, они по умолчанию пересжимаются в беспотерьный ZIP/Flate.
Но верить на слово никому нельзя, поэтому и нужен PDF сгенерированный браузером. Далее заглянуть в его потроха и выяснить, что там за растр. Потом переконвертировать весь растр в RGB 24bit (удалив прозрачность).
 
Archivist
Об этом и речь, что ему нужно удалить прозрачность. 24 bit в моём посте на это намекает.
 
 

Всего записей: 2791 | Зарегистр. 31-05-2010 | Отправлено: 18:03 02-02-2023 | Исправлено: ComboFZ, 21:19 02-02-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ

Цитата:
Потом переконвертировать весь растр в RGB 24bit (удалив прозрачность).

Противоречит условию задачи.

Цитата:
конвертировать эти цветные 32-битные изображения в цветные же 8-битные

Насчет битности. Проводим простой эксперимент. Берем Фотошоп, открываем в нем обычный 24-битный jpg и делаем быстрый экспорт в png. на выходе получаем png 32-бит. Потом этот 32-битный png экспортируем as png и ставим галочку 8-бит. На выходе получаем цветной 8-битный png с размером в 2 раза меньше.
Это я к тому, что мой XnView на разных png показывает 32 бита, 24 бита, 8 бит.
 

Цитата:
PNG (как и TIFF) внутрь PDF напрямую не засунуть, они по умолчанию пересжимается в беспотерьный ZIP/Flate.

Сделал эксперимент. С помощью PDF-XChange Editor создал pdf-файл из двух png - 32-битного и 8-битного. Внутри pdf 32-битный png переконвертировался в 24-битный jpeg/zip, а 8-битный png в (8?) -битный flate. Почесал репу. Закрыл эдитор.

Всего записей: 715 | Зарегистр. 04-11-2019 | Отправлено: 18:32 02-02-2023 | Исправлено: jourmager, 18:35 02-02-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ

Цитата:
PNG (как и TIFF) внутрь PDF напрямую не засунуть, они по умолчанию пересжимается в беспотерьный ZIP/Flate.

Интересно как в результате этих преобразований pdfimages удается извлечь png с такой же хэш-суммой как и оригинального png файла.

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 18:36 02-02-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los

Цитата:
Интересно как в результате этих преобразований pdfimages удается извлечь png с такой же хэш-суммой как и оригинального png файла.

Интересно. Когда я пробовал, то у меня pdfimages с ключем raw вместо png извлек flate. Что я делал не так, чтобы извлекался "настоящий" png?

Всего записей: 715 | Зарегистр. 04-11-2019 | Отправлено: 18:51 02-02-2023
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Cклоняюсь к тому, что snch нужен полноцветный растр, но без прозрачности (24 bit), а не обрезанный по цвету 8 bit. Он просто ошибся. Поэтому я и спросил его:
"Может имелось ввиду преобразовать в 24 bit (RGB, 8 bit на канал)?".
 
Но PDF для исследования нужен, там может быть что угодно с растром, примеры всё-таки надо выкладывать.
-------------------
Растр внутри PDF сжат в:
CCITT
JPEG
JPEG2000
ZIP/Flate
LZW
RunLength
JBIG2
 
TIIFF, PNG, BMP, GIF не поддерживаются внутри PDF, но принимаются извне для сжатия в вышеназванные форматы.

Всего записей: 2791 | Зарегистр. 31-05-2010 | Отправлено: 19:33 02-02-2023 | Исправлено: ComboFZ, 02:03 03-02-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Что я делал не так, чтобы извлекался "настоящий" png?

используете pdfimages из пакета xpdf, а не из poppler.

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 20:18 02-02-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
используете pdfimages из пакета xpdf, а не из poppler.

Я использую pdfimages из xpdf.
 
Немного изменил свой эксперимент.
Создал 24-битный (скриншот XnView), 32-битный (быстрый экспорт jpg в png Photoshop-ом). и 8-битный (экспорт 24битного png в 8-битный Photoshop-ом = as -> smaller) png-файлы. Битность проверялась XnView.
Упаковал их с помощью PDF-XChange Editor в pdf с опциями No Downsampling, No Conversion, Image Compression = Auto.
PDF-XChange для полученного pdf показывает:
24-битный png - BPC 8, Compression ZIP, Color Space DeviceRGB
32-битный png - BPC 8, Compression JPEG, ZIP, Color Space DeviceRGB
8-битный png - BPC 8, Compression ZIP, Color Space Indexed
Из полученного pdf извлек картинки:
pdfimages.exe -raw "New Document from Image Files.pdf" out
Получил:
24-битный png - flate
32-битный png - 24-битный jpg
8-битный png - flate
Если кто не понял - PDF-XChange 24- и 8-битные png упаковывает правильно - zip-ом во flate, а 32-битный перекодирует в 24-битный jpg.
 
Т.е. ув. ComboFZ прав. Какой-то интересный pdf. С 32-битными png внутри, которые, вероятно не так просто получить, если вообще возможно.

Всего записей: 715 | Зарегистр. 04-11-2019 | Отправлено: 23:29 02-02-2023
antobog

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Можете подсказать, что не так с этим pdf (жутко тормозит при листании) и можно ли это исправить?
 
https://dropmefiles.com/jmGNY

Всего записей: 92 | Зарегистр. 26-08-2012 | Отправлено: 12:00 05-02-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
antobog
там два изображения полноцветные и ещё с маскированием. медленно обсчитываются точки.
наверное, можно соединить два в одно.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 13:00 05-02-2023
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
antobog
Это MRC с подложенным OCR - проще переделать, чем поправить, но кому это надо?.. ))

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4307 | Зарегистр. 18-09-2003 | Отправлено: 13:52 05-02-2023
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
antobog
Если документ жутко тормозит, значит он активно использует jpeg2000.
 
Нужно удалить картинки размером 2049x2907, будет летать. При этом иллюстрации останутся. PitStop (или форумчане с этим плагином) в помощь.
Как более простой, но сомнительный вариант - удалить вообще все картинки одной кнопкой. Получится шустрый документ на 1.5 мегабайта.

Всего записей: 326 | Зарегистр. 10-08-2018 | Отправлено: 18:40 05-02-2023 | Исправлено: Archivist, 18:41 05-02-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Archivist

Цитата:
Нужно удалить картинки размером 2049x2907

Зачем же удалять?
А если засунуть с другим сжатием?

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 19:42 05-02-2023
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Зачем же удалять?  

Текстовый слой здесь выглядит самодостаточным - https://dropmefiles.com/S6S6n

Всего записей: 326 | Зарегистр. 10-08-2018 | Отправлено: 19:56 05-02-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru