Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Hobbit32
Adobe Acrobat + простой javascript

Всего записей: 4562 | Зарегистр. 18-09-2018 | Отправлено: 11:06 25-11-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Hobbit32
берёте консольные утилитки какие-нибудь. например pdftk (https://www.pdflabs.com/docs/pdftk-man-page/). Делаете строку, чтобы прога извлекала один листок из входного файла. Оборачиваете батничком, который ваши файлы переберет и в pdftk подсунет на вход. Делов-то.

Всего записей: 3055 | Зарегистр. 15-07-2010 | Отправлено: 13:19 25-11-2022 | Исправлено: TelecomUral, 13:20 25-11-2022
73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подробнее...




флуд, обсуждение личностей

Всего записей: 1150 | Зарегистр. 18-08-2012 | Отправлено: 17:50 25-11-2022 | Исправлено: Maz, 21:55 25-11-2022
UriF

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
Я пробежался по PDF Explorer (у меня завалялась версия 1.0.59, которую я в свое время нашел в том несте, где ВЫ рекоммендовали) и  xpdf (и платный GUI PDF Image Extraction Wizard).  Я понимаю, что оба софта используют одну и ту же библиотеку.  Я также протестировал, используя бесплатную AVS Document Converter.  размеры картинки во всех случаях 1280x720.  Но вот резолюция разная.  AVS Document Converter дает 96 dpi, а рекоммендуемые Вами софты - 72 dpi.  Естетственно, что я понятия не имею, какая резолюция была заложена в оригинальных картинках.  Я попробовал Aiseesoft PDF Converter Ultimate.  Он мне дал вообще странные результаты - размеры картинки - 2000x1125, а резолюция - 150 dpi.  При этом размер файла в 1.5-2 раза меньше, чем у предыдущих программ.  Что же правильно?  

Всего записей: 816 | Зарегистр. 14-06-2004 | Отправлено: 20:29 25-11-2022
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
UriF

Цитата:
Что же правильно?

Как можно проверить. извлекает ли программа оригинальный jpg (png ...) файл из pdf-файла или проводит конвертацию изображения с изменением разрешения, размеров, dpi, битности и даже формата.
Взять любую jpg-фотку, создать из неё pdf (см. ниже) и извлечь jpg из получившегося pdf-а с помощью pdfimages, потом PDF Explorer, GUI PDF Image Extraction Wizard, AVS Document Converter и сравнить с оригиналом. Можно по-байтово.
 
Создание pdf из изображений
1) запускаем PDF-XChange Editor
Convert -> From files -> From Image files -> Add files (jpg-и в Original) или Add Folders (который Original)
2) в окошке создания файла нажимаем кнопку Options, где  
New Page Options -> Select Paper Size by Image Size
image Processing -> No Downsampling, No Conversion
остальное auto, без OCR ...
3) ОК, ОК, save as, OK, получаем новый файл
 
Если не хочется тратить 5 минут на баловство с портабельным PDF-XChange, можно потратить чуток больше времени и выбрать что-то отсюда:
12 Best Free Software to Batch Convert JPG to PDF without Watermark
26 Best Free JPG To PDF Converter Software For Windows
10 Best Free JPG to PDF Converter or Konverter JPG Til PDF Websites

Всего записей: 728 | Зарегистр. 04-11-2019 | Отправлено: 00:48 27-11-2022
adada

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А разве, скажем, тот же PDF-XChange Editor не выводит из pdf-файла во временную папку именно оригинальную картинку вида ~ei00A488C1 по команде "Редактировать изображение"?

Всего записей: 102 | Зарегистр. 11-12-2003 | Отправлено: 12:30 27-11-2022
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
UriF

Цитата:
Естетственно, что я понятия не имею, какая резолюция была заложена в оригинальных картинках.  

Вник в суть вопроса и слегка прифигел.
Вроде неглупые профессиональные люди третий день спорят о ангелах на кончике иглы.
В данном контексте разрешение растровой картинки (dpi) физического смысла в отрыве от оборачивающего PDF файла не имеет вообще. Т.е. в экспортируемом растре важны только размеры в пикселах по вертикали и горизонтали, dpi экспорт ставит от балды, и правильно делает.
А вот внутри PDF этот имидж втиснут в определенные размеры, возможно непропорционально. Разделите этот размер на количество пикселов - получите разрешение по выбранной координате внутри PDF  
И таки да, мой кастрюлеголовый коллега 73 прав, с такими вопросами надо на rudtp обращаться, а не сюда.

Всего записей: 4562 | Зарегистр. 18-09-2018 | Отправлено: 19:26 27-11-2022 | Исправлено: MBK2, 19:27 27-11-2022
UriF

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MBK2
А что такое rudtp?

Всего записей: 816 | Зарегистр. 14-06-2004 | Отправлено: 20:02 27-11-2022
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
UriF
Примерно тут

Всего записей: 4562 | Зарегистр. 18-09-2018 | Отправлено: 20:23 27-11-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
получите разрешение по выбранной координате внутри PDF

добавлю: предполагаемый dpi картинки часто можно вычислить по ее содержимому.
 
Ну а вообще MBK2 ввёл интригу, не объяснив, что объект PDF может иметь собственное пространство ("втиснут" и потому "от балды"). По уму приличная программа экспорта должна уметь совершать обратное преобразование (табличка задаёт сжатие и поворот пространства конкретного объекта). Ежели не умеет, виноват разработчик. Тогда и будет не от балды, а в соответствии с желанием создателя pdf (если он вообще видел, что насоздавал  )

Всего записей: 3055 | Зарегистр. 15-07-2010 | Отправлено: 20:32 27-11-2022
UriF

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Попробовал поэкспериментировать, как предложил народ.  Оригинальный размер файла 1,528 Кб (300 dpi, размер - 3139х4429). PDF Explorer - 1,487 KB (размеры картинки, как оригинал, резолюция - 96 dpi).  Естественно, что PDF Image Extraction Wizard дает те же результаты, поскольку основывается на тех же xpdf библиотеках.   AWS Document Converter - 531 KB (размеры картинки - 793х422, резолюция - 96 dpi).  Aiseesoft PDF Converter Ultimate -  356 KB (размер картинки - 1240х1754, резолюция - 150 dpi).  Так что, если, как пишет MBK2  dpi там от балды, то софты, основанные на xpdf, дают оригинальный результат.  Как я понимаю, ничего другого в природе не существует.

Всего записей: 816 | Зарегистр. 14-06-2004 | Отправлено: 20:41 27-11-2022 | Исправлено: UriF, 20:41 27-11-2022
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
По уму приличная программа экспорта должна уметь совершать обратное преобразование (табличка задаёт сжатие и поворот пространства конкретного объекта).  

Вы о чем сейчас? Матрицу преобразования в jpeg лепить предлагаете или как?
UriF
Мы говорим про извлечение растровых изображений из PDF а не про их ресэмплинг при преобразовании.
 

Всего записей: 4562 | Зарегистр. 18-09-2018 | Отправлено: 22:49 27-11-2022
UriF

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MBK2
Я задал вопрос об извлечении оригинальных изображений из pdf, т.е. чтобы я не получал, скажем, upscale, а увеличишь резолюцию дисплея, так вообще мозет поплыть.  Я уже потихоньку начал это выдирание.  Не люблю смотреть комиксы в pdf смотрелке, поскольку это жрет много памяти, а стандартная смотрелка от Adobe даже  иногда виснет, хоть у меня и 16 GB RAM.  Поэтому и хочу распотрошить это добро, чтобы смотреть, скажем, в XnView.

Всего записей: 816 | Зарегистр. 14-06-2004 | Отправлено: 00:00 28-11-2022 | Исправлено: UriF, 02:01 29-11-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MBK2

Цитата:
Вы о чем сейчас?

Об этом: берёте адобовский стандарт на pdf, н-р я смотрел 3ю редакцию. Ищете блок 4.2.3 Transformation matricies. Затем 4.8.3 Image Coordinate System. А также блок 4.9.1 Form Dictionaries, параметры BBox и Matrix. Этого достаточно для понимания процесса: UriF желает видеть на жёстком диске некий оригинал, но в pdf он смотрит на результат перечисленных мной выше преобразований.
 
UPD
разжую: то есть для восстановления оригинала человек-то должен соображать, что прога должна найти все преобразования и корректно применить их, чтобы получить разрешение "видимой ему картинки". Ведь чаще всего это разрешение экрана (72 или 96дпи). Отсюда и разнобой в дпи при экспорте: задача юзера неизвестна, чего именно он хочет, пространство дисплея или физический исходник. И если человек хочет оригинальное разрешение, то пусть сам догадывается подсчитает его, исходя из физического размера листа, координат BBox, числа пикселей на каждую сторону битового потока картинки, и упомянутых матриц. оттого в продвинутых прогах можно прямо указать масштаб экспорта и его разрешение.
 

Всего записей: 3055 | Зарегистр. 15-07-2010 | Отправлено: 06:55 28-11-2022 | Исправлено: TelecomUral, 07:18 28-11-2022
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
 
Об этом: берёте адобовский стандарт на pdf, н-р я смотрел 3ю редакцию. Ищете блок 4.2.3 Transformation matricies. Затем 4.8.3 Image Coordinate System. А также блок 4.9.1 Form Dictionaries, параметры BBox и Matrix. Этого достаточно для понимания процесса: UriF желает видеть на жёстком диске некий оригинал, но в pdf он смотрит на результат перечисленных мной выше преобразований.
 

Ну это понятно, я к тому, что для экспорта в растр данное преобразование не всегда корректно возможно, ибо пикселы внезапно могут перестать быть квадратными или даже прямоугольными

Всего записей: 4562 | Зарегистр. 18-09-2018 | Отправлено: 10:03 28-11-2022
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
UriF

Цитата:
Не люблю смотреть комиксы в pdf смотрелке, поскольку это жрет много памяти, а стандартная смотрелка от Adobe даже  иногда виснет, хоть у меня и 16 GB RAM.

Некоторое время назад пробовал фриварный pdf-вьювер, оптимизированный специально под комиксы - YACReader  
У этой программы, кроме специфических функций, была ещё наивысшая скорость пролистывания pdf-файлов из всех опробованных мною на то время программ. Лично мне она не подошла отсутствием портабельности и отсутствием поддержки fb2, epub, djvu, mobi.
Какие у неё сейчас функции и проблемы - не знаю.


OMG Какой rudtp? Какие dpi? какие временные папки? Какие ресамплинг, matrices и прочие умные слова? Зачем вот это вот всё?
Элементарная задача - извлечь (не экспортировать) jpg-файл из pdf-файла в оригинальном виде, в том виде, в каком этот jpg был вставлен в pdf-файл.
Беру из каталога C:\Windows\Web\Wallpaper\Theme1\ файл img4.jpg - это тема для винды ночь и палатка
Засовываю это джипег в пдф с помощью пдф-иксчаейдж, так, как я это написал раньше
Запускаю pdfimages.exe -raw "New Document from img4.pdf" out
Запускаю Тотал Коммандер, сравниваю два джипега сначала тупо по размеру в байтах - 595'514 байт (не в килобайтах), потом побайтово, и вишенкой по MD5:
cb1db18a9907ae21c71e986a8f4ec6be *img4.jpg
cb1db18a9907ae21c71e986a8f4ec6be *out-0000.jpg
258c1b668179f3a2775b47644116bfce *New Document from img4.pdf
Потом открываю в Блокноте New Document from img4.pdf и вижу
/BitsPerComponent 8
/ColorSpace /DeviceRGB
/DecodeParms <<
/ColorTransform 1
>>
/Filter /DCTDecode
/Height 1200
/Length 595514
/Subtype /Image
/Width 1920
Расшифровываю:
внутри pdf-файла находится jpg-файл (DCTDecode), 8 бит на цвет (всего 24 бита), разрешение 1920х1080, размер 595514 байт, что полностью равно размеру исходного jpg-файла.
 
Всё! В чём проблемы извлечь обычный jpg из нормального pdf?
Почему подавляющее большинство программ не умеют извлекать оригинальный jpg из pdf - это не ко мне. Лично я знаю только две таких программы - pdfimages из xpdf (poppler). PDF Explorer

Всего записей: 728 | Зарегистр. 04-11-2019 | Отправлено: 18:31 29-11-2022 | Исправлено: jourmager, 18:59 29-11-2022
UriF

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
PDF Explorer и PDF Image Extraction Wizard одинаково выдирают картинки из pdf, поскольку обе используют xpdf.  А вот почему остальные делают это некорректно, понятия не имею.
 
Теперь вопрос другого толка.  Есть в pdf не полностью картинки, а картинки в тексте.  Причем, это не pdf, собранный из набитого текста, куда вставлены картинки, а, допустим, я не знаю, что там было внутри, html, docx (и это неважно) но туда впихнули картинки, сделали jpg файлы, а затем всю цепочку конвертнули в pdf.  Из таких кривых pdf PDF Explorer и PDF Image Extraction Wizard умудряются выдирать картинки вместо того, чтобы делать стандартную процедуру pdf-to-jpg конвертирование, чтбы получить оригинальный jpg.  Таких программ с такой функциональностью пруд-пруди, вроде бесплатного упомянутого мной AWS.  Какая программа делает это качественней?
 
Я пробовал множество программ для комиксов, но ни одна меня не удовлетворила, по сравнению с просмотром имаджей в XnView.  попробую это чудо YACReader
 
Еще раз прошу прощения у участников форума за отнятое время
 
P.S.  YACReader какой-то кривой.  там, как и в Calibre, нет возможности скроллинга от страницы к страницы, а потому переход от страницы к странице идет "рывками".  Это та причина, почему, если мне попадается книга в epub,  я ее перевожу в pdf, чтобы читать в обычном pdf вьюере.    Кроме того, масштаб сделан через задницу.  В XnView ты можешь менять масштаб мышью, а переход от странице к странице идет через верхнее меню.   в конце концов, я же смотрю это не на смартфоне, а на компьютере.

Всего записей: 816 | Зарегистр. 14-06-2004 | Отправлено: 20:00 29-11-2022 | Исправлено: UriF, 20:20 29-11-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Всё! В чём проблемы извлечь обычный jpg из нормального pdf?

тут в ветке просто масса примеров "ненормальных" pdf, из которых видимую картинку хрен выдерешь "в jpg".  
Один только изумительный пример "За рулем" чего стоит.

Всего записей: 3055 | Зарегистр. 15-07-2010 | Отправлено: 21:36 29-11-2022
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 
Всё! В чём проблемы извлечь обычный jpg из нормального pdf?

Насколько я понимаю, основная проблема в том, что люди не совсем правильно понимают выражения "извлечь растровый файл из PDF" и "разрешение растрового файла"
А так, конечно, никаких проблем
Ну вот, например, такая фраза:

Цитата:
Есть в pdf не полностью картинки, а картинки в тексте.  Причем, это не pdf, собранный из набитого текста, куда вставлены картинки, а, допустим, я не знаю, что там было внутри, html, docx (и это неважно) но туда впихнули картинки, сделали jpg файлы, а затем всю цепочку конвертнули в pdf.  Из таких кривых pdf PDF Explorer и PDF Image Extraction Wizard умудряются выдирать картинки вместо того, чтобы делать стандартную процедуру pdf-to-jpg конвертирование, чтбы получить оригинальный jpg.  

На лицо полное непонимание процесса и неумение грамотно сформулировать мысль

Всего записей: 4562 | Зарегистр. 18-09-2018 | Отправлено: 23:10 29-11-2022
UriF

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MBK2
я не скрываю, что это абсолютно новая для меня область
 
можете меня и дальше и пинать.  я сижу, читаю Вас и потребляю информацию.  ОК?

Всего записей: 816 | Зарегистр. 14-06-2004 | Отправлено: 23:35 29-11-2022
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru