Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Заменить/удалить текст (batch есть), в т.ч. кириллицу (не панацея!) - PDF Replacer
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: 73, 09:51 29-08-2024
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
 

Цитата:
Не знаю. Мне есть чем заняться помимо пробных установок разнообразного софта  И 11-й поставил специально для вас, так-то и 9го хватало пока.

 
ComboFZ говорил не ниже 11. Эта явна выше, я имел в виду что это линейка по идее продолжение 11 про.
Я вообще Акробатом не пользуюсь, ставил как раз из советов ComboFZ по поводу исправления крякозябр.
 
Сам я пользуюсь PDF-XChange Editor, и вот даже в том ограниченном количестве функций который я использую, и вижу улучшения от версии к версии. Но в принципе согласен, многие кампании из простых прог делают комбайны, ухудшая их работу.
 
Так как не оговаривалось в какую версию PDF/A сжать, я использовал по умолчанию, это PDF/A -2B.
Сохранил в PDF/A -1B и все получилось, спасибо toR_nado за подсказку.
   
 
Буду пробовать и другие файлы, которые pdf-recode не брал так переделать.
 
 
 

Всего записей: 272 | Зарегистр. 15-12-2007 | Отправлено: 13:12 06-01-2022
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
toR_nado

Цитата:
Использовал PDFXEdit 9.2.359.0 Portable NoOCR

Я использовал аналогично. На выходе получился PDF-A версии 1.4 с кучей запретов на редактирование.

Цитата:
А дальше обрабатываем pdf-recode210111.exe

в командной строке запускаю:
pdf-recode210111.exe abc.pdf [enter]
Ничего не происходит.
Иногда появляется окошко perl что pdf-файл не торт.
Пробовал менять названия exe-файла, pdf-файла, каталоги, диски, версии pdf 1a 1b, запуск от админа. Acrobat, pdf-xchange. Толку ноль.
Куда копать кто знает?
toR_nado
Сорри за офтоп. А какой чудесной программой вы обработали скриншот, чтобы были красивые циферки пунктов по порядку и красная ровная обводка?

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 15:29 06-01-2022
gutasiho

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
 

Всего записей: 7735 | Зарегистр. 14-09-2020 | Отправлено: 15:47 06-01-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Куда копать кто знает?  

поглядите текстовым вьювером, что внутри вашего abc Там не должно быть особой абракадабры вначале, на первом экране. Или в личку мне бросьте, ежели не хотите публичной выкладки. Я на предыдущей странице упоминал, что для такой древней программы главное не в PDF-A сохранить, а не юзать всяческие сжатия внутри. А это вроде как никем и ничем не регламентируется. (Поэтому можете ещё испробовать qpdf, как я там писал.)
Как вариант - что-нибудь не то с виндой (если 10я). Я пока свежую 10ю винду не поставил, мучался - сначала у меня это была какая-то первая сборка, старая. Какую посоветовали  Всё было сырое, глючило на ровном месте. Плевался. Потом обновился и в основном глюки закончились. Даже стало нравиться.
Ещё вариант: возьмите из архива, что я xanxan делал, pdf-recode и исходный pdf, попробуйте запустить эту пару. Чтобы понять, дело в вашем PDF-A или в чём-либо ещё.

Всего записей: 3330 | Зарегистр. 15-07-2010 | Отправлено: 15:51 06-01-2022
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В PDF-XChange Editor тоже можно было сделать, также надо было версию PDF-A по умолчанию поменять. Там даже 3-u какие то есть.
 
   
 
   
 
PDF-XChange Editor намного быстрее конвертит.
Но файлы в них разные по размеру выходят.
 
https://wdfiles.ru/cf0b88
 
 
 
 
Добавлено:
jourmager
 
Мышкой перетаскивайте нужный файл на pdf-recode.

Всего записей: 272 | Зарегистр. 15-12-2007 | Отправлено: 16:42 06-01-2022
toR_nado



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
xanxan
В PDF-XChange Editor тоже можно было сделать

Я же на это вроде сразу и указал.
 
Но если честно зачем весь этот гемоРрой. TelecomUral уже дал подсказку. Достаточно сменить версию PDF не выше 1.4 и не надо даже разжимать поток. После этого все пять версий pdf-recode будут обрабатывать этот файл и выдадут положительный результат, но только pdf-recode210111.exe и pdf-recode101210.exe исправят именно этот(Патрушева) файл.
Сменить версию как уже упоминали можно легко без инсталляции консольными qpdf или cpdf.
Для QPDF: qpdf --force-version=1.4 original.pdf rezultat.pdf
Из всего этого напрашивается вывод, что не в PDF файле проблема, а просто pdf-recode не хочет обрабатывать файлы выше версии 1.4.

Всего записей: 316 | Зарегистр. 20-05-2006 | Отправлено: 19:49 06-01-2022
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Из всего этого напрашивается вывод, что не в PDF файле проблема, а просто pdf-recode не хочет обрабатывать файлы выше версии 1.4.

Дело скорее в библиотеке CAM-PDF которую использует pdf-recode и которая не обновлялась кучу лет.

Цитата:
The file format through PDF 1.5 is well-supported, with the exception of the "linearized" or "optimized" output format, which this module can read but not write. Many specific aspects of the document model are not manipulable with this package (like fonts), but if the input document is correctly written, then this module will preserve the model integrity.
 
The PDF writing feature saves as PDF 1.4-compatible. That means that we cannot write compressed object streams. The consequence is that reading and then writing a PDF 1.5+ document may enlarge the resulting file by a fair margin.

Всего записей: 7730 | Зарегистр. 08-09-2001 | Отправлено: 20:05 06-01-2022
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
toR_nado
 

Цитата:
Я же на это вроде сразу и указал

 
Вы дали сокращенное название программы, я подумал это одна из множества читалок PDF.
Мне проще делать это программой которой постоянно пользуюсь а не разбираться с новыми консольными.
Хотя если если там есть пакетная обработка то можно попробовать.
Как понизить версию десяткам файлам PDF сразу?
В PDF-XChange Editor и Акробате есть такая возможность или надо юзать консольные?
 
Добавлено:
Нашел пакетную обработку в PDF-Tools 4.0 Build 213 Portable New (2013)
Как их теперь в pdf-recode пакетно закинуть?

Всего записей: 272 | Зарегистр. 15-12-2007 | Отправлено: 23:47 06-01-2022
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Всем спасибо за помощь.
У меня на Win 10 Pro 21H1 программа pdf-recode210111 заработала только после того, как я для неё установил совместимость с Win XP SP3.
pdf-recode210111 исправила кракозябры в одном из моих тестовых файлов с версией стандарта PDF 1.7 и в другом с версией 1.5.  
На другом файле версии 1.6 написала "can't save". Но после понижения версии до 1.4 с помощью qpdf - кракозябры были исправлены.
Т.о. получается, что pdf-recode210111 может исправлять абракадабру только в pdf-файлах, в которых структура соответствует версии 1.4 и не выше. При этом определить настоящую версию структуры pdf-файла по версии из свойств pdf-файла - невозможно.
Из имеющихся у меня файлов с помощью pdf-recode210111 были исправлены кракозябры-абракадабра на кириллицу в 4 файлах, в 2 файлах не получилось. В 10 файлах, где копирование получалось со знаками вопроса вместо обычных букв - ни один не был исправлен.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 17:45 07-01-2022
adada

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кстати, в довольно эффективном оптимизаторе _Orpalis pdfReducer_ присутствует настройка выбора сохранения выходного pdf-файла в версиях от 1.4 до 1.7

Всего записей: 102 | Зарегистр. 11-12-2003 | Отправлено: 17:59 07-01-2022
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
При этом определить настоящую версию структуры pdf-файла по версии из свойств pdf-файла - невозможно.  

Это не так. Некоторые ОС в свойствах pdf файла отображают его версию и др. информацию. Плюс посмотреть версию pdf файла можно и другими программами:
 
$ file foo.pdf
foo.pdf: PDF document, version 1.4, 17 pages
 
$ file bar.pdf
bar.pdf: PDF document, version 1.7, 212 pages (password protected)
 
$ xxd -l10 foo.pdf
00000000: 2550 4446 2d31 2e34 0a25                 %PDF-1.4.%
 
$ xxd -l10 bar.pdf
00000000: 2550 4446 2d31 2e36 0a25                 %PDF-1.6.%
 
$ cpdf -info foo.pdf | grep -i version
Version: 1.4

Всего записей: 7730 | Зарегистр. 08-09-2001 | Отправлено: 18:20 07-01-2022 | Исправлено: los, 18:20 07-01-2022
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
adada

Цитата:
в довольно эффективном оптимизаторе _Orpalis pdfReducer_ присутствует настройка выбора сохранения выходного pdf-файла в версиях от 1.4 до 1.7

В Orpalis pdfReducer можно только увеличивать версию выходного pdf-файла. Уменьшать нельзя.
los

Цитата:
Это не так. Некоторые ОС в свойствах pdf файла отображают его версию и др. информацию.

Проведите эксперимент. Возьмите любой hex-редактор и поменяйте 8-й байт (%PDF-1.7) в любом из ваших pdf-файлов на какую-либо цифру от 4 до 7 включительно. Потом запустите ваши file, xxd, cpdf и ещё что угодно и проверьте, какую версию pdf они покажут. О результатах сообщите, пожалуйста.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 19:19 07-01-2022
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Проведите эксперимент. Возьмите любой hex-редактор и поменяйте 8-й байт (%PDF-1.7) в любом из ваших pdf-файлов на какую-либо цифру от 4 до 7 включительно. Потом запустите ваши file, xxd, cpdf и ещё что угодно и проверьте, какую версию pdf они покажут. О результатах сообщите, пожалуйста.

бред какой-то в плане постановки вопроса.
 
А если вообще заголовок заменить/убрать, а если их вирус какой зашифрует, а если их моль побьет.. Детский сад.

Всего записей: 7730 | Зарегистр. 08-09-2001 | Отправлено: 20:27 07-01-2022 | Исправлено: los, 20:28 07-01-2022
adada

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В Orpalis pdfReducer можно только увеличивать версию выходного pdf-файла. Уменьшать нельзя.  

 
И то! Что ж, тогда -- брутально, сохранив из редактора (например, PDF-XChange) в спец. PDF-A/... Хотя и этот путь не универсален.

Всего записей: 102 | Зарегистр. 11-12-2003 | Отправлено: 21:26 07-01-2022
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
Ещё раз.

Цитата:
Некоторые ОС в свойствах pdf файла отображают его версию и др. информацию.

И что? Зачем тут К.О.?
Наверняка утверждать не буду, но с большой долей вероятности предположу, что большинство программ по обработке pdf-файлов не анализируют структуру pdf-файла, а тупо считывают версию из заголовка, которая в первых восьми байтах файла (например, %PDF-1.7).  
Т.е. при изменении версии в hex-редакторе, большинство программ просто прочитает этот изменённый номер версии, кроме специализированных программ-анализаторов и исправляторов.
Содержание самого pdf-файла может не выходить за рамки какой-либо младшей версии (например, 1.4) в определённых частях структуры, хотя в то же самое время версия PDF в заголовке будет более старшая (например, 1.7).
Ещё раз.
Программа pdf-recode версии 210111 не имеет ограничений по версии PDF как таковой (без учёта наворотов конкретной версии), т.к. я успешно избавлялся от кракозябров и абракадабры при копировании в pdf-файлах версий 1.5-1.7.
В то же самое время программа pdf-recode имеет ограничения по внутренней структуре pdf-файла, соответствующие версии 1.4, т.к. некоторые файлы мне удалось избавить от кракозябров только понижением версии до 1.4 с помощью qpdf.
Демонстрация версии pdf-файла с помощью элементарных программ типа files, xxd, cpdf, etc не имеет вообще никакого практического значения, чистый детский сад.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 21:46 07-01-2022
toR_nado



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
jourmager
Программа pdf-recode версии 210111 не имеет ограничений по версии PDF как таковой (без учёта наворотов конкретной версии), т.к. я успешно избавлялся от кракозябров и абракадабры при копировании в pdf-файлах версий 1.5-1.7.  

Действительно все так и есть. Проблемам оказалась в самом QPDF. При смене версии на 1.5 и выше производиться какая то оптимизация PDF файла. Файл может чуть чуть прибавить в весе, но в большинстве случаев он уменьшается, чего не происходит на версиях 1.4 и ниже.
Этой проблемы нет в платной cpdf после смены версии которой pdf-recode обрабатывает и v1.7 (в free похоже меняется только циферка).  
Получается что при смене версий эти программы просто по своему оптимизирую (исправляют) PDF файлы, после чего их начинает принимать pdf-recode. В подтверждение к этому обработал в том же cpdf с функцией чистки -clean. PDF файл без проблем принимают все версии pdf-recode. Та же ситуация и с mupdf mutool с функцией mutool clean.
Еще заглянув в свойства файла все того же "Патрушева..." обнаружилось, что он PDF/X-1:2001. Решил с помощью PDF-XChange Editor перегнать в ту же спецификацию и файл без проблем стал обрабатываться pdf-recode.

Цитата:
xanxan
Хотя если если там есть пакетная обработка то можно попробовать.

В qpdf, cpd и mupdf можно пакетно обрабатывать.

Цитата:
Как их теперь в pdf-recode пакетно закинуть?

Мне кажется это не правильный подход. Можно запутаться потом в файлах. Дело в том, что не факт, что именно эта версия pdf-recode исправит все файлы. У меня нашелся PDF который лечиться только pdf-recode101210. Поэтому и рекомендуется прогонять файл через все версии pdf-recode.

Всего записей: 316 | Зарегистр. 20-05-2006 | Отправлено: 17:23 09-01-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan

Цитата:
Как их теперь в pdf-recode пакетно закинуть?

интересно будет, если рекодер сможет поправить только часть шрифтов. не сталкивались с таким?

Всего записей: 3330 | Зарегистр. 15-07-2010 | Отправлено: 18:14 09-01-2022
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
интересно будет, если рекодер сможет поправить только часть шрифтов. не сталкивались с таким?

 
Я обычно проверяю на паре страниц, копируется нормально, поиск работает нормально и все.
У меня например скопилось более 30 файлов с крякозябрами, всех их проверять детально времени нет.

Всего записей: 272 | Зарегистр. 15-12-2007 | Отправлено: 08:44 10-01-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan
Понятно.
Проще всего непрофессионалу создать пачку команд конкатенацией в экселе. Генерируете список pdf-файлов с помощью консоли (dir /b >a.txt), копируете его в эксель, и пристыковываете слева экзешник. Примерно так (это не эксель, это libreoffice):
="pdf-recode210111.exe " & CHAR( 34 ) & A1 & CHAR( 34 )
Пачку строк - в bat-файл.

Всего записей: 3330 | Зарегистр. 15-07-2010 | Отправлено: 09:22 10-01-2022
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
если рекодер сможет поправить только часть шрифтов


Цитата:
Я обычно проверяю на паре страниц, копируется нормально, поиск работает нормально и все

У меня есть pdf-файлы, где часть страниц копируется нормально латиницей или кириллицей, а часть страниц абракадаброй или кракозябрами. Для себя я придумал такой способ: извлекать весь текст из pdf-файла, а потом просматривать его в блокноте, где кракозябры или знаки вопроса очень заметны.  
Но я пока не нашел идеальную программу для такого извлечения текста.
xanxan

Цитата:
Как их теперь в pdf-recode пакетно закинуть?

Как вариант из командной строки:
forfiles /s /m *.pdf /c "cmd /c pdf-recode210111 @file @file"
В этом случае программа с названием pdf-recode210111 обрабатывает все файлы с расширением pdf в том же каталоге. Но есть нюанс.  
У меня pdf-recode требует нажатия на кнопку OK после исполнения, т.е. при пакетном исправлении после запуска программы надо будет ещё N-ное количество раз нажать Enter. Наверное, это можно как-то исправить.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 12:01 10-01-2022
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru