Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vasyosuol 24 say:

Цитата:
 
Есть ещё варианты?
 

 
Хмм. Вот тебе раз. На ум приходит тогда только:
  • mutool из MuPDF. Но шансов ещё меньше, чем в предыдущем.
  • GhostScript. Понадёжнее, но синтаксис CLI гораздо сложнее.

  • Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 20:07 01-06-2023 | Исправлено: zvezdochiot, 13:18 04-06-2023
    vasyosuol 24

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    zvezdochiot
    А может, просто версию "постарее"? Я про xpdf. Вот только где б её, такую хорошую...
    MuPDF посмотрю, спасибо. А GhostScript, IMHO, "болото". Или я готовить его не умею...

    Всего записей: 1101 | Зарегистр. 16-01-2013 | Отправлено: 20:17 01-06-2023
    TelecomUral

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    А GhostScript, IMHO, "болото". Или я готовить его не умею...

    да чего там. Очень простой интерпретатор, всегда меня выручает. Настоятельно советую.
     
    Провёл эксперимент на Ульмане (md5=3E0901394EB4402C8D58D0372FA5C7F9), правда машина win10, но ghostscript должен везде работать. Если что на сайте GS старые версии можно скачать.
     

    Код:
    gswin32c.exe -dSAFER -dBATCH -dNOPAUSE -sDEVICE=png16m -r300 -dFirstPage=1 -dLastPage=12 -sOutputFile=temp\ulman-%03d.png ulman.pdf
     

    sDEVICE - выходной формат, видимо в виде имени внутреннего раскодирующего файла. Это имя для PNG 24bitcolor, подробности в доке есть.
    r300 - выходное разрешение
    sOutputFile - выходные файлы, процент-d с числом впереди это как нумеровать файлы (разрядность счётчика). Отдельно прикололо что в доке https://ghostscript.readthedocs.io/en/latest/Use.html написано ставить в cmd.exe двойные проценты чтоб заэкранировать от shell, но по факту нужен один значок процентов, иначе создается единственный файлик с первой страничкой. Но, может это потому что GS у меня на машине нашёлся ещё версии 9.19, а сейчас 10я.
     
    Строку составил по прекрасной доке, указанной выше.
     

    Всего записей: 3058 | Зарегистр. 15-07-2010 | Отправлено: 05:19 02-06-2023 | Исправлено: TelecomUral, 09:33 02-06-2023
    vasyosuol 24

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    TelecomUral

    Цитата:
    Очень простой интерпретатор, всегда меня выручает. Настоятельно советую.  

    Хорошо, попробую разобраться <в очередной раз попробую>. Староват я уже стал для этих дел, да... :-\
    А кто такой "Ульман"?

    Всего записей: 1101 | Зарегистр. 16-01-2013 | Отправлено: 14:29 02-06-2023
    TelecomUral

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    vasyosuol 24
    кто такой "Ульман"?

     
    автор книжек по программированию.

    Всего записей: 3058 | Зарегистр. 15-07-2010 | Отправлено: 14:32 02-06-2023
    los

    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    vasyosuol 24, эта версия
    _https://github.com/oschwartz10612/poppler-windows
    На вашей версии widows не запускается?

    Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 14:48 02-06-2023
    vasyosuol 24

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    los
    Нет не запускается, ошибка: "это приложение не win32". И не не "моей версии", а на классической Windows 2000 СП4.

    Всего записей: 1101 | Зарегистр. 16-01-2013 | Отправлено: 15:10 02-06-2023
    kot666



    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Друзья, подскажите консольную тулзу, которая сможет сделать отчёт по PDF-файлу (кол-во страниц, цветов, слоёв и тд и тп).
    Благодарю.

    Всего записей: 406 | Зарегистр. 06-02-2006 | Отправлено: 15:21 02-06-2023
    vasyosuol 24

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    TelecomUral
    GhostScript 9.22 на Windows 2000 вполне себе запустился; осталось только получить нужное )).
    Попробовал "тупо" вашу строчку под свои нужды приспособить - не-а, не выходит каменный цветок! (с). Самое непонятное - оно и ошибок никаких не выдаёт, просто... "Молчит, падлюка!" (с). Он (GhostScript), правда, и изначально "молчит" - только на "gxpswin32.exe --help" у меня и "раскололся"; думал сначала, что просто на Windows 2000 не работает. Нет, вполне себе работает, только вот... Результат?  
    Что я сделал: вместо "вашего"
    Код:
    temp\ulman-%03d.png ulman.pdf
     
    я поставил своё:
    Код:
    D:\200w6cs_00_dfu_eng.pdf
     
    И... Ничего! Совсем ничего - хоть бы обругался, что ли?

    Всего записей: 1101 | Зарегистр. 16-01-2013 | Отправлено: 15:33 02-06-2023
    los

    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    kot666, часть подобной информации могут вывести pdfinfo, pdfimages, pdffonts - xpdf, poppler. В пакете poppler есть еще программа poppler-dump которая объединяет в себе некоторые возможности  pdfinfo, pdfimages, pdffonts и имеет дополнительные.
    Достаточно много информации выводит cpdf как для файла так и для его страниц.
     
    P.S.
    Указывайте под какую ОС требуются программы.

    Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 16:57 02-06-2023
    73



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Для престарелых ОСей, остальных дряхлостей, и не только:
    OakDoc PDF to Any Converter Command Line

    Всего записей: 1150 | Зарегистр. 18-08-2012 | Отправлено: 17:17 02-06-2023
    kot666



    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    los
    Под Win x64.
    В данный момент, больше всего интересует инфа о цветах.
     
    PDFinfo умеет извлекать только meta данные.

    Всего записей: 406 | Зарегистр. 06-02-2006 | Отправлено: 17:29 02-06-2023 | Исправлено: kot666, 17:48 02-06-2023
    los

    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    kot666

    Цитата:
    В данный момент, больше всего интересует инфа о цветах.  

    если речь о кол-ве цветов, то с таким не сталкивался. Но если не найдете и файл содержит растровые изображения можете извлечь картинки и посчитать ко-во цветов в них.

    Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 18:20 02-06-2023
    kot666



    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    los

    Цитата:
    файл содержит растровые изображения
    Вектор. =(

    Всего записей: 406 | Зарегистр. 06-02-2006 | Отправлено: 18:32 02-06-2023
    TelecomUral

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    vasyosuol 24
    И... Ничего! Совсем ничего - хоть бы обругался, что ли?

    В вашем примере куска кода одно значение - имя входного (видимо!) файла pdf. А у меня вы процитировали два значения - сначала маска имени выходных тиффов ( по ней получатся ulman-001.png, ulman-002.png, и до ulman-012.png, все они создались в подпапке temp текущей директории) а затем имя входного файла ulman.pdf.  
    Куда вы дели имена выходных файлов - ? Которые должны без пробела стоять сразу после знака "=" и, видимо, быть с маской. Вам же не одна страница нужна скорее всего. Посмотрите доку, раздел One file per page (один файл на каждую страницу), там даже пример есть, от какой маски какие файлы получатся.
     
    Я так и думал, что надо было и скриншоты всей доки приложить, и входной файл, и выходные получившиеся файлы. Но поленился.
     
    UPD
    и не путайте одну консоль с другой. В составе GS есть версия интерпретатора, это окошко с приглашением "GS> " и можно команды вбивать, а есть чисто командный экзешник - он с буквой "c" на конце имени. Я запускал из виндового CMD.EXE именно его. Он отрабатывает строку переданных параметров и заканчивает работу, отчитываясь в окошко CMD.EXE.
     
    UPD2
    подумал: может у вас подпапки temp нету?

    Всего записей: 3058 | Зарегистр. 15-07-2010 | Отправлено: 18:45 02-06-2023 | Исправлено: TelecomUral, 18:57 02-06-2023
    los

    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    kot666

    Цитата:
    Вектор. =(  

    поробовал на одноцветном векторном pdf - экспортировал в растр и посчитал кол-во, и цвет в rgb и кол-во получилось верным. Насколько это действенно и приемлемо для многоцветного векторного pdf не знаю.
    А есть графические программы которые выводят подобную информацию? Если есть выложите пример файла(одной страницы достаточно) сверим результаты.

    Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 19:02 02-06-2023
    vasyosuol 24

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    TelecomUral

    Цитата:
    В вашем примере куска кода одно значение - имя входного (видимо!) файла pdf. А у меня вы процитировали два значения - сначала маска имени выходных тиффов  

    Да, я понял уже свою ошибку; поправился. И... оно пошло сыпать ошибками, как их перенаправить в > out.txt? В моём примере "> out.txt" выход получился "пустой", я что-то не так сделал?

    Цитата:
    Я так и думал, что надо было и скриншоты всей доки приложить, и входной файл, и выходные получившиеся файлы. Но поленился.  

    Это я скорее поленился; извините. Просто общая "задёрганность" сказывается; другие проблемы приходится решать параллельно...

    Цитата:
    и не путайте одну консоль с другой. В составе GS есть версия интерпретатора, это окошко с приглашением "GS> " и можно команды вбивать, а есть чисто командный экзешник - он с буквой "c" на конце имени

    Т.е. я "не ту" версию взял?

    Цитата:
    Я запускал из виндового CMD.EXE именно его. Он отрабатывает строку переданных параметров и заканчивает работу, отчитываясь в окошко CMD.EXE.  

    Я всё запускаю из Far (Far Manager). По сути, та же консоль, только более удобная.
    Но я так и не понял, какая версия GhostScript нужна именно мне, непременно "с буквой "c" на конце имени?"

    Всего записей: 1101 | Зарегистр. 16-01-2013 | Отправлено: 19:05 02-06-2023
    TelecomUral

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    vasyosuol 24
    какая версия GhostScript нужна именно мне

    не версия. Внутри версии есть несколько экзешников. В моём экземпляре gswin32.exe и gswin32c.exe. Нужен второй.
     
    Попробовал сохранить вывод в errors.txt, без проблем:
     

     

     
    Вероятно, у вас после знака ">" пробел лишний.
     
    И я бы не советовал использовать иные оболочки. Far штука непростая, и с GS его не тестировали, условно говоря. Я понимаю, конечно, что чудес не должно бы быть. Но не советую. Вы же сами просите консольное решение, а это cmd.exe.

    Всего записей: 3058 | Зарегистр. 15-07-2010 | Отправлено: 19:20 02-06-2023 | Исправлено: TelecomUral, 19:28 02-06-2023
    vasyosuol 24

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    TelecomUral

    Цитата:
     Внутри версии есть несколько экзешников. В моём экземпляре gswin32.exe и gswin32c.exe. Нужен второй.  

    В "моей версии" один экзешник; скрин прилагаю.


    Цитата:
    Попробовал сохранить вывод в errors.txt, без проблем: Вероятно, у вас после знака ">" пробел лишний.

    Возможно, не спорю. Буду пробовать дальше...

    Цитата:
    И я бы не советовал использовать иные оболочки.

    К сожалению, это невозможно. Сама идея как раз в том, чтобы эта строчка должна вызываться из сторонней программы. Иначе кому она нужна, такая хорошая?

    Цитата:
    Far штука непростая, и с GS его не тестировали, условно говоря.

    Я уже 25 лет "сижу под Far", иначе не могу, честно говоря . Хотя "ради чистоты эксперимента" и готов отказаться на время. Но... Ситуацию это всё равно не решает; повторяю, в дальнейшем предполагается вызов из другой программы, так что... пурку па пуа? Почему бы не из Far?

    Цитата:
    Вы же сами просите консольное решение, а это cmd.exe.

    Тут не спорю ))
     
     
     
     
    Добавлено:
    По поводу 2-х файлов: вот, в последней версии, их действительно 2-а

     
    Добавлено:
    Кстати, версия 10.01.1 на Windows 2000 не взлетела - вот вам и Ghostscript! Использую версию 9.22 - тут, похоже, без вариантов ((

    Всего записей: 1101 | Зарегистр. 16-01-2013 | Отправлено: 20:43 02-06-2023
    kot666



    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    los
    Цитата:
    экспортировал в растр и посчитал кол-во
    Дело в том, что эта информация просто хранится в PDF файле. Её можно попытаться извлечь SEDом.
    Я думал, что есть какая-то утилита, уже умеющая это делать.

    Всего записей: 406 | Зарегистр. 06-02-2006 | Отправлено: 21:28 02-06-2023
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

    Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru