Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Заменить/удалить текст (batch есть), в т.ч. кириллицу (не панацея!) - PDF Replacer
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: 73, 09:51 29-08-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vito333
я подозреваю, что можно написать батничек и внедрить его в контекстное меню. А батничком вызывать какую-нибудь консольную утилитку с ключом "объединить".  
Но это не точно
 
А так - меню, подобное вашему, мне pdf-xchange editor повесил.

Всего записей: 3330 | Зарегистр. 15-07-2010 | Отправлено: 21:30 09-10-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
 
какую-нибудь консольную утилитку
 

 
Ежели надо JPEG-и в PDF упаковать, то консольная утилита - это jpeg2pdf. Ежели PDF-ки объединить, то консольная утилита - это qpdf.
 

Всего записей: 692 | Зарегистр. 18-05-2023 | Отправлено: 21:44 09-10-2023 | Исправлено: zvezdochiot, 21:48 09-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Хотел почитать статейку про распознавание
https://disk.yandex.ru/i/wY2nqaQE66HOZQ
(md5=7B3A5FE48F51D7073186390A2610BF4F)
Нечитаемо: ни в одном вьювере, которые есть в системе, текст не виден. В полном акробате тоже. Залез в pdf-xchange editor, видно что слова изображениями. Как это можно исправить? Я с масками не умею работать. Потыкался наугад, бесполезно. Надо соображать.
 
Кстати, в sumatraPDF текст виден, что ещё раз говорит о её кривости Даже за вьювер не считаю.

Всего записей: 3330 | Зарегистр. 15-07-2010 | Отправлено: 08:20 22-10-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Нечитаемо: ни в одном вьювере, которые есть в системе, текст не виден.

открыл в нескольких - во всех все читаемо.

Цитата:
Как это можно исправить?

экспорт в изображение, 1 стр - 1 изображение, затем в pdf
https://workupload.com/file/7EtZKU4AqUJ

Всего записей: 7731 | Зарегистр. 08-09-2001 | Отправлено: 11:19 22-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Как это можно исправить? Я с масками не умею работать.

В данном конкретном случае с ними не работать надо. Их надо все удалить.
Как это сделать для одного изображения я знаю, но все одновременно одной кнопкой - увы, нет. Недоработочка со стороны PDF-XChange в моём случае.
Попробовал маски привести к 1 (одному) dpi - сработало, но очень не везде.
В FineReader есть опция Remove Color Mask, но даже после преобразования исходных indexed в RGB jpg всё равно пишет, что не может удалить маску с чёрно-белого изображения.
 

Цитата:
sumatraPDF текст виден, что ещё раз говорит о её кривости  Даже за вьювер не считаю.

Хорошо, хоть смайлик поставили Всё-таки, не будем забывать, что SumatraPDF в качестве движка pdf, epub, fb2 использует mupdf, который Artifex, который ghostscript.
 
los

Цитата:
открыл в нескольких - во всех все читаемо.

Огласите весь список, пожалуйста.
Со своей стороны оглашу свой список, где текст не виден:
Acrobat 11, 22 (?), FineReader 16, Foxit Pro 22, Nitro Pro 13, FlexiPDF, Wondershare, PDF-XChange, Readiris PDF, Inceni Infix, AMS PDF Commander, Orpalis PaperScan, частично STDUviewer (хе-хе)

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 12:55 22-10-2023 | Исправлено: jourmager, 20:22 22-10-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager, Preview, Skim, ToyViewer, Seashore, Diffraction, PDF Checkpoint, PDF Expert, Clearview, EPSViewer, mupdf-gl и др. Полегчало?
 
P.S.
Некоторые GraphicConverter 12, Acorn др. позволяют выбрать два режима просмотра с прозрачным фоном и без него.

Всего записей: 7731 | Зарегистр. 08-09-2001 | Отправлено: 13:29 22-10-2023
popov_al



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
как все запутано...
 
открыл в Acrobat Pro (у меня 8) - читабельно, но с трудом... отправил на печать в pdf
 
получился нормальный pdf - все читается прекрасно...
 
и не надо иметь/перебирать кучу "левого" софта

Всего записей: 481 | Зарегистр. 22-05-2008 | Отправлено: 13:47 22-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los

Цитата:
Полегчало?

Да, полегчало. Все эти программы для Linux или macOS, не так ли?
Я в своём посте намекнул, что отсутствие отображения данных изображений во всех профессиональных pdf-редакторах и наличие их отображений в SumatraPDF связано с глюком в mupdf/ghostscript, что вы на 1/10 подтвердили, указав среди программ mupdf-gl.
Искать в гугле, на чём сделаны остальные ваши программы с названиями preview, toy, seashore, checkpoint, expert, clearview, viewer - крайне затруднительно, я попробовал.
Ваш метод, безусловно, рабочий - если экспортировать программой, которая не видит такие маски. Проблема в том, что когда этот глюк в mupdf/ghostscript исправят, то это уже будет проблематично. Т.е. нужен какой-то более универсальный метод удаления кривых масок. Может такое умеет PitStop последних версий, но у меня его нет.
 
popov_al

Цитата:
открыл в Acrobat Pro (у меня 8) - читабельно, но с трудом... отправил на печать в pdf
получился нормальный pdf - все читается прекрасно...
и не надо иметь/перебирать кучу "левого" софта

Acrobat 8 - это 2006 год. Теоретически он должен поддерживать все фичи pdf 1.7, но на практике - "читается с трудом".
Спасибо хоть смайлик поставили не "левом" софте, а то ещё можно принять за чистую монету.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 13:49 22-10-2023 | Исправлено: jourmager, 13:57 22-10-2023
BorlandIMHO

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Нечитаемо:

LibreOfficeDraw вполне приемлемо читает.
И вполне может экспортировать в формат, читабельный браузером (Edge, Firefox).
https://wdfiles.ru/27Smk
Ну, и напечатать тоже...


----------
http://www.imho.ws

Всего записей: 2655 | Зарегистр. 12-10-2006 | Отправлено: 16:49 22-10-2023
popov_al



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Acrobat 8 - это 2006 год. Теоретически он должен поддерживать все фичи pdf 1.7, но на практике - "читается с трудом".  

я еженедельно редактирую (чищу) сотни pdf и опции (возможности) Pro 8 меня полностью устраивают...  (и все pdf нормально открываются)
 
а есть ли такие возможности в следующих версиях Pro - лень проверять
(в 9 точно есть - но уже криво сделано...)
 
и менять компы и винду ради новой версии Про - смысла никакого...
 
 
 

Всего записей: 481 | Зарегистр. 22-05-2008 | Отправлено: 16:58 22-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Чудеса в решете. Дёрнуло меня перепроверить этот странный файл - теперь в Acrobat 11 и 22 текст видно так же как и в STDUviewer - контуры с трудом. Остальные показывают как и раньше - почти белые листы.
 
popov_al

Цитата:
я еженедельно редактирую (чищу) сотни pdf и опции (возможности) Pro 8 меня полностью устраивают

С одной стороны это понятно, с тех времён новых фичей в стандарте pdf нет, а основные возможности по редактированию как бы отлажены на предыдущих версиях.  
Но, с другой стороны...
Не знаю, что вы подразумеваете под "чищу", но я сейчас собираюсь привести в порядок свою коллекцию.
И для меня самым удобным пока что является PDF-XChange PRO.
Что-то мне сомнительно, что Акробат 8 может загружать одновременно несколько файлов, или выставлять размеры страницы в % или в мм, или рекомпрессировать страницы в нужный формат. Ну и разные мелкие удобства, которые нарабатываются годами работы с пользователями.
Я с помощью Акробата не могу сжать примитивный pdf - он отказывается сжимать jpg внутри pdf. Бред вообще. Из 40 МБ делает только 38, а можно 9. А в jpeg2000 запросто сжимает до 11. Ага.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 19:29 22-10-2023
popov_al



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Не знаю, что вы подразумеваете под "чищу",
 

я работаю, в основном, со стандартами, сейчас все поставщики/продавцы "пихают" в них и кто скачал и когда и с какого IP и прочие вставки, причем как текстовые, так и графические
и все это делают разными способами
 
приходится все подобные вещи убирать

Цитата:
 
но я сейчас собираюсь привести в порядок свою коллекцию.
И для меня самым удобным пока что является PDF-XChange PRO.
 

у каждого свои запросы...

Цитата:
 
Что-то мне сомнительно, что Акробат 8 может загружать одновременно несколько файлов,  
 

да есть проблема, может открыть только 50 файлов одновременно

Цитата:
 
или выставлять размеры страницы в % или в мм, или рекомпрессировать страницы в нужный формат. Ну и разные мелкие удобства, которые нарабатываются годами работы с пользователями.
Я с помощью Акробата не могу сжать примитивный pdf - он отказывается сжимать jpg внутри pdf. Бред вообще. Из 40 МБ делает только 38, а можно 9. А в jpeg2000 запросто сжимает до 11. Ага.

так Вы работаете не с pdf, а с графикой (сканами)...  
это 2 разные вещи...
 
я например, все сканы храню только в оригинальном графическом формате
 
 

Всего записей: 481 | Зарегистр. 22-05-2008 | Отправлено: 19:45 22-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
уфф, накидали... стоило на полдня отъехать
спасибо, завтра буду вчитываться.
(я конечно решил еще утром проблему, послав на печать в принтер "Abode PDF". Но спрашивал я именно о подправке маски.)

Всего записей: 3330 | Зарегистр. 15-07-2010 | Отправлено: 19:53 22-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
popov_al

Цитата:
сейчас все поставщики/продавцы "пихают" в них и кто скачал и когда и с какого IP и прочие вставки, причем как текстовые, так и графические

Понятно. Сравнительно недавно поднималась похожая тема - как убрать ватермарки со зверушкой - один мастер под Акробат даже экшн сделал через PitStop ЕМНИП. Хотя в PDFXCh это делалось в 2 клика (с оговорками).

Цитата:
так Вы работаете не с pdf, а с графикой (сканами)...  это 2 разные вещи...

Нет. Данный пример я приводил как раз true pdf - изображения в виде jpg и текст в виде векторных шрифтов. И вообще - pdf - это контейнер, поэтому говорить, что "это 2 разные вещи" как-то странно.
 
Я с этим косяком Акробата, что 11, что 22 - не первый раз сталкиваюсь. Все сжимают jpg, а он не хочет. У меня есть подозрение почему так, но это надо будет проверить.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 20:04 22-10-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
popov_al

Цитата:
и не надо иметь/перебирать кучу "левого" софта

Вы не поверите, но sed-ом удалил все /Mask и qpdf-ом исправил все xref. Всё.

Всего записей: 692 | Зарегистр. 18-05-2023 | Отправлено: 21:08 22-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot
этим советом трудновато воспользоваться - "Mask" нет в файле. Да и sed не для слабонервных.
Приведите набор команд.

Всего записей: 3330 | Зарегистр. 15-07-2010 | Отправлено: 04:59 23-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Имеется почти обычный pdf-файл, где текст на каждой странице относится к объекту под определённым номером.
Вот 2 страницы из такого файла, весь основной текст на 1-й странице относится к объекту №26, на 2-й - к №40.
Вопрос - как можно объединить эти объекты под один номер?
Так, чтобы текст на 1-й и 2-й страницах относился бы к объекту под одним номером - например, №99.
Желательно как-то автоматически, потому что вручную выделять текстовые блоки на 100 страницах маленькое удовольствие.
Если это вообще возможно.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 16:07 01-11-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:

Цитата:
как можно объединить эти объекты под один номер?  

Совершенно непонятно как этот "текст" должен потом отображаться, но это ладно. Не надо ни при каких обстоятельствах ужирнять объекты в pdf. Наоборот их надо делить на более мелкие. Раньше даже применялся такой приём - цельное изображение нарезалось на лоскуты (полосы) и комбинировалось из этих лоскутов. Лично встречал страницы, приводящие просмотрщик в конкретный ступор. А почему? А потому что на этих страницах был один жирнейший векторный объект, содержащий немеренное кол-во кругов или квадратов. Так что не надо ужирнять объекты в pdf, тем более умышленно.
 

Всего записей: 692 | Зарегистр. 18-05-2023 | Отправлено: 16:59 01-11-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
не надо ужирнять объекты в pdf

Вот только что открыл пару книг, где текст с одинаковыми параметрами (шрифт, размер и т.д.) относился к одному объекту на всех (нескольких, многих, почти всех страницах). И никаких отрицательных явлений замечено не было.

Цитата:
Совершенно непонятно как этот "текст" должен потом отображаться, но это ладно.

А вот как раз не ладно. Если в один объект можно вставить только текст с одинаковыми параметрами, то это усложняет задачу. Потому что очень часто текст на одной странице может иметь разный шрифт, или быть курсивом или жирным, или иметь другой размер.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 17:31 01-11-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
jourmager
Вопрос - как можно объединить эти объекты под один номер?

а зачем?!

Всего записей: 3330 | Зарегистр. 15-07-2010 | Отправлено: 17:46 01-11-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru