Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Заменить/удалить текст (batch есть), в т.ч. кириллицу (не панацея!) - PDF Replacer
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: 73, 09:51 29-08-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amosopher say:

Цитата:
В книге 726 страниц и делать это вручную постранично будет очень трудозатратно.

 
Как вариант использовать сторонние средства автоматизации. На данном форуме ссылок на такие средства достаточно.

Всего записей: 692 | Зарегистр. 18-05-2023 | Отправлено: 23:40 04-02-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amosopher

Цитата:
Имеется pdf-файл, в котором на каждой странице скрытым слоем внедрён текст. ... Вопрос — можно ли (в том же XChange например) удалить этот паразитный невидимый элемент сразу со всех страниц разом?

Насколько я понял, этот "паразитный" текст является текстом, т.е. это не ватермарк, не комментарий, не xforms, не shape, не отдельный слой. Это просто невидимый текст и удалить его как объект нельзя, т.к. при удалении "паразитного" текста будет удаляться и полезный текст.
Напрашивается решение удалить такой текст с помощью функции Find and Replace, типа как в обычных текстовых редакторах а-ля Word.  
Проблема в том, что:
- в общем случае функция Find and Replace в pdf-редакторах невозможна вообще, почему - это другой разговор
- в pdf-редакторах, где есть функция Find and Replace - Acrobat, FineReader, Wondershare Element - она работает очень своеобразно
 
Короче говоря, для удаления этого "паразитного" текста нужно 4 клика на страницу - около одного часа работы. ИМХО это не очень трудозатратно. Устанавливать новый софт, искать в интернетах, лазить по менюхах - вот это вот всё - займёт больше времени. Другое дело, если таких файлов много. Тогда для начала можно попробовать вышеприведённые pdf-редакторы и поискать другие. Как вариант - может какой-то плагин для Adobe Acrobat умеет что-то такое.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 00:46 05-02-2024 | Исправлено: jourmager, 00:54 05-02-2024
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amosopher
В левом меню Акробата есть панель Content, где показывается вся информация на странице.
Там ваш текст отдельным элементом. Не выделяя его, удаляете по правой кнопке мыши (мышь наводить на значок текста).
Правда придётся пробежать по каждой странице, но действие одно.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4314 | Зарегистр. 18-09-2003 | Отправлено: 06:19 05-02-2024
Geoleo

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amosopher

Цитата:
Имеется pdf-файл, в котором на каждой странице скрытым слоем внедрён текст ТюмГУ

На каждой странице имеется, как минимум, 50 блоков прозрачного текста "ТюмГУ (г. Тюмень). Институт дистанционного образовани" (без кавычек).

 
Результат удаления заданного текста в публикации:

 
Результат анализа на наличие прозрачных объектов в файле (элемент preflite)

Всего записей: 371 | Зарегистр. 05-05-2004 | Отправлено: 08:53 05-02-2024 | Исправлено: Geoleo, 09:22 05-02-2024
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Есть ли способ исправить крякозабы?:
https://drive.google.com/file/d/1lx4UWFLKY28UVQujx4xO7ZOBIkw2fRWl/view?usp=drivesdk
Файл пдф тут:
https://cloud.mail.ru/public/yuDq/8Q257XmtU

Всего записей: 482 | Зарегистр. 22-06-2016 | Отправлено: 11:38 05-02-2024 | Исправлено: esys, 11:39 05-02-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Geoleo
Вы пропустили самый интересный этап - создание экшена Adobe Acrobat для повторения Find and Replace 30000 раз.
esys
Если это единственные кракозябры в файле, то их проще всего перебить вручную на основе оригинального текста.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 12:30 05-02-2024
useretail



BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Если это единственные кракозябры в файле, то их проще всего перебить вручную на основе оригинального текста

разве решение упомянутое MBK2 не работает?

Всего записей: 4985 | Зарегистр. 14-09-2007 | Отправлено: 12:45 05-02-2024
Geoleo

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
создание экшена Adobe Acrobat для повторения Find and Replace 30000 раз

Поясните, пожалуйста, о каком Action для Acrobat идет речь? Насколько мне известно, в Adobe Acrobat DC создавать Actions нельзя. Вот  в plug-in Enfocus PitStop Pro создавать свои Actions можно, даже нужно! Достаточно создать один Action и не надо это делать 30000 раз!))) Результат работы такого Action на втором скриншоте экрана.
Так что Вы имели ввиду в своем замечании с "самым интересным этапом"?

Всего записей: 371 | Зарегистр. 05-05-2004 | Отправлено: 12:45 05-02-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
useretail

Цитата:
разве решение упомянутое MBK2

Это решение предложил ув. ComboFZ
А MBK2 тут вообще не причём, от него только пустые разглагольствования. Предупреждаю сразу - это не переход на личности, а констатация факта, по крайней мере для этой темы.
Нет, не исправляет, потому что программа pdf-recode исправляет несоответствие глифов и буквенных значений, т.е. когда текст виден нормально, а копируется как кракозябры. А в данном случае и копируются кракозябры и текст виден как кракозябры, т.е. претензий к соответствию глифов и буквенных значений нет.
И перед тем, как написать свой предыдущий пост, я проверил на всякий случай действие всех пяти вариантов pdf-recode. Результат, как и ожидалось - отрицательный.
 
Geoleo

Цитата:
Вот  в plug-in Enfocus PitStop Pro создавать свои Actions можно, даже нужно!

А у вас plug-in Enfocus PitStop Pro запускается отдельно, без Adobe Acrobat?

Цитата:
Поясните, пожалуйста, о каком Action для Acrobat идет речь? Насколько мне известно, в Adobe Acrobat DC создавать Actions нельзя.

У вас Adobe Acrobat какой версии? У меня 22-я и в ней есть Action Wizard. Я им никогда не пользовался по причине отсутствия потребности, так что работоспособность для данного случая подтвердить не могу. И вообще я по Акробату и его плагинам не спец.

Цитата:
Достаточно создать один Action и не надо это делать 30000 раз!

Ну да. Я же написал - "создание экшена Adobe Acrobat для повторения Find and Replace 30000 раз"
Т.е экшен будет повторять Find and Replace 30000 раз. А иначе зачем экшен, если всё делается за один раз.

Цитата:
Так что Вы имели ввиду в своем замечании с "самым интересным этапом"?

То, что и написал раньше.
У вас первым пунктом "На каждой странице имеется, как минимум, 50 блоков прозрачного текста"
А вторым пунктом "Результат удаления заданного текста в публикации"
А каким образом этот результат удаления получен? Магией? Заклинаниями с бубном или волшебной палочкой? Почему всё надо клещами тянуть? У вас за 20 лет - 350 постов, т.е. вы за набивкой постов не гонитесь, как некоторые. Почему сразу не написать:
 У меня Adobe Acrobat такой то версии. В нём стоит также плагин Enfocus PitStop Pro. С помощью этого плагина можно автоматизировать функцию Find and Replace у программы Adobe Acrobat, путём записи последовательности действий (аналог макроса у Word), чтобы не тыцкать 30000 раз в данном случае, потому что долбодятлы в Adobe за 30 лет не могут докумекать до функции Find and Replace All, которая даже в Блокноте есть. И без всяких скриншотов.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 13:34 05-02-2024 | Исправлено: jourmager, 13:38 05-02-2024
Geoleo

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
У меня 22-я и в ней есть Action Wizard

Все верно, Action Wizard (Мастер действий) в Acrobat DC есть, но комплект действий может быть создан из тех действий, которые уже существуют в меню программы, т.е. очень ограничен.

Цитата:
не могут докумекать до функции Find and Replace All, которая даже в Блокноте есть. И без всяких скриншотов.

Осталось совсем немного... Узнать малую малость - всего-то чего искать (Find) и без всяких скриншотов.

Всего записей: 371 | Зарегистр. 05-05-2004 | Отправлено: 14:02 05-02-2024
useretail



BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
А MBK2 тут вообще не причём

еще как при чем, ведь это именно он пропатчил упомянутый pdf-recode
 
для начала необходимо выяснить что это за кодировка, так как проблема именно в ней

Всего записей: 4985 | Зарегистр. 14-09-2007 | Отправлено: 14:31 05-02-2024 | Исправлено: useretail, 14:32 05-02-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
useretail

Цитата:
еще как при чем, ведь это именно он пропатчил упомянутый pdf-recode

Угу. А ещё он пропатчил KDE под FreeBSD.  
Откуда вы взяли, что MBK2 вообще что-то патчил?  
pdf-recode написана на perl, причём хитромудро, и там никто ничего точно понять не может. Потому что автор делал версии программы под каждый новый вариант кракрзябров, а не по какому-то предначертанному плану. Т.е. костыль на костыле.
А те пять вариантов, которые висят для скачивания на rudtp, собрал администратор темы из постов автора pdf-recode под ником "1998" и упаковал в один архив. Всё это я уже писал

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 14:45 05-02-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
useretail
для начала необходимо выяснить что это за кодировка

там вроде не в кодировке дело. Шрифт встроен нерусский, что ли. Сайт 2cyr показывает нормальные слова только если выставить "win1251 отображать как win1252".
 

Всего записей: 3330 | Зарегистр. 15-07-2010 | Отправлено: 14:50 05-02-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:

Цитата:
Откуда вы взяли, что MBK2 вообще что-то патчил?

И это не переход на личности? Да как из пулемёта и именно оно.

Всего записей: 692 | Зарегистр. 18-05-2023 | Отправлено: 15:17 05-02-2024
toR_nado



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
amosopher
Ещё один вопрос возник. Имеется pdf-файл, в котором на каждой странице скрытым слоем внедрён текст ТюмГУ.

Infix PDF Editor вполне справляется с этой задачей (использовал Infix PDF Editor 7.5.1 portable).
Для начала нужно исправить файл в PDF-XChange (обсуждалось выше с другим фалом) иначе получим распухший файл и обрабатывается он дольше.
Открываем в Infix Правка-->Поиск и замена-->Найти-->вставить текст для поиска-->Найти все
Результат найдено совпадений: 36300
Поле Заменить оставляем пустым. Жмем Заменить все. У меня обрабатывалось где то по 150 стр. с пере сохранением файла. Мой совет по завершению сохранить файл как финальную версию. Файл
 

Всего записей: 316 | Зарегистр. 20-05-2006 | Отправлено: 15:21 05-02-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
toR_nado

Цитата:
Infix PDF Editor вполне справляется с этой задачей (использовал Infix PDF Editor 7.5.1 portable).

Подтверждаю. Этот способ Find and Replace с заменой текста на пустое место действует.
Но я использовал не Iceni Infix PDF Editor, а его клон SoftMaker FlexiPDF.
Процесс замены происходил несколько своеобразно, с промежуточными автосохранениями.
И есть нюанс - текст удаляется, а вот блоки, где был текст - не удаляются. Остаётся некая структура, которую PDF-XChange Editor показывает как Place.
На 500 страниц ушло 15 минут. Программисты Infix/Softmaker не умеют в многопоточность. А потом программа вылетела. Но сам метод рабочий.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 16:25 05-02-2024
useretail



BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Откуда вы взяли, что MBK2 вообще что-то патчил?

не откуда, а с чего: он сам об этом в деталях писал
может в это и трудно поверить, но внезапно MBK2 еще и толковый специалист
 
TelecomUral

Цитата:
там вроде не в кодировке дело. Шрифт встроен нерусский, что ли

именно в кодировке. шрифт текста диаграммы не встроен, а берется из системы (Arial Bold)
 

Цитата:
Iceni Infix PDF Editor


Цитата:
Результат найдено совпадений: 36300

если дешево и сердито, то сойдет. но по хорошему, в таких ПДФках нужно удалять целый объект, а не только заменять искомый текст на пустую строку
 
и в первом и во втором случаях универсальной софтины нет, тут нужно писать свои утилиты

Всего записей: 4985 | Зарегистр. 14-09-2007 | Отправлено: 17:45 05-02-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
useretail say:

Цитата:
именно в кодировке.

Поковырялся в pdf-ке и узнал (раньше не знал) о существовании 2х "системных" кодировок:

Код:
 
/Encoding /WinAnsiEncoding
/Encoding /Identity-H
 

Все остальные перекодировки производятся с помощью встроенных в pdf таблиц кодировки.
А есть ещё какие то "системные" перекодировки? Чтобы без составления собственной таблицы кодировки?

Всего записей: 692 | Зарегистр. 18-05-2023 | Отправлено: 18:06 05-02-2024 | Исправлено: zvezdochiot, 18:07 05-02-2024
toR_nado



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
useretail
... в таких ПДФках нужно удалять целый объект, а не только заменять искомый текст на пустую строку

А почему такая уверенность что все именно так.
Акробатом не пользуюсь, а PDF-XChange видимо так запрятал эти пустые строки.  
Обработанный файл в моем посте выше.
 


Всего записей: 316 | Зарегистр. 20-05-2006 | Отправлено: 18:24 05-02-2024
useretail



BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
Поковырялся в pdf-ке

указанная там кодировка почему-то игнорируется
думаю это связано с тем, что использовались несколько (не очень совместимых между собой) программ
или-же разные библиотеки
 
toR_nado

Цитата:
А почему такая уверенность что все именно так

потому что именно так устроен PDF формат

Всего записей: 4985 | Зарегистр. 14-09-2007 | Отправлено: 18:55 05-02-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru