Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Заменить/удалить текст (batch есть), в т.ч. кириллицу (не панацея!) - PDF Replacer
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: 73, 09:51 29-08-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
useretail say:

Цитата:
указанная там кодировка почему-то игнорируется

Ну это вовсе не так. Ежели подменить шрифт на пользующий KOI8-R раскладку, то текст прекрасно отображается (за исключением пробелов). То есть кодировка /Encoding /WinAnsiEncoding точно указана неверно. Отсюда и вопрос:
 
zvezdochiot say:

Цитата:
А есть ещё какие то "системные" перекодировки?

 
 

Всего записей: 692 | Зарегистр. 18-05-2023 | Отправлено: 19:47 05-02-2024 | Исправлено: zvezdochiot, 19:48 05-02-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
А есть ещё какие то "системные" перекодировки?

адобовский стандарт на PDF, версия 1.3:
5.9
... It uses one of the predefined encodings MacRomanEncoding, MacExpert-
Encoding, WinAnsiEncoding, or any of the predefined CMaps listed in Table
5.14 on page 343 except Identity-H and Identity-V.  
 
UPD
esys
поэтому берете hex-редактор, приписываете к шрифту табличку маппинга ToUnicode, и всё заработает. Помнится, из предустановленных кодировок перейти к специальной встроенной кодировке нельзя никакой программой. Только руками стартовать процесс.

Всего записей: 3330 | Зарегистр. 15-07-2010 | Отправлено: 21:20 05-02-2024 | Исправлено: TelecomUral, 22:13 05-02-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сорри за оффтоп и вынужденный переход на личности, но не я первый начал. Пусть MBK2 благодарит useretail
useretail

Цитата:
не откуда, а с чего: он сам об этом в деталях писал

А ещё он писал, спустя 4 года - Я сам в перле не разбираюсь
Я этот его экзешник знаю, и что он там менял - тоже знаю. А вы знаете?
6 лет после того поста на rudtp - и ни одного исправленного pdf-файла этим экзешником или по той технологии. Его так называемый патченный экзешник абсолютно бесполезен. И на все просьбы юзеров в тамошней теме починить их файлы были ответы:  

Цитата:
разбираться как правильно перекодировать - безумно муторно
удочка для ловли рыбы существует и принцип действия ее описан в теме
Процесс подробно описан, просто вы читаете невнимательно.  
Ну я ж там, вроде, расписал подробно, как и что делать?  
Сходу конвертировать шрифты, так, чтобы Вадимова перловка их начала понимать у меня не получилось, а переписать программу под поддержку TTF - дело безблагодатное, да и я не настолько незанят В общем, самый приемлемый путь для топикстартера (хоть и муторный, как я уже говорил выше) - брать InFix и ремапить в нем символы по одному:
Видимо, какие то тонкости есть, почему сходу не хляет
Что делать, если к вам пришли гости, а в доме нет продуктов? Пошлите кухарку в погреб, пускай она нарежет холодной буженины
IMHO - нетривиальная задача Ибо там, по идее, масса подводных камней может быть. Разве что чисто по кодировке?
Вы, вероятно, неправильно меня поняли. Я вовсе не рекомендовал эту утилиту для проверки и приведения макета к надлежащему виду, более того, лично я ее даже не запускал ни разу. И, скорее всего, Кэп подсказывает, что она с проблемами кодировки кириллического текста она и не поможет.  

Короче - языком трепать - не мешки ворочать.
 

Цитата:
может в это и трудно поверить, но внезапно MBK2 еще и толковый специалист  

Если вы дадите ссылку на его полезный пост (лучше во множественном числе - посты) с конкретными полезными рекомендациями - ОК.
Дело в том, что я на этом форуме знаю десяток специалистов, действительно помогающих своими советами. И могу привести сотню ссылок на толковые советы от них. Можно начать с шапки.
 

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 21:26 05-02-2024
useretail



BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
Ежели подменить шрифт на пользующий KOI8-R раскладку, то текст прекрасно отображается (за исключением пробелов). То есть кодировка /Encoding /WinAnsiEncoding точно указана неверно

WinAnsiEncoding это или Windows 1252 или ISO 8859-1 при чем тут KOI8-R и тем более шрифты не совсем понятно. боюсь предположить, что это какие-то костыли, опираться на которые в 2024-м нет никакого смысла
 
TelecomUral

Цитата:
ToUnicode, и всё заработает

не заработает, я-же говорю что кодировка игнорится

Всего записей: 4985 | Зарегистр. 14-09-2007 | Отправлено: 03:38 06-02-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
useretail
не заработает, я-же говорю что кодировка игнорится

вы профи в pdf? Вроде нет. Тогда чего спорите без выдачи подтверждающего примера.
Я уже проделывал подобную операцию пару лет назад когда в стандарте разбирался. В этой же ветке.

Всего записей: 3330 | Зарегистр. 15-07-2010 | Отправлено: 06:12 06-02-2024 | Исправлено: TelecomUral, 06:15 06-02-2024
MBK2

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
поэтому берете hex-редактор, приписываете к шрифту табличку маппинга ToUnicode

Ну ее еще как то сгенерить надо, да и нельзя просто так взять и впердолить в PDF что-либо обычным hex редактором.

Всего записей: 5033 | Зарегистр. 18-09-2018 | Отправлено: 07:22 06-02-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MBK2
ну... в общем-то hex на то и hex, что им ВСЁ можно сделать. Но, конечно, табличку xref придется править заодно.  
А взять маппинг можно любой стандартный, потом в Infix мышкой поправить проще. звездочет верно говорит - просто шрифт не в той кодировке.
 
Вполне возможно что какая-нибудь прога умеет заменить шрифт на новый но встроенный, а не типовой виндовый. Чтоб ToUnicode возник для нынешнего Arial+WinAnsiEncoding. Тогда руками ничего править не надо - скорее всего после такой замены pdf-recode сработает. Но в таких прогах я не спец.
 
UPD
Мысль пришла. Сгенерить новый пдф из одной странички с встроенным шрифтом, который уникален по имени и имеет спецкодировку. Добавить эту страничку к файлу esys. И указать замену шрифта ариал на уникальный. Затем пробовать pdf-recode. Может быть даже возможно сразу взять готовый шрифт из других пдф-ок, которые уже правильно перекурочены.

Всего записей: 3330 | Зарегистр. 15-07-2010 | Отправлено: 07:28 06-02-2024 | Исправлено: TelecomUral, 08:00 06-02-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
useretail say:

Цитата:
при чем тут KOI8-R и тем более шрифты не совсем понятно.

Разъясняю. С "системными" кодировками не вышло (нет в них KOI8). Но ежели внедрить в pdf-ку таблицу кодировки KOI8-R, и указать её как /Encoding для шрифта Arial-Bold, то текст будет отображаться. Вопрос только где взять такую таблицу (имеется в виду в Adobe-вском исполнении, там те ещё тараканы)? Откуда её скоммуниздить?
 

Всего записей: 692 | Зарегистр. 18-05-2023 | Отправлено: 12:50 06-02-2024 | Исправлено: zvezdochiot, 12:58 06-02-2024
MBK2

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Дело в том, что если там подмножество внедрено, то кодировка будет рандомная вообще.
И да, Infixом можно безо всяких Recode поправить, но руками править 100500 отшметков от шрифтов внутри PDF... o_O

Всего записей: 5033 | Зарегистр. 18-09-2018 | Отправлено: 13:15 06-02-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
там те ещё тараканы

в pdf-recode вариантов CMap - десятки. Вероятно этот вариант  подойдет:
https://disk.yandex.ru/d/OypErJu6M9uUuQ
со строки 35й.
 
Добавлено:

Цитата:
MBK2
кодировка будет рандомная вообще

если бы была рандомная кодировка - то сайт декодера 2cyr нифига бы не смог правильно отобразить.

Всего записей: 3330 | Зарегистр. 15-07-2010 | Отправлено: 13:18 06-02-2024
MBK2

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
если бы была рандомная кодировка - то сайт декодера 2cyr нифига бы не смог правильно отобразить

В большинстве случаев внедренного подмножества, она, к сожалению, именно рандомная, причем, по понятным причинам.
Чтобы такое починить существуют определенные подходы, самый простой из которых - перераспознать символы.

Всего записей: 5033 | Зарегистр. 18-09-2018 | Отправлено: 14:18 06-02-2024
useretail



BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
а что значит профи в pdf? как определить? критерии профессионализма какие?
 
раз все так легко, то покажите как надо на том самом одностраничном документе, тем более что в стандарте вы разбираетесь: https://cloud.mail.ru/public/yuDq/8Q257XmtU
 

Цитата:
прога умеет заменить шрифт на новый но встроенный, а не типовой виндовый

это тупик
 

Цитата:
Чтоб ToUnicode возник для нынешнего Arial+WinAnsiEncoding

не взлетит, юникод не использует кодовую страницу ANSI
 
zvezdochiot

Цитата:
ежели внедрить в pdf-ку таблицу кодировки KOI8-R

зачем? что-бы сделать костыль? забудьте о КОИ-8, даже ее ГОСТ уже вроде как отменен

Всего записей: 4985 | Зарегистр. 14-09-2007 | Отправлено: 04:02 07-02-2024 | Исправлено: useretail, 04:13 07-02-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
useretail
ага, щас Я предложил решение, и вдруг я же буду доказывать третьему лицу, что оно рабочее. Кому надо результат, тот пускай и доказывает. upd под "результатом" я имею ввиду самообучение по итогу этой проверки "работает/не работает".
 
Насчет профи. По тексту видно, разбирался человек в стандарте или не разбирался. Вы вот явно пишете без знаний о том как в пдф устроены кодировки шрифта: юникод конечно не использует ansi-кодировку, но параметр ToUnicode для другого преобразования - из кода символа из диапазона 0-255 в n-байтовое значение unicode. Это нужно чтобы копипаст из пдф в буфер обмена срабатывал. Для рисунка может это и не надо, но я специально отметил эту особенность, чтоб в других случаях не забыть.

Всего записей: 3330 | Зарегистр. 15-07-2010 | Отправлено: 06:38 07-02-2024 | Исправлено: TelecomUral, 06:54 07-02-2024
useretail



BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

понятно, в сухом остатке имеем два решения и одного профи, а результата ноль

Всего записей: 4985 | Зарегистр. 14-09-2007 | Отправлено: 19:10 07-02-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys

Цитата:
Есть ли способ исправить крякозабы?

Вас ещё интересует как исправить кракозябры в вашем файле?
Или уже нашли решение?
Вот мой вариант - проверяйте.
Сделано тремя кликами в стандартной программе. В принципе из моего файла сам принцип понятен. Но есть нюансы.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 21:03 07-02-2024
Sisin



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Посоветуйте, пожалуйста, консольное приложения для Windows, которое состоит из одного файла exe, может конвертировать JPG и PNG в PDF, а лучше сразу объединять несколько изображений или PDF в один PDF.

Всего записей: 1004 | Зарегистр. 07-05-2010 | Отправлено: 21:48 07-02-2024 | Исправлено: Sisin, 21:49 07-02-2024
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вот мой вариант - проверяйте

Очень хорошо, а для многостраничного файла ваш метод применим?

Всего записей: 482 | Зарегистр. 22-06-2016 | Отправлено: 22:06 07-02-2024 | Исправлено: esys, 22:08 07-02-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Sisin jpeg2pdf, sam2p.
 
 

Всего записей: 692 | Зарегистр. 18-05-2023 | Отправлено: 22:07 07-02-2024 | Исправлено: zvezdochiot, 23:00 07-02-2024
useretail



BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

jourmager

Цитата:
Сделано тремя кликами в стандартной программе. В принципе из моего файла сам принцип понятен

осталось повторить операцию для нескольких десятков-сотен других страниц

Всего записей: 4985 | Зарегистр. 14-09-2007 | Отправлено: 00:47 08-02-2024 | Исправлено: useretail, 00:47 08-02-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys

Цитата:
а для многостраничного файла ваш метод применим?

Во-первых: своё решение я отправлю вам в личку
Во-вторых: как я уже писал ранее для случая с заменой одного текста на другой в pdf-файлах, что та задача в общем случае нерешаема, то и в данном случае, исправление кракозябров, которые видны в просмотрщике как кракозябры, в общем случае нерешаемо. Но есть решения для каждого отдельного случая. И методов для исправления таких кракозябров у меня наберётся до десятка. Хотя ещё вчера я про решение такой проблемы с кракозябрами почти ничего не знал. К сожалению, из-за недостатка времени и подопытного материала предложить оптимальный метод не могу.
 
useretail

Цитата:
осталось повторить операцию для нескольких десятков-сотен других страниц

Языком трепать - не мешки ворочать.
Вот архив, внутри которого 2 pdf-файла:
01-100.pdf - сто страниц сделанных копиями из исходного файла 01.pdf с кракозябрами
01-100-fix.pdf - вышеназванный файл, где кракозябры исправлены на нормальные видимые символы и нормальный текстовый слой.
 
А теперь очень интересно ваше объяснение, как я сделал оба исправленных файла, а также ваши предложения, как всё-таки исправлять pdf-файлы с видимыми кракозябрами. Только не пустое балабольство, а конкретные методы на (вот этих вот) конкретных файлах.
Мы все с нетерпением ждём.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 12:02 08-02-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru