Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Заменить/удалить текст (batch есть), в т.ч. кириллицу (не панацея!) - PDF Replacer
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: 73, 09:51 29-08-2024
MBK2

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
Я правильно понимаю, что вы имеете в виду обьекты PDF структуры, obj? Во первых, действительно, непонятна конечная цель, зачем такая странная специфическая хотелка, это же явно часть некоего хитрого плана, причем распланированного явно неверно. Во вторых, действительно, разбиение совсем неслучайно, по спецификации есть определенные огоаничения на размер и при перераспределении непонятно как это преодолевать. И в третьих, хотелка специфична и деструктивна, чтобы ее можно было реализовать стандартными средствами без бубна.

Всего записей: 5033 | Зарегистр. 18-09-2018 | Отправлено: 18:01 01-11-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
а зачем?!

Для автоматического ремаппинга - исправления поломанных UnicodeMap в шрифтах.
Только что восстановил UnicodeMap в шрифтах в одной книжке, но там на 300+ страниц было 3-4 группы объектов по 3 (текст, заголовок, выделенный текст). т.е. надо было кликнуть на всю книжку дюжину раз.
Проблемы начинаются, когда кликать надо по несколько раз на каждой странице.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 18:04 01-11-2023
MBK2

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
Так проще и правильнее  закодить автоматизацию починки unicodemap скопом, чем перераспределение текста между обьектами

Всего записей: 5033 | Зарегистр. 18-09-2018 | Отправлено: 18:13 01-11-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MBK2

Цитата:
Так проще и правильнее  закодить автоматизацию починки unicodemap скопом, чем перераспределение текста между обьектами

Ну да, проще и правильнее. Кто ж спорит. Но, насколько мне известно, до сих пор реально практически это никто не сделал.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 18:44 01-11-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:

Цитата:
до сих пор реально практически это никто не сделал.

Ну именно "этого" может и не сделал, но для решения одной задачи я в Master PDF Editor на одной странице составил для xdotools набор действий, после чего этот набор не просто ко всем страницам применил, а к 20 выпускам журнала, каждый по сотне страниц. Такие вот дела.
 

Всего записей: 692 | Зарегистр. 18-05-2023 | Отправлено: 18:56 01-11-2023 | Исправлено: zvezdochiot, 18:57 01-11-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
jourmager
до сих пор реально практически это никто не сделал

Ибо не автоматизируется, я так предполагаю. И с конкатенацией объектов будет та же фигня, 100%. Покопайте ситуацию поглубже, там обычно выясняется что есть три ступеньки (уровня) агрегирования, типа "шрифт/маппинг/объект", и масса отличий в первых двух уровнях. Ни один алгоритм не справится найти общее и соединить третий уровень. Только глазками.
Значит, максимум, что можно выжать - это удобная подготовка к ручной работе. Таким путем шли авторы pdf-recode, они генерили все имеющиеся маппинги (шаг1) и предлагали вручную написать рекодинговые таблички для автоматического исправления файла (шаг2).
 
Ну и еще светлая мысль - поперепробовать всевозможные проги-оптимизаторы. Вдруг есть программисты, которые подумали об объединении идентичных объектов. Хотя шанс невысок. Где-то в хелпах мне попадалась строчка "объединение объектов", кстати.

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 02:40 02-11-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Ибо не автоматизируется, я так предполагаю.

Для ремаппинга можно применить OCR, который автоматизирует распознавание символов во всей книге на всём разнообразии шрифтов.  

Цитата:
Ну и еще светлая мысль - поперепробовать всевозможные проги-оптимизаторы. Вдруг есть программисты, которые подумали об объединении идентичных объектов.

Да. Вы оказались правы.
У меня на 2 разных файлах сработала оптимизация для объединения объектов.
PDF-XChange Editor  -> Save as Optimized -> Cleanup -> Discard duplicates of fonts и Discard duplicates of XForms
 
Текстовые объекты с различными номерами стало возможно объединить при устранении дубликатов шрифтов, и в моём случае, т.к. текст был упрятан в XForms, ещё и устранение дубликатов XForms.
Но , вероятно, устранение дубликатов шрифтов возможно только при полном соответствии шрифтов, или в моём случае - когда для глифа нет символа в текстовом слое.
 
Вероятно, что Acrobat, Foxit и др тоже умеют объединять текстовые объекты таким образом, но пока не было возможности проверить.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 13:35 05-11-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
jourmager
во всей книге на всём разнообразии шрифтов

тогда уж проще в ФР файл засунуть.

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 13:37 05-11-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
тогда уж проще в ФР файл засунуть

Засунуть просто, но когда высовываешь - на выходе фигня. Я пробовал. Проблема в том, что ФР не умеет (или я не смог заставить) корректировать только текстовый слой, оставляя в неприкосновенности глифы. Он подставляет сразу полностью весь шрифт - и видимые глифы и невидимый текстовый слой. А шрифт он подставляет фигово. Буквы правильные, а их начертание сикось накось. Подозреваю, что это связано с интеллектуальной собственностью на шрифты. Ну  и ещё недоработанные алгоритмы. Хотя их доработать ИМХО совсем не трудно.
 
P.S. Бу-га-га. Adobe Acrobat Pro 22 и Foxit PDF Editor Pro 12 при всех включенных опциях оптимизации не смогли объединить текстовые объекты, а PDF-XChange Editor 10 - смог. И ещё, оказывается, у Acrobat и Foxit полностью одинаковые опции и меню оптимизации - как под копирку, кроме наличия grayscale у Acrobat и MRC у Foxit.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 14:31 05-11-2023 | Исправлено: jourmager, 17:44 05-11-2023
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как перевести в ПДФ сразу много файлов *svg?
Пример файла https://cloud.mail.ru/public/g1Zb/33QpddQ7c

Всего записей: 482 | Зарегистр. 22-06-2016 | Отправлено: 10:11 06-11-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys

Цитата:
Как перевести в ПДФ сразу много файлов *svg?

Использовать программу для пакетного преобразования, либо написать простенький *.bat или *.sh в зависимости от используемой ОС.
Нужно учесть что некоторые программы могут переводить  svg в растровый формат, что может не подходить.
результат работы https://github.com/typst/svg2pdf
https://workupload.com/file/X7vCxBVdUgr

Всего записей: 7741 | Зарегистр. 08-09-2001 | Отправлено: 12:16 06-11-2023
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 https://github.com/typst/svg2pdf

*exe или *setup там нет? Самому надо компилировать?

Всего записей: 482 | Зарегистр. 22-06-2016 | Отправлено: 12:49 06-11-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Самому надо компилировать?

да.

Всего записей: 7741 | Зарегистр. 08-09-2001 | Отправлено: 13:46 06-11-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys say:

Цитата:
*exe или *setup там нет?

Учитывая, что svg2pdf пользует librsvg-2.0 и cairo-pdf, под винду его вряд ли вам кто то соберёт.
Ваш вариант - пользовать Inkscape через CLI. Он это умеет:

Код:
 
inkscape --help
 

И pdf он тоже умеет. А уж svg - это, собственно, ради чего он и делался.
 
 

Всего записей: 692 | Зарегистр. 18-05-2023 | Отправлено: 13:47 06-11-2023 | Исправлено: zvezdochiot, 13:48 06-11-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
Учитывая, что svg2pdf пользует librsvg-2.0 и cairo-pdf

Это не так.

Всего записей: 7741 | Зарегистр. 08-09-2001 | Отправлено: 14:00 06-11-2023
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Спасибо!

Всего записей: 482 | Зарегистр. 22-06-2016 | Отправлено: 14:26 06-11-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los say:

Цитата:
Это не так.

Ну да. Спутал я с си-шным проектом. Но в растовском зависимости похожи. Ежели осилите скомпилять - честь вам, да хвала.
 

Всего записей: 692 | Зарегистр. 18-05-2023 | Отправлено: 14:30 06-11-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys

Цитата:
Как перевести в ПДФ сразу много файлов *svg?

Это может сделать Orpalis PDF Reducer. Есть портабельный вариант.
Надо установить настройки изображений: качество высокое (или вообще отключить recompress), отключить jpeg2000 и downscale.
К сожалению, эта программа конвертирует отдельные svg (и любые другие) файлы в отдельные pdf-файлы, которые потом надо будет объединить.
 
Второй вариант - использовать онлайн конвертер https://tools.pdf24.org , но есть ли у него ограничение на количество файлов и/или их объём мне не известно. Если будете конвертировать целую книгу таким образом, то просьба сообщить о результатах.
Использовать надо PDF-конвертер (не PDF в изображения).
К сожалению, этот сайт также конвертирует отдельные svg (и любые другие) файлы в отдельные pdf-файлы, которые потом надо будет объединить.
Судя по метаданным, при конвертации используется Cairo и Inkscape - это если захотите заморочиться с командной строкой.
 
Третий вариант - это онлайн Orpalis - https://avepdf.com/combine-to-pdf (Convert -> Combine to PDF), после конвертирования надо ещё указать Combine. Но какие ограничения по числу и объему файлов для бесплатного конвертирования я не знаю.
 

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 15:59 06-11-2023 | Исправлено: jourmager, 16:31 06-11-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:

Цитата:
отдельные pdf-файлы, которые потом надо будет объединить.

Не вопрос: RU-BOARD: Редактирование PDF файлов: PDFTK Builder.
 
 

Всего записей: 692 | Зарегистр. 18-05-2023 | Отправлено: 16:24 06-11-2023 | Исправлено: zvezdochiot, 16:24 06-11-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
И ещё про конвертацию svg в pdf
Офлайновый PDF24 Creator не смог найти у меня ни один 3 pdf-принтеров и вывел ошибку.
XNConvert MP сконвертировал в jpg, png, pdf в ужасном качестве и с утратой текста. Причём внутри pdf оказался jpeg крайне низкого разрешения, и снова без текста. Не знаю, увидел ли он GhostScript.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 18:05 06-11-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru