Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
и у меня тоже только кусок слова, "посольст-". Иначе добегает до 90й.
Интересно, что там с 8й страницей? акробат ридер 7 упорно аварийно закрывается при поиске. PDF Xchange Editor 7 показывает ее как чистый лист, хотя и изображение и текст в составе дерева страницы присутствуют.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 16:08 27-12-2020
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
 

Цитата:
Интересно, что там с 8й страницей? акробат ридер 7 упорно аварийно закрывается при поиске. PDF Xchange Editor 7 показывает ее как чистый лист, хотя и изображение и текст в составе дерева страницы присутствуют.

 
Да интересный вопрос, как раз на днях попался PDF файл, там 4 страницы такие, не стал заморачиватся.
Но все же интересно, как такое править?
 
Напишите  Ма Цзяну. В DjVu вроде все нормально.
 
У меня по умолчанию стоит PDF-XChange Editor последняя сборка 343, там находит, даже специально включил опцию "целые слова", все равно находит, акробат проверил, действительно не находит. Хотя надо проверить на последней версии и посмотреть настройки поиска.
 
   
 
 
 
Добавлено:
Как уменьшать конский размер файлов после FR мы нашли, накладываем OCR на изначальный PDF.
 
А вот как быть с картинками? Проверял на разных, если изначально упаковать их в PDF, то качество распознавания падает. Оптимизация иногда решает вопрос, обычно на черно-белых файлах. Иногда размер без потери качества все равно большой.

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 17:26 27-12-2020 | Исправлено: xanxan, 17:30 27-12-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Напишите  Ма Цзяну

Написал. Причина понятна - разный шрифт в заголовке (upd или в сером цвете полоски под колонтитулом). Стр.292 вообще прелесть.
 
upd
ответил, что ему нужно время чтобы перейти на 0.29ю версию jbig2enc.
 
upd2
Тем временем я попросил на рутрекере поглядеть на этот ваш файл попристрастнее
https://rutracker.org/forum/viewtopic.php?p=80723917#80723917
 

 

 
xanxan
Там и про то, как работать с картинками.
Ссылка на файлы папаВлад ("результат")
https://ru.files.fm/u/2v9dttd2x
 
upd3
Перепробовав кучу вариантов, остановился на версии одностраничного словаря. Именно он не позволяет djvutoy нормально сконвертировать ваш djvu. Не знаю, как вы делали дежавю, но если пересобрать из тиффов передний слой заново, со словарем на 100 страниц, все потом в pdf конвертируется.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 17:50 27-12-2020 | Исправлено: TelecomUral, 13:27 10-01-2021
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Оригинальный PDF весит 7 Мб, после FR 14 и 15 версии, только текст весит 9Мб. Обычно чистый текст их FR весит 1-2Мб.
 
Фон не стал заливать, для чистоты примера.
https://cloud.mail.ru/public/CXys/QF7Btjj4o

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 04:50 31-01-2021
luxor



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Чем можно крутануть растровый .pdf на 1 градус.
В акробате про минимум 2 гр. А FineReader не всегда корректно выравнивает.
Спасибо.

Всего записей: 1707 | Зарегистр. 19-10-2004 | Отправлено: 17:20 01-02-2021
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
luxor,
cpdf с вашей задачей не справляется?
cpdf -rotate-contents 1 in.pdf -o out.pdf  

Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 19:26 01-02-2021
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan

Цитата:
после FR 14 и 15 версии, только текст весит 9Мб

Документ большой, многостраничный (680 стр.), так и должно быть, там же не один шрифт после распознования, плюс тэги, плюс встроенное подмножество шрифтов. Без них OCR-текст от FR весит 4.9MB.
 
Если распозновать в Акробате 11 (с OCR-движком от IRIS), то текст весит 6MB.
 
luxor

Цитата:
...крутануть растровый .pdf на 1 градус

Акробатовскими плагинами:
Evermap AutoPagex Plug-in > Rotate Page Content
Pitstop Pro 12 > Глобальные изменения > Страница > Повернуть содержимое страницы (Global Changes > Page > Rotate Page Content)
Quite A Box Of Tricks > Transform > Free Rotate
Quite Imposing Plus 3 > Page Management > Page Tools > Rotate pages
 
Есть один неприятный момент при повороте растра/картинок/сканов в PDF (кроме поворотов на 90/180/270°) - изображения замыливаются при показе (и это при том, что они не пересжимаются в плагинах).
Желательно их, картинки, беспотерьно выудить из PDF, повернуть в растровых редакторах и снова загнать в PDF.
Что интересно: при сдвиге картинок в PDF влево/вправо/вверх/вниз - замыливания нет.

Всего записей: 2794 | Зарегистр. 31-05-2010 | Отправлено: 10:49 02-02-2021 | Исправлено: ComboFZ, 11:28 02-02-2021
luxor



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los

Цитата:
cpdf с вашей задачей не справляется?

Спасибо, но не моё ...
 
ComboFZ

Цитата:
Желательно их, картинки, беспотерьно выудить из PDF, повернуть в растровых редакторах и снова загнать в PDF.

Да так и приходится, по старинке.

Всего записей: 1707 | Зарегистр. 19-10-2004 | Отправлено: 13:22 02-02-2021
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Есть ещё древний A-PDF Deskew 3.5.4 (не плагин). В нём тоже можно повернуть растр на 1°.
Изображения пересжимает, замыливает, картинки с масками портит, плюсом - много настроек в Settings.
Работать с A-PDF Deskew нужно аккуратно.

Всего записей: 2794 | Зарегистр. 31-05-2010 | Отправлено: 16:07 02-02-2021 | Исправлено: ComboFZ, 16:24 02-02-2021
luxor



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ
Ладно, забудьте, буду делать как раньше.
Спасибо ещё раз.

Всего записей: 1707 | Зарегистр. 19-10-2004 | Отправлено: 17:17 02-02-2021
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Обычным способом через PDF-XChange Editor получилось наложить текст на картинки, а через PDF-Tools 4.0 что-то непонятное получается, первый файл который не сработал, интересно в чем проблема?
 
https://cloud.mail.ru/public/hg97/BVYG2dXCT

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 20:33 05-02-2021
kot666



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Неужели невозможно каким-нибудь sedом вычистить xmp-информацию из PDF файла?

Всего записей: 406 | Зарегистр. 06-02-2006 | Отправлено: 23:41 05-02-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kot666
Вот устройство ссылочной таблицы PDF:
http://citforum.ru/programming/digest/pdf_inside/
То есть чтобы удалить некий объект внутри пдфки, потом надо выявить все куски cross-reference table (она дописывается в разные места при редактированиях содержимого) и пересчитать все указатели объектов в ней.
Если же просто заменить информацию нулями, то сломается механизм распаковки этого объекта, поскольку для экономии места объекты обычно сжимаются алгоритмами, н-р типа flate.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 04:34 06-02-2021
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kot666

Цитата:
Неужели невозможно каким-нибудь sedом вычистить xmp-информацию из PDF файла?

$ cpdf -remove-metadata in.pdf -o out.pdf
также при помощи cpdf можно редактировать xmp или создавать.

Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 09:38 06-02-2021
kot666



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Спасибо, изучу.
los
Спасибо, попробую.

Всего записей: 406 | Зарегистр. 06-02-2006 | Отправлено: 15:17 06-02-2021
lyolik r

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Не попадалась ли консольная утилита для замены страниц местами, смотрел в сторону qpdf и cpdf,но такого функционала не оказалось.

Всего записей: 461 | Зарегистр. 26-05-2012 | Отправлено: 05:43 08-02-2021
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
lyolik r,
можете более четко сформулировать задачу?

Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 10:16 08-02-2021
lyolik r

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
 
Поменять страницы местами в пределах одного пдф файла,к примеру первую со второй.

Всего записей: 461 | Зарегистр. 26-05-2012 | Отправлено: 12:49 08-02-2021
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
lyolik r,
посмотрите в сторону pagemaster(pdftron) или pdftk. В крайнем случае можно задействовать shell скрипт.

Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 14:12 08-02-2021
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Имеется с 10-к джву файлов
Хотелось бы слить их в один пдф
Думаю  
1) разобрать джву в тифф
2) в тифф обрезать лишние поля (на страницах)
3) выровнять пиксельный размер тифф (dpi?), чтобы в пдф страницы были одного размера
4) все обработанные тифф собрать в один пдф
подскажите, какое ПО для этого лучше использовать (в каждом пункте)

Всего записей: 1430 | Зарегистр. 02-08-2008 | Отправлено: 15:37 08-02-2021
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru