Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
korsh84

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
Спасибо за совет, все получилось.
сработали конструкции вида:
ptrcmd.exe in.pdf out.pdf "Download Date \| .*$" "$EMPTY$" -EY
и т.п.
 
Но остался вопрос - как осуществить crop, затрагивающий все слои (включая текстовый)?

Всего записей: 4 | Зарегистр. 01-11-2005 | Отправлено: 11:39 29-08-2013
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
korsh84
Акробат + Imposal

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 12:02 29-08-2013
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Удаление и редактирование метаданных в PDF файлах - Adept PDF Layout Changer 2.0

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 10:34 01-09-2013
Wu Tang



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
привет
не знаю в ту тему или нет, ребят у кого стоит софт для разборки pdf на картинки, кому не сложно разберите один маленький файлик - http://rghost.ru/48523873

----------
Всему свое время и каждому свой час!
Хочешь жить - умей вертеться!

Всего записей: 3767 | Зарегистр. 15-10-2007 | Отправлено: 03:13 02-09-2013
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Wu Tang
Поскольку разделка на страницы в искомом файле неоднозначна, то ли резать вдоль сдвоенных страниц, то ли нет, будет лучше, если Вы это сделаете самостоятельно с помощью A-PDF Cut. Это не больно и не страшно Если нужно, выложу в варезном топике портабельную версию.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 09:17 02-09-2013
Kolobkovskiy

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Wu Tang

Цитата:
у кого стоит софт для разборки pdf на картинки, кому не сложно разберите один маленький файлик
В смысле, на картинки? Чтобы каждая страница стала отдельным jpg?

----------
В кроссворды онлайн играть, или на украинском онлайн кроссворды

Всего записей: 207 | Зарегистр. 01-09-2013 | Отправлено: 14:32 02-09-2013
Wu Tang



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
да, только если портабельную.
хотел постранично.
Kolobkovskiy
ага

----------
Всему свое время и каждому свой час!
Хочешь жить - умей вертеться!

Всего записей: 3767 | Зарегистр. 15-10-2007 | Отправлено: 22:30 03-09-2013
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Del

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 22:49 03-09-2013 | Исправлено: Astra55, 17:51 04-09-2013
IGORGUBA



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите, как образом можно увеличить контрастность в PDF-документе (скан книги)?

Всего записей: 2242 | Зарегистр. 19-02-2007 | Отправлено: 17:34 12-09-2013
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
IGORGUBA
Если нужно менять контраст изображений во всём документе сразу, то, видимо, только беспотерьным (если получиться) извлечением всех картинок и их обработкой пакетом в IrfanView и ему подобным софтом.
 
Если нужно отредактировать изображения в PDF выборочно:
ARTS PDF Aerialist Pro (плагин для Acrobat)
Debenu PDF Crackerjack (плагин для Acrobat)
Acrobat + Photoshop (либо другой редактор изображ.)
Nitro PDF Pro (в свойствах картинки)
CAD-KAS PDF Editor 3.3 Pro
Serif PagePlus
Pelikan Software KFT priPrinter

Всего записей: 2791 | Зарегистр. 31-05-2010 | Отправлено: 21:30 12-09-2013
IGORGUBA



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ
Да,
Цитата:
нужно менять контраст изображений во всём документе сразу, то
. Понял, спасибо.

Всего записей: 2242 | Зарегистр. 19-02-2007 | Отправлено: 21:33 12-09-2013
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Чтобы не создавать отдельную тему, решил сначала поинтересоваться здесь. Благо народ собрался достаточно знающий.
 
Знакомым часто приходится преобразовать в PDF большие партии документов из канцелярии и бухгалтерии. Поштучно это делать громоздко и нудно, а хорошо работающего пакетника пока что найти не получается. В результате какую-то часть удается пакетизировать, а какую-то так и приходится делать вручную.
Так что если кто-то знает надежно работающий пакетник для преобразования основных офисных форматов в PDF, то было бы очень даже кстати.
 
Что от него требуется?
1. Преобразовывать в PDF форматы DOC(X), XLX(X), RTF (и хорошо бы PPT(X)  ).
2. Загружать все это не только файлами, но и целыми папками (деревьями папок).
3. При сохранении воспроизводить загруженный набор папок (дерево папок) в том же виде, как он был получен.
4. Если по ходу работы возникает какая-то ошибка, то не зависать в ожидании реакции пользователя, а продолжать обработку дальше. А ошибку предъявлять потом, в конце работы.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 19:35 20-09-2013
smersh2012



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
помогите решить такую проблему: как в акробате (11.0.4 pro) две страницы в одну объединить ... на одной странице pdf-файла находится лицевая сторона водительского удостоверения, на второй странице - оборотная сторона, как их в одну страницу свести?  гугл покурил, ничего не нашел, только объединение документов в один файл, но у меня другая задача
задавал этот вопрос здесь, мне посоветовали вот этот скрипт или плагины типа Quite Imposing ... скрипты и  плагины с акробатом юзать не доводилось, поэтому подскажите как установить и использовать плагины и скрипты в Acrobat Pro 11.0.4 ? в гугле ничего не нашел (может, не там искал) и если про плагины еще пишут, что их нужно устанавливать в папку plug-in (хотя такой у меня в папке с акробатом нет), то как курить скрипты нигде ничего не обнаружил .. спс ... (вообще, конечно, странно, что флагманская программа и даже разработчик pdf-файлов не может штатными средствами выполнять такие простые операции типа delete в ворде)

Всего записей: 2472 | Зарегистр. 30-01-2012 | Отправлено: 10:07 24-09-2013 | Исправлено: smersh2012, 10:10 24-09-2013
michail10

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Акробатом не пользуюсь, редактирую в др. проге. Насколько помню, экспорт в изображения или прямо в Word в Акробате есть. Ну а дальше вариантов много. Возможно в виде изображения и в Акробат можно вставить.

Всего записей: 913 | Зарегистр. 06-02-2010 | Отправлено: 09:32 25-09-2013 | Исправлено: michail10, 09:35 25-09-2013
fbm

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Когда-то давно в теме был задан вопрос:

Цитата:
...
Делаю OCR растровых pdf-ов. Перепробовал несколько программ - везде одна и та же проблема: после подкладывания текстового слоя в выходном файле заметно искажается исходная растровая графика. Я как-то привык  с djvu, что там при OCR картинку можно не трогать совсем. Можно ли сделать аналогичное с pdf? Посоветуйте подходящий софт, пожалуйста!

Я для себя решил проблему следующим образом.  
 
Необходим следующий софт: Acrobat с установленным Enfocus PitStop Pro, ABBYY PDF Transformer (или его аналог), PDF-XChange Tools, XnConvert
 
0. Делаешь удаление невидимого текстового слоя в исходном pdf (если он есть), для чего в меню Acrobat Document -> Examine Document ставим галочку на "Hidden text", снимаем галочки со всех остальных элементов, жмем кнопку в нижней части окна "Remove".  
 
1. Делаешь pdf файл с OCR слоем (например, посредством ABBYY PDF Transformer)
 
2. (данный пункт делать обязательно, иначе итоговый файл оптимизацией не дожмешь до исходного размера) Открываешь PDF с OCR слоем в Acrobat и удаляешь графику Меню - Plug-Ins - Enfocus PitStop Pro - Run Global Change (Alt-Ctrl-G), в появившемся окошечке выбираешь Standart - Remove Graphics. Проследи, чтобы Run on - Complete Document, All, Show Results - Always, а в настройках окошечка (кнопка вверху справа - Edit... ), отжимаешь галочку на Text, Area - Inside Area, галочку на Overlapping the area. Делаешь Run. Результат сохраняешь.  
   
3. Открываешь PDF-XChange Tools, выбираешь "Перекрывающий PDF". Первым открываешь pdf с OCR, затем открываешь pdf с изображением. Проследи, чтобы стояла галочка на "Поместить файл перекрытия на передний план", иначе получится, что текстовый слой будет отображаться поверх графики. (Если порядок открытия файлов перепутал, тогда убери галочку с "Поместить файл перекрытия на передний план".) Остальные сопутствующие параметры оставляешь по умолчанию.  
 
Если после перекрытия текст просвечивает через графику, значит она полупрозрачная и придется делать весь текст в pdf невидимым. Для чего его придется закрыть белым цветом:
 
4. Сохраняешь страницы исходного PDF в формате tiff (Save As...)
 
5. Конвертируешь их через XnConvert, чтобы залить все полученные изображения белым цветом. Для этого:  
 
а) Во вкладке Входные данные - Добавить папку с tiff файлами. Проследи, чтобы добавленные файлы были отсортированы по имени в правильном порядке.
 
б) Во вкладке Действия задаешь след. последовательность действий: Изменение глубины цвета - Черно-белое, Изменение глубины цвета - 24 бита, Замена цвета Черного на Белый с допуском ноль. В Предпросмотр - После убедится в заливке исходного изорбражения белым цветом.
 
в) Во вкладке Выходные данные: Исходная папка, Имя файла - ####, Формат TIF, LZW, LZW, Удалять исходный файл.
 
г) Жмешь Преобразовать.
 
6. В Acrobat делаешь из полученных tiff файлов Combine - Merge Files into a Single PDF... Результат желательно проконтролировать по иконкам страниц.
 
7. Перекрываешь файл с OCR слоем файлом с белой заливкой страниц. Результат желательно проконтролировать по иконкам страниц.
 
8. Перекрываешь полученный файл с OCR слоем и с белой заливкой страниц исходным PDF файлом.
 
Немножко заморочено, но позволяет получать желаемый результат.

Всего записей: 165 | Зарегистр. 04-02-2006 | Отправлено: 15:03 26-09-2013 | Исправлено: fbm, 15:07 26-09-2013
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
fbm
Крутая методика! Стоя, на лыжах, в гамаке - просто сущее удовольствие по сравнению с такими трудностями Все это делается куда проще и быстрее, в рамках самого Акробата с плагинами и без Питстопа. Только глубинный смысл всех этих телодвижений сводится к нулю, поскольку есть ClearScan. Для 90% сканированных файлов достаточно минимальной обработки растра и в Акробат. Если хочется, потом в djvu.

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 15:45 26-09-2013
fbm

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
 
Мне кажется, Acrobat с ClearScan (или без) распознает ощутимо хуже в сравнении с Transformer, и все равно портит исходную графику.
 
У меня речь идет о сохранении исходного качества картинки некоторого уже существующего pdf, а вовсе не о сканировании и создании своего.
 
А что сложно, так я не спорю. Но может вы предложите более простой вариант, или подскажете, что в этом алгоритме можно упростить?

Всего записей: 165 | Зарегистр. 04-02-2006 | Отправлено: 16:44 26-09-2013 | Исправлено: fbm, 17:48 26-09-2013
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
fbm
Качество распознавания для скрытого текста не есть основная задача, чтобы ради минимального выигрыша создавать текстовый слой в FR или PT, а потом внедрять его в растр. Если растр был правильно и качественно обработан перед ClearScan, результаты будут вполне приемлемые, текст будет векторным текстом, а растровые картинки и все прочее, CS не имеет привычки портить, оставляет как есть. Удалить растр можно плагином Clear and Count, посмотреть скрытый текст плагином ISI Toolbox 5, есть там такая фича. Заодно можно глазами оценить качество OCR. Наложить один слой на другой можно плагином Imposal. А вот таскать файлы из программы в программу, да еще и конвертируя их при этом, не самый лучший вариант. Но главная задача - перед передачей растра в Акробат, привести его в надлежащий вид. Если текст и серые фото, я вообще перестал заморачиваться с обработкой серого, обхожусь бинаризацей в Binarization Image Prosessor, поскольку у него самые тонкие настройки качества именно для серых фото.

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 18:32 26-09-2013
fbm

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Качество распознавания для скрытого текста не есть основная задача, чтобы ради минимального выигрыша создавать текстовый слой в FR или PT, а потом внедрять его в растр.  

Качество распознаваемого текста - задача основная, если предполагается дальнейшее индексирование в поисковой базе. И ни один из известных мне программных продуктов не справляется с этой задачей лучше, чем продукты от Abbyy. Даже близко.

Цитата:
Если растр был правильно и качественно обработан перед ClearScan, результаты будут вполне приемлемые, текст будет векторным текстом, а растровые картинки и все прочее, CS не имеет привычки портить, оставляет как есть. Удалить растр можно плагином Clear and Count, посмотреть скрытый текст плагином ISI Toolbox 5, есть там такая фича. Заодно можно глазами оценить качество OCR. Наложить один слой на другой можно плагином Imposal.  

Плагин ISI Toolbox 5, к сожалению, у меня так и не заработал, и, самое главное, имеет конечный срок лицензии. Imposal не пробовал.

Цитата:
А вот таскать файлы из программы в программу, да еще и конвертируя их при этом, не самый лучший вариант.  

Разумеется, поэтому, если можно смириться с небольшим ухудшением качества pdf после распознавания в Transformer - то лучше с этим смириться. Но попадаются (хотя и очень редко) файлы, где распознавание приводит к резкому ухудшению растра. Вот для таких случаев методика дает идельный результат: OCR слой и полное сохранение исходной картинки. Можно, конечно, хранить оба файла... но я не искал легких путей.  

Всего записей: 165 | Зарегистр. 04-02-2006 | Отправлено: 19:01 26-09-2013 | Исправлено: fbm, 19:01 26-09-2013
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
fbm
Цитата:
И ни один из известных мне программных продуктов не справляется с этой задачей лучше, чем продукты от Abbyy.
От ABBYY тоже не справляется, поэтому не имеет смысла тратить время и силы. Ошибки в невероятном количестве все равно будут, поэтому достоверность индексации весьма условная вещь.
Цитата:
Плагин ISI Toolbox 5, к сожалению, у меня так и не заработал, и, самое главное, имеет конечный срок лицензии.
Ну да, до 2017 года Вам мало. Могу сделать до 2077 года, подойдет? Если учесть, что ломал я его уже давно, и за это время никаких проблем ни у кого не было, то не стОит об этом беспокоиться. И последнюю версию 6.2 тоже приручил. Но с Акробатом XI работать не будет в любом случае.
Цитата:
Но попадаются (хотя и очень редко) файлы, где распознавание приводит к резкому ухудшению растра.
Пример такого файла в студию! Мне интересно как такое может быть.
 
 

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 21:09 26-09-2013
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru