Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
fbm

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55

Цитата:
От ABBYY тоже не справляется, поэтому не имеет смысла тратить время и силы. Ошибки в невероятном количестве все равно будут, поэтому достоверность индексации весьма условная вещь.

Конечно условная. Но мой опыт говорит о том, что указанный вариант все-таки дает лучшие результаты.

Цитата:
Ну да, до 2017 года Вам мало. Могу сделать до 2077 года, подойдет?  Если учесть, что ломал я его уже давно, и за это время никаких проблем ни у кого не было, то не стОит об этом беспокоиться. И последнюю версию 6.2 тоже приручил. Но с Акробатом XI работать не будет в любом случае.

Спасибо, но он у меня все равно и с 9-кой не работает почему-то. Но это уже не важно.

Цитата:
Пример такого файла в студию! Мне интересно как такое может быть.

Я неверно выразился: обычно качество непосредственно растра ухудшается достаточно, чтобы это стало как-то заметно, потому что программы при распознавании зачем-то выполняют еще обработку растра, что к положительному результату привести не может по определению. Наиболее заметно это ухудшение проявляется в появлении (или усилении) ареала точек вокруг букв. Иногда, если книжка полезная, даже с такой "мелочью" мириться очень не хочется. Так что "резкое ухудшение растра" имеет скорее субъективный характер.  
 
Распознавание так же может иметь результатом и заметное увеличение размера файла. Обычно с этим тоже можно мириться. А иногда нет.  
 
http://libgen.org/get?open=0&md5=50D4F34CF60AA29D349C3902D7843256
 
Попробуйте прикрутить к нему OCR.

Всего записей: 165 | Зарегистр. 04-02-2006 | Отправлено: 03:00 27-09-2013 | Исправлено: fbm, 04:31 27-09-2013
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
fbm
Цитата:
он у меня все равно и с 9-кой не работает почему-то
Пора уже иметь в хозяйстве и другие версии, хотя бы в портабельном виде.
Цитата:
Но это уже не важно.  
Я без этого плагина вообще не могу работать с pdf, поскольку он может то, что недоступно в любых других программах.
Цитата:
Попробуйте прикрутить к нему OCR.
Сначала засунул файл в Акробат, а он говорит нечеловеческим голосом "Да ты, хозяин, совсем охренел, подсовывать мне такое говно, не буду обрабатывать, даже не проси!". И действительно, поглядел файл в PDF Explorer, а там помимо отвратной обработки сканов, еще и "оптимизация", проведенная кривыми ручонками школоты. Страницы порезаны на куски, туши свет, сливай воду, об извлечении даже речи нет. Очень хочется взять афтара этого файла за грудки, с наслаждением трясти, приговаривая "Рано тебе Акробатом пользоваться, не знаешь ни хрена, FreePic2PDF - предел для твоих умственных способностей!". Поэтому конвертить в растр, а потом обратно в pdf, других путей нет. Всю книгу делать не стал, только зря время тратить, вот десятая часть в djvu - http://rghost.ru/48998337
 
 

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 09:54 27-09-2013
fbm

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55

Цитата:
Пора уже иметь в хозяйстве и другие версии, хотя бы в портабельном виде.  

Я не профессионал. Пока мои потребности закрывает 9-ка.

Цитата:
Я без этого плагина вообще не могу работать с pdf, поскольку он может то, что недоступно в любых других программах.

Он мне в свое время понадобился для скрытия OCR слоя, который просвечивал через картинку. Как-то очень криво, но удалось обойтись.

Цитата:
Сначала засунул файл в Акробат, а он говорит нечеловеческим голосом "Да ты, хозяин, совсем охренел, подсовывать мне такое говно, не буду обрабатывать, даже не проси!". И действительно, поглядел файл в PDF Explorer, а там помимо отвратной обработки сканов, еще и "оптимизация", проведенная кривыми ручонками школоты. Страницы порезаны на куски, туши свет, сливай воду, об извлечении даже речи нет. Очень хочется взять афтара этого файла за грудки, с наслаждением трясти, приговаривая "Рано тебе Акробатом пользоваться, не знаешь ни хрена, FreePic2PDF - предел для твоих умственных способностей!". Поэтому конвертить в растр, а потом обратно в pdf, других путей нет. Всю книгу делать не стал, только зря время тратить, вот десятая часть в djvu - http://rghost.ru/48998337  

До самого интересного - "полутоновых" картинок,  вы не добрались. Подобрать пристойные параметры их кодирования в djvu с сохранением размера файла - у меня когда-то не получилось, а делать обработку в ручном режиме тоже как-то... Короче, мой вариант прикручивания OCR слоя дает попиксельно исходный файл и незначительное увеличение размера. А по трудоемкости он сравним с перекодированием в djvu.

Всего записей: 165 | Зарегистр. 04-02-2006 | Отправлено: 11:35 27-09-2013
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
fbm
Цитата:
До самого интересного - "полутоновых" картинок,  вы не добрались.
Просю - http://rghost.ru/49000022 Только картинки уже испорчены сжатием. Вы не находите, что самой злободневной задачей стало не изготовление хороших книг из сканов, а попытки изготовления хороших книг из говенных сканов? Одни портят, другие тратят время на исправление. Я уже не раз говорил в топике по электронным книгам - это путь в тупик.

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 12:58 27-09-2013
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Маленькая обработка и тот же файл стал почти в два раза меньше - http://rghost.ru/49005307 по сравнению с предыдущим постом. Исходные сканы все же сделаны неоптимально во всех отношениях, несмотря на 600 dpi.

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 18:05 27-09-2013
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
fbm

Цитата:
Если после перекрытия текст просвечивает через графику, значит она полупрозрачная и придется делать весь текст в pdf невидимым. Для чего его придется закрыть белым цветом:    4. Сохраняешь страницы исходного PDF в формате tiff...

Можно сделать белую векторную заливку в самом PDF подложив её под графику сканов:
Acrobat X (XI) > Инструменты > Старницы > Изменить дизайн страницы > Фон > Добавить фон
После добавить OCR текст от FineReader с помощью PDF-XChange Tools или Callas PDF Toolbox.
В этом случае текст  не будет просвечивать через маску изображения, т.к. между ними будет белая векторная заливка (к тому же она ничего не весит, если одинаковый размер страниц).

Всего записей: 2791 | Зарегистр. 31-05-2010 | Отправлено: 19:26 28-09-2013
QWewqcex

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Можно ли извлечь изображения из pdf файла?

Всего записей: 11 | Зарегистр. 25-09-2013 | Отправлено: 17:34 30-09-2013
sergio147



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
QWewqcex,
 
100500 раз обсуждалось, причём относительно недавно.
 
Просмотрите тему и уточните вопрос.


----------
Есть многое на свете, друг Гораций,
что неподвластно нашим мудрецам

Всего записей: 2444 | Зарегистр. 28-10-2006 | Отправлено: 17:43 30-09-2013
NOWENKII

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Посоветуйте программу для редактирования PDF документа. В нем нужно исправить данные в таблице. Добавить в таблицу строки с текстом или набрать текст в добавленных и существующих строках. Удалить текст, чтобы не оставалось пустое место вместо него.

Всего записей: 393 | Зарегистр. 13-02-2007 | Отправлено: 12:14 06-10-2013
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NOWENKII
Последние версии MS Office требуемый объем работы не тянут?

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 11:54 10-10-2013
NOWENKII

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Последние версии MS Office требуемый объем работы не тянут?  

 
Да тянут, ими и тяну. Хлопотно с большими документами. Приходится применять Nitro Pro, чтобы в Word или Excel перевести (открывать ими сразу часто не корректно получается), правлю, а потом обратно в PDF. Вот и надеялся, что что-то придумано более удобное.

Всего записей: 393 | Зарегистр. 13-02-2007 | Отправлено: 17:54 10-10-2013
sergio147



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Товарищи,
 
подскажите, что вот с такими монстрами можно делать, какие правильно настройки оптимизации выставить?
 
 
   
 
Формы Xobject 90% места занимают О_О

----------
Есть многое на свете, друг Гораций,
что неподвластно нашим мудрецам

Всего записей: 2444 | Зарегистр. 28-10-2006 | Отправлено: 17:00 28-10-2013
sergio147



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот ещё один уродец:
 
 
 
 
оптимизация Adobe Acrobat ничего не даёт
 
   
 
Тут основной объём - Потоки содержания. Видимо, векторные картинки, т.к. качество обалденное.
 
 
 
Добавлено:
---
 
помогите его уменьшить, пожалуйста, без большой потери качества

----------
Есть многое на свете, друг Гораций,
что неподвластно нашим мудрецам

Всего записей: 2444 | Зарегистр. 28-10-2006 | Отправлено: 02:26 30-10-2013
Chimanalyt

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Может понизить версию пдф?

Всего записей: 343 | Зарегистр. 23-06-2006 | Отправлено: 11:56 01-11-2013
distortion



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите сильную альтернативу Pdf Grabber
На входе - многостраничные документы с разнородными данными (тексты с большим кол-вом стилей, сложные многоуровневые таблицы, изображения с нестандартной геометрией канвы, ссылки, букмарки)
На выходе - MS Office'ные форматы
 
Добавлено:
А если сумеет еще и вскрывать protected pdf, то вообще здорово.

Всего записей: 3708 | Зарегистр. 07-04-2001 | Отправлено: 15:02 02-11-2013
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
distortion
 
Able2Doc Professional
AnyBizSoft PDF Converter (Wondershare PDF Converter Pro)
Nitro PDF Professional
 
Что касается исправления корявого текста при переводе pdf в *.doc(x) - Pdf Grabber'у нет равных.

Всего записей: 2791 | Зарегистр. 31-05-2010 | Отправлено: 16:26 02-11-2013 | Исправлено: ComboFZ, 16:35 02-11-2013
sergio147



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите,  
 
как сюда добавить OCR, не повредив качество нарисованного текста:
 
#
 


----------
Есть многое на свете, друг Гораций,
что неподвластно нашим мудрецам

Всего записей: 2444 | Зарегистр. 28-10-2006 | Отправлено: 13:12 07-11-2013 | Исправлено: sergio147, 13:12 07-11-2013
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sergio147
в документе когда-то перевели шрифты в кривые с удалением текстовых объектов
 
1. Распознаёте документ в FineReader, сохраняете в PDF
2. Извлекаете из него текстовый OCR-слой, правите при необходимости
3. Склеиваете OCR-слой с оригиналом с помощью PDF-Tools 4.0 или Callas PDF Toolbox
#
если перед склейкой с OCR-текстом удалить лишние объекты в оригинальном pdf находящиеся за пределами его видимой части, документ ещё немного "похудеет"
#
т.к. в оригинальном документе уже есть фоновая заливка, то OCR-слой ляжет под неё и не будет просвечивать
 
 
можно распознать документ с помощью Nuance PDF Converter Pro и потом оптимизировать в Акробате, результат будет тот же: оригинал + OCR

Всего записей: 2791 | Зарегистр. 31-05-2010 | Отправлено: 18:56 07-11-2013 | Исправлено: ComboFZ, 01:57 08-11-2013
bookserg

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
3. Склеиваете OCR-слой с оригиналом с помощью Callas PDF Toolbox

ComboFZ, если можно, саму процедуру склеивания можно по пунктам, подробнее...
 

Всего записей: 91 | Зарегистр. 27-04-2009 | Отправлено: 19:31 07-11-2013
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bookserg
1. Закидываем в Callas PDF Toolbox документ PDF в который хотим внедрить OCR-текст.  
2. Закидываем в Callas второй документ с извлеченным OCR-текстом от FineReader (окно активно)  
3. Переходим в  Switchboard > Arrange > Sandwich, жмем Execute > File > Save As...  
 
получаем PDF с внедренным OCR-текстом
 
сокращённо отсюда:
http://forum.ru-board.com/topic.cgi?forum=93&topic=3514&start=800#17

Всего записей: 2791 | Зарегистр. 31-05-2010 | Отправлено: 22:37 07-11-2013
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru