Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
rex



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
Тогда интересно было бы включить в тестирование и полную версию FineReader.

Всего записей: 2319 | Зарегистр. 20-10-2003 | Отправлено: 13:40 21-08-2010
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Не интересно. И так ясно, что OCR FR или PT годится только для сканов.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 16:12 21-08-2010
LonerDergunov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Имеются два варианта pdf-файла (скан).
Один - с OCR, второй - без оного. Первый - сильно пережатый (артефакты jpg сжатия), второй меньше пожатый. Содержимое идентичное, разрешение страниц одинаковое.
Чем и как можно вынуть OCR слой из одного документа и вставить его в другой? Вроде бы простейшая операция, но не могу найти ни в какой программе такой опции.

Всего записей: 2972 | Зарегистр. 11-07-2007 | Отправлено: 02:53 28-08-2010 | Исправлено: LonerDergunov, 02:57 28-08-2010
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
LonerDergunov

Цитата:
Чем и как можно вынуть OCR слой  

Допустим, вынете Вы его, а как привязывать к новым координатам букв/слов на страницах? Проще заново сделать OCR, чем переносить.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 07:22 28-08-2010
LonerDergunov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Проще заново сделать OCR, чем переносить.

А чем вообще делается OCR-слой для готового pdf-файла?
Можно разобрать pdf на отдельные странички-картинки, распознать, потом собрать обратно. Но при этом при сборке нового pdf страницы опять пережимаются-портятся, чего не хотелось бы делать.

Всего записей: 2972 | Зарегистр. 11-07-2007 | Отправлено: 14:05 28-08-2010
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
LonerDergunov

Цитата:
А чем вообще делается OCR-слой для готового pdf-файла?  

Если с извлечением растра из pdf, то чем хотите - FR, OP, Acrobat и т.д. Это растровый скан в pdf контейнере, поэтомуможно делать что угодно.  

Цитата:
Но при этом при сборке нового pdf страницы опять пережимаются-портятся

Нет, это совсем не обязательно. Если есть приличный скан в pdf, обработайте ClearScan, OCR будет автоматом. Пусть хуже, чем в FR, зато качество изображения будет лучше, и достоверность в целом тоже. Опять же, в djvu перегнать проблем нет. Не далее, как вчера я этим занимался - http://forum.ru-board.com/topic.cgi?forum=93&topic=3172&start=940#14
 

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 14:53 28-08-2010
vitaly1



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55

Цитата:
ClearScan

Что это?

Всего записей: 5415 | Зарегистр. 28-08-2004 | Отправлено: 16:20 28-08-2010
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
vitaly1
Типа векторный фонт, создаваемый из растра, идея похожа на CPC. Стандартная фича в Акробате 9, совмещена с OCR. Резко улучшает качество текста, разумеется, когда есть это самое качество. Из дерьма конфету не сделает, проверено.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 16:27 28-08-2010
LonerDergunov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
Спасибо. Думал, что простейшее распознавание можно выполнить в небольшой программе (Acrobat тяжеловесный, качать было очень долго).
Если делать в Акробате распознавание "одним кликом", то лучше уж выбирать опцию "Изображение с поиском".
ClearScan принудительно разворачивает изображение, пережимает его, а шрифты делает "рваными" и трудночитаемыми.
В результате чего итоговое качество pdf-файла страдает очень сильно.
Качесто OCR в режиме "Изображение с поиском" и в режиме ClearScan у меня получалось сравнимым, причем по крайней мере один раз точно ClearScan распознал текст намного хуже, чем режим "Изображение с поиском".
 

Цитата:
Резко улучшает качество текста, разумеется, когда есть это самое качество.

...и резко ухудшает, если это низкокачественный скан, скачанный из сети.

Всего записей: 2972 | Зарегистр. 11-07-2007 | Отправлено: 04:18 30-08-2010 | Исправлено: LonerDergunov, 14:33 30-08-2010
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
LonerDergunov
Нет конкретный примеров - нет разговора и нет далеко идущих выводов. Поэтому утверждения насчет ухудшения качества остаются целиком на Вашей совести.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 08:28 30-08-2010
LonerDergunov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Поэтому утверждения насчет ухудшения качества остаются целиком на Вашей совести.

Насчет этого совесть моя чиста.
Насчет качества OCR - поправил предыдущее сообщение. Точно был какой-то скан, где "Изображение с поиском" выдало результат OCR намного лучше, чем в режиме ClearScan. К сожалению, не могу вспомнить какой именно (пробовал распознавать случайным образом журналы из 300-гиговой коллекции).
 
Насчет ухудшения качества изображения и отображаемого текста. В архиве оригинал (скачан на просторах интернета, оставлены несколько страниц для уменьшения размера) и вариант после обработки ClearScan.
http://rghost.ru/2482751

Всего записей: 2972 | Зарегистр. 11-07-2007 | Отправлено: 14:56 30-08-2010
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
LonerDergunov
Продукт рук, растущих из задницы испортить невозможно. Если сканируют при 150dpi, да еще лень выставить яркость/контраст, невольно напрашивается вывод о мозговом аппарате облегченного образца Вот результат самой примитивной обработки. Как говорят, почувствуйте разницу, на фото особого внимания не обращал - http://narod.ru/disk/24268337000/Original-Image0004b.pdf.html

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 15:41 30-08-2010
LonerDergunov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
 
Забавно, и правда намного лучше текст получился.
Чем "отбеливать" задний фон? Photoshop-ом каждую страничку по отдельности?

Всего записей: 2972 | Зарегистр. 11-07-2007 | Отправлено: 16:07 30-08-2010
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
LonerDergunov

Цитата:
Photoshop-ом каждую страничку по отдельности?

Это не наш подход Называется Автобаланс и Ресэмплинг, обе функции в CleanerZoomer, есть батч, работает очень быстро. Я пользуюсь версией 3.7, хотя есть более новая. Этот CZ каким-то образом давит jpg артефакты, поэтому удается легко улучшить даже паршивые изображения.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 17:28 30-08-2010 | Исправлено: Astra55, 17:29 30-08-2010
sergio147



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите пожалуйста, возможно ли ПАКЕТНОЕ редактирование pdf файлов вот так:
 
1) изменить размер отдельной страницы в каждом pdf файле
 
2) удалить один и тот же заданный текст из всех pdf файлов
 
Если возможно, то какими средствами?
 
Заранее спасибо!

Всего записей: 2444 | Зарегистр. 28-10-2006 | Отправлено: 10:24 15-09-2010
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
sergio147
Если изменять размер одной и той же страницы во всех pdf файлах, то скорее да, чем нет, это зависит от требований, которые Вы не указали. С удалением текста могут быть фонтовые заморочки, попробуйте A-PDF Text Replace.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 10:51 15-09-2010
sergio147



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55,  
 
1)  
Например, обрезать в каждом pdf файле 1-ую страницу на 1.5 см сверху.
Можно?
 
2) Спасибо! Попробую.

Всего записей: 2444 | Зарегистр. 28-10-2006 | Отправлено: 11:59 15-09-2010
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
sergio147
Тогда, скорее всего, A-PDF Page Crop через командную строку. Иначе батч не поддерживается.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 12:24 15-09-2010
sergio147



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55,  
 
Очень интересная контора A-PDF
Похоже, у них есть всё для работы с форматом pdf.
 
Вот только денег хотят за свои программы. С ходу у меня не получилось найти вылеченные версии (см. здесь и на torrents.ru)
 
Подскажите, пожалуйста, где можно взять A-PDF Text Replace и A-PDF Page Crop пригодные для работы

Всего записей: 2444 | Зарегистр. 28-10-2006 | Отправлено: 12:51 15-09-2010
vitaly1



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Для кропа (и не только) использую вот такую штуку - http://www.pdfill.com Главный плюс - бесплатна, вот только не знаю, поддерживает ли пакетный режим.
 
И еще есть PDFTK - пакетная обработка PDF файлов из командной строки.

Всего записей: 5415 | Зарегистр. 28-08-2004 | Отправлено: 12:59 15-09-2010
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru