Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов.


Решение типичных задач по редактированию PDF

Обрезать страницы - A-PDF Crop, Acrobat + Imposal
Разрезать страницы на части - A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat + Quite Imposing Plus/Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - A-PDF Page Master, Neevia PDFtoolbox, Acrobat + Map Soft Plug-in Suite
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat + Evermap AutoPagex
Исправить наклон страниц - A-PDF Deskew, A-PDF Scan Optimizer или Acrobat + Evermap AutoPagex/ISI Toolbox
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat + Quite A Box Of Tricks/ISI Toolbox
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat + Preflight, CallasPDF Toolbox
Удалить или заменить часть текста или текстовые ватермарки - Acrobat, A-PDF Text Replace, Infix
Удаление любых ватермарков - We PDF Watermark Remover (da best!)
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat
Тема по плагинам для Acrobat
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: sergio147, 12:09 17-05-2019
rex



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
Тогда интересно было бы включить в тестирование и полную версию FineReader.

Всего записей: 2319 | Зарегистр. 20-10-2003 | Отправлено: 13:40 21-08-2010
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Не интересно. И так ясно, что OCR FR или PT годится только для сканов.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 16:12 21-08-2010
LonerDergunov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Имеются два варианта pdf-файла (скан).
Один - с OCR, второй - без оного. Первый - сильно пережатый (артефакты jpg сжатия), второй меньше пожатый. Содержимое идентичное, разрешение страниц одинаковое.
Чем и как можно вынуть OCR слой из одного документа и вставить его в другой? Вроде бы простейшая операция, но не могу найти ни в какой программе такой опции.

Всего записей: 2972 | Зарегистр. 11-07-2007 | Отправлено: 02:53 28-08-2010 | Исправлено: LonerDergunov, 02:57 28-08-2010
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
LonerDergunov

Цитата:
Чем и как можно вынуть OCR слой  

Допустим, вынете Вы его, а как привязывать к новым координатам букв/слов на страницах? Проще заново сделать OCR, чем переносить.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 07:22 28-08-2010
LonerDergunov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Проще заново сделать OCR, чем переносить.

А чем вообще делается OCR-слой для готового pdf-файла?
Можно разобрать pdf на отдельные странички-картинки, распознать, потом собрать обратно. Но при этом при сборке нового pdf страницы опять пережимаются-портятся, чего не хотелось бы делать.

Всего записей: 2972 | Зарегистр. 11-07-2007 | Отправлено: 14:05 28-08-2010
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
LonerDergunov

Цитата:
А чем вообще делается OCR-слой для готового pdf-файла?  

Если с извлечением растра из pdf, то чем хотите - FR, OP, Acrobat и т.д. Это растровый скан в pdf контейнере, поэтомуможно делать что угодно.  

Цитата:
Но при этом при сборке нового pdf страницы опять пережимаются-портятся

Нет, это совсем не обязательно. Если есть приличный скан в pdf, обработайте ClearScan, OCR будет автоматом. Пусть хуже, чем в FR, зато качество изображения будет лучше, и достоверность в целом тоже. Опять же, в djvu перегнать проблем нет. Не далее, как вчера я этим занимался - http://forum.ru-board.com/topic.cgi?forum=93&topic=3172&start=940#14
 

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 14:53 28-08-2010
vitaly1



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55

Цитата:
ClearScan

Что это?

Всего записей: 5415 | Зарегистр. 28-08-2004 | Отправлено: 16:20 28-08-2010
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
vitaly1
Типа векторный фонт, создаваемый из растра, идея похожа на CPC. Стандартная фича в Акробате 9, совмещена с OCR. Резко улучшает качество текста, разумеется, когда есть это самое качество. Из дерьма конфету не сделает, проверено.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 16:27 28-08-2010
LonerDergunov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
Спасибо. Думал, что простейшее распознавание можно выполнить в небольшой программе (Acrobat тяжеловесный, качать было очень долго).
Если делать в Акробате распознавание "одним кликом", то лучше уж выбирать опцию "Изображение с поиском".
ClearScan принудительно разворачивает изображение, пережимает его, а шрифты делает "рваными" и трудночитаемыми.
В результате чего итоговое качество pdf-файла страдает очень сильно.
Качесто OCR в режиме "Изображение с поиском" и в режиме ClearScan у меня получалось сравнимым, причем по крайней мере один раз точно ClearScan распознал текст намного хуже, чем режим "Изображение с поиском".
 

Цитата:
Резко улучшает качество текста, разумеется, когда есть это самое качество.

...и резко ухудшает, если это низкокачественный скан, скачанный из сети.

Всего записей: 2972 | Зарегистр. 11-07-2007 | Отправлено: 04:18 30-08-2010 | Исправлено: LonerDergunov, 14:33 30-08-2010
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
LonerDergunov
Нет конкретный примеров - нет разговора и нет далеко идущих выводов. Поэтому утверждения насчет ухудшения качества остаются целиком на Вашей совести.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 08:28 30-08-2010
LonerDergunov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Поэтому утверждения насчет ухудшения качества остаются целиком на Вашей совести.

Насчет этого совесть моя чиста.
Насчет качества OCR - поправил предыдущее сообщение. Точно был какой-то скан, где "Изображение с поиском" выдало результат OCR намного лучше, чем в режиме ClearScan. К сожалению, не могу вспомнить какой именно (пробовал распознавать случайным образом журналы из 300-гиговой коллекции).
 
Насчет ухудшения качества изображения и отображаемого текста. В архиве оригинал (скачан на просторах интернета, оставлены несколько страниц для уменьшения размера) и вариант после обработки ClearScan.
http://rghost.ru/2482751

Всего записей: 2972 | Зарегистр. 11-07-2007 | Отправлено: 14:56 30-08-2010
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
LonerDergunov
Продукт рук, растущих из задницы испортить невозможно. Если сканируют при 150dpi, да еще лень выставить яркость/контраст, невольно напрашивается вывод о мозговом аппарате облегченного образца Вот результат самой примитивной обработки. Как говорят, почувствуйте разницу, на фото особого внимания не обращал - http://narod.ru/disk/24268337000/Original-Image0004b.pdf.html

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 15:41 30-08-2010
LonerDergunov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
 
Забавно, и правда намного лучше текст получился.
Чем "отбеливать" задний фон? Photoshop-ом каждую страничку по отдельности?

Всего записей: 2972 | Зарегистр. 11-07-2007 | Отправлено: 16:07 30-08-2010
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
LonerDergunov

Цитата:
Photoshop-ом каждую страничку по отдельности?

Это не наш подход Называется Автобаланс и Ресэмплинг, обе функции в CleanerZoomer, есть батч, работает очень быстро. Я пользуюсь версией 3.7, хотя есть более новая. Этот CZ каким-то образом давит jpg артефакты, поэтому удается легко улучшить даже паршивые изображения.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 17:28 30-08-2010 | Исправлено: Astra55, 17:29 30-08-2010
sergio147



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите пожалуйста, возможно ли ПАКЕТНОЕ редактирование pdf файлов вот так:
 
1) изменить размер отдельной страницы в каждом pdf файле
 
2) удалить один и тот же заданный текст из всех pdf файлов
 
Если возможно, то какими средствами?
 
Заранее спасибо!

Всего записей: 2390 | Зарегистр. 28-10-2006 | Отправлено: 10:24 15-09-2010
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
sergio147
Если изменять размер одной и той же страницы во всех pdf файлах, то скорее да, чем нет, это зависит от требований, которые Вы не указали. С удалением текста могут быть фонтовые заморочки, попробуйте A-PDF Text Replace.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 10:51 15-09-2010
sergio147



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55,  
 
1)  
Например, обрезать в каждом pdf файле 1-ую страницу на 1.5 см сверху.
Можно?
 
2) Спасибо! Попробую.

Всего записей: 2390 | Зарегистр. 28-10-2006 | Отправлено: 11:59 15-09-2010
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
sergio147
Тогда, скорее всего, A-PDF Page Crop через командную строку. Иначе батч не поддерживается.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 12:24 15-09-2010
sergio147



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55,  
 
Очень интересная контора A-PDF
Похоже, у них есть всё для работы с форматом pdf.
 
Вот только денег хотят за свои программы. С ходу у меня не получилось найти вылеченные версии (см. здесь и на torrents.ru)
 
Подскажите, пожалуйста, где можно взять A-PDF Text Replace и A-PDF Page Crop пригодные для работы

Всего записей: 2390 | Зарегистр. 28-10-2006 | Отправлено: 12:51 15-09-2010
vitaly1



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Для кропа (и не только) использую вот такую штуку - http://www.pdfill.com Главный плюс - бесплатна, вот только не знаю, поддерживает ли пакетный режим.
 
И еще есть PDFTK - пакетная обработка PDF файлов из командной строки.

Всего записей: 5415 | Зарегистр. 28-08-2004 | Отправлено: 12:59 15-09-2010
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Имя:
Пароль:
Сообщение

Для вставки имени, кликните на нем.

Опции сообщенияДобавить свою подпись
Подписаться на получение ответов по e-mail
Добавить тему в личные закладки
Разрешить смайлики?
Запретить коды


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2018

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru