Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
logs2



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый вечер!
 
Спасибо за отклик. Вы здесь, судя по всему, в одиночестве отдуваетесь!
 

Цитата:
В окне Actions / Attributes for Select image (для PitStop 12) ставите:
 
Select image by filter type: +zip +Also look at soft-mask images (остальные галки сняты)
Select if image width or height is: equal to 343 pixels
Select if image width or height is: equal to 524 pixels

 
Стер одно нужное изображение, попавшее под эти признаки.
Оставил filter type и поставил по ppi, только после этого получилось убрать вотермарки, не затронув полезные изображения.
 

Цитата:
Callas PDF Toolbox v5.0 Portable by conservator > Switchboard > Arrange > Slise
там наглядно видно при удалении вотермарков во втором сгенерированном PDF, что удалено

 
После экшена Pitstop, если указать это в опциях, показывает отчет в окошке, где перечислены удаленные объекты, подсвечивая удаленные области белым цветом. Но это не глобальный отчет в отдельном файле (где на пустом белом листе показаны только удаленные объекты и так по каждой странице), и чтобы быть на 100% уверенным в том, что нужные изображения не удалены, необходимо пролистать каждую страницу. Не очень удобно, так как сначала нужно перейти на страницу, затем нажать порядковый номер удаленного объекта в списке и посмотреть подсвеченную белым цветом область, где этот объект находился до удаления. Допустим удалено 50 объектов. Он показывает их списком удаленных. На каждой странице находилось по два, как в моем случае, вотремарка. Открыта страница 1. Нажимаю в списке удаленных объект 1 - вижу подсветку. Нажимаю объект 2 - вижу подсветку. Теперь, чтобы увидеть подсветку объекта 3 и 4, мне нужно пролистнуть на страницу 2. И так по списку. Если страниц 200-300, то проверка потребует минимум полчаса времени и концентрации внимания.
 
А так, в общем, вотермарки убрал.

Всего записей: 78 | Зарегистр. 01-08-2017 | Отправлено: 18:17 18-02-2020
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
logs2

Цитата:
После экшена Pitstop, если указать это в опциях, показывает отчет в окошке, где перечислены удаленные объекты, подсвечивая удаленные области белым цветом.

 
Спасибо за информацию. В Callas PDF Toolbox v5.0 всё, конечно, намного удобней, наглядней сделано.
 
А вообще, на данный момент, знаю только несколько программ умеющих сравнивать PDF на изменения:
 
Callas PDF Toolbox v5.0
Nuance Power PDF Advanced 2.10
Nuance PDF Converter Pro 7.3
Acrobat Pro
PitStop plug-in
Qoppa PDF Studio 9.2.0 Pro
Nitro PDF Enterprise 9.0
PDFBlink (расширение для программы PStill)
FineReader 14 Enterprise (ищет изменения только в тексте)

Всего записей: 2794 | Зарегистр. 31-05-2010 | Отправлено: 17:06 19-02-2020
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ

Цитата:
А вообще, на данный момент, знаю только несколько программ умеющих сравнивать PDF на изменения:  

_http://www.qtrac.eu/diffpdf.html
_https://vslavik.github.io/diff-pdf/
_https://www.diffchecker.com/desktop

Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 17:28 19-02-2020
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los

Цитата:
_http://www.qtrac.eu/diffpdf.html  
_https://vslavik.github.io/diff-pdf/  
_https://www.diffchecker.com/desktop  

DiffPDF
 
Попробовал, неплохая утилита.
Но при визуальном сравнении (не тексту) Callas PDF Toolbox всё равно рулит.
 
 
diffchecker
 
Скачал триальную, работает на Win7 и выше, сейчас нет возможности потестить.

Всего записей: 2794 | Зарегистр. 31-05-2010 | Отправлено: 21:19 19-02-2020 | Исправлено: ComboFZ, 21:37 19-02-2020
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ, я просто подсказал еще варианты.
P.S.
на GitHub есть несколько проектов, в основном, использующих poppler.

Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 22:01 19-02-2020
galina2000

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравствуйте. Документ pdf - таблица, текстовые блоки в которой произвольно захватывают по несколько столбцов в строке. Подскажите, пожалуйста, как разделить эти текстовые блоки по столбцам таблицы? Спасибо.

Всего записей: 472 | Зарегистр. 21-08-2006 | Отправлено: 00:46 20-03-2020
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как известно FineReader после OCR клепает огромные файлы.  
Оптимизация таких файлов уменьшает такие файлы, но не намного и обычно с потерей качества.
Лучший выход который нашел, удалять картинки в новом файле и вставлять их из старого.
Делаю это в PDF-XChange Editor.
Но иногда попадаются файлы где это не получается, картинки накладываются друг на друга и файл становится мутным. Как это исправить?
Пример.
 
https://dropmefiles.com/rwTR6

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 04:11 31-03-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
galina2000
может, вам их в графику перевести, и перераспознать как таблицу? окольным путем пойти.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 05:44 31-03-2020
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan

Цитата:
...выход который нашел, удалять картинки в новом файле и вставлять их из старого.  
Делаю это в PDF-XChange Editor.  
Но иногда попадаются файлы где это не получается, картинки накладываются друг на друга и файл становится мутным.

В старом файле бинаризированный (ч.б.) растровый текст в виде маски (имеет прозрачность в условно белых полях), соответственно OCR-текст в финальном файле просвечивает через него.
Здесь два выхода.
Либо в финальном файле отключить заливку шрифтов в OCR-тексте в том же PDF-XChange Editor 7.0/8.0 (поиск и копипаст по OCR-тексту останутся).
Либо в старом файле (оригинале), перед его наложением на файл с OCR-текстом, сделать белую фоновую векторную заливку. Тогда OCR-текст не будет просвечивать через маску бинаризированного ч.б. текста.
 
galina2000

Цитата:
Документ pdf - таблица, текстовые блоки в которой произвольно захватывают по несколько столбцов в строке. Подскажите, пожалуйста, как разделить эти текстовые блоки по столбцам таблицы?  

От вашей приложенной картинки толку мало. Нужен реальный пример страниц из этого PDF.

Всего записей: 2794 | Зарегистр. 31-05-2010 | Отправлено: 18:56 31-03-2020 | Исправлено: ComboFZ, 09:47 16-04-2020
corrector

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan

Цитата:
Как известно FineReader после OCR клепает огромные файлы.  
Оптимизация таких файлов уменьшает такие файлы, но не намного и обычно с потерей качества.
Лучший выход который нашел, удалять картинки в новом файле и вставлять их из старого.
Делаю это в PDF-XChange Editor.
Но иногда попадаются файлы где это не получается, картинки накладываются друг на друга и файл становится мутным. Как это исправить?  

 
Я делаю так:
1) Сохраняю результат распознования в pdf (текст под изображением страницы). Назовем его FR.
2) С помощью утилиты Callas PDF Toolbox отделяю слой текста OCR из файла FR в отдельный файл txt.
3) С помощью утилиты PDF-Tools 4 подклеиваю слой txt к исходному файлу pdf из изображений страниц.

Всего записей: 218 | Зарегистр. 15-05-2006 | Отправлено: 21:52 31-03-2020 | Исправлено: corrector, 21:53 31-03-2020
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ
 
А можете пошагово разложить как это сделать для обоих вариантов?
 
Добавлено:
corrector
 
А можете на моих файлах выше, проверить, работает на них этот способ или нет?

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 00:02 01-04-2020
corrector

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan
 
Посмотрите архив с результатами работы.
Там Ваши файлы и добавленные мною:
ocr8.pdf - файл с распознанным текстом (распознавал в FineReader 8; у меня в FR нет словаря для азербайджанского языка - поэтому в OCR "склепал" текст на аз. языке на смеси англ. и казахского языков).
ocr15.pdf - файл с распознанным текстом вашим FR (В вашем Ocr.pdf зачем-то присутствуют и все изображения страницы; я убрал их и получил ocr15).
orig+ocrFR8.pdf - результат подклейки ocr8.pdf к оригиналу.
orig+ocrFR15.pdf - результат подклейки ocr15.pdf к оригиналу.

Всего записей: 218 | Зарегистр. 15-05-2006 | Отправлено: 13:28 01-04-2020 | Исправлено: corrector, 18:57 01-04-2020
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
corrector
 
PDF-Tools 4, все что там есть дублируется в PDF-XChange Editor.
 
Ваше наложение на мой файл, получилось точно таким же мутным как у меня.
Значит нет разницы как выдергивать текст.  
 
Подождем может быть ComboFZ, распишет как отключить заливку шрифтов или делать белую фоновую заливку.
 
 
 

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 19:18 02-04-2020
corrector

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
PDF-Tools 4, все что там есть дублируется в PDF-XChange Editor.  

Если не трудно, покажите, где в PDF-XChange Editor располагается операция наложения pdf-файла как слоя на другой pdf-файл (в PDF-Tools 4 операция называется "Перекрывающий PDF")? Собственно, только из-за этой операции я и пользуюсь утилитой PDF-Tools 4.
 

Цитата:
Ваше наложение на мой файл, получилось точно таким же мутным как у меня.
Значит нет разницы как выдергивать текст.

 
Что с чем Вы сравниваете? И "мутность" каких объектов Вы наблюдаете?
 
а) изображения на странице?
В моем файле orig+ocrFR8.pdf изображения идентичны изображениям в вашем Оригинальный файл.pdf (сравнивал с увеличением 1200% - разницы не увидел), что не удивительно: я же подклеивал файл ocr8.pdf - распознанный текст (в нем нет никаких изображений, т.к. распознаванию у меня подвергались  только текстовые блоки).
В вашем файле После наложения.pdf изображения не идентичны изображениям в вашем Оригинальный файл.pdf (сравнивал с тем же увеличением 1200%). Объясняю это тем, что в файле После наложения.pdf "сверху" лежит файл Ocr.pdf, в котором кроме распознанного текста есть и изображения (по-видимому, Вы при анализе документа оставили и блоки изображений); "внизу" же лежит Оригинальный файл.pdf.
 
б) текст?
В моем файле orig+ocrFR8.pdf изображение текста абсолютно такое же, как и в Оригинальный файл.pdf; распознанный текст располагается "под" своим визави из оригинала и не видим вообще (потому никак не может влиять на визуальное восприятие текстовых областей).
В вашем файле После наложения.pdf текст выглядит "раздвоенным" по той же причине: "сверху" лежит распознанный текст и из-под него "проглядывает" изображение текста оригинала (проявляются неточности выбора шрифтов распознавания Файнридером и неточности позиционирования ФР текста).
 

Всего записей: 218 | Зарегистр. 15-05-2006 | Отправлено: 20:44 03-04-2020 | Исправлено: corrector, 22:03 03-04-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
corrector
xanxan

Цитата:
Что с чем Вы сравниваете?

и в какой программе смотрите.
В хроме orig+ocrFR15.pdf с задвоением контуров:
 

 
И в верхнем правом углу колонтитула хорошо видно, что это векторный шрифт просвечивает. В буквах "лей".
А в стареньком PDF-Xchange Reader всё совсем иначе:
 


Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 05:15 04-04-2020 | Исправлено: TelecomUral, 05:52 04-04-2020
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
corrector
 
Я про orig+ocrFR15 говорил, так как ставить FR 8 не собираюсь. Стоят FR14-15.
Качество распознавания иногда лучше в одном а иногда в другом.  
 
То есть ваш способ  Callas PDF Toolbox + PDF-Tools 4 тут не помогает.
 

Цитата:
Объясняю это тем, что в файле После наложения.pdf "сверху" лежит файл Ocr.pdf, в котором кроме распознанного текста есть и изображения (по-видимому, Вы при анализе документа оставили и блоки изображений); "внизу" же лежит Оригинальный файл.pdf.

 
Что значит оставить блоки изображений? Я вообще анализ не запускаю, в принципе что с ним что без него без разницы.
 
TelecomUral
 
А какая разница?  Смотрел в PDF-XChange Editor, проверил сейчас в Акробате все также.

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 09:19 04-04-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan
для начала вы не ответили на вопрос corrector что с чем вы сравниваете.
что же до "разницы" - вопрос мой был: а чем смотрите именно вы. Может вообще спец.читалкой какой-нибудь, тогда и вид может быть иным, чем у других местных читателей ваших помощников.
Так-то ComboFZ толково разъяснил причину. Вы зачем-то тащите растровое изображение букв в финальный файл. И пока что неясно, вы хотите векторный шрифт видеть, или растровые буквы.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 09:27 04-04-2020 | Исправлено: TelecomUral, 10:17 04-04-2020
corrector

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan

Цитата:
Я вообще анализ не запускаю...  

 
Совершенно напрасно. После анализа (и до распознавания) Вы могли бы удалить все блоки изображений (на автомате ФР их формирует, распознает и тащит в распознанный файл) - ведь вам нужен от ФР на выходе только текст, не так ли? Если же бл. из. очень много или же вам лень заниматься их уборкой, чтож, сохраняйте результаты распознавания как умеете - и тогда-то после этого займитесь отделением мух от котлет изображений от текста (для этого и нужен Callas PDF Toolbox) и подклейкой затем распознанного текста (желательно под оригиналом) к оригиналу (здесь я пользуюсь PDF-Tools 4; где и можно ли вообще проделать эту операцию в PDF-XChange Editor - Вы мне так и не ответили).

Всего записей: 218 | Зарегистр. 15-05-2006 | Отправлено: 13:58 04-04-2020 | Исправлено: corrector, 14:01 04-04-2020
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
corrector
 
Не запускал, так-как при распознавание все равно этот анализ автоматом происходит.
Но вариант сохранить только текст интересный, надо проверить что на этот счет есть в последних версиях.
Дело в том что иногда распознанный текст получается в отличном качестве и по объему даже меньше чем оригинал, подклеиваю я его на оригинал только когда речь идет о размерах 50+МБ. Или когда качество после обработки ухудшается.
Если FR сделал из 5Мб - 10Мб, я не буду заморачиватся его наложением.
 
Я так понял по вашим словам, автоматической чистки блоков в FR нет? Тогда этот способ не подходит.
 
PDF-Tools 4 я как-то ставил, все что там было было и в PDF-XChange Editor. У меня версия Editor Plus 8.0 333.0
Потому я его удалил. Могу поставить для теста, но не вижу смысла, ваш способ в данном случае не сработал.
 
Вы взяли мой файл Ocr.Pdf полученный после распознавания в FR 15, почистили картинки, я их специально не удалил что бы показать размер файла. У вас получился orig+ocrFR15.pdf.
Потом как я понял вы выдернули шрифт с помощью Callas PDF Toolbox и залили в оригинал через PDF-Tools 4.
Получился у вас такой же нечитабельный файл как у меня. Может он немного различается по качеству, но сути это не меняет. Значит ваш способ в данном случае не помогает.
Я в принципе скачал Callas PDF Toolbox, но там качество еще хуже получилось.
 
TelecomUral

Цитата:
 Вы зачем-то тащите растровое изображение букв в финальный файл. И пока что неясно, вы хотите векторный шрифт видеть, или растровые буквы.

 
Я не знаю что такое растровые или векторный шрифт, я действую согласно инструкции от ComboFZ-а, найденной на другом сайте.
С 95% книг это сработало, на сотни книг у меня наверное всего 3 файла где эта метода не сработала.
 
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1517991006
 
Открываем в PDF-XChange Editor 7.0 распознанный в FineReader (как текст под изображением) документ PDF.
 
В окне программы внизу, слева, жмём на иконку шестерёнки Параметры > Контент.
Слева откроется панель Содержание.
 
Жмём в панели Содержание, вверху, на иконку шестерёнки Параметры > Выбранные > Изображения (выделятся все растровые изображения в PDF).
Стучим по клавише Delete для удаления картинок.
Сохраняем документ с OCR-текстом через Сохранить как.
 
Быстрое наложение картинок (сканов) на OCR-текст в документах PDF.
Открываем в PDF-XChange Editor 7.0 два документа PDF:
один - с подготовленными картинками/сканами
другой - с OCR-текстом
 
Окно (вкладку) с картинками делаем активным.
В панели Содержание (см. выше как открыть) > Параметры > Выбранные > Изображения
(выделятся все растровые изображения в PDF)
клавишами Ctrl+С копируем картинки в буфер обмена.
 
Вставляем картинки из буфера обмена (Shift+Insert) в окно с OCR-текстом.
При вставке должна быть активна та страничка в окне, с которой будут начинаться картинки в документе.
Сохраняем документ через Сохранить как.
 
 
Из того что написал ComboFZ, не знаю правильно ли, сделал первый вариант, залил белый фон в оригинал. Не помогло.
Как попробовать второй способ -   "в финальном файле отключить заливку шрифтов в OCR-тексте", пока не нашел.
 
https://images.vfl.ru/ii/1586030507/d25ec1ff/30104046.jpg

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 23:11 04-04-2020
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan
 
На примере PDF-XChange Editor 7.0.
 
1. Отключение векторной заливки в шрифтах:
 
Закидываем в программу PDF-документ с чистым OCR-текстом (т.е. без картинок).
 
В верхней закладке Главная > Вид активируем иконки Контент и Свойства, откроются соответствующие боковые панели.
 
В левой панели Содержание по иконке с шестерёнкой заходим в Выбранные > Текст. Выделятся все текстовые объекты (шрифты) во всём документе PDF.
 
В правой боковой панели Свойства в Цвете заливки ставим: Пусто.
 
---------------------------
2. Наложение белой (любой) векторной заливки между OCR-текстом и оригинальным растром (сканами/картинками).

Забрасываем в PDF-XChange два документа: один - с чистым OCR-текстом, другой - оригинальный PDF с картинками/сканами.
Активируем вкладку с оригинальным PDF.
 
В верхней закладке Организация > Фон > Добавить в появившемся модуле делаем фоновую белую (любую по цвету) векторную заливку для всех страниц оригинального PDF > OK.*
 
В левой боковой панели Содержание по иконке с шестерёнкой заходим в Выбранные > Все. Выделятся ВСЕ объекты на всех страницах оригинального PDF. Копируем их в буфер обмена (Ctrl+C).
 
Активируем вкладку с OCR-текстом.
Вставляем (накладываем) все объекты из буфера обмена на OCR-текст клавами Shift+Insert (для PDF-XChange 8.0 сочетание классическое - Ctrl+V).
 
Сохраняем итоговый документ через Сохранить как.
 
-----------------------------
* Прозрачность в документе и заливки можно посмотреть активировав на время в верхней закладке Вид > Сетка прозрачности.

Всего записей: 2794 | Зарегистр. 31-05-2010 | Отправлено: 03:44 05-04-2020 | Исправлено: ComboFZ, 06:34 05-04-2020
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru