Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Часто в интернете встречаются файлы PDF, где текст выделяется блоками и представляет собой крякозябры.
Я предполагаю что все эти файлы с archive.org
Вот пример, можно зайти в FULL TEXT и увидеть что текст прекрасно распознан, так почему PDF у них получаются такие кривые?
https://archive.org/details/nakaspiiskommori00lish

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 11:17 07-12-2020
gringus

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравствуйте. Обращаюсь к специалистам набившим руку на удалении всяких надписей в файлах pdf. Скачал книгу, на каждой странице присутствует такая надпись. Как рационально удалить их? Какой метод лучше подойдёт? Заранее Всех благодарю. Образец: https://transfiles.ru/9clw1

Всего записей: 19 | Зарегистр. 21-08-2009 | Отправлено: 20:06 15-12-2020
RIKARDOYYY

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gringus
Я не специалист. Иногда, что-то делал для себя. Если нужно удалить как бы, "чтобы глаз не мозолило", то можно открыть файл в PDF-XChange Editor Plus, к примеру. Экспортировать файл в картинки. А далее, порташкой от conservator SoftOrbits Photo Stamp Remover 11.0 Ml(ru) Portable (здесь: http://forum.ru-board.com/topic.cgi?forum=35&topic=43617&start=160) поработать. Там уже, как больше понравится: маркером или выбором по цвету и пр. Есть там и пакетный режим, но насколько он будет применим, сказать трудно. У Вас ведь только образец был в архиве. В целом, приемлемый результат был достигнут (пробовал), там где поверх текста. Ну и, затем, снова собрать в PDF-документ.
Если же книга представляет для Вас некую ценность и на последующее, то лучше немного потрудиться. То есть, взять хотя бы ABBYY Screenshot Reader (по версии, сами сориентируетесь, здесь: http://forum.ru-board.com/topic.cgi?forum=35&topic=42550&start=380). Там, у Вас, хоть и 347 страниц, но текста не очень много, по факту. Пробовал - быстро получается. Только немного вычитывать за ним приходится. Потом, ворд уже можно перегнать в PDF. Зато, книга будет смотреться идеально.  
Будь это редактируемый PDF, а не "набор картинок", то там бы, скорее всего, проблему решал Iceny Infix PDF Editor без лишней головной боли. Но, что есть.

Всего записей: 726 | Зарегистр. 25-02-2005 | Отправлено: 03:05 17-12-2020
galina2000

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравствуйте. Подскажите, пожалуйста, как можно заменить отдельные векторные изображения в полученном документе растровыми, с сохранением размера и точной позиции изображения на странице. Спасибо.
 
TelecomUral
Спасибо, так и поступила с последующей заменой проблемных страниц (карты в векторном формате).

Всего записей: 472 | Зарегистр. 21-08-2006 | Отправлено: 19:32 18-12-2020 | Исправлено: galina2000, 23:04 19-12-2020
RIKARDOYYY

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
galina2000
Берёте изображение (к примеру, "вырезать" и сделать копию, на всякий случай), открываете в бесплатной программе XnViewMP v0.98.0.0 https://www.xnview.com/en/ Далее, из контекстного меню, конвертируете в нужный формат, к примеру, в jpg или другие (по надобности). Ну и вставляете в нужное Вам место, в документе. Это если я Вас правильно понял. Так, на вскидку, посмотрел "eps", "ai", "psd" - все отлично получается. Если кореловский, то проще растеризовать в самом кореле. Ну а если какие-то проблемы с размером (ну, вдруг такое случится), то открываете в просмотрщике изображений Office 2003 (мне, к примеру, в таких случаях, он удобнее других программ) и там подгоняете так, как Вам нравится.  
Добавлено: иногда, есть удобство, в подобных случаях, воспользоваться FastStone Capture. Скриншот получается отличный. Указываете лишь нужный формат и % качества

Всего записей: 726 | Зарегистр. 25-02-2005 | Отправлено: 16:10 19-12-2020 | Исправлено: RIKARDOYYY, 16:17 19-12-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
RIKARDOYYY
речь вроде о другом. Как векторные примитивы pdf-стандарта растеризовать. То есть в pdf вписана команда "нарисовать здесь прямоугольник цветом таким-то, линией такой-то толщины", а нужно преобразовать команду в картинку tiff, вклеив ее в это же место взамен команды.
 
По мне так проще на виртуальный принтер вывести.

Всего записей: 3048 | Зарегистр. 15-07-2010 | Отправлено: 17:43 19-12-2020
RIKARDOYYY

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Простите, неверно понял автора поста. Думал, что есть документ, где требуются единичные правки.

Всего записей: 726 | Зарегистр. 25-02-2005 | Отправлено: 17:58 19-12-2020
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Попробовал в нескольких версиях DjVuToy, последняя 3.04.
 
Текст копируется нормально, но визуально справа не отображается.
 
https://dropmefiles.com/bwHCK

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 04:09 22-12-2020
Solenyi_XYU

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Приветствую! Подскажите как мне разместить PDF документ в интернете.
 Как пример

Всего записей: 10 | Зарегистр. 22-12-2020 | Отправлено: 12:13 22-12-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
Solenyi_XYU
размещаете на гуглдиске, открываете публичный доступ и даете ссылку.
Как пример
https://drive.google.com/file/d/1n9QDNzNyqqsxlGUU3G5VMyvY007H0ApQ/view

Всего записей: 3048 | Зарегистр. 15-07-2010 | Отправлено: 12:29 22-12-2020
Solenyi_XYU

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUra благодарю за помощь!

Всего записей: 10 | Зарегистр. 22-12-2020 | Отправлено: 13:23 22-12-2020
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan

Цитата:
Текст копируется нормально, но визуально справа не отображается.  

 
Похоже, что DjVu обработали в FR11 DjVu Text Layer Crutch, т.к. в конце строк половинки слов в переносах склеены, из-за этого OCR-текст в PDF выделяется криво (зато работает поиск на склеенных словах-переносах).
Нужно книгу заново распознать в FineReader для сохранения мягких переносов, взять из его PDF-файла OCR-текст и подменить в PDF, полученным от DjVuToy 3.04. Будет правильное выделение слов и корректный поиск слов с мягкими переносами в PDF.
 
Вообще, это относится и к DjVu, которые не обрабатывали в FR11 DjVu Text Layer Crutch, и которые были сконвертированы в PDF с помощью DjVuToy 3.04. Хоть там и правильное выделение текста, но в таких PDF поиск на словах с переносами не работает. Т.е., опять же, нужно распознавание в FR и последующая подмена OCR-текста.
 
Для книг без переносов слов в конце строки это делать не нужно.
 

Всего записей: 2794 | Зарегистр. 31-05-2010 | Отправлено: 15:23 22-12-2020 | Исправлено: ComboFZ, 19:46 27-12-2020
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ

Цитата:
Нужно книгу заново распознать в FineReader

 
Это не вариант. Есть несколько вариантов этой серии в сети. Но только этот вычитан. Придется оставить так.
 
А есть какая нибудь альтернатива DjVuToy, которая позволяет переносить текст в PDF?

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 22:12 22-12-2020
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan
DjVuToy 3.04 не портит OCR-текст при конвертировании в PDF, OCR-текст "испорчен" в самой DjVu-книге.

Всего записей: 2794 | Зарегистр. 31-05-2010 | Отправлено: 07:02 23-12-2020 | Исправлено: ComboFZ, 07:41 23-12-2020
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ

Цитата:
DjVuToy 3.04 не портит OCR-текст при конвертировании в PDF, OCR-текст "испорчен" в самой DjVu-книге.

 
Это я понял, но на всякий случай проверять файлы с которыми не справляется DjVuToy. Или альтернатив нет?

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 01:03 24-12-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan
через xslt преобразование xml.

Всего записей: 3048 | Зарегистр. 15-07-2010 | Отправлено: 01:39 24-12-2020
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вроде как DEE 7.5 в бач-моде и DjVu Small Mod 0.7.4 сохраняют OCR-текст в PDF, но кириллица там нечитабельная, только латиница корректная.
Забылось уже за давностью.

Всего записей: 2794 | Зарегистр. 31-05-2010 | Отправлено: 02:08 24-12-2020
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ

Цитата:
Вообще, это относится и к DjVu, которые не обрабатывали в FR11 DjVu Text Layer Crutch, и которые были сконвертированы в PDF с помощью DjVuToy 3.04. Хоть там и правильное выделение текста, но в таких PDF поиск на словах с переносами не работает. Т.е., опять же, нужно распознавание в FR и последующая подмена OCR-текста.

 
 
Вот к примеру только сейчас обработал, все нормально выделяется и ищется. Пример -  посольст-ве
На странице 22.
https://dropmefiles.com/Wu94K

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 03:07 27-12-2020
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan
 

Цитата:
...все нормально выделяется и ищется. Пример -  посольст-ве  
На странице 22.  

 
Acrobat Pro X, XI, DC_2019 не находят это слово в поиске на 22-й стр.
В то время, как в распознанном и заменённом OCR-тексте от FineReader 14 он находит.
 
Лучше подкладывать OCR-текст от FineReader в сконвертированные файлы DjVu -> PDF.

Всего записей: 2794 | Зарегистр. 31-05-2010 | Отправлено: 11:36 27-12-2020 | Исправлено: ComboFZ, 19:34 27-12-2020
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan

Цитата:
Пример -  посольст-ве  
На странице 22.  

 
ComboFZ

Цитата:
Acrobat Pro 10 и 11 не находят это слово в поиске на 22-й стр.  

 
у меня получается найти только с пробелом 'посольст- ве'

Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 12:43 27-12-2020
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru