Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
RIKARDOYYY

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
papaVlad
Наверное, corrector показал отдельный пример общего вида, так сказать, а не весь файл.  
 
corrector, простите, отправил сообщение и лишь затем увидел Ваш пост. Так бывает.

Всего записей: 726 | Зарегистр. 25-02-2005 | Отправлено: 23:45 23-04-2021 | Исправлено: RIKARDOYYY, 23:47 23-04-2021
asd174

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вс
Цитата:
Не городите ерунды. Я за деньги не работаю.

Спасибо вам большое человеческое, как говорится, дай бог вам здоровья, и всем остальным кто помог решить проблему,  очень все помогли, спасибо ещё раз!
 
Добавлено:

Цитата:
asd174
Как говорил В.Высоцкий в песне, про джина.. о предложении. Да шутка это, разумеется.   
Вот, держите: PDF и архив с отдельными страницами квитанций (если, вдруг, что-то будете пересобирать).  
 
https://disk.yandex.ru/i/0A9jK6A2mjk0AQ  
https://disk.yandex.ru/d/hw65Nk_P9LK2Cw  
 
И немножко баловства со вкладками, поскольку, сегодня, как бы уже начинается суббота:  
 
https://disk.yandex.ru/i/Zg0bSrIWKiIxKw  
Удачи в Ваших делах, по службе  
 

Спасибо большое!

Всего записей: 59 | Зарегистр. 17-01-2017 | Отправлено: 05:30 24-04-2021
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
.

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 21:06 24-04-2021 | Исправлено: xanxan, 17:09 26-04-2021
RIKARDOYYY

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
-del

Всего записей: 726 | Зарегистр. 25-02-2005 | Отправлено: 10:41 25-04-2021 | Исправлено: RIKARDOYYY, 12:16 25-04-2021
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
adada

Цитата:
url=http://forum.ru-board.com/topic.cgi?forum=5&topic=13464&start=2000#19
Есть проблема.  
Встречаются pdf-файлы, полученные сканированием старых книг с пожелтевшими страницами, в которых создателем желтый фон подложен под чб-текстовый...
...К сожалению, осуществить эту операцию мне пока удается только постранично...
...(Интересно, что в PDF-Exchange Editor возможность тотального выделения изображений во всем документе имеется -- но только всех слоев одновременно.)
 
Вот свойства двух изображений, объединенных в исходном файле в одно  
(1) Текстовый прозрачный "подслой" с непрозрачными символами:  
тип: изображение (Image)  
DeviceRGB  
Внешняя мягкая маска (External SoftMask)  
 
(2) Фоновый "подслой", изображающий пожелтевшую от времени страницу книги без текста.  
тип: изображение (Image)  
DeviceRGB  
маски нет  
 
В PDF-Exchange Editor Plus (v. 9.350) эти "подслои" удается посредством операции временного смещения верхнего изображения в сторону разделить, перенести в полноценные раздельные слои. (После чего ими, естественно, можно управлять, в том числе и в Foxit PhantomPDF.)  
Но сделать это удается только поочередно для каждой страницы, что при их значительном количестве весьма трудоемко.  

 
Похоже, что в PDF применялось MRC-сжатие или он был сконвертирован из DjVu.
Подробнее о технологии MRC: https://habr.com/ru/company/abbyy/blog/119790/
 
Сложность в том, что там два изображения наложены друг на друга: фон+маска.
Пока действенный способ по удалению фоновых изображений - это удалять их вручную в программе PDF-XChange Editor/Pro 7.0 и новее:
Вкладка Главная > Вид > иконка Контент.
Слева откроется панель Содержание > иконка шестерёнки Параметры > Выбранные > Изображения.
Выделятся все растровые изображения.
В списке боковой панели фоновые изображения показаны выше маски, просто щёлкаете по фону в списке и удаляете из каждой страницы. При этом, что хорошо, визуально видно удаление фона.
 
То же самое можно сделать в боковой левой панели Acrobat Pro XI (иконка Содержимое), но там надо каждый раз открывать содержимое каждой страницы.
 
По идее из PDF автоматом можно удалять картинки по их уникальным признакам в таких мощных программах как Callas PDF Toolbox или в плагине Enfocus PitStop, но в старых версиях что-то не получается это сделать. Они плохо/не стабильно работают с PDF-файлами в которых растр/сканы разделены на слои при помощи MRC-технологии.

Всего записей: 2791 | Зарегистр. 31-05-2010 | Отправлено: 13:59 10-06-2021 | Исправлено: ComboFZ, 16:54 13-06-2021
adada

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ

Цитата:
Пока действенный способ по удалению фоновых изображений - это удалять их вручную в программе PDF-XChange Editor/Pro 7.0 и новее:
 
Вкладка Главная > Вид > Другие панели > Контент.
 
Слева откроется панель Содержание > Параметры (иконка шестерёнки) > Выбранные > Изображения.
Список страниц частично развернется: выделятся все растровые изображения.
 
Фоновые изображения в списке боковой панели показаны выше маски, просто щёлкаете по фону в списке и удаляете из каждой страницы. При этом, что хорошо, визуально видно удаление фона.  
 
+
"Полуавтоматический" вариант: удерживая Ctrl, командой ЛКМ поочередно снимается выделение строк всех "масочных" изображений, после чего командой Del удаляются все фоновые изображения, оставшиеся выделенными.

 
You made my day, большое спасибо за участие! )))
 
 
 
 
 
 

Всего записей: 102 | Зарегистр. 11-12-2003 | Отправлено: 17:29 10-06-2021
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вообще с удалением фона под маской надо действовать осторожно. Часто часть текста не ушедшая в маску уходит в фон, поэтому фон тоже нужен.

Всего записей: 2791 | Зарегистр. 31-05-2010 | Отправлено: 17:57 10-06-2021
adada

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да, я догадывался об этом.
И вариантом с очисткой от фона интересовался, в основном, чтобы попробовать использовать его для последующего наложения на текст, полученный в FineReader в результате распознавания полновесного, с фоном, файла.
Минус на минус, говорят, иногда даёт плюс! )

Всего записей: 102 | Зарегистр. 11-12-2003 | Отправлено: 19:06 10-06-2021
norma



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как менять размер только внутреннего поля для переплета (это в середине листа, для последующей резки листа А4 пополам в этом месте до формата А5) при печати брошюрой на принтере.  
Подобная фишка встроена в PDF-XChange, но у него не хватает другой функциональности как у Acrobat.  

Всего записей: 152 | Зарегистр. 27-12-2003 | Отправлено: 17:41 18-06-2021 | Исправлено: norma, 18:28 18-06-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
norma
извратом, через нестандартный размер листа.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 18:53 19-06-2021
bomzz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
никто на практике не конвертировал pdf в текст консольным приложением?

Всего записей: 3412 | Зарегистр. 29-03-2016 | Отправлено: 10:14 30-06-2021
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bomzz,
конвертировал, вернее сказать извлекал текст, но в чем смысл вашего вопроса?

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 10:50 30-06-2021
bomzz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
смысл в том чем и как.

Всего записей: 3412 | Зарегистр. 29-03-2016 | Отправлено: 11:21 30-06-2021
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bomzz

Цитата:
смысл в том чем и как.

чем - pdftotext(poppler или xpdf), ghostscript - бесплатны.
 
pdtxt _https://www.pdf-tools.com
pdf2text _https://www.pdftron.com/
эти платные.
 
Есть и др. программы.
 
 
Добавлено:
если pdf содержит картинку с текстом, но не содержит текстового слоя - текст извлечен не будет.

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 11:48 30-06-2021
bomzz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
отлично извлекся. а я то думал как распознавание текста запихано в такой размерчик
 
Добавлено:
тот кто запихивал текст в пдф поленился

Всего записей: 3412 | Зарегистр. 29-03-2016 | Отправлено: 11:56 30-06-2021
galina2000

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравствуйте. Подскажите, пожалуйста, возможно ли восстановить текст формулы на стр. 205(522) документа
http://conf-durso.ru/docs/sames_2_2015.pdf
он же
https://docplayer.ru/60609713-Ekologiya-ekonomika-informatika.html

los, большое спасибо! К сожалению, мне не удалось этого добиться ни в одном из имеющихся редакторов. Не могли бы вы чуть подробнее мне объяснить, лучше в ПМ.

Всего записей: 472 | Зарегистр. 21-08-2006 | Отправлено: 03:47 02-07-2021 | Исправлено: galina2000, 20:17 02-07-2021
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
видимо, да


Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 11:15 02-07-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
а как вы это сделали?

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 14:29 02-07-2021
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
а как вы это сделали?

открыл в редакторе и выделил для редактирования. Так выглядит в другом редакторе


Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 15:25 02-07-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
сколь ни пытался подобраться к формуле через редакторы - ничего подобного вашей картинке не получается. Можно экспортнуть объект XForm в word (через PDF Xchange Editor Plus 7), но шрифт Symbol заменяется на Segoi. Соответственно, квадратики вместо матсимволов.
Юзал acrobat 9 Pro. И libreoffice 7. Во всех случаях в режиме редактирования знаки остаются огромными и не на своих местах.
 

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 08:11 06-08-2021
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru