Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
Sputnikk



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В этом файле, который ЗР 2022 02 на стр 107/114, примерно пятьдесят тысяч изображений по паре пикселей и по десятку байт, так что неудивительно, что просмотрщики тормозят. Размер одной этой страницы, извлечённой с помощью PDF-XChange - 25 МБ
Интересно, зачем так делать в каждом выпуске.
Вчера проверил - планшет показывает пустую страницу 30 секунд. У него слабый проц OMAP4430, 2 ядра Cortex-A9 1000 ГГц. Читалка EBookDroid
 
 

Всего записей: 6661 | Зарегистр. 17-10-2011 | Отправлено: 04:34 06-02-2022 | Исправлено: Sputnikk, 06:24 06-02-2022
Sputnikk



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Есть редактор с автообрезкой центрального разворота для правильного отображения "панорамной" картинки на развороте?  
В EBookDroid трудно настроить идеальную обрезку страниц, в Акробат рейдере вообще не предусмотрено

Всего записей: 6661 | Зарегистр. 17-10-2011 | Отправлено: 07:09 06-02-2022 | Исправлено: Sputnikk, 07:15 06-02-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Sputnikk
в шапке гляньте

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 08:31 06-02-2022
ULer



Moderator
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Sputnikk

Цитата:
Давать ссылки на торренты запрещено законом РФ.

В твоём воспалённом воображении.
http://forum.ru-board.com/forum.cgi?action=filter&forum=35&filterby=topictitle&word=PDF

----------
http://dc.ru-board.com/ — Anime, Books, Cartoons, Clips, Databases and Maps, Games, Misc, Music, Movies, Scripts and Templates, Series, Soft, Training Courses, XXX.

Всего записей: 7441 | Зарегистр. 18-10-2007 | Отправлено: 13:05 07-02-2022 | Исправлено: ULer, 13:12 07-02-2022
insulin11



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Не знаю правильно ли тут задаю вопрос, если что извиняюсь.
ХР, Adobe Acrobat XI Pro. Неделю открывал один и тот-же файл - .ai. Через неделю он стал открываться как на скриншоте. Ничего не менял. Что произошло? Куда копать?
Спасибо.


Всего записей: 1989 | Зарегистр. 25-09-2008 | Отправлено: 22:57 07-02-2022
Sputnikk



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ULer
Цитата:
 
Sputnikk
 
Цитата:
Давать ссылки на торренты запрещено законом РФ.
 
В твоём воспалённом воображении.  
http://forum.ru-board.com/forum.cgi?action=filter&forum=35&filterby=topictitle&word=PDF
как темы с "PDF" в названии связаны с торрентами и законом РФ?  
 
 
Добавлено:
Не суди по себе о других.

Всего записей: 6661 | Зарегистр. 17-10-2011 | Отправлено: 06:07 08-02-2022 | Исправлено: Sputnikk, 06:25 08-02-2022
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
insulin11, видимо, файл *.ai был сохранен без совместимости с pdf. Нужно открыть его в Illustrator и при сохранении выбрать "Create PDF Compatible File" или что-то подобное.

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 10:06 08-02-2022
insulin11



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Нужно открыть его в Illustrator и при сохранении выбрать "Create PDF Compatible File" или что-то подобное

что опять делаю не так? я ж писал, раньше этот файл нормально открывался.
задам вопрос по другому, в ai может быть встроено что-то типа триала?

Всего записей: 1989 | Зарегистр. 25-09-2008 | Отправлено: 14:01 08-02-2022
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
я ж писал, раньше этот файл нормально открывался.

У меня изначально этот файл.открывается именно так. Но т.к. этот вопрос мало связан с pdf файлами, лучше будет если вы зададите его в соответствующих темах.

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 14:14 08-02-2022
LonerD



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Подскажите, в чём разница между двумя файлами?
https://www.upload.ee/files/13874238/1945-01.rar.html
Размер разный. Визуально одинаковые. Распаковываю через pdfimages - внутри содержимое идентичное.
И самое странное - при распознавании OCR слоя в Abby PDF Transformer+ получается сильно разный результат.

Всего записей: 835 | Зарегистр. 27-06-2006 | Отправлено: 00:02 10-02-2022
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В файле 1945-01.pdf содержит шрифты и видимо, какой-то битый, ocr-слой.

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 10:07 10-02-2022
LonerD



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
los
Спасибо.  
Действительно, есть шрифты.
 
Получается, что ABBY обрабатывает не только отсканированный слой-картинку, но и использует встроенные шрифты при распознавании текста с картинки О_о
То есть можно улучшить результат распознавания скана, предварительно встроив в pdf-файл какие-то (как понять какие?) шрифты?
А после распознавания текста, шрифты уже по сути и не задействованы и их можно как-то (какой программой?) удалить? (Акробат и PDF XChange при оптимизации не видят шрифты в выложенном выше файле их и не удаляют).

Всего записей: 835 | Зарегистр. 27-06-2006 | Отправлено: 14:37 10-02-2022 | Исправлено: LonerD, 15:39 10-02-2022
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LonerD

Цитата:
Получается, что ABBY обрабатывает...

не пользуюсь, не знаю. Но вывод кажется мне сомнительным. В 1945-01.pdf имеется ocr-слой, как мне представляется он испорчен или что-то подобное. Выполните:
$ pdftotext 1945-01.pdf -
 

Цитата:
А после распознавания текста, шрифты уже по сути и не задействованы и их можно как-то (какой программой?) удалить?  

шрифты удалить - не проблема, а вот понять нужны ли они(какие именно) гораздо сложнее.

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 16:36 10-02-2022
LonerD



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору

Цитата:
В 1945-01.pdf имеется ocr-слой, как мне представляется он испорчен или что-то подобное.  

Слой имеется. Он не испорчен, просто корявый. Скорее всего сделан в Акробате. Сами сканы сложные для распознавания, Акробат выдаёт такой вот результат.
 
После удаления текстового слоя шрифты остаются, и ABBYY выдает результат распознавания отличающийся от файла, который изначально без шрифтов.
 

Цитата:
шрифты удалить - не проблема

А как в данном случае их удалить?

Всего записей: 835 | Зарегистр. 27-06-2006 | Отправлено: 18:19 10-02-2022 | Исправлено: LonerD, 18:36 10-02-2022
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А как в данном случае их удалить?

все, используя Ghostscript, шаблон:
gs -sDEVICE=pdfwrite -dFILTERTEXT -o out.pdf 1945-01.pdf

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 19:00 10-02-2022
toR_nado



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Слой имеется. Он не испорчен, просто корявый.

Из текста там только ира и 18 (см. картинку). Остальное сплошные пробелы.
 

 
 

Цитата:
А как в данном случае их удалить?

Зачем что то удалять. Есть же файл 1945-01+.pdf в нем только растр (нет текст. слоя и шрифтов).  
Можно например воспользоваться PDF-XChange и удалить слой вместе с шрифтами, но получишь тот же 1945-01+.pdf.

Всего записей: 312 | Зарегистр. 20-05-2006 | Отправлено: 19:01 10-02-2022 | Исправлено: toR_nado, 19:06 10-02-2022
LonerD



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Спасибо, получилось удалить (в Акробате удалялся текстовый слой).
 

Цитата:
Зачем что то удалять

Целью было понять, почему в ABBYY PDF Transformer+ получался разный результат распознавания текста.
Вывод - действительно наличие шрифтов в PDF-файле влияет на распознавание.

Всего записей: 835 | Зарегистр. 27-06-2006 | Отправлено: 20:13 10-02-2022
amosopher

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Растеризация страницы с подшивкой оригинального текста
1) Открываем файл в PDF-XChange Editor
2) В левом нижнем углу нажимаем "Параметры" -> в выпавшем меню нажимаем "Контент" -> слева появляется панель "Содержание"
3) Становимся мышкой на нужной странице в панлеи "Содержание"-> ПКМ -> Выбранные -> Текст -> на странице появляется выделенный текст
4) ПКМ на странице ->  Новый документ из Выбранного -> в программе появляется новая вкладка "Новый документ" -> Сохранить как, например, text.pdf
5) В исходном файле, где был выделен текст, ПКМ на странице -> Удалить -> весь выделенный текст удаляется и остаются только изображения
6) Меню -> Преобразование -> Растеризовать страницы -> я оставил по умолчанию jpeg среднее 300 dpi
7) Возвращаемся на файл с текстом text.pdf -> Становимся на нужной странице в панели "Содержание" -> ПКМ -> Выбранные -> Текст -> появляется выделение на тексте и на нём ПКМ -> Копировать
8) Переходим на исходный файл -> меняем курсор на стрелку -> кончик стрелки устанавливаем точно в место, где должна быть верхняя точка первой буквы вставляемого текста -> ПКМ -> Вставить как содержимое
9) Профит
 

 
По этой схеме мы получается можем только постранично заменять текст в книге? Если у меня есть книга на 500 страниц (векторный pdf с кракозябрами), то все страницы разом не получится ведь исправить таким образом? К тому же будут шрифты меняться, а это значит, что издательское форматирование изменится

Всего записей: 134 | Зарегистр. 29-01-2010 | Отправлено: 22:08 13-02-2022
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amosopher
Данный рецепт писался для конкретной задачи:
В pdf-файле есть страница, грубо говоря, из 2 слоёв - слой с изображениями и слой с текстом, которые отображаются на экране нормально.  
Копируются из слоя с текстом кракозябры или нормальный текст в данном случае не интересует.
Внутренняя структура слоя с изображениями каким-то образом слишком усложнена - 50000 отдельных изображений, что приводит к очень медленному выводу на экран.
Поэтому стоит задача - из 50000 отдельных изображений сделать одно на всю страницу, а сверху на него наложить слой с текстом.

Цитата:
По этой схеме мы получается можем только постранично заменять текст в книге?

Можно одну, а можно несколько - всё дело в опциях выбора страниц.

Цитата:
не получится ведь исправить таким образом?

Исправить что? Кракозябры? Тогда нет.

Цитата:
будут шрифты меняться

При данном методе шрифты не меняются.

Всего записей: 715 | Зарегистр. 04-11-2019 | Отправлено: 01:00 14-02-2022
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Если копировать текст прямо на сайте то все норм.
А вот если скачать, то в Акробате, PDF-XChange Editor и Хроме выходят крякозябры. Как так получается?
https://www.academia.edu/9200941
 
Вот скачанная версия.
https://wdfiles.ru/766ce4

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 18:15 19-02-2022
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru