Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
shrmn



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Вся графика в PNG- формате, но  
1- у всех есть альфа канал...который НИКОМУ НЕ НУЖЕН
2 все картинки еще продублированы файлами 104a78a1-0000-0000-0000-000000000000.woff (пример)
Не стал искать что это...
Размер файла HTML (только текст) - 730к (неочищенный)
Все картинки - 3.71 MB
Размер увеличен, так как в папке сохранились и те, которые наверняка не попадут в компиляцию.
Например есть картинка разорванная пополам. 1 часть на одной странице, а вторая на следующей...Интересно: как читать такие схемы? )
Новый PDF со всем мусором: ~5м (много преувеличено)
Но все это не имеет смысла
Andrea
Можно на Mega.nz открыть акаунт и кидать туда свои поделки...ну и когда нужно смотреть, скачивать, обмениваться
Ах, да....читал, вспомнил детство.
Уже и забыл какие сердечники мотал и провод ПЛШ
Вот за это спасибо

Всего записей: 3664 | Зарегистр. 17-12-2002 | Отправлено: 02:05 15-04-2023
73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Дети, вы что, поголовно альтернативно одаренные с ментальными особенностями? Надеюсь, знаете что это такое на обычном языке А ведь было говорено, и не раз, что начинать решение подобных задач следует всегда с ПостСкрипта и Дистилляции. Размер сразу уменьшается до 10,5 метров, желающие могут выеживаться дальше, больше и глубже. До обработки вектора ФайнРидером докатились, "королева в восхищении!", остальные валяются с фейспалмом...

Всего записей: 1148 | Зарегистр. 18-08-2012 | Отправлено: 07:13 15-04-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
73
А ведь было говорено, и не раз

не вижу в шапке

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 08:35 15-04-2023
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В PDF-файле по ссылке текст набран кириллицей с возможностью выделения, но если его скопировать и вставить в какой-либо текстовый редактор - то он получается в нечитаемом виде. Возможно ли восстановить текст? https://disk.yandex.ru/d/v2b2aLqnIcjbZA

Всего записей: 1367 | Зарегистр. 05-04-2010 | Отправлено: 09:05 15-04-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D
недавно обсуждалось что частично помогает открытие в foxit12 с немедленной конвертацией в формат docx.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 09:32 15-04-2023
Geoleo

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D
Тема поднималась неоднократно, но универсальное решение так и не найдено.
Изучайте...
jourmager - http://forum.ru-board.com/topic.cgi?forum=5&topic=17599&start=2100#21
ComboFZ  - http://forum.ru-board.com/topic.cgi?forum=5&topic=17599&start=2800#8
Когда в конце 90-х технари полезли в пизайнеры, нифига не понимающие что такое шрифт, а пизайнеры полезли в технари, нифига не понимаюшие что такое кодировка шрифтов, то и получился "Диздец пизайну!" (С) - плакат Номеркова (Ростов-на-Дону, 1998 г.)
 

Всего записей: 359 | Зарегистр. 05-05-2004 | Отправлено: 10:01 15-04-2023 | Исправлено: Geoleo, 10:23 15-04-2023
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D Недавно решил проблему так: загрузил пдф в ФР15 - загрузился с видимой кириллицей. Тут же, после выделения областей, выгрузил в пдфРЕДАКТОР как изображения и сделал ОСР. Кирилица после этого копировалась нормально (конечно без вычитки)

Всего записей: 1430 | Зарегистр. 02-08-2008 | Отправлено: 11:43 15-04-2023 | Исправлено: alpopo, 11:44 15-04-2023
Geoleo

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
del

Всего записей: 359 | Зарегистр. 05-05-2004 | Отправлено: 13:14 15-04-2023 | Исправлено: Geoleo, 09:53 16-04-2023
73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Цитата:
не вижу в шапке
Да ты что! "Какая неприятность!"(с) Вот исходная мыслЯ, а если нет желающих читать и осмысливать прочитанное, то все претензии именно к ним. А я никому ничего не должен. По части базовых понятий "Что такое PDF/PS и для чего они нужны?!, так уж точно, для этого есть масса популярной литературы.
P.S. Поддержу Geoleo, за использование FineReader для обработки векторного текста PDF (за исключением редких случаев для FR8, царствие ему небесное, а ABBYY - анафема!), топить с последующим расстрелом и повешением. Утомили уже своей простотой. Четверть века прошла, а попытки прошагать по тем же граблям, живы по сей день.

Всего записей: 1148 | Зарегистр. 18-08-2012 | Отправлено: 15:14 15-04-2023 | Исправлено: 73, 15:19 15-04-2023
Andrea



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
73, выложите, пожалуйста, обработанный вами файл

Всего записей: 1094 | Зарегистр. 24-12-2015 | Отправлено: 17:28 15-04-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вставлю и я свои пять копеек насчёт дивного файла от Andrea
Предлагаю оптимизированный файл, сжатый до 5'739'241 байт.
Оптимизация велась по 3 направлениям:
1) картинки электронных схем, печатных плат в векторном формате, которые занимают полностью всю страницу, растеризированы в b&w jbig2 600 dpi (page background - white). Это уменьшило файл с 22 МБ до 13 МБ.
2) удалены соответствующие дубликаты картинок - те, которые Container <PlacedPDF> : (Path|Path... на парных страницах. Это уменьшило файл с 13 МБ до 7 МБ.
3) рекомпрессирована передняя обложка и удалена невидимая задняя обложка. 7 -> 5 МБ.
Почему так, а не иначе, при потребности могу объяснить.
Все делалось в PDF-XChange.
Можно убрать ещё мегабайт-два-три, наверное, но уже лень.
Главное было понять принцип, что делать с такими файлами, и какой от этого выигрыш.
P.S. в аналогичном, но более "правильном" файле от Andrea нет дублирования информации

Всего записей: 728 | Зарегистр. 04-11-2019 | Отправлено: 18:31 15-04-2023 | Исправлено: jourmager, 19:05 15-04-2023
73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrea
https://send.cm/d/P2x5
Не делал абсолютно ничего - сохранить в PS, открыть PS в Дистиллере.

Всего записей: 1148 | Зарегистр. 18-08-2012 | Отправлено: 19:11 15-04-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Не делал абсолютно ничего - сохранить в PS, открыть PS в Дистиллере.

Смотрим на получившийся файл и видим, что Content Streams, т.е. те самые электронные схемы и печатные платы в векторном формате, уменьшились с 22 МБ до 10 МБ. Т.е. была выкинута невидимая информация с соседних страниц. Кроме того, ясное дело, удалены дубликаты текста, пережата передняя обложка и удалена невидимая задняя.
 
Это всё хорошо, но вместо нормального текстового слоя теперь абракадабра с кракозябрами и знаками вопроса. Грохнулся текстовый слой от PostScript-а и Distiller-а.

Всего записей: 728 | Зарегистр. 04-11-2019 | Отправлено: 19:40 15-04-2023
Andrea



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager, отлично! Много времени ушло на всё? Плохо, что не существует "однокнопочных" решений для подобных случаев - оптимизаторы с этим файлом практически не справлялись.. В PDFXCEdit 8.0.336 удалил обрезанное содержимое из вашего файла, и он дополнительно уменьшился до 5 441 722 байт (вообще давно обратил внимание, что размер True PDF файлов (в отличие от pdf-сканов) часто уменьшается без видимой потери качества лишь после этой операции - обычно незначительно, но иногда даже в разы. Но только в тех случаях, если они не содержат растровых картинок, или если их мало).

Цитата:
абракадабра с кракозябрами
Да, тоже заметил это в файле от 73, но только после того, как вы про это написали. Что говорит о том, что после обработки возможны неожиданности

Всего записей: 1094 | Зарегистр. 24-12-2015 | Отправлено: 20:25 15-04-2023 | Исправлено: Andrea, 20:50 15-04-2023
toR_nado



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В PDFXCEdit 8.0.336 удалил обрезанное содержимое из вашего файла

А вот меня удивляет почему именно с этого не начили перед оптимизацией.
Это же прямо бросаетьса в глаза. Так трудно нажать "Удалить обрезанное содержимое"

Это так же заметно если извлечь текст poppler-ом.
 

Цитата:
jourmager
Пробовал через Crop страниц, чтобы обрезать невидимую часть - но у меня не получилось сделать это для всего файла, только для одной страницы.  

Организация --> Обрезать --> Удалить обрезанное содержимое (все страницы)
 

Цитата:
Ну как? Нажали? И какой размер файла получили? Ссылку на него можно?

Размер меняется не сильно (23,28 Мб --> 22,89 Мб), также как и

Цитата:
он дополнительно уменьшился до 5 441 722 байт

Но зачем мусор нужен в файле. Лучше удалить в самом начале и работать будет по приятней.

Всего записей: 314 | Зарегистр. 20-05-2006 | Отправлено: 20:50 15-04-2023 | Исправлено: toR_nado, 22:05 15-04-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrea

Цитата:
Много времени ушло на всё?

На понимание, как всё устроено в этом файле - в нём каждая страница содержит также информацию (текст и векторные картинки) соседней парной страницы, и поиск лучшего решения с перебором вариантов - сравнительно много.
На само сжатие - считайте сами:
- выписать на листочек номера страниц, где векторные изображения занимают всю площадь страницы - более 70 штук
- растеризовать их по списку - моментально
- удалить дубликаты картинок в векторном формате - пробежаться по Contents и удалять по одной строке с соответствующей страницы - 70 скроллов и 70 делетов
- остальное - стандартные операции
 
Пробовал через Crop страниц, чтобы обрезать невидимую часть - но у меня не получилось сделать это для всего файла, только для одной страницы.  
 

Цитата:
Плохо, что не существует однокнопочных решений для подобных случаев

Вариант с конвертацией в PostScript и последующей обратной конвертацией в PDF - это как раз однокнопочное решение. Проблема в кириллических шрифтах. Как это исправить - я не знаю.
 
toR_nado

Цитата:
Так трудно нажать

Ну как? Нажали? И какой размер файла получили? Ссылку на него можно?

Всего записей: 728 | Зарегистр. 04-11-2019 | Отправлено: 20:57 15-04-2023 | Исправлено: jourmager, 21:00 15-04-2023
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Бывает, что после оптимизации, текст начинает копироваться с переносами и переводами строк, хотя до оптимизации текст был в строку без переносов.

Всего записей: 1367 | Зарегистр. 05-04-2010 | Отправлено: 21:11 15-04-2023
Andrea



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
toR_nado, для удаления обрезанного содержимого я обычно в меню миниатюр PDFXCEdit выделяю все страницы, затем нажимаю "Удалить обрезанное содержимое". И делаю это на копии файла, т.к размер может увеличиться, если в файле зашито много растровых изображений. Это вроде как одно и то же. Но в данном файле эффект от удаления был мизерным. Кстати, с этого и начинаю "оптимизацию"

Всего записей: 1094 | Зарегистр. 24-12-2015 | Отправлено: 21:37 15-04-2023 | Исправлено: Andrea, 21:48 15-04-2023
toR_nado



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Andrea
на ваших скринах это не "Удалить обрезанное содержимое", а "Обрезать страницы".

Это только для того, чтобы показать, что кто разделил страницы, а обрезанное не удалил.
Видно например изобр. на 265 стр. которое вроде есть, но в открытом пдф совсем не видно

Цитата:
в меню миниатюр PDFXCEdit выделяю все страницы, затем нажимаю "Удалить обрезанное содержимое".

А чем это плохо:
Организация --> Обрезать --> Удалить обрезанное содержимое (все страницы)

Цитата:
И делаю это на копии файла, т.к размер может увеличиться

Не замечал такого, в меньшую Да.

Всего записей: 314 | Зарегистр. 20-05-2006 | Отправлено: 21:52 15-04-2023 | Исправлено: toR_nado, 22:03 15-04-2023
Andrea



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
toR_nado

Цитата:
на ваших скринах это не "Удалить обрезанное содержимое", а "Обрезать страницы"
Эти слова я написал сначала, но потом отредактировал коммент, т.к понял, что вы имели в виду. Но с этим файлом толку от этой опции практически нет

Цитата:
Не замечал такого
Попробуйте на любом pdf-скане, содержащем обрезанное содержимое, его удалить, чтобы убедиться, что возможно увеличение размера файла при удалении из него обрезанного содержимого. На pdf-сканах - это 100%; на pdf-ebook - иногда

Всего записей: 1094 | Зарегистр. 24-12-2015 | Отправлено: 22:18 15-04-2023 | Исправлено: Andrea, 22:36 15-04-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru