Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов (часть 1)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Заменить/удалить текст (batch есть), в т.ч. кириллицу (не панацея!) - PDF Replacer
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: Maz, 07:24 22-12-2024
73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Почти сутки бесплатно для детей ясельного возраста и приравненных к ним:
PDF Eraser Pro 1.9.9
Цитата:
Erase Text and Images: Remove text, logos, pictures, and other objects you don't need from your PDF documents.
Add Your Own Content: After erasing, you can add your own text and images to customize the PDF.
Delete Pages: Easily remove unnecessary pages to declutter your PDF.
Rotate Pages: Fix improperly oriented pages with a simple click.

Всего записей: 1313 | Зарегистр. 18-08-2012 | Отправлено: 12:37 02-08-2024 | Исправлено: 73, 08:15 31-08-2024
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Что-то подозрительно.

Всего записей: 525 | Зарегистр. 22-06-2016 | Отправлено: 15:48 02-08-2024
BorlandIMHO

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
73

Цитата:
сохранить дистрибутив+сериал и пользоваться ими без ограничений.

Ограничение там, однако, есть: дата регистрации д.б. не более 04.08.2024.
Уже 05.08.2024 при попытке регистрации получите ошибку...
 
 
esys

Цитата:
подозрительно

Нормальный time-restricted giveaway, что же в нём подозрительного-то?..
Не сказать, чтоб отматывать дату назад (при установке/регистрации) шибко приятно, но ничего сильно страшного...
Всяко лучше, чем срок действия лицензии, истекающий через месяц...

Всего записей: 2882 | Зарегистр. 12-10-2006 | Отправлено: 19:54 02-08-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
BorlandIMHO say:

Цитата:
Ограничение там, однако, есть: дата регистрации д.б. не более 04.08.2024.

 
Run As Date.

Всего записей: 796 | Зарегистр. 18-05-2023 | Отправлено: 20:01 02-08-2024
BorlandIMHO

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
Run As Date.

Спасибо, обойдусь.

Всего записей: 2882 | Зарегистр. 12-10-2006 | Отправлено: 20:44 02-08-2024
73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
BorlandIMHO
Цитата:
Уже 05.08.2024 при попытке регистрации получите ошибку...
Я никаких ошибок не получу даже без перевода даты, поскольку умный и опытный. Регистрация там примитивная, нужно только сохранить кое-что. Ну да детям это не нужно, они и так справятся. А с параноиками мне вообще разговаривать не о чем.

Всего записей: 1313 | Зарегистр. 18-08-2012 | Отправлено: 22:05 02-08-2024
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
что же в нём подозрительного-то?

Например, там не офсайт разработчика.

Всего записей: 525 | Зарегистр. 22-06-2016 | Отправлено: 22:38 02-08-2024
BorlandIMHO

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys

Цитата:
там не офсайт разработчика.

Там специализированный сайт с ежедневной "раздачей подарков" {различной, зачастую весьма сомнительной, степени полезности} от самых разных разработчиков. Вполне себе легальный...

Всего записей: 2882 | Зарегистр. 12-10-2006 | Отправлено: 09:59 04-08-2024
73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
PDF Replacer Pro С тайной надеждой, что хомячки смогут совладать с этим архисложным софтом. Сарказм, если что...

Всего записей: 1313 | Зарегистр. 18-08-2012 | Отправлено: 09:47 29-08-2024 | Исправлено: 73, 11:20 30-08-2024
bebop22

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вопрос специалистам. На сайте archive.org выложены сканы многих книг с добавлением желтого фона. Иногда можно видеть, как сперва загружается белая страница, а потом появляется желтизна. Как убрать желтый фон?
В интернете нашел  
--------------------------
The images (of pages of text) in at least some archive.org PDF files are combinations of 2 PBM images and a PGM image. One of the PBM images is the mask. I discovered this when I ran a utility to extract images from a PDF and have no idea how the PDF standard addresses this or how PDF libraries and utilities make use of the mask images.
-------------------------
Какая программа может убрать этот mask? Лучше всего было бы вообще удалить его из файла pdf, но и просто просмотрщик, где можно отключить его тоже подойдет.
Спасибо!

Всего записей: 167 | Зарегистр. 20-02-2007 | Отправлено: 05:52 07-09-2024
www_world

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bebop22
Так выложите одну книгу как пример. Люди гадать длжны, что именно применено в конкретном случае?

Всего записей: 502 | Зарегистр. 04-11-2018 | Отправлено: 06:10 07-09-2024
bebop22

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
www_world
 
Например:
https://archive.org/details/wirelesstelegrap00eccl/page/127/mode/1up
 
ссылка на файл:
https://archive.org/download/wirelesstelegrap00eccl/wirelesstelegrap00eccl.pdf

Всего записей: 167 | Зарегистр. 20-02-2007 | Отправлено: 06:26 07-09-2024
www_world

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bebop22
Однозначно хорошего решения для этого случая не существует.
Дело в том, что когда-то, судя по всему, это были обычные хорошие цветные сканы, Потом их распознали, а сами сканы разделили на слои с помощью цветовых фильтров на чб и цветной слой.
Далее, в зависимости от контента страницы, цветной слой масштабировали в сторону уменьшения для уменьшения размера. Чб слой сделали прозрачным (как чернила на стекле). Потом это засунули в Pdf, который теперь имеет три группы объектов - текстовый слой (распознанный), чб слой без фона и фоновый цветной слой.
Там, где чистый текст - цветной слой (фон старой бумаги) в разы меньше. Там, где растровые рисунки - фон больше (в пикселях), вплоть до размера чб слоя(например см портрет автора книги). Это происходит потому что  цветной фон сохраняет остальные цветовые каналы кроме черного - поэтому он не чистый там где растр, а как бы размытый чб.
Из этого следствия: если удалить цветной фон, вы напрочь убъете все растровые рисунки (они превратятся в пародию, как в убитых djvu.
Можно разделить на отдельные слои эти картинки - слой цветных картинок, слой чб. И отключать цветной по потребности, не удаляя из файла.
Можно поиграться с прозрачностью цветных картинок (осветлив их) - растровые рисунки пострадают, но не необратимо при желании прозрачность можно выключить.
Остальные варианты еще более трудоемки.
Вот такая ситуация.
 
И да, то что я назвал чб слой (на котором текст), это есть та самая mask. которую вы мечтаете удалить.
И оба типа картинок у вас, насколько я могу судить, в формате jpeg2000.
 
Сам бы я ничего не делал с такими файлами. "быстренько" ничего хорошего сделать нельзя - можно лишь ухудшать, а я не сторонник плодить говенные сущности*, ибо паства махровых экономов-djvu-филов это сделала до нас и, боюсь, этого не расхлебать еще не одно десятилетие (претензии не к формату, и не ко всем филам этого формата, а именно к указанной пастве, которая в силу межушной пустоты отличается огромной плодовитостью и наплевательским отношением, как чужому труду, так и своему (в части сканирования), в угоду мифической экономии и скорости). Пример, "плодиков" указанной касты - чуть выше по топику - номер журнала НиЖ.
К самому формату djvu - претензий нет. В нем не то, что чб, полноцеветные, полиграфического качества файлы можно делать - пальчики оближешь. Но, некоторые видят в нем лишь возможность запихать все и вся с качеством факсов для передачи по диалапу.
 
Если же книжка необычайно нужна/важна для вас (например, планируете распечатать и переплести), то вам стоит обратиться в тему по Фотошопу, чтобы оные неформальные специалисты, составили для вас точный пошаговый алгоритм редактирования, для максимального обесцвечивания фона без потери визуального качества документа. Работа кропотливая, но благодарная.
 
Все, что вам могут "насоветовать" тут - приведет к потере всех полутонов, включая текстовые. Документ из полноцветного превратится в однобитно-пиксельный, фактически мусор.
_________________
* ибо они имеют свойство саморазмножаться, поглощая или вытесняя качественные сущности. Стоит сделать что-нибудь чуть попроще, подешевле, поминиатюрнее, пусть даже ценой значительной потери качества - и оно тот час завоюет прилавки, жилища, компьютеры. умы и сердца масс. И у этой тенденции "упрощения" нет границ или красных линий, она столь же необъятна, как глупость или жадность.
 
PS Подробнее...

Всего записей: 502 | Зарегистр. 04-11-2018 | Отправлено: 07:38 07-09-2024 | Исправлено: www_world, 12:06 10-09-2024
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bebop22
В Акробате слева есть менюшки и в них есть меню "Content".
В нём раскрываете каждую страницу до конца и удаляете первое сверху изображение, второе и есть ваша маска.
Возможно не прав, но вроде бы автоматизм невозможен, если сильно нужно - делаем постранично ручками.


----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4321 | Зарегистр. 18-09-2003 | Отправлено: 12:12 07-09-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
www_world say:

Цитата:
Чб слой сделали прозрачным (как чернила на стекле).

И "это" плохое решение, ибо не более чем тормозная пародия на DjVu. В PDF изначально есть гораздо более грамотное решение: наложение на ЧБ подложку обрезанных иллюстраций без всяких там тормозных "невидимостей". Изображения в PDF при этом становятся абсолютно независимыми и могут иметь любое разрешение, цветовое пространство и кодировку/упаковку. Такие вот дела.
 

Всего записей: 796 | Зарегистр. 18-05-2023 | Отправлено: 12:33 07-09-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bebop22
slava_kry

Цитата:
В нём раскрываете каждую страницу до конца и удаляете первое сверху изображение

Это можно делать безболезненно только на страницах, которые не содержат иллюстраций в виде фотографий или графики в градациях серого. Иначе, грубо говоря, "серая" картинка превратится в черно-белую с соответствующим резким ухудшением качества.

Цитата:
вроде бы автоматизм невозможен

В общем случае ИМХО автоматизировать можно двумя путями:
1) ЕМНИП ComboFZ писал про то, что в Acrobat Pro + PitStop можно выделить изображения, основываясь на их характеристиках, типа размера в пикселях. В данном файле почти все "ненужные" страницы имеют размеры в пикселях и dpi значительно меньше, чем "информативные" страницы.
Хотелось бы увидеть подтверждение или опровержение этому от специалиста по Acrobat+PitStop
2) можно тупенько в PDF-XChange Editor провести Recompress всех TrueColor изображений в B&W
 
Но в данном конкретном случае из-за наличия фотографий slava_kry прав

Цитата:
делаем постранично ручками

 
zvezdochiot

Цитата:
Цитата:
Чб слой сделали прозрачным (как чернила на стекле).
И "это" плохое решение, ибо не более чем тормозная пародия на DjVu.

Не понял. А причём тут прозрачность чб слоя к тормознутости? Тормознутость в этом файле из-за тормознутого jpeg2000 по 2 штуки на страницу, причём 2-й в 500 dpi. И эту тормознутость jpeg2000 уже 25 лет никто побороть не может, скорее всего потому что никому не надо, но нет.

Всего записей: 912 | Зарегистр. 04-11-2019 | Отправлено: 13:52 07-09-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:

Цитата:
А причём тут прозрачность чб слоя к тормознутости? Тормознутость в этом файле из-за тормознутого jpeg2000 по 2 штуки на страницу

Что правда, чтоле? Истину глаголишь?
 
Меньше трёпу:
1) Беру ЧБ, кодирую в JBIG2, делаю PDF с картинкой. Открывается и отображается менее чем за секунду.
2) Беру тоже самое ЧБ, инвертирую и кодирую в JBIG2, делаю PDF с маской прозрачности (только маской). Открывается и отображается более чем за 2 сек.
 
А так "не при чём". Свистите дальше.

Всего записей: 796 | Зарегистр. 18-05-2023 | Отправлено: 14:43 07-09-2024 | Исправлено: zvezdochiot, 14:44 07-09-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
1) Беру ЧБ, кодирую в JBIG2, делаю PDF с картинкой. Открывается и отображается менее чем за секунду.
2) Беру тоже самое ЧБ, инвертирую и кодирую в JBIG2, делаю PDF с маской прозрачности (только маской). Открывается и отображается более чем за 2 сек.

Оба файла в студию, пожалуйста. Чтобы можно было проверить вот эти вот 1 и 2 секунды.

Всего записей: 912 | Зарегистр. 04-11-2019 | Отправлено: 16:20 07-09-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:

Цитата:
Оба файла в студию...

Ожидаемо. Для тебя? Ну нет. Сам себе сделай. Или не можешь? А о чём тогда говорим?
 
PS: Перехожу в режим игнора. Уже не обещаюсь его не нарушать, но стараться буду.

Всего записей: 796 | Зарегистр. 18-05-2023 | Отправлено: 19:10 07-09-2024 | Исправлено: zvezdochiot, 19:11 07-09-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот файл, который я из исходника тупо рекомпреснул в чб с помощью PDF-XChange Editor. Естественно, все "серые" фото стали чб.
При этом исходную softmask в JBIG2 на 500 dpi не трогаю. Естественно, файл открывается и листается реактивно, по сравнению с исходником.

Всего записей: 912 | Зарегистр. 04-11-2019 | Отправлено: 22:07 07-09-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов (часть 1)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru