Редактирование PDF файлов (часть 2) - [1] :: Программы :: Компьютерный форум Ru.Board
Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Активные темы » Редактирование PDF файлов (часть 2)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части темы: часть 1 [?]

Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого [?]
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay) [?]
О технологии MRC с примерами - 1, 2 [?]
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF [?]
Заменить/удалить текст (batch есть), в т.ч. кириллицу (не панацея!) - PDF Replacer
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1 [?], 2 [?]
Редактировать текст - PDF-XChange Editor [?], Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, SoftMaker FlexiPDF, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro [?]
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 39458 | Зарегистр. 26-02-2002 | Отправлено: 08:59 05-04-2025
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
jourmager

Цитата:
Кто-то может подсказать, какого чёрта у меня в предыдущем сообщении наконец-то появилась подпись, первый раз за 800 сообщений? И снова пропала.

Модератор тонко намекнул (после последней запятой), что нужно делать

Всего записей: 7249 | Зарегистр. 14-01-2005 | Отправлено: 17:14 05-04-2025 | Исправлено: shch_vg, 17:16 05-04-2025
pressF



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
какие ещё инструменты есть кроме
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
для редактирования метаданных? просмотр и удаление вручную/в автоматическом режиме всего

Всего записей: 1565 | Зарегистр. 29-03-2023 | Отправлено: 16:56 21-04-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день. Подскажите пожалуйста, какими инструментами можно добавить в готовый pdf-файл нумерацию.
В интернете нашел онлайн-инструменты, но они не позволяют подобрать размер шрифта, цвет, гарнитуру, и место на полосе, где ставится номер страницы (есть выбор в левом верхнем углу, в правом нижнем и т.д.).

Всего записей: 664 | Зарегистр. 04-05-2016 | Отправлено: 18:03 28-04-2025
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku, можно  использовать pdftk с опцией multistamp.
Создаете pdf содержащий только колонцифы и объединяете его с исходным pdf. Создать pdf с нумерацией можно в MsWord и аналогах, Scribus/Indesign/CorelDraw и  др. программах верстки (мастер страница).
Вместо pdftk можно так же использовать qpdf с опциями  
--overlay, --underlay

Всего записей: 1003 | Зарегистр. 14-12-2005 | Отправлено: 18:17 28-04-2025 | Исправлено: U235, 18:25 28-04-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235, спасибо. А бесплатная версия может это делать? Или нужна Pro?

Всего записей: 664 | Зарегистр. 04-05-2016 | Отправлено: 18:30 28-04-2025
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku, бесплатная, которая server. Запуск из командной строки.

Всего записей: 1003 | Зарегистр. 14-12-2005 | Отправлено: 18:57 28-04-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235, не могли бы помочь с командной строкой. Не могу разобраться.
Я установил pdftk server.
Есть файл fff1.pdf, в который нужно вставить нумерацию.
Есть файл fff2.pdf, в котором только нумерация.
Количество страниц в обоих файлах одинаковое.
Оба файла в корне диска D.

Всего записей: 664 | Зарегистр. 04-05-2016 | Отправлено: 19:10 28-04-2025
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
pdftk fff1.pdf multistamp fff2.pdf output out.pdf
как-то так...
Ну и в начале перейти на диск D.
Возможно над перезагрузить компьютер после установки pdftk.

Всего записей: 1003 | Зарегистр. 14-12-2005 | Отправлено: 19:15 28-04-2025 | Исправлено: U235, 19:17 28-04-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235, спасибо, получилось.

Всего записей: 664 | Зарегистр. 04-05-2016 | Отправлено: 19:29 28-04-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku say:
Цитата:
добавить в готовый pdf-файл нумерацию.

   
jPdf Tweak. ГУИ. Онклюзив.
 

Всего записей: 926 | Зарегистр. 18-05-2023 | Отправлено: 21:11 28-04-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot, спасибо. Попробую и эту программу. А нумерацию можно задать в произвольном месте?

Всего записей: 664 | Зарегистр. 04-05-2016 | Отправлено: 15:26 29-04-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
romy

Цитата:
А что же мы получаем, когда печатаем/экспортируем pdf

Не понял.
PDF - это в некотором роде контейнер, внутри которого в своём собственном формате могут сохранятся только ограниченное количество графических форматов - jpeg, jpeg2000, jbig2, CCITT, а также графика заархивированная в ZIP, RLE и т.п. и т.д. и пр.
Все остальные форматы внутри pdf преобразуются именно в этот набор типов форматов, а в какой именно зависит от настроек программы-обработчика.
Т.е. теоретически можно создать векторную иллюстрацию в Corel в формате cdr или в Adobe Illustrator в формате ai, и эту векторную иллюстрацию сохранить как pdf с помощью тех же Corel или AI. При этом внутри окажется что-то из доступных типов объектов - растровые типа jpeg сотоварищи или специфические для pdf векторные объекты типа path, shape, place, но никак не cdr или ai.

Цитата:
Например, в этой масса чёрно-белых рисунков, которые в формате gif будут весить килобайт 20, а вектором может и меньше

Вот архив с pdf-файлами, сделанными из "Архитектур".
Head First Architecture_370_Optimized.pdf - это 370 страница англоязычного оригинала, где сохранены только иллюстрации "звёздочки" в виде векторных элементов. Размер файла 1.268.494 байта.
Head First Архитектура_366_Optimized - это аналогичная 366 страница русскоязычного оригинала, где сохранены только иллюстрации "звёздочки" в виде растровых изображений в формате CCITT 4 по 112 байт каждое. Размер файла 5123 байта.
 
Ещё раз - растровый вариант 5 килобайт, векторный более 1 мегабайта.
 
Разумеется, данный пример не может служить чистым доказательством превосходства одного типа данных над другим в плане размера. Это просто практическая иллюстрация результатов оптимизации в конкретной программе.
 
 
А вот ещё пример, широко известный в узких кругах.
Некоторые экземпляры pdf-файлов журнала За рулем имеют одну тормознутую страницу, которая к тому же весит несколько десятков мегабайт.
Архив с примером такой страницы, внутри:
За рулем 2023 01_94 = original.pdf - оригинал размером = 28 265 051 байт
За рулем 2023 01_94 = only images_Optimized.pdf - только картинки = 19 451 265 байт
За рулем 2023 01_94 = only path_Optimized.pdf - только векторные элементы типа path = 9 016 814 байт
За рулем 2023 01_94 = rasterized.pdf - полностью растеризованная страница с векторным текстом 300 dpi = 403 671 байт
 
Ещё раз - только векторные элементы весят 9 мегабайт, а вся растровая страница - 400 килобайт

Всего записей: 993 | Зарегистр. 04-11-2019 | Отправлено: 13:29 08-05-2025 | Исправлено: jourmager, 14:30 08-05-2025
KChernov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
Цитата:
Ещё раз - растровый вариант 5 килобайт, векторный более 1 мегабайта.
А вектор в этом варианте сжатый или нет?
И я правильно понимаю, что это вектор в форматах path/shape?

Всего записей: 2706 | Зарегистр. 20-04-2004 | Отправлено: 21:45 08-05-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я не теоретик. Я практик. Есть конкретные файлы и есть конкретные инструменты и есть конкретные критерии оценки работы с этими файлами с помощью этих инструментов.
KChernov

Цитата:
А вектор в этом варианте сжатый или нет?

Я же предоставил файл для скачивания и просмотра. Скачайте и посмотрите. В блокноте. Или в pdf-редакторе. Можно даже в qpdf разжать то, что было сжато.

Цитата:
И я правильно понимаю, что это вектор в форматах path/shape?

PDF-XChange Editor в файле векторной Архитектуры показывает только элементы path

Цитата:
Как это нельзя, если он при масштабировании должен перерисовываться?!?

Я же специально написал - "При соответствующих условиях, конечно."
А соответствующее условие - это создание растровой картинки с таким значением dpi, что при увеличении невозможно будет увидеть лесенку на контурах объектов. Вернее, будет непонятно - это лесенка от растра или от пикселей монитора - монитор то растровый. Любители сивой старины могут вспомнить векторные мониторы, но.

Всего записей: 993 | Зарегистр. 04-11-2019 | Отправлено: 23:42 08-05-2025
romy



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
 
Cовершенно в жопу верно, как говорил один мой знакомый. PDF — это контейнер. И самое суть этого контейнера, для чего его разрабатывали, чем он был лучше других древних форматов хранения и обмена визуальными (и не только) данными — он хранит и/или растровый, векторный (и даже медиа) контент в том виде, в каком его в контейнер поместили (если не указано иное). Это и было его назначением. Текст остаётся текстом, картинка — картинкой, вектор — вектором. Следующий пользователь (принтер) извлекает из файла именно то, что хотел (условно). Конечно, Adobе уже дошёл до стадии развития компании, когда в продуктах ищут фатальные недостатки и теперь мы имеем Interactive PDF и (обычный?) PDF. Sic transit... Поэтому, можно поместить в PDF вектор Ai и достать из него вектор Ai. Возможно, вас запутал тот факт, что сам Acrobat всегда предлагал довольно небольшой инструментарий для работы с этими объектами. Кроме того (насколько понимаю), есть нюансы экспорта (печати), в файле генерируется bitmap-ы содержимого для одинакового отображения на любом экране (вроде бы, до недавнего времени PS умел напрямую отображать только InDesign).
 
Проиллюстрирую на примере ваших файлов. Слева Head First Architecture_370_Optimized.pdf открытый в Ai. Как видите, вот он вектор, никуда не делся. Забавно, что справа файл Head First Архитектура_366_Optimized открытый в Acrobat, и, несмотря на то что в файле вместо символов — картинки, Acrobat воспринимает эти картинки как блок текста. Хотя, если открыть его в Ai, то вектора там, конечно, не будет. Будут ряды одинаковых картинок со звёздочкой. Кстати, разница в качестве видна прямо на экране (векторные звёздочки отображаются идеально, растровые — со небольшой ступенькой), в этом смысле вектор, конечно же предпочтительнее.  
 
   
 
Почему файл с картинкой весит там мало? Вестимо, по причине того, что в файле описана всего одна повторяющаяся звёздочка с разными координатами. Почему файл с вектором весит так много. Должна была быть описана одна повторяющаяся звёздочка (ещё лаконичнее, в виде вектора т.е. набора координат) и её положение на странице. Этого отчего-то не произошло (особенности экспорта или печати, генерирующей программы?). Ситуацию можно поправить путём оптимизации файла встроенным механизмом Acrobat, файл станет весить 9 килобайт, вместо 1,2 мегабайта. При этом он по прежнему будет содержать вектор. Есть подозрение, что вес сложится из пяти килобайт картинки (растровая версия, которая отображается на экране) и четырёх килобайт данных о векторе. Касаемо вопроса "что лучше", я категорически согласен, нужно смотреть по месту. Иногда вектор — избыточное удовольствие.
 
Например, ваш широко известный в узких кругах пример страницы из журнала. Там внутри вот такой кошмар:
 
   
 
Двести тысяч объектов, два миллиона узлов. "Векторизован" literally каждый пиксель фотографий. Это результат то ли бездумного применения команды trace, то ли какой-то пакетной обработки (давно не занимаюсь полиграфией, не помню уже когда и как такие ситуации обычно возникают). Но это не пример векторизации (которая здесь, понятное дело, не должна была коснуться фотографий), и не пример, на котором можно изучать эффективность хранения вектора. Это пример невнимательности. Так же, как утверждать что png — плохой, неэффективный, формат, потому что сжатое в него фото (с применённым эффектом noise) весит вчетверо больше против jpg. Он попросту не пригоден в этом случае.

Всего записей: 547 | Зарегистр. 19-02-2006 | Отправлено: 01:42 09-05-2025 | Исправлено: romy, 05:50 09-05-2025
KChernov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
romy
Цитата:
файл станет весить 9 килобайт, вместо 1,2 мегабайта. При этом он по прежнему будет содержать вектор. Есть подозрение, что вес сложится из пяти килобайт картинки (растровая версия, которая отображается на экране) и четырёх килобайт данных о векторе
А разве растр не должен полностью заместиться?

Цитата:
Это результат то ли бездумного применения команды trace, то ли какой-то пакетной обработки
А нейросетки пока ещё не умеют такое грамотно векторизовать?
 
 
jourmager
Цитата:
Я же предоставил файл для скачивания и просмотра. Скачайте и посмотрите. В блокноте. Или в pdf-редакторе. Можно даже в qpdf разжать то, что было сжато.  
Ок
Но просто раз уж вы сравниваете размер растра и вектора, у меня сложилось впечатление, что вы понимаете, что там и как хранится. Но нет так нет

Цитата:
Я же специально написал - "При соответствующих условиях, конечно."
А соответствующее условие - это создание растровой картинки с таким значением dpi, что при увеличении невозможно будет увидеть лесенку на контурах объектов. Вернее, будет непонятно - это лесенка от растра или от пикселей монитора - монитор то растровый
То ли вы просто так ответили (и покидали всё в одну кучу), то ли у вас странное представление о векторной графике.
На самом деле нормальная векторная графика при каждом увеличении полностью перерисовывает сцену, каждый раз выдавая максимально сглаженное изображение (так что да, визуальные проблемы могут быть исключительно если пиксели монитора слишком крупные).
Или вы про то, что пдф как раз так и работает: рендерит вектор только один раз под заданный дпи в растр, а потом только масштабирует?..

Всего записей: 2706 | Зарегистр. 20-04-2004 | Отправлено: 19:44 09-05-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
romy

Цитата:
Поэтому, можно поместить в PDF вектор Ai и достать из него вектор Ai

Ну да. Можно. Наверное. С помощью программы-перекодировщика. И ещё 100500 графических и текстовых форматов. И как это отменяет тот факт, что внутри pdf в своём собственном формате хранятся только растровые форматы jpeg, jpeg2000, и прочие, а также векторные объекты path, shape, place. И никаких cdr или ai в их собственных форматах там не будет. А будет нечто, преобразованное Корелом или Иллюстратором согласно настройкам программы. Нарисовали в Кореле стрелочки и рамочки - будут path-ы в pdf, нарисовали Мону Лизу на Вакоме - вот даже не знаю, что будет. Нет у меня под рукой ни Корела с Иллюстратором, ни Вакома. А у вас?
 
Есть стандарт PDF на 750 страниц текста, где чётко указано, какие объекты можно хранить в pdf - всё те же jpeg, jpeg2000, jbig2, path и прочие. И нет там никаких cdr или ai.
 
Я вообще не понимаю, о чём мы тут рассуждаем?
 
Добавлено:
 
 
KChernov

Цитата:
раз уж вы сравниваете размер растра и вектора

Я ничего не сравниваю. Я же написал:
"Разумеется, данный пример не может служить чистым доказательством превосходства одного типа данных над другим в плане размера."
И далее.
"Это просто практическая иллюстрация результатов оптимизации в конкретной программе."
Я просто практически показал, что конкретный файл с конкретными векторными рисунками может иметь размер больше чем конкретный файл с растровыми рисунками. Т.е. заявление

Цитата:
Не, ну если в этом пдфнике ещё и картинки в вектор перевести - было бы совсем круто (да и размер бы сразу же уменьшился в разы)

имеет очень мало общего с реальной жизнью.
 

Цитата:
На самом деле нормальная векторная графика при каждом увеличении полностью перерисовывает сцену, каждый раз выдавая максимально сглаженное изображение (так что да, визуальные проблемы могут быть исключительно если пиксели монитора слишком крупные).

Еще раз, я же написал: "создание растровой картинки с таким значением dpi, что при увеличении невозможно будет увидеть лесенку на контурах объектов. Вернее, будет непонятно - это лесенка от растра или от пикселей монитора - монитор то растровый."
 
Во-первых - разрешающая способность человеческого глаза около 1 угловой минуты. Во-вторых. Современные мониторы все растровые, т.е. имеют вполне определенный размер пикселя. Для монитора 27" 4К это будет 0,155 мм (164 dpi). Поэтому любой векторной рисунок на таком мониторе будет иметь видимые человеческим глазом лесенки размером 0.155 мм. Можно сделать растровый рисунок, который при увеличении 6400% будет иметь точно такие же видимые человеческим глазом лесенки размером 0.155 мм, т.е. иметь dpi 164x64=10000

Всего записей: 993 | Зарегистр. 04-11-2019 | Отправлено: 20:21 09-05-2025
KChernov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
Цитата:
имеет очень мало общего с реальной жизнью
Сравнение оправдано исключительно при сравнимом качестве сопоставляемого (а не так, что 1 растр сравнивается с документом со 100500 копий векторных аналогов). Ну или это демонстрация неадекватной конвертации/создания по крайней мере одного из сравниваемых образцов.

Цитата:
Для монитора 27" 4К это будет 0,155 мм (164 dpi). Поэтому любой векторной рисунок на таком мониторе будет иметь видимые человеческим глазом лесенки размером 0.155 мм
Мне остаётся только позавидовать вашему столь замечательному зрению, что вы видите пиксели на 27" 4к мониторе
У меня вот на 32" 2к даже если и есть лесенки - мне придётся специально их искать - просто так при обычном использовании я их просто не вижу

Всего записей: 2706 | Зарегистр. 20-04-2004 | Отправлено: 22:34 09-05-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А вот ещё один pdf "в векторе" - Архитектура
Вернее кусок книги в 100 страниц размером 60 МБ. Вся книга в 400 страниц имеет размер 292 МБ.
Вопрос - как уменьшить размер этого "векторного" файла?
Автоматом. Не занимаясь ерундой типа OCR а ФайнРидере, или всё растеризовать и прогнать в СканКромсаторе.
Иллюстрации там в основном jpg 150 dpi medium quality, так что сжимать изображения там уже некуда. Их общий размер около 25 МБ.

Всего записей: 993 | Зарегистр. 04-11-2019 | Отправлено: 00:51 10-05-2025 | Исправлено: jourmager, 00:54 10-05-2025
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2

Компьютерный форум Ru.Board » Компьютеры » Программы » Активные темы » Редактирование PDF файлов (часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru