Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
toR_nado



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los

Цитата:
если ''непонятное ПО" - это Infix Pro

TelecomUral видимо интересно чем Jonmey заменил шрифты CIDFont на шрифт KaiTi. При этом удалив старые.

Цитата:
TelecomUral
Я даже не сумел извлечь поток deflate, что ни в какие рамки не лезет.  

Вроде бы все ссылается на Producer>PDFdo.com  5.5.6.0
 
 
 

Всего записей: 314 | Зарегистр. 20-05-2006 | Отправлено: 17:02 11-03-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Э-э-э...
Оригинальный позавчерашний файл
Acer Swift 3 SF314-41 STRONGBOW PK 18848-1.pdf
Created: 21.10.2020 18:58:22
Modified: 17.09.2021 12:40:41
Application: (Infix Pro)
PDF Producer: PDFdo.com  5.5.6.0
PDF Version: 1.6
File Size: 3,43 MB (3 597 573 Bytes)
Number of Pages: 106
Page Size: 29,7 x 21,0 cm (A4)
 
 
Исправленный сегодняшний файл Acer Swift 3 SF314-41 STRONGBOW PK 18848-1_fix.pdf
Acer Swift 3 SF314-41 STRONGBOW PK 18848-1_fix.pdf
Created: 21.10.2020 18:58:22
Modified: 11.03.2024 4:49:27
Application: (Infix Pro)
PDF Producer: PDFdo.com  5.5.6.0
PDF Version: 1.6
File Size: 5,78 MB (6 062 919 Bytes)
Number of Pages: 106
Page Size: 29,7 x 21,0 cm (A4)
 
Видно, что Application и PDF Producer одинаковы в исходном и исправленном файлах, т.е. при внедрении шрифта эти метаданные исправлены не были, т.е. программа, с помощью которой внедрялся шрифт - неизвестна.
Поэтому присоединяюсь к вопросу - чем?

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 18:51 11-03-2024
toR_nado



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Взято из PDF-XChange:
 
Acer Swift 3 SF314-41 STRONGBOW PK 18848-1.pdf
ModifyDate>2021-09-17T12:40:41+07:00
ICNAppName>Infix Pro
ICNAppVersion>7.4.4
 
Acer Swift 3 SF314-41 STRONGBOW PK 18848-1_fix.pdf
ModifyDate>2024-03-11T07:49:27+03:00
ICNAppName>Infix Pro
ICNAppVersion>7.7.0

Всего записей: 314 | Зарегистр. 20-05-2006 | Отправлено: 19:40 11-03-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
toR_nado
Спасибо. Полезно.
А как вы увидели ICNAppName и ICNAppVersion в PDF-XChange?
Я такое нашел в Document Properties -> Custom, но это как-то непривычно.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 20:06 11-03-2024
toR_nado



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

 
Можно сохранить в .xmp файл (для изучения). Открывается любым текстовым редактором.  
По шаманить и загрузить обратно. Но я ни чего такого не делал.
Для меня в этом окне самая полезная крайняя правая кнопочка.
 

Всего записей: 314 | Зарегистр. 20-05-2006 | Отправлено: 21:05 11-03-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
toR_nado
И ещё раз спасибо!
Т.е. ICNAppName и ICNAppVersion в данном файле можно посмотреть в PDF-XChange Editor кроме  
Document Properties (Ctrl+D) -> Custom
также в  
Document Properties (Ctrl+D) -> Description -> Additional Metadata -> Advanced -> раскрыть httр://ns.adobe.com/pdfx/1.3
Самая правая кнопочка в этом окне - Delete, если кто не увидел.
Кстати, в Блокноте эти данные выглядят так:
<</CreationDate (D:20201021185822+08'00')/Creator (\(Infix Pro\))/ICNAppName (Infix Pro)/ICNAppPlatform (Win)/ICNAppVersion (7.7.0)/ModDate (D:20240311044927)/Producer (PDFdo.com  5.5.6.0)>>

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 21:32 11-03-2024 | Исправлено: jourmager, 21:48 11-03-2024
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Посмотреть xmp:
pdfinfo -meta file.pdf
cpdf -print-metadata file.pdf

Всего записей: 7336 | Зарегистр. 08-09-2001 | Отправлено: 22:24 11-03-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los

Цитата:
Посмотреть xmp:
pdfinfo -meta file.pdf
cpdf -print-metadata file.pdf

Спасибо. Работает.  
Но, если вы имели в виду cpdf и pdfinfo , то под Windows они работают не совсем. В выходных данных нет строк:
xmlns:pdfx="http://ns.adobe.com/pdfx/1.3/"
<pdfx:ICNAppName>Infix Pro</pdfx:ICNAppName>
<pdfx:ICNAppVersion>7.7.0</pdfx:ICNAppVersion>
<pdfx:ICNAppPlatform>Win</pdfx:ICNAppPlatform>
 
А эти строки есть при извлечении xml с помощью PDF-XChange Editor
 
 
 
 

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 23:22 11-03-2024
toR_nado



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
то под Windows они работают не совсем. В выходных данных нет строк:

Все именно так для Acer Swift 3 SF314-41 STRONGBOW PK 18848-1_fix.pdf, но вот в Acer Swift 3 SF314-41 STRONGBOW PK 18848-1.pdf информация отображается корректно. PDF-XChange рулит.
 
pdfinfo -custom file.pdf так работает и для Acer Swift 3 SF314-41 STRONGBOW PK 18848-1_fix.pdf (у меня poppler)

Цитата:
CreationDate:    Wed Oct 21 13:58:22 2020 RTZ 2 (ceia)
Creator:         (Infix Pro)
ICNAppName:      Infix Pro
ICNAppPlatform:  Win
ICNAppVersion:   7.7.0
ModDate:         Mon Mar 11 07:49:27 2024 RTZ 2 (ceia)
Producer:        PDFdo.com  5.5.6.0

 
В Xpdf 4.05 тоже работает -custom для ...._fix.pdf

Цитата:
Creator:        (Infix Pro)
Producer:       PDFdo.com  5.5.6.0
CreationDate:   Wed Oct 21 18:58:22 2020
ModDate:        Fri Feb  4 13:44:17 2022
ICNAppName:     Infix Pro
ICNAppPlatform: Win
ICNAppVersion:  7.7.0
Tagged:         no
Form:           AcroForm
Pages:          106
Encrypted:      no
Page size:      841.92 x 595.32 pts (A4) (rotated 0 degrees)
File size:      6062919 bytes
Optimized:      no
JavaScript:     no
PDF version:    1.6

Всего записей: 314 | Зарегистр. 20-05-2006 | Отправлено: 23:42 11-03-2024 | Исправлено: toR_nado, 00:27 12-03-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
toR_nado

Цитата:
Все именно так, но вот в Acer Swift 3 SF314-41 STRONGBOW PK 18848-1.pdf информация отображается корректно.

Упс. Подтверждаю. Спасибо. Был неправ. Пробовал на Acer-bla-bla_fix.
Тогда получается, что при внедрении шрифтов в Acer-bla-bla.pdf с помощью Infix 7.7.0 в этом pdf произошли некие изменения, которые повлияли на корректность вывода метаданных с помощью cpdf и pdfinfo (xpdf), так штоле? Т.е. как бы Infix 7.7.0 лажает?
 
Интересно, ноутбуки на этих схемах - такие же неисчерпаемые

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 00:15 12-03-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
вот, к слову, ещё один крупный недостаток формата пдф проявился. Подмена шрифтов, и ее трудно выявить. Я честно думал что в foxit вижу родные шрифты, так как они необычного начертания, а они тоже авто-подмененные. Фирменные.

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 07:07 12-03-2024
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager, xmp в файле *_fix.pdf этих данных не содержит. А команды приведены для чтения именно xmp.
 

Цитата:
которые повлияли на корректность вывода метаданных с помощью cpdf и pdfinfo (xpdf), так штоле?

нет произошло изменение xmp и т.д.

Всего записей: 7336 | Зарегистр. 08-09-2001 | Отправлено: 08:50 12-03-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
ещё один крупный недостаток формата пдф проявился. Подмена шрифтов, и ее трудно выявить.

Поддержу. Предполагалось и декларировалось, что PDF будет стандартом для обмена электронными документами, при этом документы будут выглядеть одинаково, независимо от ОС, программ, принтеров и всего прочего. Фигвам. Обман с самого начала. Отсутствие требования обязательного встраивания шрифтов, причём в полном объёме (а не в виде сабсетов), в реальности приводит к проблемам с отображением и с поиском/копированием текста.
 
Я этот Acer-bla-bla.pdf (не фикс) смотрел в 5 программах и везде он отображался с разными шрифтами. 5 программ - 5 шрифтов.
 
los

Цитата:
xmp в файле *_fix.pdf этих данных не содержит. А команды приведены для чтения именно xmp.
нет произошло изменение xmp и т.д.

Не понял.  
Ещё раз. Для файла Acer-bla-bla_fix.pdf:
PDF-XChange Editor сохраняет xmp-файл именно с этими данными, откуда я собственно их и взял.
А cpdf и pdfinfo (xpdf) сохраняет xmp-файл без этих данных.
Кто и что тут виновато, мне конечно теоретически интересно, но практически нужную информацию про то, чем всё-таки внедрили шрифты в Acer-bla-bla_fix.pdf можно узнать только с помощью PDF-XChange Editor.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 12:16 12-03-2024
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Ещё раз. Для файла Acer-bla-bla_fix.pdf:
PDF-XChange Editor сохраняет xmp-файл именно с этими данными, откуда я собственно их и взял.

Основываясь на ваших словах PDF-XChange Editor сохраняет отсебятину, а не содержащийся в файле xmp.
 
PDF может содержать т.н. метаданные в нескольких видах и xmp только один из них.
Удалите xmp из файла и pdfinfo по прежнему выведет:
$ pdfinfo -custom no_xmp.pdf
CreationDate:    Wed Oct 21 12:58:22 2020 CEST
Creator:         (Infix Pro)
ICNAppName:      Infix Pro
ICNAppPlatform:  Win
ICNAppVersion:   7.7.0
ModDate:         Mon Mar 11 05:49:27 2024 CET
Producer:        PDFdo.com  5.5.6.0
 

Цитата:
чем всё-таки внедрили шрифты в Acer-bla-bla_fix.pdf можно узнать только с помощью PDF-XChange Editor.

весьма поспешный вывод.

Всего записей: 7336 | Зарегистр. 08-09-2001 | Отправлено: 13:13 12-03-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los

Цитата:
Основываясь на ваших словах PDF-XChange Editor сохраняет отсебятину, а не содержащийся в файле xmp.

Точно такую же отсебятину сохраняет Adobe Acrobat 22. Будем спорить с разработчиками стандарта, что надо сохранять в xmp, а что нет? Я не буду, а вы?

Цитата:
весьма поспешный вывод.

Да, В данном случае моё высказывание было некорректным, т.к. я имел в виду PDF-XChange Editor против cpdf и pdfinfo (xpdf).
Данную информацию можно узнать ещё с помощью Adobe Acrobat, Foxit Editor/Reader, Nitro. Может есть ещё что-то.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 14:43 12-03-2024
nikrons

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ребятишки.
 
Может кто сможет помочь.
 
Имеется pdf файл:
hттps://minjust.gov.ru/uploaded/files/reestr-inostrannyih-agentov-01032024_yzJpOWF.pdf
 
Есть ли какая-нибудь утилита, чтобы из командной строки преобразовать этот pdf в xlsx ?
Ну или чтобы из этого pdf в командной строке сохранить любой столбец в txt ?
 
Спасибо.

Всего записей: 617 | Зарегистр. 09-08-2001 | Отправлено: 16:52 14-03-2024
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
nikrons, можете переложить этот файл на какой-нибудь обменник?

Всего записей: 7336 | Зарегистр. 08-09-2001 | Отправлено: 18:18 14-03-2024
nikrons

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hттps://transfiles.ru/cf6nd

Всего записей: 617 | Зарегистр. 09-08-2001 | Отправлено: 21:05 14-03-2024
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
nikrons say:

Цитата:
из командной строки преобразовать этот pdf в xlsx?

Ежели ты откроешь этот pdf в LibreOffice, либо в Inkscape, то увидишь, что эта "таблица" была ею только до тех пор, пока не стала pdf-кой. В pdf-ке же всё не так. В pdf-ке эта таблица стала набором линий и отдельных, разбросанных по странице слов. Нет в этом хозяйстве больше ни столбцов, ни самой таблицы. И нету никакой консольной утилиты, способной из этой каши сформировать хоть что то вменяемое. Максимум, который можно получить - это более-менее распределённый текст с помощью утилиты pdftotext с опцией -layout из пакета poppler-tools.

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 23:48 14-03-2024
Jonmey

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
nikrons
https://workupload.com/file/M92PbpZUuYw
pdf -> doc -> html -> xlsx

Всего записей: 1319 | Зарегистр. 17-01-2011 | Отправлено: 04:03 15-03-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru