Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
MBK2
Ссылку на тему нашли, но слабо чуть дальше почитать?

Во-от! Я же помню, что когда разбирался, нормальное описание процесса было найдено на rudtp.

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 19:22 14-01-2024
IamDimulya



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Коллеги.
Не нашёл простого описания, как скомилированный pdf-recode запустить.
Даю ему входной pdf файл - он говорит,что не может сохранить, не говоря уже о каких-то дополнительных ключах. Ещё бывает он спрашивает, что не так с файлом, никаких инструкций, как ему это объяснить.
Сил моих нет всё читать, проще взять пачку кривых pdf и сунуть их в Hotfolder Finereader.  
Решил, что мой сценарий - освоить recode, на уровне короткой попытки, если не сработает,  буду FR.
Благодарю.

Всего записей: 396 | Зарегистр. 01-09-2003 | Отправлено: 02:45 17-01-2024
useretail



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
MBK2
вот те на! вы уже и по PDFам спец? можно задавать вопросы?

Всего записей: 4638 | Зарегистр. 14-09-2007 | Отправлено: 03:15 17-01-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
IamDimulya
Даю ему входной pdf файл - он говорит,что не может сохранить

прога добавляет к имени пдфки плюсик. если такой файл уже имеется, то извините.
У меня всё работает:
 

 
слева сверху видно что старые файлы "9+" я дважды переименовывал, добавляя подчеркивание. Один раз для удаления старого файла-эксперимента, второй - из-за того что забыл вовремя PrintScreen нажать чтоб эту картинку с окошком "OK" вам вывести. Пришлось трижды запускать прогу.
 
UPD
Чтобы не было чудес с входными файлами понижайте их версию до 1.4 и разжимайте внутренние потоки. Для разжимания пользуюсь qpdf (строчка запуска qpdf --qdf --object-streams=disable temp\Pag0.pdf temp\Pag0_o.pdf).

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 06:59 17-01-2024 | Исправлено: TelecomUral, 07:05 17-01-2024
MBK2

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
useretail

Цитата:
можно задавать вопросы?

Так автору и задавайте, мапед не мой.
А так программа, конечно, сделана левой ногой, инструмент и обработка ошибок чудовищна, ошибка сохранения файла и чтото пошло не так, по сути, покрывают весь широкий спектр возможных ошибок. Судя по тому, что при всей, якобы востребованности, никто так и не изьявил желания переписать ее на чем то более вменяемом, это Неуловимый Джо.

Всего записей: 4576 | Зарегистр. 18-09-2018 | Отправлено: 11:06 17-01-2024
useretail



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
MBK2
а задам вам, как автору патча для cp1251.pl
более 10 лет назад вы писали:

Цитата:
Если кодировка текстовых строк cp1251 (маленькая буква “a” имеет код 0xE0, а большая “A” – 0xC0), то для базовой версии перекодировщика годится, стандартный. Однако, возможна и кодировка ASCII (“A”-0x80,”a”-0xA0)

вы уже выяснили что это за кодировка?

Всего записей: 4638 | Зарегистр. 14-09-2007 | Отправлено: 06:08 19-01-2024
IamDimulya



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Коллеги, я в восторге: конвертер версии Tipard PDF Converter 3.3.32 от 2023 года успешно извлекает текстовый слой из книг из openlibrary и archive.org в то время, как последние версии многих известных продуктов вроде Foxit, Adobe, PdfExchange и Nitro делать этого не хотят. Причём Foxit PDF Editor показывает текстовый слой по ctrl-6, но экспортирует либо графику вместо текста, либо вообще отказывается это делать, остальные не лучше.
Такое ощущение, что существует как и в Windows hidden API, который управляет этим функционалом.
Загнать текст в PDF во многих случаях означает похоронить его точную копию или как то так...

Всего записей: 396 | Зарегистр. 01-09-2003 | Отправлено: 04:47 02-02-2024
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
IamDimulya say:

Цитата:
успешно извлекает текстовый слой

 
Cpdf давным-давно "это" решает без лишних мучений:

Код:
 
cpdf -draft in.pdf -o ocr.pdf
 

Или вы как то по другому хотели произвести извлечение?

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 12:24 02-02-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
IamDimulya
Файнридер не пробовали?

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 18:56 02-02-2024
IamDimulya



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot
В приведённой вами команде один pdf преобразуется в другой... У меня задача получить полноценновый текстовый вариант, чтобы засунуть его в автоматическую систему перевода. Предложенное вами может загнать pdf в docx без искажений?
 
shch_vg
Пробовал. Вы мне предлагаете делать текстовый слой документам, в которых он уже есть? И зачем? Тогда, когда книга мне особо важна, я так и делаю. И устал от этого.  
Возьмём, скажем, официальную документацию к Davici Resolve, она 4.000 страниц. Что за обезьяний труд всё распознавать? Но текстовый слой извлечь не получается, pdf-ов кривых очень много. Я добавляю всё в один индекс, то, что Гугл удаляет из результатов поиска и наиболее ценно, вероятно оказывается в индексе кУкУГла. Присоединяйтесь.
Помимо этого, хочется делать автоматические переводы к книгам, но сил распознавать всё интересное нет. Я уже распознал тысячи книг, которых нигде в моём качестве нет, у меня теперь задача, чтобы другие могли получить к ним доступ.  
Но увы, я написал и на раздачу Либрусека, и Флибусты, о том, что их версии fb2 содержат искажения в первую очередь в потере картинок, смешивании комментариев, текстов под картинками и основного текста книги, но заинтересованного отклика не получил. Людей устраивает накопление и чтение вместо книг их кастрированных огрызков...
Оно и понятно, всюду боты, основные информационные ресурсы созданы под крышей хозяев денег в первую очередь с целью контроля информации, вносимые искажения являются частью глобальной пропаганды...
Кто готов к сотрудничеству в сфере хранения и распространения оригинальных книг?

Всего записей: 396 | Зарегистр. 01-09-2003 | Отправлено: 22:00 02-02-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
IamDimulya

Цитата:
У меня задача получить полноценновый текстовый вариант, чтобы засунуть его в автоматическую систему перевода.

ОК. Задача ясна.  
Не ясно другое - какие именно у вас трудности извлечь текстовый слой из pdf для системы автоматического перевода?
Извлекать текстовый слой может практически любой pdf-просмотрщик или редактор.

Цитата:
Вы мне предлагаете делать текстовый слой документам, в которых он уже есть? И зачем?  

Вам НЕ предлагали делать текстовый слой документам, в которых он уже есть.  
Вам предложили попробовать программу ABBYY FineReader.  
У которой для работы с pdf в настройках OCR есть опция PDF recognition mode -> Use only text from PDF. Т.е. повторного распознавания не будет, а будет использован текстовый слой. который уже можно извлечь обычной копипастой. Это если надо plain text.  
А если надо извлечь текст с сохранением оригинального форматирования - то это делается через экспорт, например Save as Microsoft Document Word. Хотя форматирование сохраняет кривовато.

Цитата:
хочется делать автоматические переводы к книгам

При существующем технологическом уровне систем автоматического перевода такие переводы будут низкого качества. Хотя, надо признать, автоматический перевод (я имею в виду на русский язык) может быть лучше сделанного современным человеком переводчиком.  

Цитата:
у меня теперь задача, чтобы другие могли получить к ним доступ.

А в чём проблема? Причём тут вообще Флибуста и Либрусек? Начните для начала с ру-борда - есть специальные темы для бесплатной раздачи книг. Если нет подходящей по тематике темы, то создайте свою. Сразу оцените, насколько ваши книги востребованы. А если хотите зарабатывать на скачивании ваших книг с платных файлообменников - то есть и такие сайты.

Цитата:
Кто готов к сотрудничеству в сфере хранения и распространения оригинальных книг?

Готовых может и много, но у каждого свои интересы, и они могут не совпадать с вашими.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 00:14 03-02-2024
IamDimulya



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
 

Цитата:
ОК. Задача ясна.  
Не ясно другое - какие именно у вас трудности извлечь текстовый слой из pdf для системы автоматического перевода?
Извлекать текстовый слой может практически любой pdf-просмотрщик или редактор.  

 
Сложность в том, чтобы получить качественный текст. Для Finereader я разработал свой алгоритм, но он трудоёмкий потому, что выделение не просто осществляю руками, но ещё и учитываю блоки примечаний так, чтобы они шли рядом с точкой, которая на них ссылается. В этом сценарии получается docx в режиме (сохранить форматированный текст), в котором весь текст идёт последовательно, а картинки не разбивают абзацы на куски.
 
Какой именно просмотрщик извлекает текст? Я не знаю ни одного.  
Полноценные продукты это делают и у меня их коллекция - все основные крупные продукты в разных версиях. Однако, в режимах без OCR на одних и тех же документах они лажают, падают и прочее. Процесс занимает много времени и заканчивается с непредсказуемым результатом. Яркий пример - официальная документация для DaVinci Resolve 18.5.
Готов выложить её для экспериментов желающих проверить функционал имеющихся в доступе программ.
 

Цитата:
Вам НЕ предлагали делать текстовый слой документам, в которых он уже есть.  
Вам предложили попробовать программу ABBYY FineReader.  
У которой для работы с pdf в настройках OCR есть опция PDF recognition mode -> Use only text from PDF. Т.е. повторного распознавания не будет, а будет использован текстовый слой.  

 
Сколько именно текстов вы экспортировали из FR таким образом? 10? 100?
Я только что проверил, версия 15.0.113.3886, в настойках стоит использовать только слой из PDF. Взял два документа, один скан с архив.орг, другой - изначально pdf, в обоих текстах показывается в Foxit Reader по ctrl-6 текстовый слой. Однако, FR при попытке сохранить несколько страниц в docx говорит, что страницы не распознаны. Возможно, я не ударил вовремя в бубен.
 
Отдельного внимания заслуживает форматирование, что значит "кривовато"? Зачем вместо полноценного текста его кривая копия? Предлагаете её переводить?  
 

Цитата:
При существующем технологическом уровне систем автоматического перевода такие переводы будут низкого качества. Хотя, надо признать, автоматический перевод (я имею в виду на русский язык) может быть лучше сделанного современным человеком переводчиком.  

 
Обсуждаем ли мы здесь качество перевода и его критерии? В параллельной теме http://forum.ru-board.com/topic.cgi?forum=35&topic=45670&start=80#18 я высказался по этому поводу.
 

Цитата:
А в чём проблема? Причём тут вообще Флибуста и Либрусек? Начните для начала с ру-борда - есть специальные темы для бесплатной раздачи книг. Если нет подходящей по тематике темы, то создайте свою. Сразу оцените, насколько ваши книги востребованы. А если хотите зарабатывать на скачивании ваших книг с платных файлообменников - то есть и такие сайты.  

 
Проблем нет, есть задачи. Смысл того, что я делаю каждый день на протяжении более чем 12 лет в том, что книги имеют связь одна с другой. Каждая отдельная книга особой ценности не имеет, но связанная логика, которую они несут, не имеет аналогов.
С недавно обнаруженной библиотеки анны я скачал уже сотни книг и научных документов. Ранее я для особо важных для меня на тот момент книг их скриншотил с архива.орг, но в библиотеке анны есть почти всё.  
Помните Высоцкого? "Удивительное рядом, но оно запрещено!" И дальше будет хуже...
Из 600 терабайт книг, которые есть у Анны, ценность для selFSearch имеет... ну, скажем, 10 Гигабайт. Многие книги или научные документы удалось найти только там, хотя многие доступны где-то ещё.  
Смысл в связанности.
Наиболее это заметно по современной физике и физиологии человека.  
Масонские академии наук(а они все таковые) и их полицейский отдел "По борьбе с лженаукой" совместно с ФРС уже сотни лет создают знания, предназначенные для искажения истины.  
Но если взять несколько настоящих авторов вроде Акимова и Ацюковского, то всед за ними вытягиваются знания, за которыми стоят огромные возможности торсионики, двигатели с КПД в сотни процентов, преобразователи эфира, методы развития биолокационных способностей в каждом и т.п. Когда автор книги по биоэнергетике ссылается на работы Шипова с Акимовым - это великий приплод.  
Чтобы увидеть серьёзную работу ботов по борьбе с Истиной, почитайте отзывы на рутрекере в раздачах Акимова, Шипова, Ацюковского, Дайненко.
Продолжая тему биолокации, книги Пучко есть в Интернете, но без знаний из Лекций Салля и других перечисленных авторов мне с физмат школой и прочим, было смешно этим заниматься, теперь же я чувствую себя обманутым, ибо 239 и её крутые преподаватели оказались рабами 5-й колонны, вдолбив в меня ложные определения фальшивой теории относительности и ангажированной науки, сформированной по указанию ротшильдов для того, чтобы утопить успехи Теслы и эфирной физики.
К эфирной физике прилагаются и остальные дисциплины такие как биофизика, биохимия, лингвистико-волновая генетика (вместо ложной обычной генетики) и квантовая модель воды, являющейся базой настоящей всей современной науки. Но большинство людей понятия не имеет о том, что в науке давно происходит революция, переворачивающая образ жизни тех, кто соприкасается с тем, как на самом деле устроен мир.
Подлинная наука создаёт целостное знание, тогда как задача жрецов, порабощающих планету - расщепление знания и разделение людей. Сюда же и настоящая холистическая медицина вместо рокфеллероской фармакологической аллопатии...
А в либрусеке детективы есть, а науки и дисциплин, связанных с человеком и выживанием нет. И это не случайно!
Помимо перечисленных стоит для общего ознакомления рекомендую посмотреть Жигалова "Уничтожение торсионных исследований".
 

Цитата:
Готовых может и много, но у каждого свои интересы, и они могут не совпадать с вашими.  

Прошу меня простить, если я похож на чайника, таковым не являюсь, 2.5 высших образования и статус сертифицированного тренера Microsoft - тяжёлый груз, от которого теперь пытаюсь избавиться...
 
 

Всего записей: 396 | Зарегистр. 01-09-2003 | Отправлено: 02:49 03-02-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 06:50 03-02-2024
amosopher

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Попался pdf-файл, который моментально раздувается в объёме при любой попытке внести в него изменения. Достаточно удалить пустую страницу или добавить букмарки — и файл весом 4 мб начинает весить 25 мб. Пытался обложку добавить, которая весит 190 кб — файл тут же до 25 мб увеличился. Подскажите, как можно в XChange это исправить

Всего записей: 137 | Зарегистр. 29-01-2010 | Отправлено: 14:01 04-02-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amosopher

Цитата:
Попался pdf-файл, который моментально раздувается в объёме при любой попытке внести в него изменения. Достаточно удалить пустую страницу или добавить букмарки — и файл весом 4 мб начинает весить 25 мб. Пытался обложку добавить, которая весит 190 кб — файл тут же до 25 мб увеличился. Подскажите, как можно в XChange это исправить

PDF-XChange Editor (Pro)
Organize -> Extract Pages -> Pages - All, Subset - All, Type - Save all extracted pages to one file -> OK
 
Вот что получилось
Удалили 4 пустых страницы, добавил содержание в букмарки. Размер файла - 3,7 МБ.
Содержание в букмарках не исправлял - оно кривое.
 
P.S. Причину столь странного поведения исходного файла не знаю.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 17:01 04-02-2024 | Исправлено: jourmager, 17:04 04-02-2024
JAPWork

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amosopher
Сразу после обложки удалил 60 страниц. Размер стал 3585433 байт. Adobe Acrobat Pro, 2023.006.20380 64-разрядная

Всего записей: 470 | Зарегистр. 12-02-2003 | Отправлено: 17:06 04-02-2024
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amosopher
В PDFTK Builder никаких таких "проблем" не наблюдается.
 

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 18:50 04-02-2024
amosopher

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
PDF-XChange Editor (Pro)
Organize -> Extract Pages -> Pages - All, Subset - All, Type - Save all extracted pages to one file -> OK
 
Вот что получилось
Удалили 4 пустых страницы, добавил содержание в букмарки. Размер файла - 3,7 МБ.
Содержание в букмарках не исправлял - оно кривое.
 
P.S. Причину столь странного поведения исходного файла не знаю

 
Вы очень непривычным для меня способом редактировали pdf в XChange. Как я понял, вы извлекли все страницы из файла, а затем снова объединили их в один файл. Видимо потом вы уже и вносили изменения в новый файл. Я же просто открываю исходный файл и прямо в нём делаю правки — удаляю пустые страницы, добавляю обложку. После этого размер файла сразу увеличивается. А букмарк-оглавление я вообще через другую программу делаю — Pdf&Djvu bookmarker. Но это также приводит к мгновенному разбуханию файла. Вот пример этого pdf увеличенного объёма.
 
У меня стоит PDF-XChange Editor Plus v10.2.1.385. Репак кролика

Всего записей: 137 | Зарегистр. 29-01-2010 | Отправлено: 20:27 04-02-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amosopher

Цитата:
Вы очень непривычным для меня способом редактировали pdf в XChange.

Я не редактировал pdf. Я искал решение проблемы - некорректная обработка программой PDF-XChange Editor дефективного pdf-файла. Этот pdf-файл ИМХО является дефективным потому, что содержит, согласно Audit Usage, более десяти тысяч элементов в структуре Structure Info. А его обработка в PDF-XChange Editor является некорректной потому, что удаляется Fast Web View, и удаляется, ИМХО, некорректно, т.к. PDF-XChange Editor вообще не умеет создавать Fast Web View. Вероятно в процессе изменения архитектуры pdf-файла с Fast Web View в без оного и происходит распухание объема. Именно элементы Structure Info добавляют в объеме 20 МБ. Извлечение страниц, а потом их сборка - просто удаляет элементы Structure Info вообще.
При обычной работе, я также, как и вы - "просто открываю исходный файл и прямо в нём делаю правки — удаляю пустые страницы, добавляю обложку."

Цитата:
Как я понял, вы извлекли все страницы из файла, а затем снова объединили их в один файл.

Нет. Я же написал Save all extracted pages to one file - т.е. все страницы извлекаются и объединяются сразу автоматически. А так, как вы написали, надо было сначала Organize -> Extract Pages -> Save each page to separate file, а потом Convert -> From Files -> Combine Files into a Single PDF

Цитата:
А букмарк-оглавление я вообще через другую программу делаю — Pdf&Djvu bookmarker.

Хозяин - барин. Но у PDF-XChange Editor достаточно мощная и простая ИМХО система создания оглавлений в букмарках - как сразу из Оглавления в тексте, так и из отдельного txt-файла, с последующим визуальным редактированием.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 21:17 04-02-2024 | Исправлено: jourmager, 21:38 04-02-2024
amosopher

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
Я понял, что вы сделали. Организация — извлечь страницы — извлечь все страницы в новый документ. Это действительно решает проблему с последующим редактированием документа, так что спасибо за подсказку!  
 
Добавлено:
Ещё один вопрос возник. Имеется pdf-файл, в котором на каждой странице скрытым слоем внедрён текст ТюмГУ. Если развернуть содержимое страницы в XChange, то этот невидимый текст становится заметен. Его легко можно удалить со страницы. Вопрос — можно ли (в том же XChange например) удалить этот паразитный невидимый элемент сразу со всех страниц разом? В книге 726 страниц и делать это вручную постранично будет очень трудозатратно. Если можно, то как именно это делается?

Всего записей: 137 | Зарегистр. 29-01-2010 | Отправлено: 22:31 04-02-2024 | Исправлено: amosopher, 22:41 04-02-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru