Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов.


Решение типичных задач по редактированию PDF

Обрезать страницы - A-PDF Crop, Acrobat + Imposal
Разрезать страницы на части - A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat + Quite Imposing Plus/Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - A-PDF Page Master, Neevia PDFtoolbox, Acrobat + Map Soft Plug-in Suite
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat + Evermap AutoPagex
Исправить наклон страниц - A-PDF Deskew, A-PDF Scan Optimizer или Acrobat + Evermap AutoPagex/ISI Toolbox
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat + Quite A Box Of Tricks/ISI Toolbox
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat + Preflight, CallasPDF Toolbox
Удалить или заменить часть текста или текстовые ватермарки - Acrobat, A-PDF Text Replace, Infix
Удаление любых ватермарков - We PDF Watermark Remover (da best!)
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat
Тема по плагинам для Acrobat
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: sergio147, 12:09 17-05-2019
fbm

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55

Цитата:
От ABBYY тоже не справляется, поэтому не имеет смысла тратить время и силы. Ошибки в невероятном количестве все равно будут, поэтому достоверность индексации весьма условная вещь.

Конечно условная. Но мой опыт говорит о том, что указанный вариант все-таки дает лучшие результаты.

Цитата:
Ну да, до 2017 года Вам мало. Могу сделать до 2077 года, подойдет?  Если учесть, что ломал я его уже давно, и за это время никаких проблем ни у кого не было, то не стОит об этом беспокоиться. И последнюю версию 6.2 тоже приручил. Но с Акробатом XI работать не будет в любом случае.

Спасибо, но он у меня все равно и с 9-кой не работает почему-то. Но это уже не важно.

Цитата:
Пример такого файла в студию! Мне интересно как такое может быть.

Я неверно выразился: обычно качество непосредственно растра ухудшается достаточно, чтобы это стало как-то заметно, потому что программы при распознавании зачем-то выполняют еще обработку растра, что к положительному результату привести не может по определению. Наиболее заметно это ухудшение проявляется в появлении (или усилении) ареала точек вокруг букв. Иногда, если книжка полезная, даже с такой "мелочью" мириться очень не хочется. Так что "резкое ухудшение растра" имеет скорее субъективный характер.  
 
Распознавание так же может иметь результатом и заметное увеличение размера файла. Обычно с этим тоже можно мириться. А иногда нет.  
 
http://libgen.org/get?open=0&md5=50D4F34CF60AA29D349C3902D7843256
 
Попробуйте прикрутить к нему OCR.

Всего записей: 157 | Зарегистр. 04-02-2006 | Отправлено: 03:00 27-09-2013 | Исправлено: fbm, 04:31 27-09-2013
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
fbm
Цитата:
он у меня все равно и с 9-кой не работает почему-то
Пора уже иметь в хозяйстве и другие версии, хотя бы в портабельном виде.
Цитата:
Но это уже не важно.  
Я без этого плагина вообще не могу работать с pdf, поскольку он может то, что недоступно в любых других программах.
Цитата:
Попробуйте прикрутить к нему OCR.
Сначала засунул файл в Акробат, а он говорит нечеловеческим голосом "Да ты, хозяин, совсем охренел, подсовывать мне такое говно, не буду обрабатывать, даже не проси!". И действительно, поглядел файл в PDF Explorer, а там помимо отвратной обработки сканов, еще и "оптимизация", проведенная кривыми ручонками школоты. Страницы порезаны на куски, туши свет, сливай воду, об извлечении даже речи нет. Очень хочется взять афтара этого файла за грудки, с наслаждением трясти, приговаривая "Рано тебе Акробатом пользоваться, не знаешь ни хрена, FreePic2PDF - предел для твоих умственных способностей!". Поэтому конвертить в растр, а потом обратно в pdf, других путей нет. Всю книгу делать не стал, только зря время тратить, вот десятая часть в djvu - http://rghost.ru/48998337
 
 

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 09:54 27-09-2013
fbm

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55

Цитата:
Пора уже иметь в хозяйстве и другие версии, хотя бы в портабельном виде.  

Я не профессионал. Пока мои потребности закрывает 9-ка.

Цитата:
Я без этого плагина вообще не могу работать с pdf, поскольку он может то, что недоступно в любых других программах.

Он мне в свое время понадобился для скрытия OCR слоя, который просвечивал через картинку. Как-то очень криво, но удалось обойтись.

Цитата:
Сначала засунул файл в Акробат, а он говорит нечеловеческим голосом "Да ты, хозяин, совсем охренел, подсовывать мне такое говно, не буду обрабатывать, даже не проси!". И действительно, поглядел файл в PDF Explorer, а там помимо отвратной обработки сканов, еще и "оптимизация", проведенная кривыми ручонками школоты. Страницы порезаны на куски, туши свет, сливай воду, об извлечении даже речи нет. Очень хочется взять афтара этого файла за грудки, с наслаждением трясти, приговаривая "Рано тебе Акробатом пользоваться, не знаешь ни хрена, FreePic2PDF - предел для твоих умственных способностей!". Поэтому конвертить в растр, а потом обратно в pdf, других путей нет. Всю книгу делать не стал, только зря время тратить, вот десятая часть в djvu - http://rghost.ru/48998337  

До самого интересного - "полутоновых" картинок,  вы не добрались. Подобрать пристойные параметры их кодирования в djvu с сохранением размера файла - у меня когда-то не получилось, а делать обработку в ручном режиме тоже как-то... Короче, мой вариант прикручивания OCR слоя дает попиксельно исходный файл и незначительное увеличение размера. А по трудоемкости он сравним с перекодированием в djvu.

Всего записей: 157 | Зарегистр. 04-02-2006 | Отправлено: 11:35 27-09-2013
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
fbm
Цитата:
До самого интересного - "полутоновых" картинок,  вы не добрались.
Просю - http://rghost.ru/49000022 Только картинки уже испорчены сжатием. Вы не находите, что самой злободневной задачей стало не изготовление хороших книг из сканов, а попытки изготовления хороших книг из говенных сканов? Одни портят, другие тратят время на исправление. Я уже не раз говорил в топике по электронным книгам - это путь в тупик.

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 12:58 27-09-2013
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Маленькая обработка и тот же файл стал почти в два раза меньше - http://rghost.ru/49005307 по сравнению с предыдущим постом. Исходные сканы все же сделаны неоптимально во всех отношениях, несмотря на 600 dpi.

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 18:05 27-09-2013
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
fbm

Цитата:
Если после перекрытия текст просвечивает через графику, значит она полупрозрачная и придется делать весь текст в pdf невидимым. Для чего его придется закрыть белым цветом:    4. Сохраняешь страницы исходного PDF в формате tiff...

Можно сделать белую векторную заливку в самом PDF подложив её под графику сканов:
Acrobat X (XI) > Инструменты > Старницы > Изменить дизайн страницы > Фон > Добавить фон
После добавить OCR текст от FineReader с помощью PDF-XChange Tools или Callas PDF Toolbox.
В этом случае текст  не будет просвечивать через маску изображения, т.к. между ними будет белая векторная заливка (к тому же она ничего не весит, если одинаковый размер страниц).

Всего записей: 2571 | Зарегистр. 31-05-2010 | Отправлено: 19:26 28-09-2013
QWewqcex

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Можно ли извлечь изображения из pdf файла?

Всего записей: 11 | Зарегистр. 25-09-2013 | Отправлено: 17:34 30-09-2013
sergio147



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
QWewqcex,
 
100500 раз обсуждалось, причём относительно недавно.
 
Просмотрите тему и уточните вопрос.


----------
Есть многое на свете, друг Гораций,
что неподвластно нашим мудрецам

Всего записей: 2390 | Зарегистр. 28-10-2006 | Отправлено: 17:43 30-09-2013
NOWENKII

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Посоветуйте программу для редактирования PDF документа. В нем нужно исправить данные в таблице. Добавить в таблицу строки с текстом или набрать текст в добавленных и существующих строках. Удалить текст, чтобы не оставалось пустое место вместо него.

Всего записей: 387 | Зарегистр. 13-02-2007 | Отправлено: 12:14 06-10-2013
Shangry

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NOWENKII
Последние версии MS Office требуемый объем работы не тянут?

Всего записей: 391 | Зарегистр. 27-10-2006 | Отправлено: 11:54 10-10-2013
NOWENKII

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Последние версии MS Office требуемый объем работы не тянут?  

 
Да тянут, ими и тяну. Хлопотно с большими документами. Приходится применять Nitro Pro, чтобы в Word или Excel перевести (открывать ими сразу часто не корректно получается), правлю, а потом обратно в PDF. Вот и надеялся, что что-то придумано более удобное.

Всего записей: 387 | Зарегистр. 13-02-2007 | Отправлено: 17:54 10-10-2013
sergio147



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Товарищи,
 
подскажите, что вот с такими монстрами можно делать, какие правильно настройки оптимизации выставить?
 
 
   
 
Формы Xobject 90% места занимают О_О

----------
Есть многое на свете, друг Гораций,
что неподвластно нашим мудрецам

Всего записей: 2390 | Зарегистр. 28-10-2006 | Отправлено: 17:00 28-10-2013
sergio147



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот ещё один уродец:
 
 
 
 
оптимизация Adobe Acrobat ничего не даёт
 
   
 
Тут основной объём - Потоки содержания. Видимо, векторные картинки, т.к. качество обалденное.
 
 
 
Добавлено:
---
 
помогите его уменьшить, пожалуйста, без большой потери качества

----------
Есть многое на свете, друг Гораций,
что неподвластно нашим мудрецам

Всего записей: 2390 | Зарегистр. 28-10-2006 | Отправлено: 02:26 30-10-2013
Chimanalyt

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Может понизить версию пдф?

Всего записей: 343 | Зарегистр. 23-06-2006 | Отправлено: 11:56 01-11-2013
distortion



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите сильную альтернативу Pdf Grabber
На входе - многостраничные документы с разнородными данными (тексты с большим кол-вом стилей, сложные многоуровневые таблицы, изображения с нестандартной геометрией канвы, ссылки, букмарки)
На выходе - MS Office'ные форматы
 
Добавлено:
А если сумеет еще и вскрывать protected pdf, то вообще здорово.

Всего записей: 3708 | Зарегистр. 07-04-2001 | Отправлено: 15:02 02-11-2013
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
distortion
 
Able2Doc Professional
AnyBizSoft PDF Converter (Wondershare PDF Converter Pro)
Nitro PDF Professional
 
Что касается исправления корявого текста при переводе pdf в *.doc(x) - Pdf Grabber'у нет равных.

Всего записей: 2571 | Зарегистр. 31-05-2010 | Отправлено: 16:26 02-11-2013 | Исправлено: ComboFZ, 16:35 02-11-2013
sergio147



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите,  
 
как сюда добавить OCR, не повредив качество нарисованного текста:
 
#
 


----------
Есть многое на свете, друг Гораций,
что неподвластно нашим мудрецам

Всего записей: 2390 | Зарегистр. 28-10-2006 | Отправлено: 13:12 07-11-2013 | Исправлено: sergio147, 13:12 07-11-2013
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sergio147
в документе когда-то перевели шрифты в кривые с удалением текстовых объектов
 
1. Распознаёте документ в FineReader, сохраняете в PDF
2. Извлекаете из него текстовый OCR-слой, правите при необходимости
3. Склеиваете OCR-слой с оригиналом с помощью PDF-Tools 4.0 или Callas PDF Toolbox
#
если перед склейкой с OCR-текстом удалить лишние объекты в оригинальном pdf находящиеся за пределами его видимой части, документ ещё немного "похудеет"
#
т.к. в оригинальном документе уже есть фоновая заливка, то OCR-слой ляжет под неё и не будет просвечивать
 
 
можно распознать документ с помощью Nuance PDF Converter Pro и потом оптимизировать в Акробате, результат будет тот же: оригинал + OCR

Всего записей: 2571 | Зарегистр. 31-05-2010 | Отправлено: 18:56 07-11-2013 | Исправлено: ComboFZ, 01:57 08-11-2013
bookserg

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
3. Склеиваете OCR-слой с оригиналом с помощью Callas PDF Toolbox

ComboFZ, если можно, саму процедуру склеивания можно по пунктам, подробнее...
 

Всего записей: 87 | Зарегистр. 27-04-2009 | Отправлено: 19:31 07-11-2013
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bookserg
1. Закидываем в Callas PDF Toolbox документ PDF в который хотим внедрить OCR-текст.  
2. Закидываем в Callas второй документ с извлеченным OCR-текстом от FineReader (окно активно)  
3. Переходим в  Switchboard > Arrange > Sandwich, жмем Execute > File > Save As...  
 
получаем PDF с внедренным OCR-текстом
 
сокращённо отсюда:
http://forum.ru-board.com/topic.cgi?forum=93&topic=3514&start=800#17

Всего записей: 2571 | Зарегистр. 31-05-2010 | Отправлено: 22:37 07-11-2013
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Имя:
Пароль:
Сообщение

Для вставки имени, кликните на нем.

Опции сообщенияДобавить свою подпись
Подписаться на получение ответов по e-mail
Добавить тему в личные закладки
Разрешить смайлики?
Запретить коды


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2018

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru