Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
у FineReader PDF 15 (не OCR Editor) глюк, который выражается в невозможности использовать более 2 потоков процессора при распознавании.  

Мда блин повезло мне. Хоть прям на Windows 10 уже переходи - никак руки не дойдут, а комп поддерживает спокойно да и все проги уже просят 10-ку постоянно. Надо собраться и решиться наконец. Начну записывать в блокнот, что нужно сохранить для переноса, чтобы не забыть.
 

Цитата:
Да. Наверное. Пробуйте.  

Ну да, после переноса - было 235 МБ, стало 236 МБ - почти так же и осталось.
 

Цитата:
поэтому лучше применять jpg

Ну значит так и буду поступать, тем более это даже лучше для просмотра будет.
 

Цитата:
обычно эктрактирую 1-10-100 страниц

Ну да можно чтобы проверить работу.
=============
=============
 
У меня вот есть другая книга, где уже написано на каждой странице "Глубина цвета: 8" - хотя там полно рисунков и цветного текста, как она может быть "серой" (раз Глубина цвета: 8?
Как её переводить в PDF - значит цветность оставить на JPG: Средняя - т.к. здесь это не главное что-ли? Но цветная же?
Вот пример 1 рисунка.

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3502 | Зарегистр. 22-12-2003 | Отправлено: 09:35 13-11-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dracula

Цитата:
У меня вот есть другая книга, где уже написано на каждой странице "Глубина цвета: 8" - хотя там полно рисунков и цветного текста, как она может быть "серой" (раз Глубина цвета: 8?

Почитайте
https://etc.usf.edu/techease/win/images/what-is-bit-depth/

Всего записей: 7336 | Зарегистр. 08-09-2001 | Отправлено: 09:47 13-11-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dracula say:

Цитата:
Как её переводить в PDF... Вот пример 1 рисунка.

Это палитра 256 цветов. Для такого sam2p предусмотрен:

Код:
 
sam2p -pdf:2 -m:dpi:-300 26_________.png 26_________.sam2p.pdf
 

 
PS: Можно также tiff2pdf использовать из libTIFF.

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 09:57 13-11-2023 | Исправлено: zvezdochiot, 10:01 13-11-2023
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot
ни первая ни вторая я не понял бинарные коды где прога сама - мне что попроще типа Adobe Acrobat Pro и там настройки колбасить. У меня итак время уходит на всё это - хочу не заморачиваться.

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3502 | Зарегистр. 22-12-2003 | Отправлено: 10:28 13-11-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dracula

Цитата:
написано на каждой странице "Глубина цвета: 8" - хотя там полно рисунков и цветного текста, как она может быть "серой

Что-то мне это напомнило: "Доктор, а где вы такие картинки берёте?"
А если по делу:
Искомое изображение - это png. Ищем wikipedia (eng) png. Внутри статьи находим Pixel format
Allowed combinations of colour type and bit depth. И видим, что 8-битными png могут быть или greyscale или indexed. Что такое grayscale - понятно. 8 бит - это 256 градаций серого цвета. но это не наше изображение. А что такое indexed? Ищем в Википедии "Цветное индексированное изображение" или в Wikipedia "Indexed color". Откуда узнаём, что (далее будет описание конкретно для 8-битного индексированного RGB):
Цветное индексированное изображение - это изображение, где цвет пикселя записан не прямо тремя байтами RGB, а цвет пикселя имеет свой номер (индекс) от 0 до 255, а само изображение внутри имеет таблицу, где каждому индексу есть соответствие уже тремя байтами RGB.
Типичный представитель 8-битного индексированного изображения - это GIF.
 

Цитата:
Как её переводить в PDF

Это зависит от того, какой программой вы делаете pdf из изображений.
Сам pdf понимает индексированные изображения, поэтому обычно при импорте сохраняется индексирование и глубина цвета 8 бит.
Т.е. можно:
1) импортировать индексированные изображения в pdf и всё оставить как есть
2) перед импортом конвертировать изображения в jpg (например) и уже потом jpg импортировать в pdf
3) после импорта в редакторе pdf конвертировать индексные изображения в jpg
4) найти программу, которая "на лету" будет делать pdf с jpg-ами из индексированного изображения
А зачем вообще переводить изображения в pdf из индексированных в jpg? При использовании качества medium для jpg будет существенно уменьшен размер, но появятся типичные для jpg артефакты сжатия.
Пункты 1 и 3 умеет PDF-XChange Editor.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 10:38 13-11-2023 | Исправлено: jourmager, 11:05 13-11-2023
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
"Доктор, а где вы такие картинки берёте?"

Как я и писал выше, на сайте book(dot)ru - но сейчас почему-то не пускает меня на данный сайт вообще.  
Я скачивал с помощью Bulk Image Downloader - там можно поставить delay (задержка) на 5 и больше секунд - я писал разными способами "регулярные выражения" - но он 100 страниц за минуты 2-3 скачивает - хоть что пиши, но задержки нет. Скорее всего из-за этого и заблочили меня даже на вход на данный сайт. Хотя я и IP менял и VPN включал - не входит и всё теперь.
Update: сейчас зашёл. Кто бы подсказал как в Bulk Image Downloader настроить Delay правильно, чтобы реально задержка была между каждой страницей скачивания - только 5000 секунд поставил и тогда секунд 15 ждало перед первым разом и потмо как обычно быстро скачало остальные.
 

Цитата:
И видим, что 8-битными png могут быть или greyscale или indexed

Понятно теперь. Так и буду действовать дальше - исходя из этого уже.
 

Цитата:
А зачем вообще переводить изображения в pdf из индексированных в jpg? При использовании качества medium для jpg будет существенно уменьшен размер, но появятся типичные для jpg артефакты сжатия.
Пункты 1 и 3 умеет PDF-XChange Editor.

Я так и поступил, первый пункт проделал и всё.
Делал так - File > New Documents > New Images > Add files - выбираю все рисунки и добавляю > OK > File > Save as > PDF. Так и не нашёл настройки PDF где узнать, в Adobe Acrobat Pro там можно настроить сохранение в PDF как я хочу.  
Был размер 25,7 МБ - стало 25,8 МБ (это я только 100 страниц попробовал - а в книге 727 страниц - 183 МБ).

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3502 | Зарегистр. 22-12-2003 | Отправлено: 12:58 13-11-2023 | Исправлено: Dracula, 13:01 13-11-2023
esys

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
и IP менял и VPN включал

Цифровой отпечаток надо менять еще.

Всего записей: 340 | Зарегистр. 22-06-2016 | Отправлено: 14:17 14-11-2023
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys

Цитата:
Цифровой отпечаток надо менять еще.

Это как - объясни не понял?

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3502 | Зарегистр. 22-12-2003 | Отправлено: 16:17 14-11-2023
esys

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Гуглите "Цифровой отпечаток след".

Всего записей: 340 | Зарегистр. 22-06-2016 | Отправлено: 16:58 14-11-2023
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
К примеру вот 1 страница (выдрал из PDF книги английской) - там я так понял издательская книга уже созданная сразу PDF используется?
Что меня заинтересовало - скачайте и увидите сами, при нажатии на рисунок - он выделяется в рисунок и можно ПКМ сразу скопировать его, а в нашем случае, если использовать просто для распознавания ABBYY FineReader PDF 15 - там распознавание происходит без возможности работы с распознанным текстом, т.е. как распознал так его и сохраняем.
 
В ABBYY FineReader 15 OCR-редакторе можно распознаный текст редактировать и главное рисунки (если не до конца выделились как рисунок) отредактировать.
 
Но, т.к. мы не сохраняем из ABBYY FineReader 15 OCR-редакторе распознанный PDF тут же (т.к. там мои PNG в отличном качестве переконвертируются в JPEG2000.
 
Следовательно (как и с JPEG) мы используем для сохранения OCR слоя другую программу, в данном случае PDF-XChange Editor (скопировать с OCR PDF в оригинальный PDF OCR слой).
 
НО, я хочу, чтобы и рисунки тоже на оригинальном PDF тоже выделялись, как на английской книге, я пример выложу ниже. Если в PDF-XChange Editor копировать только Text слой - то соответственно только текст и скопируется, а чтобы и рисунки выделялись в оригинальном PDF, как и на английской странице (как пример), то и копировать уже в PDF-XChange Editor нужно не как Text а как "All" - а это уже выходит двойной размер, наложение одной на другую картинку (типа было 241 МБ станет около 500 МБ).
 
Как с этим быть, чтобы и картинки выделялись и чтобы размер не увеличивался при этом?
Ведь в ScanKromsator для создания DJVU книг картинки обрабатываются отдельно и уже потом вставляются (объединяются) в сам готовый DJVU. Типа такого с PDF можно проворачивать и как долго это будет по времени происходить дополнительно от распознавания?
 
И вообще америкосы в своих книгах для распознавания точно не используют нашу русскую ABBYY FineReader а что тогда?
 
Сам файл вот он .

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3502 | Зарегистр. 22-12-2003 | Отправлено: 17:14 14-11-2023
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот Вы мне объясните - вот имеется уже готовая книга (сделанная кем-то). Там внутри и текст распознан и ВЫДЕЛЯЕТСЯ КАЖДЫЙ РИСУНОК. И размер меньше 4 МБ всего и качество текста и рисунков на высоте.
Medvedev (book) + 237 page
 
Как такое возможно? Я вот выложил 1 страницу от издательства (237 страница) - она занимает при увеличении 500% 1 МБ (при 100% текст при увеличении становится нечётким до ужаса).
 
Как думаете где книга была распознана? В ABBYY FineReader или в другом приложении? Поясните по поводу этих рисунков - как они их выделяют? Я в диком шоке.  
 
Давайте разбираться вместе - я думаю если бы я перевёл все мои рисунки (если бы сохранял) в PDF - вышло где-то бы 100 МБ не меньше. И это без выделения рисунков.
 
А то я щас атлас по хирургии с онкологией сохранил и там при увеличении в 500% у меня 900 страниц вышло около 4 ГБ - если сохранить даже в JPEG (высшее качество) выйдет не менее 1,300 МБ - как такое вообще показывать - скажут идиот куда такой размер нам пихаешь? А меньше качество картинок ухудшится, это же атлас - там нужно чёткие рисунки же.
 
Кто разбирается - распознайте 237 страницу и выделите рисунок отдельно, чтобы в PDF он при нажатии (как в книге английской, чт оя показал вчера 1 страницу и в новой Медведева) выделялся сразу же сам, а не приходилось вручную выделять его обводя.
 
Я знаю, что в ABBYY FineReader при распознавании в ABBYY FineReader 15 OCR-редакторе он выделяет рисунки - но если переносить в PDF-XChange Editor не только текстовый слой, но и рисунки (то есть выбираю не Text а All) - то размер файла увеличивается в 2 раза и накладывается друг на друга - и становится как бы грязно даже ещё).
 
Какой другой способ есть или как правильно из ABBYY Finereader (двух версий) взять эти рисунки, точнее, чтобы в оригинальном PDF так же обводились АВТОМАТИЧЕСКИ при нажатии на любой рисунок.
 
Вот что я выяснил сейчас:
Распознал в ABBYY FineReader 15 OCR-редакторе - картинка выделилась я при сохранении в PDF выбрал такие параметры:
На рисунке нажимал и выбирал как "Barcode", "Recognition Area", "Background Picture" и дальше сохранял как "Text and Pictures only" или "Текст под изображением" и в PDF-XChange Editor объединял с одного PDF в другой и выбирал как "All", чтобы и текст и картинку захватить или хотя бы обрамление картинки и все разы (8 раз соответственно) у меня или картинка не выделялась в конечном PDF или текст накладывался по второму разу (даже сбоку как-то) и если даже картинка выделялась когда в ABBYY FineReader выбирал как "Картинка" - то размер становился в 2 раза больше.
 
Короче у меня не получилось. Интересно в PDF это работает или только в DJVU можно картинку выделять? Я два примера привёл вверху - это что в издательстве сделаны эти 2 книги были что-ли? Изначально текст распознана отдельно и картинки обработаны отдельно? Нам самим этого не добиться вручную?

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3502 | Зарегистр. 22-12-2003 | Отправлено: 03:26 16-11-2023 | Исправлено: Dracula, 06:01 16-11-2023
73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dracula
Ты решил сразу в двух местах - http://forum.ru-board.com/topic.cgi?forum=93&topic=3514&start=4860#lt вынимать мозги людям? Неужели за десять лет (10, Карл!) ты так ничего и не понял? И так же уперт в те же проблемы - http://forum.ru-board.com/topic.cgi?forum=93&topic=3514&start=820#9 Сделай милость, начни изучение PDF/сканирование/обработка от печки - растр, вектор и далее без остановок. Там глядишь придет понимание, что часто электронные книги создают без участия сканера и FR, поэтому нет смысла ломиться в открытую дверь и портить думатель себе (это ладно!) и другим людям (а это нехорошо!). Надеюсь, в указанном топике тебе в очередной раз объяснят в чем отличие PDF из сканера, хоть бы и пропущенного через FR и созданного в одной из издательских программ, а потом упакованного в PDF контейнер. А то ты утомил уже своей простотой и полным отсутствием знаний об электронных книгах и категорическим нежеланием читать материалы в шапках. Появляется нездоровое желание забить осиновый кол в сердце, как самому крутому вампиру, чтобы раз и навсегда заглушить этот фонтан

Всего записей: 1151 | Зарегистр. 18-08-2012 | Отправлено: 04:39 16-11-2023
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
73

Цитата:
Появляется нездоровое желание забить осиновый кол в сердце, как самому крутому вампиру, чтобы раз и навсегда заглушить этот фонтан  

Осинорубоколец, если так тебя это смущает, но ты упорно читаешь, стискивая зубы, лучше бы один раз объяснил мне, раз получил степень доктора в данной области - я бы запомнил и применял. Но нет, тебе легче читать и усмехаться.
Я то хоть стараюсь, хочу узнать, а когда такие только язвят, то и приходится наступать на грабли и тыкаться как кутёнку - чтож - раз так - буду и впредь писать, что сам найду и комментировать это.
 
В одном месте я спрашиваю как обрабатывать обложки, здесь как работать с PDF, в третьем про издательства - так что везде успеваю.
 
А ты не думал, родной, что я эти 15 лет с 2008 года не сканировал и не обрабатывал книги и вообще не выяснял ничего про это за это время. А раньше я сканировал и обрабатывал в DJVU - не в PDF - а сейчас я спрашиваю именно про PDF - чувствуешь разницу?

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3502 | Зарегистр. 22-12-2003 | Отправлено: 05:51 16-11-2023 | Исправлено: Dracula, 06:06 16-11-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Dracula
Я то хоть стараюсь, хочу узнать

напишите мне в личку, я постараюсь всё объяснить.

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 06:08 16-11-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dracula
1)
Цитата:
Вот Вы мне объясните

Я из вашего png Медведева стр 237 сделал pdf.
Вы такой результат хотите получить?
 
2)
Цитата:
вот имеется уже готовая книга (сделанная кем-то). Там внутри и текст распознан и ВЫДЕЛЯЕТСЯ КАЖДЫЙ РИСУНОК. И размер меньше 4 МБ всего и качество текста и рисунков на высоте.

В общих чертах, это true pdf, предназначенный для распространения (продажи) по интернету.
Он никем не был распознан, он такой получился в издательстве.
Качество текста "на высоте" потому, что векторные шрифты.
Качество рисунков "на высоте"? Нет. Оно отвратительное. Это чрезмерное сжатие до 100 dpi (примерно с 300 - 360) с качеством medium.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 14:51 16-11-2023
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Я из вашего png Медведева стр 237 сделал pdf.
Вы такой результат хотите получить?  

Это что-то изумительное, не передать словами - качество текста отличное, распознанно и главное рисукно выделяется, да и ещё 125 кб вышло всего (я думал без выделения рисунка у меня вышло бы около 400 кб думаю бы).
 
Я глянул в настройках к рисунку черепа - там "Метод компрессии: JPEG/ZIP. Качество JPEG: Низкое". Я знаю, что ZIP это типа оставить как есть не пережимая, а JPEG/ZIP это видимо близко к лучшему. Но качество низкое - может можно выбрать получше, типа среднее, высокое? Я для будущих обработок, чтобы знать как действовать. Т.к. очень важны рисунки в медицине, чтобы были чёткими, т.к. специалисты должны видеть, что на рисунке передаётся и как это интерпретировать.
 

Цитата:
В общих чертах, это true pdf, предназначенный для распространения (продажи) по интернету.
Он никем не был распознан, он такой получился в издательстве.  

А понятно тогда теперь.
 

Цитата:
Качество текста "на высоте" потому, что векторные шрифты.  

А я могу так же эти векторные шрифты сделать на своих PNG рисунках, например на странице 237 мой пример - Вот Вы применили векторные шрифты на рисунке или нет? И вообще как их делать? Векторные шрифты что увеличивают чёткость шрифты, да и ещё и уменьшают размер выходного PDF?
 

Цитата:
Качество рисунков "на высоте"? Нет. Оно отвратительное. Это чрезмерное сжатие до 100 dpi (примерно с 300 - 360) с качеством medium.

Ага - ради уменьшения размера они пошли на такие жертвы - лучше пусть будет больше размер, чем так издеваться над рисунками.  
============
============
 
Так как же Вы всё-таки смогли сделать так, что рисунок выделяется теперь? Это нужно на каждой странице мне персонально выделять (обрамлять) будет каждый рисунок или автоматически это можно применить будет ко всей книге? Это меня волнует прям до жути. А то я скачиваю книги в PNG - но не перевожу в PDF - всё жду когда мне расскажут про обрамление рисунков.
 
P.S. Вы все здесь огромные специалисты, за столько лет научились - если бы сидел здесь с Вами все эти годы - так же знал бы много - так что не обессудьте и не серчайте - я сам понимаю, когда новичок приходит и начинает что-то писать, а для специалиста это уже давно знакомо и начинает даже раздражать от такой "тупости". Это как мы знаем комп и пытаемся объяснить старшему поколению как и что включить и т.д. и не хватает терпения и начинаем выходить из себя, типа как можно этого не знать )))

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3502 | Зарегистр. 22-12-2003 | Отправлено: 16:07 16-11-2023 | Исправлено: Dracula, 16:22 16-11-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dracula

Цитата:
Я глянул в настройках к рисунку черепа - там "Метод компрессии: JPEG/ZIP. Качество JPEG: Низкое".

Это вы про какой файл пишете и в какой программе такое видели?

Цитата:
 Я знаю, что ZIP это типа оставить как есть не пережимая, а JPEG/ZIP это видимо близко к лучшему.

Нет. Это несжимаемый jpg сжимают в zip. Таким образом можно дополнительно выиграть 1-10%.

Цитата:
Так как же Вы всё-таки смогли сделать так, что рисунок выделяется теперь?

Основную работу сделал FineReader PDF OCR Editor 16 в режиме Text and pictures only.
Задача была сильно облегчена наличием "оригинального" true pdf.
И всё равно остались трудноустраняемые косяки.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 18:22 16-11-2023 | Исправлено: jourmager, 18:23 16-11-2023
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Это вы про какой файл пишете и в какой программе такое видели?  

Ваш же файл 237 страница, что Вы сделали - а смотрел я как в шапке рекомендовали так:
PDF-XChange Editor 7.0 / 8.0,  
или активировать инструмент Главная > Редактировать > Изображения
кликнуть правой клавишей мышки по картинке и из выпадающего меню выбрать: Перекодировать изображения > Детали изображения
 

Цитата:
Нет. Это несжимаемый jpg сжимают в zip. Таким образом можно дополнительно выиграть 1-10%.

Интересно - значит в качестве не теряется, но размер может уменьшить. Хорошо тогда.
 

Цитата:
Основную работу сделал FineReader PDF OCR Editor 16 в режиме Text and pictures only.

О - у меня на Windows 7 не встаёт 16 версия - наверное нужно поставить на виртуалку 16 версию и там прогонять мои файлы значит. Потому что я делал тоже в 15 версии Text and picture only и у меня ничего не вышло.
 
Так как Вы делали - распознали, картинка выделилась и дальше сохранили как "Text and pictuire only" и в PDF-XChange Editor соединили 2 слоя - выбрав "All" - не "Text" же только, иначе как картинка стала выделяться в PDF - тогда почему не наложилась 1 картинка на другую и размер не увеличился в 2 раза?
 

Цитата:
Задача была сильно облегчена наличием "оригинального" true pdf.  

Простите, Вы что работали не с 237 страницей отдельно только, которая в архиве стояла отдельно? Вы взяли и из самой издательской книги 237 страницу каким-то образом?  
 
Но, у меня же не будет в других книгах таких книг - у меня же только PNG изображения. Поэтому мне нужно чтобы с PNG получать в PDF выделение картинки.

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3502 | Зарегистр. 22-12-2003 | Отправлено: 19:01 16-11-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dracula

Цитата:
Ваш же файл 237 страница, что Вы сделали - а смотрел я как в шапке рекомендовали так:
PDF-XChange Editor 7.0 / 8.0

Понятно. Для прояснения ситуации желательно, чтобы вы показали скриншот, откуда вы взяли "Метод компрессии: JPEG/ZIP. Качество JPEG: Низкое".

Цитата:
Вы взяли и из самой издательской книги 237 страницу каким-то образом?

Вы когда-нибудь работали в редакторе текстов типа Microsoft Word? Если работали, то выбирали там тип и размер шрифта?
 
Для того, чтобы текст в моём самодельном "true pdf" был похож на оригинальный, мне надо было узнать тип и размер шрифта в оригинале. Проще всего это сделать если иметь оригинал.  
Из оригинала узнаём, что основной текст на странице сделан на шрифте PetersburgC Type 1 размер 10.5. Плюс ещё шрифт верхнего колонтитула, шрифт подписи к иллюстрации (я на него забил, использовал, что FineReader предложил), шрифт номера страницы.  
Вот для чего был нужен оригинальный pdf.
Хотя можно использовать и то, что подставляет FineReader по своему разумению.
Шрифт я скачал из интернет, но не Type 1, а OTF.
Теоретически можно было шрифт Type 1 вытащить из оригинального pdf, но я у же забыл программы, которые так могут, а искать действительно работающее решение не было времени.
 
Может кто-то знает, чем вытаскивать шрифты из pdf, особенно Type 1?
 
Если бы не было оригинального pdf с шрифтами, то пришлось бы спрашивать у спецов в соответствующей теме или искать похожий true pdf похожего издательства. А размер подбирать на глазок.
 
При всём этом видно, что форматирование текста, расположение слов в строке, размер шрифта, пробелы между словами - отличаются в моём pdf и оригинальном - это первый косяк.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 20:24 16-11-2023
popov_al



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
можно спросить ?
 
я правильно  понимаю, что весь этот флейм был разведен только по одной причите - что "товарищ" не умеет пользоваться поиском в и-нете, в результате скачал эту книгу в виде картинок и просит "общественность" научать его сделать из картинок красивый .PDF ?
 
ведь речь идет именно об этой книге ? скачал с либгена, вот копия
 
оригинальный (true) pdf

Всего записей: 479 | Зарегистр. 22-05-2008 | Отправлено: 20:33 16-11-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru