Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов (часть 1)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Заменить/удалить текст (batch есть), в т.ч. кириллицу (не панацея!) - PDF Replacer
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: Maz, 07:24 22-12-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:
Цитата:
Смотреть для начала jpeg-recompress

"Слегка" неверно. Смотреть для начала stb-image-metrics из той же git-организации ORG.IPEP. В отличии от jpeg-recompress, stb-image-metrics не повязан ни на какой графической библиотеке, типа libjpeg, или libwebp, и производит именно метрики для пар графических файлов одинакового размера.

Всего записей: 796 | Зарегистр. 18-05-2023 | Отправлено: 01:50 21-02-2025 | Исправлено: zvezdochiot, 01:51 21-02-2025
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Почему SVG после перевода в PDF тяжелые, хотя это вроде бы вектор?

В данном конкретном случае во всех файлах svg 32442 символа/глифа (строк начинающихся с <path d=..). Из них уникальных 824, что составляет порядка 2.5%.  В pdf эти символы попадают в виде кривых, а не шрифтов, отсюда большой размер. Это еще хорошо, что в пределах страницы в svg есть словарь символов..
Интересно, какой программой эти svg генерировались..

Всего записей: 992 | Зарегистр. 14-12-2005 | Отправлено: 09:33 21-02-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
Смотреть для начала stb-image-metrics

она есть скомпилированная под винду/дос?

Всего записей: 3427 | Зарегистр. 15-07-2010 | Отправлено: 06:41 22-02-2025
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
В релизах вроде есть: https://github.com/ImageProcessing-ElectronicPublications/stb-image-metrics/releases/download/0.4.0/stbimmetrics-0.4.0-win32.zip
Еще по сравнения картинок и метрики: https://imagemagick.org/script/compare.php
https://usage.imagemagick.org/compare/#statistics

Всего записей: 992 | Зарегистр. 14-12-2005 | Отправлено: 07:53 22-02-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Привет всем.
 
Добавлю ещё один инструмент визуального сравнения PDF для естественного интеллекта: diff-pdf

Всего записей: 796 | Зарегистр. 18-05-2023 | Отправлено: 17:16 22-02-2025
sharlatanat



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
slava_kry

Цитата:
В таком ключе нужно понять каковы оригиналы.

Оригинал, собранный PDF-XChange Viewer — https://fex.net/ru/s/sspenfk
Сжатый PDF Reducer — https://fex.net/ru/s/vkp8bal

Цитата:
Дайте, пожалуйста, страниц по 10 или сканов или PDF'ок условно "хорошего" и условно "плохого" качества и на какой размер вы рассчитываете.

Страницы по отдельности — https://fex.net/ru/s/lyfe1v2
 

Цитата:
Конечно, мы подразумеваем, что предварительная обработка оригиналов не предусмотрена - сжимаем "как есть"... так?

Да, так и есть.

Цитата:
Может просто уменьшить сжатие?!

Не вариант, надо книги на 600-800 страниц (да, попадаются и такие!) умещать в размер до 120 мегабайт.
 
TelecomUral

Цитата:
ни одна программа не сумеет определить приемлемое именно вам максимальное качество сжатия. Не бывает таких настроек в софте: "сделай мне хорошо".

Спорное утверждение:
 

 

Цитата:
При разносортном содержимом (разные параметры сканирования, сжатия, распознавания и т.д.) жать скопом все под одни настройки - значит гарантированно угробить определенную часть информации.

В данном случае задача оставить читаемым текст и схематические рисунки, обычно получается.

Цитата:
А разбираться индивидуально с каждым источником - задача муторная и совершенно безблагодатная, особенно, в наш век быстрых носителей информации огромного обьема.

Не все онлайн-библиотеки принимают файлы неограниченных размеров.
 
jourmager

Цитата:
По моему опыту такое бывает в 2 случаях: когда этих страниц несколько тысяч или когда исходные страницы (например в tiff, png) внутри pdf преобразуются в беспотерьную картинку типа zip. Какой случай у вас?

Спасибо за совет, теперь страницы в jpg делаю, а не png.
 
All
 
Придумал вот что, теперь перевожу страницы в 2-битные png, трамбую на максимум PNGOut, и формируются вполне компактные документы, которые потом можно вообще не ужимать.

----------
©

Всего записей: 1292 | Зарегистр. 24-02-2006 | Отправлено: 15:03 23-02-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп

Всего записей: 3427 | Зарегистр. 15-07-2010 | Отправлено: 15:39 23-02-2025
MBK2

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Спасибо за совет, теперь страницы в jpg делаю, а не png

Совет странный, png, в отличие от jpg - сжатие без потерь, а значит не шакалит текст при пережатии. Вдобавок, жать монохромный техт жпегом - весьма спорная выгода, в конце прошлого века специально для оптимального жатия монохромных текстовых сканов разработали алгоритм CCITT - жмет гораздр лучше жпега, а главное - без потерь.

Всего записей: 5172 | Зарегистр. 18-09-2018 | Отправлено: 17:52 23-02-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MBK2 say:
Цитата:
ля оптимального жатия монохромных текстовых сканов разработали алгоритм CCITT

Ежели точнее, то CCITT FAX Group 4.
Так то да. Очень шустро. Но есть слабые места. Доработали бы до CCITT FAX Group 5: чтобы дельта-кодирование не только по предыдущей строке, а по одной из N предыдущих строк, и был бы кодер на все времена. Такой же шустрый декодер, как CCITT FAX Group 4, но гораздо более всеядный кодер.
Но "на нет и суда нет". Поэтому пользуем jbig2enc.
 

Всего записей: 796 | Зарегистр. 18-05-2023 | Отправлено: 18:18 23-02-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sharlatanat

Цитата:
Спасибо за совет, теперь страницы в jpg делаю, а не png.

Не понял. Что значит "делаю"?
Сканировать в jpg крайне нежелательно. Особенно с источников плохого качества.
Потому что возможна потеря информации при возможной последующей обработке типа разрезка разворотов, исправление угла наклона, выпрямление строк, обрезка полей, бинаризация, OCR.
Сканировать желательно в форматы без потерь типа tiff или png.
А вот на последнем этапе возможно сжатие в jpg с качеством не менее 65% (medium) и не менее 300 dpi.

Цитата:
При сборке PDF-XChange этих страниц в один документ получается огромный размер, до нескольких гигабайт.

Как я и говорил, внутри вашего файла (размером 2 ГБ) каждая страница - это изображение в формате ZIP размером в среднем по 10-12 МБ каждое.
Сжатие их в jpg medium 300 dpi даст, допустим, 600 кб на страницу. При ограничении в 120 МБ на файл это не вариант.

Цитата:
При сжатии Orpalis PDF Reducer (особенно при включении опции MRC)

Ваш файл с MRC имеет размер 96 МБ. Я сделал MRC размером 36 МБ.  
С помощью Orpalis PDF Reducer я сжимал отдельные jpg в отдельные pdf.
Опции: General - снять галку Only process PDF files, Compression вкл MRC, background 100 dpi, Images - medium, выкл JPEG2000 (у вас эта опция включена, поэтому тормоза при просмотре), 300 dpi. остальное вроде бы по вкусу.  
Потом сборка отдельных pdf в один с помощью PDF-XChange Editor.
Наверное, это самый быстрый способ.

Цитата:
особенно при включении опции MRC) иногда на некоторых страницах появляются не читаемые места, как будто смазанные

MRC - это автоматическое разделение текста и картинок. Алгоритмы этой автоматики кривоватые, из-за этого могут появляться искажения как текста, так и картинок.

Цитата:
Придумал вот что, теперь перевожу страницы в 2-битные png, трамбую на максимум PNGOut, и формируются вполне компактные документы, которые потом можно вообще не ужимать.

Такое работает только на идеально черно-белых сканах. На цветных (книга черно-белая, а скан - цветной) типа того, что вы предоставили, результат при простом уменьшении битности изображения будет непредсказуемый.
 
Лучше обработать файлы в программах типа ScanTailor или ScanCromsator и на выходе получить более-менее нормальное 1-битные бинаризированные изображения, которые потом собрать в PDF-XChange Editor и там сжать в CCCIT G4/ZIP - на выходе будет 26 МБ (текст 600 dpi).
Можно и в JBIG2, но что-то он лично мне не очень нравится - тормоза, если малое сжатие (малый словарь) то малый выигрыш по объему, если сильное сжатие, то возможны искажения текста. Смысл экономить 5-10 МБ?
Затраты по времени конечно же выше, чем при MRC-сжатии.

Цитата:
Задача — читаемые текст...при как можно меньшем размере файла

Наилучшее качество текста, естественно, будет при OCR с заменой текста на векторные шрифты. Размер файла также минимальный - 2,5 МБ. Но, естественно, надо делать вычитку текста на ошибки. Поэтому затраты по времени равны скорости чтения 2 книг. Зато можно книгу прочитать, а не просто сделать.
Вообще-то говоря, вычитка должна быть и при простом OCR (текст под изображением), но это обычно никто не делает - сканировщики и обработчики, а не читатели.
 
P.S. Update.
Сделать OCR можно ещё в Adobe Acrobat Pro с использованием технологии проприетарной ClearScan, когда буквы заменяются на векторные кривые в виде какого-то стандартного шрифта. Ну, такое себе.

Всего записей: 912 | Зарегистр. 04-11-2019 | Отправлено: 21:16 23-02-2025 | Исправлено: jourmager, 00:19 24-02-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:
Цитата:
вычитка должна быть и при простом OCR (текст под изображением), но это обычно никто не делает

А инструмент то нормальный есть, чтобы такое делать? Чтобы простой и понятный, а не кот в мешке. Сколько не искал, ни разу такого не нашёл. И главное, чтобы позволял кодирование - отдельно, OCR - отдельно.
 

Всего записей: 796 | Зарегистр. 18-05-2023 | Отправлено: 21:37 23-02-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
А инструмент то нормальный есть, чтобы такое делать?

Что значит в вашем понимании "нормальный"?
Вот скриншот FineReader-а в режиме распознавания и проверки орфографии

Слева окно с оригиналом, справа окно с распознанным текстом, внизу увеличенный оригинал, плюс окно собственно проверки с подсказками.  
Могу ещё скриншот PDF-XChange Editor-а в режиме проверки орфографии - надо?

Цитата:
Чтобы простой и понятный

И чего проще - хочешь в правом окне меняй текст по своему разумению, хочешь - пользуйся подсказками. Хотя есть недостатки с точки зрения эргономики.

Цитата:
Сколько не искал, ни разу такого не нашёл

И сколько вы OCR-редакторов практически перепробовали? На своём Debian/Devuan? Там хоть GUI к Тессеракту есть?

Цитата:
И главное, чтобы позволял кодирование - отдельно, OCR - отдельно

Не знаю, что такое "кодирование", но обычно все стремятся к комбайнам, потому что задалбывает для одной задачи иметь десяток программ. И вообще - какая разница?

Всего записей: 912 | Зарегистр. 04-11-2019 | Отправлено: 23:57 23-02-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
про эргономику вычитки

Всего записей: 3427 | Зарегистр. 15-07-2010 | Отправлено: 07:32 24-02-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:
Цитата:
Вот скриншот FineReader-а в режиме распознавания и проверки орфографии

Примерно так и думал, что окромя FR и нету нишиша.
 
jourmager say:
Цитата:
Там хоть GUI к Тессеракту есть?

Ежели к официальным добавить все гитовские поделки, то хоть опой жуй. Только толку с них, как с козла молока.
Более-менее надежда была на Gscan2pdf, но не тут то было. Распознавание только внутри этой поделки (извне загрузить HOCR нельзя), отдельного OCR (PDF только с OCR) нет, так еще и результат, после долгой, утомительной правки - полный кал, негожий совсем (именно в смысле внедрения OCR в PDF). Такие вот дела.

Всего записей: 796 | Зарегистр. 18-05-2023 | Отправлено: 07:42 24-02-2025 | Исправлено: zvezdochiot, 07:42 24-02-2025
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как вы смотрите на использование нового гугловского кодека jpegli в PDF? Это обратно совместимый с JPEG кодек, использующий наработки несовместимого jpegXL и крайне медленного guetzli. Дает заметное улучшение картинки при аналогичном или меньшем размере файла. Закинул тестовый образец в PDF, работает.
 
Могут ли быть подводные камни?
 

Всего записей: 362 | Зарегистр. 10-08-2018 | Отправлено: 10:23 24-02-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Могут ли быть подводные камни?

как адобовскую flash отымут.

Всего записей: 3427 | Зарегистр. 15-07-2010 | Отправлено: 10:44 24-02-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Archivist say:
Цитата:
Дает заметное улучшение картинки при аналогичном или меньшем размере файла.

Так то оно всё так. Но есть "но"! Всё это адаптация JPEG для общего назначения. В то время как мне известна только одна работа по адаптации JPEG именно для типографии. А говоря конкретнее для комиксов. И эту работу провёл Kornel Lesinski, а результатом её стал jpge. Такие вот дела.
 

Всего записей: 796 | Зарегистр. 18-05-2023 | Отправлено: 10:56 24-02-2025 | Исправлено: zvezdochiot, 10:58 24-02-2025
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
как адобовскую flash отымут.

Кодек производит стандартные, совместимые с любым утюгом жпеги, кто ж их отымет.
 
zvezdochiot

Цитата:
мне известна только одна работа по адаптации JPEG именно для типографии

Ничто не мешает сравнить эти кодеки на комиксах. Кстати эти иллюстрации к статье я уже видел в публикациях по mozjpeg.

Всего записей: 362 | Зарегистр. 10-08-2018 | Отправлено: 11:58 24-02-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Archivist say:
Цитата:
я уже видел в публикациях по mozjpeg.

Автор тот же: Kornel Lesinski, Только mozjpeg - кодек общего назначения, как и jpegli. Потому как mozjpeg - альтернатива libjpeg, как и libjpeg-turbo, только цели альтернатив разные. А вот jpge остался верен исходной задаче и не претерпел корректировок, связанных с общим назначением.
 

Всего записей: 796 | Зарегистр. 18-05-2023 | Отправлено: 12:25 24-02-2025 | Исправлено: zvezdochiot, 12:27 24-02-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
оффтоп. похоже, еще один источник нечитаемого фуфла в Сети

Ну почему же оффтоп? Изготовление высококачественных pdf-файлов - это как раз одна из тем этой темы. Сжатие pdf-файлов с приемлемым качеством - туда же. Чтобы не получить "нечитаемое фуфло". Кстати, обычно "нечитаемое фуфло" я вижу у djvu-файлов. Типа текст в 100 dpi.
 
Сетовать на "нечитаемое фуфло" можно, но это неконструктивно. Редакторы pdf иногда предлагают обработку сканов, тот же PDF-XChange Editor имеет Enhance Scan, где есть Deskew, Background Removal, Despeckle, Descreen, Text Sharpening, Remove Black Edges, Correct Prespective/2D distortions. Но, к сожалению, эти функции во многом проигрывают специализированным программам типа ScanTailor или ScanKromsator. Одна из причин - ST и SK обрезают ненужные поля вокруг текста, "грязь" на которых влияет на качество бинаризации. Плюс более контролируемый ручной режим в спец-программах.
Я ни разу не спец в ScanTailor, но чтобы бинаризировать одну страницу из набора sharlatanat мне надо было примерно 10 секунд - на "расставление резаков". Там ЕМНИП 6 типов типовых страниц, т.е. обучающее видео - 1 минута, ещё пару минут на остальные операции. Сколько у вас, как специалиста по ScanKromsator, займёт обработка в ScanKromsator шести типовых страниц? Сколько займет времени обучающее видео без лишних экзерсисов? Для pdf, конечно же.
 

Цитата:
оффтоп
да не то слово. в ФР править текст жуть как неудобно.
Я думал над темой эргономики, и ничего лучше чем две синхронизированные и рядом по вертикали размещенные лупы не придумал. Раньше машинистки линейку двигали на пюпитре.
То есть интерфейс где-то такой: слева во всю высоту скан справа во всю высоту текст
посредине экрана эти полосы разорваны и во всю ширину вставлено две лупы, захватывающие три-четыре строки скана и текста. Лупа на скан повыше текстовой.  

Ну почему опять оффтоп? OCR - это неотъемлемая часть всех продвинутых pdf-редакторов, и проверка орфографии - это неотъемлемая часть OCR - в идеале. И в идеале такая проверка должна быть удобной.
Если вы посмотрите на мой скан ФайнРидера в режиме проверки орфографии, то вы увидите почти то же самое, что вы хотите - слева скан, справа текст, лупа скана внизу (а не посередине), лупа с текстом и словарной поддержкой - в любом месте экрана. Некоторые элементы интерфейса можно кастомизировать. но многое нельзя, и это неудобно. Я вот сейчас подумал, что наверное лучше иметь отдельный портабельный ФайнРидер, с интерфейсом, который уже настроен на проверку орфографии.
А вот теперь оффтоп - меня сильно удивляет, почему bolega не сделал отдельную программу для вычитки текстового слоя в djvu. Отдельную - потому что может хоть тогда эта программа будет эргономически удобна. Для djvu - потому что он любитель и знаток djvu, и там это проще. Это удивление касается и NME.
 


Цитата:
Примерно так и думал, что окромя FR и нету нишиша

Я вроде понятно написал - "Могу ещё скриншот PDF-XChange Editor-а в режиме проверки орфографии - надо?" Вот такой скриншот
 

 
Это проверка орфографии в PDF-XChange Editor 10 в режиме замены картинки с текстом на векторные шрифты. К сожалению, отсутствует экран с источником-сканом. Только уже распознанный текст.
Кстати, на этом же скриншоте видны результаты обработки скана в Enhance Scan - то о чём я говорил - грязь на полях. но текст уже на более-менее нормальном фоне.
 
Добавлено:
zvezdochiot

Цитата:
мне известна только одна работа по адаптации JPEG именно для типографии. А говоря конкретнее для комиксов. И эту работу провёл Kornel Lesinski, а результатом её стал jpge

 
Вот скриншот, где с увеличением 300% слева оригинал jpg размером 1.234.370 байт, справа сжатый с качеством 65 помощью jpge ( командная строка jpge.exe 1.jpg 2.jpg 65 ) - размер 695.708 байт.
Кто-то видит разницу или я что-то делаю не так?
 

 
 
 
 
Добавлено:
Archivist

Цитата:
Как вы смотрите на использование нового гугловского кодека jpegli в PDF?

Во-первых - а зачем? Лучшее качество при меньшем размере? Для pdf? Для чтения книг в режиме fit to width на экране монитора?  
А где можно скачать программу-кодек jpg -> jpegli, чтобы попробовать? Я уже попробовал jpge - не впечатлил.

Всего записей: 912 | Зарегистр. 04-11-2019 | Отправлено: 12:58 24-02-2025
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов (часть 1)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru