Редактирование PDF файлов (часть 1) - [196] :: Программы

TelecomUral

Цитата:

оффтоп. похоже, еще один источник нечитаемого фуфла в Сети

Ну почему же оффтоп? Изготовление высококачественных pdf-файлов - это как раз одна из тем этой темы. Сжатие pdf-файлов с приемлемым качеством - туда же. Чтобы не получить "нечитаемое фуфло". Кстати, обычно "нечитаемое фуфло" я вижу у djvu-файлов. Типа текст в 100 dpi.

Сетовать на "нечитаемое фуфло" можно, но это неконструктивно. Редакторы pdf иногда предлагают обработку сканов, тот же PDF-XChange Editor имеет Enhance Scan, где есть Deskew, Background Removal, Despeckle, Descreen, Text Sharpening, Remove Black Edges, Correct Prespective/2D distortions. Но, к сожалению, эти функции во многом проигрывают специализированным программам типа ScanTailor или ScanKromsator. Одна из причин - ST и SK обрезают ненужные поля вокруг текста, "грязь" на которых влияет на качество бинаризации. Плюс более контролируемый ручной режим в спец-программах.
Я ни разу не спец в ScanTailor, но чтобы бинаризировать одну страницу из набора sharlatanat мне надо было примерно 10 секунд - на "расставление резаков". Там ЕМНИП 6 типов типовых страниц, т.е. обучающее видео - 1 минута, ещё пару минут на остальные операции. Сколько у вас, как специалиста по ScanKromsator, займёт обработка в ScanKromsator шести типовых страниц? Сколько займет времени обучающее видео без лишних экзерсисов? Для pdf, конечно же.

Цитата:

оффтоп
да не то слово. в ФР править текст жуть как неудобно.
Я думал над темой эргономики, и ничего лучше чем две синхронизированные и рядом по вертикали размещенные лупы не придумал. Раньше машинистки линейку двигали на пюпитре.
То есть интерфейс где-то такой: слева во всю высоту скан справа во всю высоту текст
посредине экрана эти полосы разорваны и во всю ширину вставлено две лупы, захватывающие три-четыре строки скана и текста. Лупа на скан повыше текстовой.

Ну почему опять оффтоп? OCR - это неотъемлемая часть всех продвинутых pdf-редакторов, и проверка орфографии - это неотъемлемая часть OCR - в идеале. И в идеале такая проверка должна быть удобной.
Если вы посмотрите на мой скан ФайнРидера в режиме проверки орфографии, то вы увидите почти то же самое, что вы хотите - слева скан, справа текст, лупа скана внизу (а не посередине), лупа с текстом и словарной поддержкой - в любом месте экрана. Некоторые элементы интерфейса можно кастомизировать. но многое нельзя, и это неудобно. Я вот сейчас подумал, что наверное лучше иметь отдельный портабельный ФайнРидер, с интерфейсом, который уже настроен на проверку орфографии.
А вот теперь оффтоп - меня сильно удивляет, почему bolega не сделал отдельную программу для вычитки текстового слоя в djvu. Отдельную - потому что может хоть тогда эта программа будет эргономически удобна. Для djvu - потому что он любитель и знаток djvu, и там это проще. Это удивление касается и NME.

Цитата:

Примерно так и думал, что окромя FR и нету нишиша

Я вроде понятно написал - "Могу ещё скриншот PDF-XChange Editor-а в режиме проверки орфографии - надо?" Вот такой скриншот

Это проверка орфографии в PDF-XChange Editor 10 в режиме замены картинки с текстом на векторные шрифты. К сожалению, отсутствует экран с источником-сканом. Только уже распознанный текст.
Кстати, на этом же скриншоте видны результаты обработки скана в Enhance Scan - то о чём я говорил - грязь на полях. но текст уже на более-менее нормальном фоне.

Добавлено:
zvezdochiot

Цитата:

мне известна только одна работа по адаптации JPEG именно для типографии. А говоря конкретнее для комиксов. И эту работу провёл Kornel Lesinski, а результатом её стал jpge

Вот скриншот, где с увеличением 300% слева оригинал jpg размером 1.234.370 байт, справа сжатый с качеством 65 помощью jpge ( командная строка jpge.exe 1.jpg 2.jpg 65 ) - размер 695.708 байт.
Кто-то видит разницу или я что-то делаю не так?

Добавлено:
Archivist

Цитата:

Как вы смотрите на использование нового гугловского кодека jpegli в PDF?

Во-первых - а зачем? Лучшее качество при меньшем размере? Для pdf? Для чтения книг в режиме fit to width на экране монитора?
А где можно скачать программу-кодек jpg -> jpegli, чтобы попробовать? Я уже попробовал jpge - не впечатлил.

Модерирует : gyra, Maz
Maz (05-04-2025 09:00): Редактирование PDF файлов (часть 2)	Версия для печати • Подписаться • Добавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200