Scan Tailor (часть 2) - [28] :: Программы :: Компьютерный форум Ru.Board

Цитата:

Я бы не сказал, что оно обременительно. Разве трудно положить в некую папку исключительно графические файлы? Это можно сделать средствами любого коммандера.

Просто у каждого своя собственная методика работы, и эта методика вполне может предполагать наличие в папке с обработанными сканами чего-то еще. Это могут быть еще какие-то скрипты, распознанные страницы в формате hocr или, скажем, текстовый файл с оглавлением. Кое-что из этого может быть рассчитано на другие варианты обработки того же самого материала (скажем, кодирование в pdf). Можно, конечно, и убрать всё это хозяйство из директории непосредственно перед обработкой, но делать так каждый раз будет крайне неудобно.

Цитата:

С этого момента поподробнее, пожалуйста Сначала я делал, как советуете Вы и monday2000 -- уменьшал размер цветного слоя перед тем, как выделить чанки. Но DjView 4 на это ужасно ругался и картинку не отображал.

Он ругается потому, что ему нужно, чтобы размеры маски были строго кратными размерам фона. Естественно, это требование будет нарушено, если, к примеру, мы пытаемся понизить разрешение с 600 до 300dpi при том, что обработанный скан имеет нечетное количество пикселей по высоте или ширине. К сожалению, СТ не позволяет контролировать пиксельные размеры файлов на выходе, из-за чего и получаются такие казусы.

Цитата:

Тогда я плюнул и стал просто размывать. Ведь эффект-то будет почти тот же. Или нет?

Мне кажется, это будет просто потеря качества при сохранении неоправданно большого размера. Размытие, конечно, стоит делать для избавления от растра, но никак не для уменьшения веса картинки.

Цитата:

А для cjb2 что сделать посоветуете? -losslevel 200 ?

А вот с cjb2, думаю, лучше не рисковать. Проблема в том, что там используется старая, неотрегулированная версия алгоритма, которая дает избыточное сжатие за счет некорректных подстановок. Правда, уменьшение уровня агрессии в таких случаях обычно тоже не спасает

Цитата:

Нет, если подряд идут две и более черно-белые страницы, minidjvu вызывается именно в многостраничном режиме. Попробуйте менять размер словаря, и Вы это увидите.

Спасибо за разъяснение: значит, я плохо смотрел.

Цитата:

Но для сепарированных файлов Вы правы, я не придумал, как вызывать minidjvu многостранично. Может быть, Вы придумаете?

А в чем проблема? Точно так же из каждого закодированного файла извлекаем блок Sjbz, который потом объединяем с заранее подготовленным фоном. Просто делать это придется в цикле.

И, кстати, совершенно не нужно записывать трехслойные файлы с черным квадратом Малевича в качестве блока FG44. В текущей версии djvumake можно вместо этого написать FGbz=#black, что гораздо более корректно.

Добавлено:
U235

Цитата:

убрал ограничения на агресивность

Зачем же их было убирать? cjb2 и так дает избыточную степень сжатия.

Цитата:

добавил большую корректность при работе с буквами "и" и "н" при больших степенях сжатия

Если бы дело было только в этих буквах... У меня вот как-то вместо всех "i" появилась правая половинка от буквы "n" с характерным закруглением, а точки над ними сделались треугольными, поскольку кодировщику почему-то приглянулся ошметок от заглавного "E" с засечкой. Короче говоря, алгоритм безусловно требует правки, но только в сторону большей жесткости, подобно тому, как это было сделано в minidjvu.

Модерирует : gyra, Maz
Maz (10-01-2024 10:45): Scan Tailor (часть 3)	Версия для печати • Подписаться • Добавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200