Scan Tailor (часть 2) - [26] :: Программы :: Компьютерный форум Ru.Board

anagnost96

Цитата:

Но ведь это же так и есть. Если текст уже бинаризован, а картинка -- нет, то разделить их никакого труда не составляет.

Я начал диалог с Tulon по поводу вопроса "встраивать - не встраивать" разделение сканов именно прямо в СТ, а не в отдельную утилиту (вроде Сепаратор и т.п.). По мере беседы неожиданно выяснилось, что этот вопрос является следствием более важного вопроса: "всегда или не всегда делать разбиение сканов". Я считаю, что "всегда" (и даже думал, что так считают все, и это само собой очевидно), а Tulon, оказывается, считает, что "не всегда". Что в большинстве случаев "и так сойдёт" (по качеству), а кому "не сойдёт" - тот разделит сканы в сторонней утилите, а зато так, мол, интерфейс проще, и "чайнику не надо заморачиваться с разбиением сканов, а напрямую кодировать СТ-вывод в DjVu Solo 3.1 - чтобы там автосегментёр сам разделил тексты в маску, картинки в задний фон" (это я своими словами пересказываю мысль Tulon'а).

Я, пытаясь убедить Tulon в ошибочности его взгляда ("не всегда делать разбиение") привёл ему такие преимущества разбиения "всегда" перед "не всегда":

1. 100% гарантия качества при последующем DjVu-кодировании. Гарантированно полное отсутствие явления "порча картинок".

2. Отсутствие потребности в DjVu-кодировщике, обладающим автосегментацией. Взамен используются 2 гораздо более простых DjVu-кодировщика: чёрно-белый и цветной - которые могут быть даже свободно-бесплатными и с открытыми исходниками (и за этим ИМХО будущее). Из легально-бесплатных DjVu-кодировщиков, обладающих автосегментацией, есть один-единственный DjVu Solo 3.1 - но он и старый, и неудобный, и там нет профилей кодирования, и он создаёт DjVu версии 21 (а последняя - 27), и он сделан под Windows - а на других платформах его надо запускать только через виртуальную машину.

3. Возможность дообработать уже разделённые сканы в любой сторонней программе - перед DjVu-кодированием. А Tulon, получается, уповает на безграничную мощь СТ (что очевидно нереально).

4. Tulon'у обязательно потребуется встроить в СТ ещё и Blur - для размытия картинок. Это чтобы хоть как-то прогарантировать, что при последующей автосегментации вся картинка попадёт именно в фон. Но применение Blur - это лишняя проблема: это и сложнее, и труднее (надо ж размыть точно в меру - больше размоешь - качество хуже, меньше размоешь - не добьёшься хорошей подсказки автосегментёру - куда девается "простота" для чайника!), и время это отнимает. Да ещё и Blur - это, как ни крути, тоже своего рода порча картинок - просто более слабо выраженная.

Многие пользователи ведь захотят, чтобы картинки именно вообще никак не портились - при кодировании в DjVu. Им же не объяснишь, что "картинки попортятся - но не очень сильно".

Они тогда на PDF переключатся, потому что, мол, "в PDF картинки не портятся".

5. Субъективный довод: на мой взгляд, с разделёнными сканами нагляднее работать. Там сразу видно - как я разбил исходные сканы, правильно ли, и где какие ошибки разбиения имели место. И разбитые сканы можно просмотреть в любом вьювере - а не-разбитые (но логически разделённые на чб текст и серую картинку) сканы можно посмотреть (на предмет правильности логического разбиения) только в СТ - на стадии вывод (т.е. расположение и границы Picture-зон посмотреть).

Добавлено:
Dashout

Цитата:

это уже паранойя...

Лучше взгляните на свои прошлые посты.

Кстати, к примеру, ScanKromsator делался как раз по правильному принципу "качество в ущерб простоте". Просто у bolega ситуация вышла из под-контроля (в силу недостатка программистской квалификации).

Поэтому, получается, что ScanKromsator - это "правильная программа" (просто некачественная), а Scan Tailor - это "неправильная программа" (но зато качественная).

Модерирует : gyra, Maz
Maz (10-01-2024 10:45): Scan Tailor (часть 3)	Версия для печати • Подписаться • Добавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200