Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 3)

Модерирует : gyra, Maz

gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Начало обсуждения - 1 часть, 2 часть.
 
Текущая версия: ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.1 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом...

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 18:07 30-03-2009 | Исправлено: Maz, 09:43 22-08-2018
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
кусок из Хрестоматии

этот самый кусок и продолжает сбивать. я из него сделал вывод, что финализация обязательна. То есть всегда. А bolega пишет чуть выше - не всегда, а только когда automargins включен. Очень мутно написано, если уже есть собственный опыт, как был у меня. Я и написал - концы с концами не сходились до сих пор.  
Но я ещё потом поразбираюсь на практике. Как из отпуска выйду, и после окончания текста про визард.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 17:32 10-08-2018
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кусок как раз про то, что хотя в "Whats new" написано, что всегда, на самом деле нет, и указано, когда именно нет.  Я тогда до этого очень долго доходил.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 19:22 10-08-2018
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Archivist
Если обложка получена сканированием, неужели какие-то несчастные пересохранения могут как-то заметно повлиять на ее качество? Скан это всегда некое приближение к оригиналу + случайный мусор (шум), вызванный несовершенством освещения, бумаги, оптики, ЭЦП и т.п. Пересохранения без смены цветности, качества, без фильтров если и влияют, то в диапазоне, соответствующему исходному шуму, imho. Вы привели difference, но если это делалось в режиме RGB, то это вовсе не показатель. Надо сравнивать хотя бы HSL, вот если стали меняться компоненты H или S, то это ощутимо. А если цвет например из (100,200,150) стал (101,201,151), то это все на уровне мусора.
 
Добавлено:
TelecomUral
В режиме доступной финализации можно изменять поля, размеры, габариты контента страницы. Чтобы это было возможно, СК нужно:
- знать, где на странице контент, а где он кончается и начинаются белые поля.  
- страница должна быть обработана, но поля еще не должны быть добавлены/убавлены и размер не должен быть приведен к размеру книги.
Если этой информации нет, то режим финализации невозможен.
При отключенной автоматике СК не знает, где поля, а где контент, поэтому регулировать ничего уже не может.
 

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 19:32 10-08-2018
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Уверен, людям берущимся за переделки чьих-то книг не чужд перфекционизм. А что мы получаем при повторной конвертации обложки в JPEG? В случае пересохранения с максимальным коэффицинтом качества размер файла увеличивается в несколько раз. С умеренным коэффициентом размер не меняется, но падение качества становится заметным на глаз (особенно в тексте и красных цветах). Зачем же что-то терять, если можно свободно переносить старые джейпеги непосредственно в новые PDF. Пусть даже не Кромсатором, а с помощью дополнительных приложений (кстати, с открытым кодом). Это вопрос скорее даже психологический.  
 
Вот если человек не знает об особенности Кромсатора с переводом старых джейпегов через тиф, он просто создаст себе пдф и не заметит никакой разницы в силу уже особенностей отображения пдф. А если узнает, или ему укажут на это, очевидно будет расстроен.

Всего записей: 329 | Зарегистр. 10-08-2018 | Отправлено: 19:52 10-08-2018
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
и после окончания текста про визард

Мне кажется, что в тексте должен быть ответ на вопрос: будут или нет отличия в процессе джву-кодинга в случаях, если режим финализации запустился (вы видите контур и поля , автомаржины включены), и в случае, если как вот тут финализация оказалась недоступна.
Мне кажется, что различий быть не должно, но 100% уверенности в этом у меня нет и практических проверок я не проводил. Ведь по логике, если кодировать нефинализированные страницы, то они останутся без полей

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 19:56 10-08-2018
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Archivist

Цитата:
не чужд перфекционизм

Одобряю.
Мне просто нужно понять, так ли необходимо в СК с таким трепетом относиться к сканированным jpg. Перфекционизм это существенный аргумент.
 
Добавлено:
daa2013
Финализация изменяет только геометрию, но не качество.  
При этом однако, пока страница нефинализирована, можно выполнять кое-какие переделки, например ребинаризовать с другим порогом или менять параметры despeckle, c.smooth.
 
Добавлено:

Цитата:
Ведь по логике, если кодировать нефинализированные страницы, то они останутся без полей  

Либо наоборот, если фактическое пространство за контентом было больше заданных полей, то оно не будет уменьшено.

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 20:04 10-08-2018
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
Archivist
по поводу изменения размера после многократных пересохранений. Заинтересовался, полез поглубже. Увеличил пиксели и поставил картинки рядом. Да, видно, что цветовая компонента становится поменьше. Обратил внимание на настройки кодера, там стоит среди прочего какой-то параметр "YUV122". Накопал на сайте http://www.photofiltre-studio.com/forum/viewtopic.php?p=173508
такой вот текст:
It uses by default YUV 122 component sampling, It's fast, the result jpeg file will be smaller, BUT IT'S too lossy for colors (especially red ones), as result - the image will be much blurry and lost many details. So even 100% quality in this mode - great loss of true colors. I myself use only AcdSee v3.0 for Jpeg compression, There I can chose the YUV better compressions method - YUV111. So If I chose 100% quality - The result photo should have NO changes at all.
Припомнил, что YUV122 это вроде выбор коэффициентов деления при детализации обработки цветовых компонент относительно канала яркости. Примерно так: если на канал яркости мы отдаём 8 бит, то при "1-2-2" на два канала цветности - по 2 бита (а при YUV111 будет по 4 бита). Опять же, это я дилетантски излагаю.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 06:51 11-08-2018
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подробнее... [/more]

Всего записей: 329 | Зарегистр. 10-08-2018 | Отправлено: 09:11 11-08-2018 | Исправлено: Archivist, 10:05 11-08-2018
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите пожалуйста, как лучше обрабатывать книгу с множеством таких страниц (черный текст и участки с серым фоном). Я сделал в градациях серого на выходе и файл получился около 80 мег.
 
   
 
 

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 09:44 11-08-2018
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
Archivist
уменьшается, но к пределу:

причём первоначальный скачок большой.
Ищите, откуда у вас рост размера. Ерунда какая-то. Там же, по памяти, все незначащие нули, и прочая постоянная инфа, ужимаются либо отбрасываются.
На работе win7, вот там я встречал, что jpeg, конвертированный средствами винды откуда-нибудь из тиффа, даже если внутри заведомо ужатые мелкие детали - да, выходит ненормально здоровенный. Никак не меньше 3Мб. А со старыми конвертилками всё чётко.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 10:01 11-08-2018
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Ищите, откуда у вас рост размера. Ерунда какая-то. Там же, по памяти, все незначащие нули, и прочая постоянная инфа, ужимаются либо отбрасываются.  

Возможно, объем метаданных растет.
Я сталкивался с таким, когда в Фотошопе в JPG сохранял. Мегабайтный файл превращался в 40 мегабайтный.
Решение, либо скрипт использовать:
https://forums.adobe.com/message/8456985#8456985
Либо сохранять Save for Web.

Всего записей: 3142 | Зарегистр. 29-09-2005 | Отправлено: 10:12 11-08-2018
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
DmitryKz
Результаты были получены в ACDSee 3.1 под Win7 (честно говоря, связь работы кодека с ОС весьма призрачна). Извиняюсь за продолжение оффтопа.  
 
 
 
Добавлено:
asku
Серый фон можно перевести в битональный режим дитерингом.
Поковырял первое приложенное изображение (предварительно исправив ссылку):
https://i.imgur.com/3V56hwt.png

Всего записей: 329 | Зарегистр. 10-08-2018 | Отправлено: 10:25 11-08-2018
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
файл получился около 80 мег

Это здесь оффтоп, но, попробуйте сделать пдф с оптимизацией. Нужен акробат про, из исходных картинок объединяете всё в один файл, сохраняете результат, следующий шаг, для русскоязычной версии программы ->сохранить как другой->оптимизированный файл pdf там выбираем для цвета и серого сжатие  jpeg2000(экспериментируем с размером сегмента размер-качество) и для текста JBIG2. Сохраняем. Далее, прогоняем через clearscan. Инструменты->распознование текста ->в этом файле (выбираем изменить и выбираем clearscanязык русский разрешение 600 дпи). Последовательность шагов важна для размеров файла, до двух раз доходит.

Всего записей: 2873 | Зарегистр. 22-03-2005 | Отправлено: 11:50 11-08-2018
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku

Цитата:
как лучше обрабатывать книгу

Уточните, что такое "лучше"? Тут же противоречие - либо долго, либо немаленький размер.
Я бы перешёл в режим авторасстановки пикчур-зон по отпусканию мыши, и налепил их на серые прямоугольнички. Это не так долго как кажется. Только вначале нужно точно подобрать все свойства зоны, поэкспериментировать, как будет выглядеть итоговая зона на выходе в дежавю. Чтоб без ручной дообработки. Наверное, лучше красить фон зоны серым, зону делать BW. Но если сканы повернуты на угол - будет некрасиво, серое будет и вне черной окантовки. Тогда можно чего-нибудь придумать с парой наложенных зон, чтобы позиционирование не мешало красивому виду. А вставлять их из кармана и пододвигать на нужное место мышкой.
Дизеринг, кстати, тоже неплохое решение.
Upd
Уу, что-то я невнимательно посмотрел на картинки. Там линии серые, над фамилиями. Нда, просто так это не выделишь. Может, пропустить такие трёхцветные блоки через RasterID?

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 07:16 12-08-2018 | Исправлено: TelecomUral, 10:29 12-08-2018
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Уточните, что такое "лучше"?  

 
Я имел в виду вопрос — «Как бы вы сделали на моем месте?»
 

Цитата:
RasterID

 
А что это такое?

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 21:38 12-08-2018
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
asku
RasterID - программа обработки сканов чертежей. Умеет в том числе и постеризовать. Хороша тем, что настройка цветов постеризации очень удобная. И есть пакетная обработка. Так что если ваши сканы однородные по тональности (были хорошо прижаты к стеклу), может проще их через RiD прогнать, а СК тут неудобен, массу многоугольных зон выделять в нём занудно.  
 
Да, забыл упомянуть сразу:
В СК может быть удобно выделять на скане области одного цвета щелчком Shift+Ctrl+ЛКМ на цветной полоске. Если ширины захвата цвета не хватит - в опциях СК эта регулировка на первой закладочке "Color threshold for magicwand". По умолчанию =20. Иногда эта фича сильно выручает.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 04:16 13-08-2018 | Исправлено: TelecomUral, 10:26 13-08-2018
feudor

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
По мне так лучше вычищать мусор вручную


Цитата:
А как это вычистить в ручную?

я не знаю очистить серый фон в кромсаторе, зато я это делал в скан тейлор, там основной функционал это приведение скана в идеальный вид - белый фон, черный текст, ровные поля, исправление всяких изгибов страницы
Пользоватся лучше этой версией ScanTailor Universal:
https://github.com/trufanov-nok/scantailor

Всего записей: 70 | Зарегистр. 26-05-2004 | Отправлено: 08:13 13-08-2018
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
опять со своим СТ полезли. Чего вам в своих топиках то не сидится.  

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 08:50 13-08-2018 | Исправлено: bolega, 10:37 16-08-2018
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите, не изобретаю ли я велосипед? Обрабатываю сканы справочника с последующим переводом в PDF (clearscan). И все бы прекрасно, если бы не верхний колонтитул с названием главы, отделенный от текста горизонтальной линией. Клирскан эту линию каждый раз искажает неимоверно, что портит впечатление от книги. Если бы колонтитул был одинаковым на каждой странице (или хотя бы через одну), я бы его просто срезал и потом вставил уже Акробатом, но глав в книге много и у каждой уникальное название.
 
С учетом выравнивания Кромсатором верхней границы всех страниц, решил заливать белым саму эту линию (фиксированную область на картинке) макросом в Фотошопе. Где-то 50 страниц после этого пришлось вручную подправить. Потом в Акробате вставил колонтитул с линией, красиво получилось.
 
Все правильно сделал, или есть способы попроще? Все же ситуация с колонтитулами должна часто встречаться при обработке книг.

Всего записей: 329 | Зарегистр. 10-08-2018 | Отправлено: 10:51 20-08-2018
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Archivist
вопрос неясен. СК тут при чём? Клирскан же вы делаете после СК. Тогда что, вопрос о выравнивании? Но линия не повлияет на выравнивание по вертикали, если она глубже к центру, чем текст колонтитула. Неясно как-то вы описали.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 11:38 20-08-2018
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 3)
gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru