Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » ScanKromsator / СканКромсатор (Часть 3)

Модерирует : gyra, Maz

gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Начало обсуждения - 1 часть, 2 часть.
 
Текущая версия: ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.1 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом...

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 18:07 30-03-2009 | Исправлено: Maz, 09:43 22-08-2018
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Ladina
"В сотню книг" это Вы меня обидели!
Хотя бы 1000 сказали...
Отобрать у ребенка игрушку невозможно - себе дороже.
За качеством текста я не следил, основной упор делал на картинки (Ваша основная проблема).
Если сделать как у driver1991, то и буквы будут поровнее, и размер поменьше. В png я ничего не конвертировал. Если Вы хотели сказать "в djvu", то компилировал я, "не отходя от кассы", т.е. прямо в СК. Если бы делал это через DJVU Small, то размер получился бы еще меньше.
Мультики я не забирал, так что возвращать мне нечего.
Писал я в свое время мануалы (но недописал ), как обрабатывать шахматную литературу, которая немного посложнее обработки художественной.
Если найдете время и это Вам интересно, можете посмотреть их вот по этой ссылке.
 
P.S. А зачем Вам что-то улучшать, на либрусеке и так неплохо нынешний вариант качают.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 00:42 16-03-2015
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Оставлю пару хотелок для нового Кромсатора. (Жалко, что нет никаких новостей о ходе его разработки...)
 
1. Ужирнение на пиксель/утоньшение на пиксель.  
Хочу, чтобы в постобработке, также как при применении зеленой и красной метелки можно было выделить прямоугольник (а по возможности и многоугольник), внутри которого сработал бы такой фильтр. Насколько я знаю, он программируется матрицей весов соседних пикселей, точно также как гауссовский блур.
Кстати, в постобработке так можно сделать и блур.
 
2. В том случае, если я хочу сделать стандартную одинаковую обрезу всех картинок, чтобы мне не надо было бы делать авторасстановку резаков.
Вот сейчас я сижу и тупо жду пока он полтыры тыщи стр. "правильно" обкорнает. А мне этого не надо. Мне надо только сантиметр справа сразу у всех срезать. (После окончания обработки буду применять копирование позиции первого ко всем. Странно, что её нельзя вызвать без такой обработки.)
 
3. Про желательность инструмента "выделение с фиксированной пропорцией сторон"  я уже, вроде, писал.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 18:53 20-03-2015
rzia

Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Коллеги, практически некогда не сталкивался с таким шрифтом, но вот тут попалось несколько старых журналов.
Помогите подобрать оптимальные настройки, что бы буквы не съедались. Основная проблема это тонкие линии у букв, они у меня как не стараюсь, немного страдают, не у всех букв, но у некоторых.
Несколько страниц сырого скана прилагаю  
https://yadi.sk/i/vYdPiq0afUdYK
https://yadi.sk/i/2zzy3Xx_fUdYM  
Заранее спасибо

Всего записей: 36 | Зарегистр. 07-05-2012 | Отправлено: 12:47 24-03-2015
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013

Цитата:
Вот сейчас я сижу и тупо жду пока он полтыры тыщи стр. "правильно" обкорнает. А мне этого не надо. Мне надо только сантиметр справа сразу у всех срезать.  

Поставьте на первом скане соответствующий движок в нужное положение, затем по правой клавише мыши на этом движке распространите его позицию на все последующие.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 12:58 24-03-2015
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
 
Так проблема-то и была в том, что
"не применялось копирование ко всем, если не выполнена черновая расстановка".
 
Странно, сейчас получилось.
Если первый распознать, тогда его опции применяются.  
Но я именно так в прошлый раз и делал ! Глюк какой-то видно был.
 
Спасибо.
 
Добавлено:
rzia
увы неясно что у вас страдает, и будет ли предлагаемый вариант лучше,
тем более, если внимательно посмотреть на скан, у некоторых букв изначально есть дефекты,
но я шрифты с тонкими линиями в последнее время стал кодировать с "избыточным апсемплингом".
Т.е. сканам в 600 принудительно в СК задаю  300/400 дпи и делаю апсемплинг до 600. (Т.е. 1200/900, фактически.) Затем уже  по-новой пихаю в СК или СТ.
 
Получается как-то так:
 
СК (highdark):
http://rghost.ru/6P5pcfv7V
 
СТ (жирнее +30)
http://rghost.ru/7MYZLwVHq
 
Upd:  
На самом деле я вот сейчас сравниваю результаты в СК на Хайдарк
с таким апсемплингом и без него,
не помогло. Как было так и есть.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 16:17 24-03-2015 | Исправлено: daa2013, 17:49 24-03-2015
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013

Цитата:
Если первый распознать, тогда его опции применяются.

А кто Вам мешает предварительно отмаркировать и заодно убрать все ненужные опции, щелкнув правой клавишей мыши на пустом месте любой заставки (кроме C.Smooth) и выбрав Clear all options & mark all?
 
Добавлено:
rzia
Поскольку Вы не привели результат своего действия, не с чем сравнивать, лучше или хуже.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 17:58 24-03-2015 | Исправлено: shch_vg, 18:05 24-03-2015
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я неточно выразился.  
Я имел в виду: если на первом расставить резаки, то их положение скопируется.
Обнуление опций, естественно не проблема.
 
Проблема, повторюсь, была в том, что почему-то не копировалось положение резаков. Сейчас всё в порядке. В чем был глюк, не знаю. Может, винды сбоили.
Я же решил, что это нормальное поведение.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 18:08 24-03-2015
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013

Цитата:
На самом деле я вот сейчас сравниваю результаты в СК на Хайдарк  
с таким апсемплингом и без него,  
не помогло.

И не поможет.
Если в какой-то букве в исходнике есть разрывы, то СК ни при каких параметрах не способно их убрать. А на 641-м тифе дело усугубляет треугольная затемненность левого нижнего угла и вертикальная правой стороны.
Попытка ее убрать с помощью доп.параметров приведет к еще большему ухудшению слабых ( и не только их) букв.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 18:20 24-03-2015
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Меня результат в СТ для данных проапсемпленных сканов полностью устраивает.  
Я даже бы и не парился.  
Только надо сборку Featured использовать, чтобы картинки не высветлялись.  
Здесь использование СТ оправданно, так как криволинейные иллюстрации.
 

Цитата:
Попытка ее убрать с помощью доп.параметров приведет к еще большему ухудшению слабых ( и не только их) букв.

Хайдарк - вроде локальный метод бинаризации, ему должно быть на это пофиг.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 18:34 24-03-2015
rzia

Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Да, извините, не выложил свой результат, исправляюсь
https://yadi.sk/d/mKmu2WQdfW9eA
В действительности на оригинале некоторые буквы конечно с разрывами. Но все же, может быть кто-то сможет сделать лучший вариант чем у меня, или лучше не сделать?
Уточню, что картинки от мусора не чистил (пост обработка).

Всего записей: 36 | Зарегистр. 07-05-2012 | Отправлено: 12:56 25-03-2015 | Исправлено: rzia, 12:59 25-03-2015
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
rzia

Цитата:
Но все же, может быть кто-то сможет сделать лучший вариант чем у меня, или лучше не сделать?

Очень сомневаюсь, что в рамках СК можно заметно улучшить Ваш вариант.
Я не силен в вопросе распознавания, но попробуйте распознать свои страницы, м.б. оно (распознавание) как-то свяжет буквы с изъянами с нормальными и даст возможность подменить плохие.
Правда, букву "к" в выражении "постройКи аэроплановъ", находящемся в нижней части в первой колонки стр.201, никакая программа не спасет из-за дефекта в исходном скане.
Лично меня при просмотре Вашего варианта наличие мелкого мусора раздражает не меньше, чем дефекты отдельных букв, а попытки убрать их неручным способом приведут к еще большим разрушениям в тексте.
Возможно, я заблуждаюсь...

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 13:48 25-03-2015
driver1991

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
 

Цитата:
оно (распознавание) как-то свяжет буквы с изъянами с нормальными и даст возможность подменить плохие.  

 
К сожалению - не помогает.
 
Я уже нескоькл месяцев вожусь с одной, плохо напечатанной, книгой и, вероятно, буду вынужден опубликовать ее как есть. Если интересуют исходники:
 
https://yadi.sk/i/3cNWQ-ErfWNai
 
По сторонам букв много вертикальных штрихов - это просвечивание, оставшееся на оригинале, книга напечатана фотокопированием, их никак не убрешь.
 
Выпадают также элементы букв. Это не восстанавливается.
 
Вопросы.
 
1. Т. к. элементы букв выпадают при сканировании, есть ли информация о том, как этого избежать? Занимался ли кто-нибудь этим? Пробовали ли различные режимы сканирования?
 
2. Вопрос по сканеру. Несколько томов одного и того же издания при цветном сканировании переплетов получаются разного цвета. Сканер не новый. Ухудшается ли цветопередача сканера с его "возрастом"? Можно ли ее восстановить настройками?
 
3. Сканирование переплетов с обильной позолотой или серебрением. Есть ли возможность получить приличное изображение?
 
 

Всего записей: 376 | Зарегистр. 12-09-2011 | Отправлено: 15:44 25-03-2015
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
driver1991
Вряд ли эти вопросы относятся к этой теме, лучше спрашивать их, например, здесь.
 
P.S. Приведенный Вами пример автоматически обработать в СК (думаю, что и в любой другой программе) невозможно из-за дрянной полиграфии, а вручную очень долго и муторно.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 17:03 25-03-2015 | Исправлено: shch_vg, 17:08 25-03-2015
Ladina



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Прочитала с десяток страниц назад), пока больше рассуждений о том, каким должен быть хелп. Вот пока я ещё недалеко ушла от состояния полного чайника, выскажу своё мнение. Если бы я взалась в первый раз за книгу с отличным крупным шрифтом, не пришлось бы просить помощи), но у меня таких нет. Вот перед компом лежат три штуки, которые я бы хотела сделать в дежавю и с каждой свои трудности, в первую очередь со шрифтом. Мне бы гораздо больше помогли не статьи, а фотки, где, в каком меню какие значения выбираются, лишние слова как раз раздражают и мешают.) В идеале: название примера, допустим мелкий шрифт, серые фотки и по пунктам действия в кромсаторе без лишних слов.)
Когда начинаешь делать книгу, естественно, ищешь то, что поможет решить твою проблему. Мне думается, что при таком функционале проги, разумнее разделить хелп на конкретные темы, чтобы новичку легче было выделить нужное ему. Азарт же появляется, когда хоть что-то получилось.)  
Сейчас буду искать всю инфу по цветному тексту и кодировке его в крамсаторе. Жёлтый, причём на первых страницах куски достаточно насыщенного цвета, а ближе к концу книги бледно-жёлтые, еле читаемые. Был бы пример с картинками...) Это я мечтаю.

Всего записей: 695 | Зарегистр. 28-01-2012 | Отправлено: 21:00 28-03-2015 | Исправлено: Ladina, 01:02 29-03-2015
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Ladina

Цитата:
Быб бы пример с картинками...) Это я мечтаю.

Мечтать не вредно!
Пример с картинками будет, когда Вы его сделаете...
Мне вот интересно: Вы сейчас немного научитесь что-то делать в СК и сразу станете составлять хелпы и примеры с картинками?
 
К чему это я?  
Ах, да!
Не надо строить никаких иллюзий, здесь максимум можно получить ответ на какой-нибудь КОНКРЕТНЫЙ вопрос, а хелп может появиться, если Вы сами его напишите.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 22:12 28-03-2015 | Исправлено: shch_vg, 22:14 28-03-2015
nikson89

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Page - special... - Fixed deskew angle
Как, изменяя тут значения, получать/видеть результат не прибегая к запуску обработки скана? Т.е. можно ли наблюдать изменения угла наклона в интерактивном режиме (по аналогии с функцией apply to whole image у quality) ?
Про "включаем режим линейки Image -> Ruler проводим линию, держа ЛКМ" знаю.

Всего записей: 225 | Зарегистр. 09-11-2007 | Отправлено: 19:07 29-03-2015 | Исправлено: nikson89, 20:29 29-03-2015
nick444



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как у Кромсаторов с поддержкой многоядерных процессоров? У меня на i5 и i7 загрузка не выше 15 процентов, поэтому сканы обрабатываются дольше, чем могли бы при полном использовании возможностей процессора. Возможно ли что-то с этим сделать?

----------
Heaven or hell, LETS ROCK!.

Всего записей: 704 | Зарегистр. 04-11-2005 | Отправлено: 00:57 08-04-2015
Gazoved

Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
nick444, Пока никак
Я когда-то писал уже.
 
Автор: Gazoved, Отправлено:13:43 15-03-2014
 
Дорогие коллеги, кто-нибудь проверял какие из параметров компьютера влияют в наибольшей степени на скорость обработки изображений+есть ли зависимость от версии и типа ОС (операционной системы)?
 
Я провел небольшой тест, не совсем корректный, были различные ОС.
Для теста была использована некая книжка, которая обрабатывалась на 4-ех машинах.
Машины:
 
1. Два четырехъядерных процессора с поддержкой HT (2х Xeon E5620 @ 2.40GHz), 16 ГБ DDR3 ECC 1333MHz, дисковая подсистема для ОС (RAID10) и рабочего диска (RAID10) - раздельные на базе LSI MegaRAID SAS 9260-4i на дисках Seagate ST3250310NS, ОС - Windows Server 2012
 
2. Один двухъядерный процессор DualCore Athlon 64 X2 4600+ @ 2.40GHz, 4 ГБ DDR 400MHz, HDD для ОС - INTEL SSDSA2M080G2GC, рабочий диск (RAID6) - на базе Adaptec RAID ASR-51245 на 12 дисках Hitachi HDS722020ALA330, ОС - Windows Server 2003
 
3. Один двухъядерный процессор Mobile DualCore Core Duo T2600 @ 2.2GHz, 2 ГБ DDR2 667MHz, HDD один - INTEL SSDSA2M080G2GC, ОС - Windows XP Pro
 
4. Один четырехъядерных процессор Core i7 4500U @ 2.4GHz, 6 ГБ DDR3L 1600MHz, HDD один - 750 ГБ 5400, ОС - Windows 7 Pro
 
Время затраченное на DK (Draft kromsate) ЧЧ:ММ:
1. - 00:30; 2. - 00:45; 3. - 00:42; 4. - 00:19
 
Время затраченное на Process (параметры одинаковые) ЧЧ:ММ:
1. - 02:08; 2. - 04:17; 3. - 01:28; 4. - 02:07
 
Так что же в наибольшей степени влияет на скорость обработки и как ускорить обработку (помимо параллельного запуска нескольких копий и разделения между ядрами)?
 
bolega как-то упоминал уже 14:20 15-08-2014

Цитата:
Работа над новой версией СК почти подходит к завершению.
 
Новое:
 
- Обработка распределяется параллельно по нескольким процессорам/ядрам. Кол-во задействованных ядер задается пользователем: File->Options->Processing->Number of used cpu kernels.
 Скорость параллельной обработки в зависимости от используемых опций выросла в 2..5 раз (проверялось на 4-х ядерном i5).  
.....
 

Всего записей: 111 | Зарегистр. 03-05-2006 | Отправлено: 20:20 14-04-2015 | Исправлено: Gazoved, 13:19 15-04-2015
cuneiform

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Автор bolega пишет:
 
http://forum.ru-board.com/topic.cgi?forum=5&limit=1&m=1&start=1715&topic=24351
 
II.    Обработка
 
Обработка в текущей версии претерпела значительные изменения в части предоставления пользователю полного контроля над определением контура контента страниц и размерами итоговой книги.  
 
1. Улучшен алгоритм контурного анализа, предназначенного для определения контента страницы, т.е. контура текста/графики на скане. Новый алгоритм задействуется при включенной опции Smart contour на закладке Options. Опция включена по умолчанию, в том числе и для заданий, сохраненных в предыдущих версиях SK.  
 
Новый алгоритм практически полностью исключает во время обработки отрезания выступающих за основной контур одиночных символов и строк, например, номеров страниц.  
 
Оказывается, что это писалось в 2008 году и под хз какую версию. Теперь от этих методик не осталось и следа.
Может устаревшие инструкции надо убрать, что б с толку не сбивали? Ну нет этих опций и нефиг их искать.
А я вот посчитал, что отстал от жизни, и мне нужно осваивать эти новые методики финализованных и нефинализованных и некатегоризованных тасков. А оказывается что это все осталось в 2008 году.

Всего записей: 2061 | Зарегистр. 27-04-2006 | Отправлено: 15:06 18-04-2015 | Исправлено: cuneiform, 19:12 18-04-2015
leescott

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Oh!
Where to download new edition SK ? And else, Who could email a new edition SK to me?
Thanks!

Всего записей: 33 | Зарегистр. 13-11-2011 | Отправлено: 08:31 19-04-2015 | Исправлено: leescott, 08:33 19-04-2015
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » ScanKromsator / СканКромсатор (Часть 3)
gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru