Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
угу, спасибо!
 
Добавлено:
bolega
Хочу после хоткея "convert to ellipse selection" добавить область (через Shift). Однако при первом же нажатии ЛКМ эллиптическое выделение пропадает. Сие есть баг или фича?
Вопрос вызван примером от zaaley на publ.lib.ru про книгу Челышева. Там картинка не просто эллипс, а с выступающими за контур уголочками. Хотел их захватить через полигональные области в эту же зону.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 11:46 01-02-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Хочу после хоткея "convert to ellipse selection"  

В MW или VR?
Не смог воспроизвести. Ни там, ни там

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 16:15 01-02-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
В MV.
Странно, и я не смог повторить, как ни бился. Всё чётко работает. А предыдущий запущенный экземпляр - не хотел объединять области. Именно при хоткее на эллипс. Я раза три проверил.
Ну ладно, подождём
 
UPD
сейчас посоображал, в чём отличие в поведении экземпляров. При попадании мышки на эллиптическое выделение вид курсора не менялся, оставался стандартной стрелочкой-указателем. Контур пунктирный был виден, а действия - как будто его нет.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 16:46 01-02-2022 | Исправлено: TelecomUral, 16:53 01-02-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
В новой версии есть режим принудительного мультивыделения. Правда, пока только для VR
 
Добавлено:

Цитата:
а действия - как будто его нет.

Может, зона как-то повлияла? Или включенный режим mouse-up. Наложилось и получилась неуловимая комбинация для бага, такое бывает

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 16:54 01-02-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Не, всё проще Я таки вспомнил, и воспроизвёл.
Я тогда на прямоугольнике щёлкнул ПКМ, хотел Zoom selection вызвать. Но передумал, типа, нафиг тут точность. И щёлкнул мимо всплывшего меню на прямоугольник выделения, чтобы меню пропало. Вызвал хоткей, эллипс получился. А вот Shift+ЛКМ уже увы.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 17:04 01-02-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А я не воспроизвел. Да и не может меню повлиять на это

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 17:15 01-02-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
нда... неустойчиво...
Что-то тут не то.
А вот вспомогательный вопрос: если при нажатом Shift щёлкнуть и отпустить ЛКМ, выделение должно пропасть? Сейчас пропадает. Я вот присмотрелся сам к себе - может, это я косячу, в мелком масштабе просто мимо мелких кусочков промахиваюсь, и дело в том, дрогнула в это время мышь или нет - ? Увеличил эллипс по ширине экрана, и уловил этот нюанс - если мышь тянуть, то всё чётко плюсуется, а если щёлкнуть и отпустить, поняв, что ошибся с местом щелчка, то неустойчивое поведение. Я-то был уверен, что раз я Shift зажал и держу, то никаких пропаданий имеющегося выделения быть уже не должно. В других программах именно так привык.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 17:42 01-02-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
то никаких пропаданий имеющегося выделения быть уже не должно. В других программах именно так привык.

Я уже несколько раз объяснял, почему так. Редактор распознает действие пользователя не по нажатию мышки, а по ее отпусканию. Иначе неопределенность, что хотел сделать пользователь: выделить объект щелчком, или начать обычное выделение. Если в момент окончания щелчка есть выделение, значить было выделение, если нет - была попытка выбрать какой-то объект (например, зону или то же выделение) и тогда СК ищет что находится в точке щелчка.  
Обычно другие редакторы решают эту проблему введя кнопку, нажатие который переводит редактор в режим выбора объекта. В СК это было бы ужасно неудобно. Например, вы нарисовали зону и захотели ее тут же отредактировать, тогда нужно нажимать эту кнопку, потом снова отжимать и т.д.
И зачем каждый раз приводить в пример другие программы? У СК свои особенности интерфейса, заточенные под задание зон, mouse-up режимы и т.п.

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 18:54 01-02-2022 | Исправлено: bolega, 18:56 01-02-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подумал о следующем.
 
Не будут ли умляуты, ударения, диакритические знаки восприниматься как спеклы и вычищаться ? Может, для них какую-то доп.защиту встроить ?
Например:
а) встроенную в СК библиотеку таких знаков
б) для гласных букв принудительный показ пользователю спеклов в зоне расположения таких знаков (сверху буквы).
 
Добавлено:
Еще одна идея появилась.
Допустим, произошли замены внутри выделения или на всей странице.
Как понять полезны они или вредны ? Организовать переключение (мигание) было/стало по PageUp, например. !
Т.е. юзер жмет клавишу и переключается на было, еще раз на стало, затем снова было - и т.д.
При таком постоянном переключении глаз и заметит, что изменилось. А при непрерывном повторении и определит степень полезности.  
Но только это не автомигание, а именно по нжажтию клавиши переключение должно быть. И с достаточно высокой скоростью (индивидуально оптимальной для скорости чтения каждого пользователя).
 
 
 

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 20:39 01-02-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Не будут ли умляуты, ударения, диакритические знаки восприниматься как спеклы и вычищаться ?  

А есть примеры?
Если вы про обработку, задайте такие буквы как despeckle-protected на закладке Protect окошка exclusive page options. Ударения так уже не задашь, но они больше точек, а точки  при обычном despeckle не вычищаются.
 

Цитата:
юзер жмет клавишу и переключается на было, еще раз на стало, затем снова было  

Это делается через undo/redo. Redo пока в СК нет.

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 22:15 01-02-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
И зачем каждый раз приводить в пример другие программы?

для объяснения. Видите, я даже не заметил сначала, в чём отличие. Посчитал багом. Теперь понятно.
Замечу, что в режиме лассо щелчок и отпускание не приводят к "выбору объекта"

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 01:42 02-02-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А есть примеры?
 

 
https://disk.yandex.ru/d/soOk7rOmN1U0Tg
 
Левое и правое ударения:
   
 
поэтому я тут сам не сразу сообразил, что это тоже ударения
   
 
 
Здесь - такой знак встречается только один раз на всю книгу:
   
 
 
Добавлено:

Цитата:
Это делается через undo/redo. Redo пока в СК нет.

 
Чтобы не мышью, а с клавы это делать, им будут нужны хоткеи.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 04:31 02-02-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
И еще возникла мысль. Вот я делаю Анду-Реду. Вижу ошибочную замену и втыкиваю правильный глиф. Ведь после этого Анду-Реду прекратит работу ? и будет помнить только последнюю коррекцию ?  
А хотелось бы чтобы он как-то фиксировался именно на большой замене области или страницы  (возможно, большой замене+малой коррекции), чтобы можно было переключением было-стало проверять дальше.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 07:08 02-02-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Замечу, что в режиме лассо щелчок и отпускание не приводят к "выбору объекта"

И это специально. Иначе нельзя было бы поставить вершину в месте, уже занятом зоной.
 

Цитата:
Ведь после этого Анду-Реду прекратит работу ?

Да. Тогда undo/redo не пойдет.  
Кстати, в окошке preview сейчас так и сделано. Там выводится наложение глифа на букву скана и цветами показано расхождение. Если нажать ЛКМ, будет показан результат наложения, если нажать ПКМ, будет показана исходная буква.
 
Добавлено:

Цитата:
https://disk.yandex.ru/d/soOk7rOmN1U0Tg  

И что именно у вас там пропадает, и при каких параметрах обработки?

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 08:40 02-02-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Поскольку новой версии у меня нет, то я всё делаю ручками, и у меня ничего не пропадает
Но, если я при контроле глазами нахожусь на грани ошибки, то возникают опасения, что для  авто-режимов не помешает дополнительный контроль.
 
Повторно сформулирую идею: если удаляемый спекл/марашка находится в чувствительной области (вверху гласной буквы), то принудительно показать этот участок юзеру для дополнительного подтверждения действия по удалению. Возможно не всегда, а когда включен некий параметр "контроль диакритики".  
 
https://ru.wikipedia.org/wiki/%D0%94%D0%B8%D0%B0%D0%BA%D1%80%D0%B8%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B5_%D0%B7%D0%BD%D0%B0%D0%BA%D0%B8
 
Добавлено:

Цитата:
Кстати, в окошке preview сейчас так и сделано. Там выводится наложение глифа на букву скана и цветами показано расхождение. Если нажать ЛКМ, будет показан результат наложения, если нажать ПКМ, будет показана исходная буква.  

Проблема тут в том, что для контроля правильности нужно видеть слово целиком, иногда даже в тексте:
 
Это исходник, если что:
 

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 08:55 02-02-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Повторно сформулирую идею: если удаляемый спекл/марашка находится в чувствительной области (вверху гласной буквы), то принудительно показать этот участок юзеру

А я повторно поинтересуюсь: про какое удаление идет речь. Во время обработки никакого показа не предусмотрено. Это невозможно. В окне VR подсветка есть и сейчас. Смотрите и контролируйте сколько хотите. Я не пойму, что вы хотите.

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 09:11 02-02-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А есть примеры?

https://disk.yandex.ru/d/HPZuwoN61NGAzA
особенно U с двумя штришками сверху. 10я строка в списке l4_0031a.jpg

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 09:14 02-02-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вы дали пример обработанных сканов, похоже по методике начала 2000-х. Что вы там собрались обрабатывать? Мы обсуждаем замену глифов. Какое отношение к этому имеет удаление спеклов?

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 09:16 02-02-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
мотрите и контролируйте сколько хотите. Я не пойму, что вы хотите.

 
Хорошо.
Буду копить примеры и когда появится новая версия, и если с этим будут наблюдаться проблемы, то тогда сформулирую идею повторно и конкретнее. Книг с диакритикой, кстати, мне тоже ранее как-то особо не попадалось.
В данный момент я ничего не хочу. Я делюсь идеями, которые у меня возникают о работе программы, которую я еще не крутил и опираюсь пока только на собственные представления о её функционировании.
 
Добавлено:

Цитата:
Вы дали пример обработанных сканов, похоже по методике начала 2000-х. Что вы там собрались обрабатывать? Мы обсуждаем замену глифов. Какое отношение к этому имеет удаление спеклов?

Я там буквы с глифами восстанавливаю.
 
Добавлено:

Цитата:
Какое отношение к этому имеет удаление спеклов?  

Кажется понял вопрос.
 
Вот я задал параметр отбора "разорванная буква" (из N частей). Он эквивалентен моему буква+спекл (красная буква) - т.е. в ячейке тессеракта помимо буквы есть еще какой-то штришок. Происходит замена, штришок пропадает. А это та-дам - была диакритика.
 
Добавлено:
Ну, или наплыв сверху +20%
   
 
Добавлено:
Или там триггер какой есть, удалять не удалять спеклы внутри ячеек при замене на идеальные глифы  ?

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 09:25 02-02-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
особенно U с двумя штришками сверху. 10я строка в списке l4_0031a.jpg

О, известный случай - список литературы на нескольких языках. Хуже не придумаешь. Я обычно задаю для таких страниц despeckle=fine-2. И все получается нормально.
Попробовал ради интереса сделать ocr. Задал rus+eng+deu, получилось плохо, все немецкие диакритич. буквы распознались как английские. Задал rus+deu, получилось более-менее.  
 
daa2013

Цитата:
т.е. в ячейке тессеракта помимо буквы есть еще какой-то штришок. Происходит замена, штришок пропадает.  

Нет, СК делает не так. Все сложнее. Заменяется не ячейка тессеракта (это было бы слишком опасно), а ячейка глифа. Как правило, эти ячейки никогда не совпадают. Да и в любом случае размеры самих букв (эталона и реальной буквы скана) тоже не совпадают, после вклеивания по периметру в промежутке между ячейками глифа и тессеракта остается мусор. И вот здесь начинается самое интересное. Ранее надо было это мусор вычищать самому. Теперь есть режим, при котором СК сам чистит ошметки. Т.е. СК после замены буквы как бы прибирает в окрестностях замены, убирает спеклы и марашки. Размер спеклов используется тот же, что и при mouse-up-despeckle или подсветки. Если он стандартный, то потери маловероятны, но и чистка так себе. При оптимальном размере спеклов чистится намного лучше, но в примере  

Цитата:
Ну, или наплыв сверху +20%

действительно, диакритика удалится, т.к. касается буквы. Чтобы СК не трогал мусор (или похожее на мусор), нужно, чтобы он был хотя бы на 1 пиксел отстоял бы от ячейки глифа. Все, что касается ячейки и имеет размер меньше предельного спекла, будет удалено. Я назвал такую авто-зачистку remove  touching.
Если есть опасения на этот случай, то можно включить режим подсветки remove touching. Тогда вместо удаления всего того, что я описал выше, оно будет просто подсвечено. В этом случае удаление станет полностью контролируемым.
UPD
Можно в принципе усложнить remove touching, приняв для пространства над буквой другой порог размера спекла, сделав его более безопасным. Можно сделать это только для гласных, знать бы только как их отличать для других языков. Но повторю, если между ячейкой глифа и спеклом будет хотя бы одна пустая строка, СК спекл не тронет. Например, буквы "ё" как правило безопасно заменять буквой "е", точки не пострадают. То же и для "й"-"и".

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 10:17 02-02-2022 | Исправлено: bolega, 10:37 02-02-2022
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru