Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MrLAG

Цитата:
Проблема в том, что выбор этой опции для ч/б зон вообще ничего не меняет.  

Меняет, просто это работает по другому: у каждой зоны на закладке djvu есть опция Separate b/w-coding, вот если ее включить, то эта зона начнет кодироваться своим отдельным методом, который задан в "BW zones options" визарда djvu. Т.е. задание метода еще не достаточно, нужно еще указать, какие зоны будут его использовать, а это, похоже, вы не учли.
Кстати, сам я много лет пользуюсь этой возможностью, и там все работает как надо.
 

Цитата:
при включённой автоматической финализации  

что-то вы не договариваете , не верю, что один лишний вызов меню представляет неудобство. Ощущение, что это нужно не вам, а кому-то совсем уж ленивому. "Откройте мне правое веко...".
 
daa2013

Цитата:
Для некоторых книг, особенно если нет OCR, оказывается, бывает нужна постоянно повышенная точная позиционирования глифа

Тоже не верится, мне такие не встречались, где прям постоянно такие проблемы бы были. Как говорится, нет примера - нет фичи.

Всего записей: 4435 | Зарегистр. 09-09-2002 | Отправлено: 08:17 27-02-2023 | Исправлено: bolega, 08:36 27-02-2023
xMARx

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Если создать новую зону где-нибудь полностью внутри габарита страницы, то такой проблемы вообще не возникнет.

__1) Вроде правая зона находится внутри габарита страницы. Соответствующие галочки в оциях поставил
(restore zone position, crop b/w picture zones) поставил, но правая зона в приложенном задании все равно прыгает сильнее, чем хотелось бы.
ссылка на задание
__В задании, как и в прошлый раз, в начале обрабатываем страницу без зоны (выбираем exclude zone), а потом обрабатываем только правую зону.  
 
__2) В окне RV при использовании прямоугольного выделения, если нажать на точку вне выделенной области, то текущее выделение отменится, а новое выделение не начнется. Если же использовать полигональное выделение, то нажатие на точку вне выделения не только отменяет текущее, но и начинает новое. Может для единообразия имеет смысл сделать так, чтобы во втором случае при нажатии вне выделенной области, выделение  отменялось и только при втором нажатии начиналось новое выделение?
 
__Также, на всякий пожарный, повторю замечания из своего прошлого сообщения (19-02-2023 |), т.к. не уверен, что вы их увидели
__3) в окне RV почему-то не получается сделать так, чтобы комбинация ctrl+двойной клик меняла цвет ластика.
 
__4) у меня для движения области используется комбинация клавиш  ctrl+M. Если я выделю область (например, с символом) и нажму эту комбинацию два раза (поторопился или по другой причине), то символ нельзя будет стереть ластиком. Если потом сохранить страницу, выйти из окна  RV и войти, то символ пропадет. Может имеет смысл как-то исправить этот момент.

Всего записей: 66 | Зарегистр. 22-06-2009 | Отправлено: 21:33 28-02-2023 | Исправлено: xMARx, 21:36 28-02-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
xMARx
нажатие на точку вне выделения не только отменяет текущее, но и начинает новое. Может для единообразия имеет смысл  

при чём здесь единообразие, кому оно нужно на практике? Сейчас правильно сделано для полигонов, удобно выделять.

Всего записей: 3048 | Зарегистр. 15-07-2010 | Отправлено: 02:58 01-03-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Сейчас правильно сделано для полигонов, удобно выделять.

Имелось наверно в виду, что при таком поведении невозможно просто снять текущее выделение, находясь в режиме polygonal. Приходится либо отключать polygonal, либо делать двойной щелчок, чтобы тем самым задать пустое выделение, что кстати является аналогом ординарного щелчка при прямоуг. режиме. Так что на самом деле тут единообразие и есть, другое дело, что для снятия выделения нужно больше действий. Это так, и я не знаю как это обойти. Так, как предлагает xMARx, можно сделать, но тогда, наоборот, пропадет единообразие: для перехода от текущего выделения к новому нужно делать лишний щелчок, зато отменять выделение удобнее. Тут надо смотреть, что делается чаще.
 
xMARx

Цитата:
__3) в окне RV почему-то не получается сделать так, чтобы комбинация ctrl+двойной клик меняла цвет ластика

Для этого нужно, чтобы был активен режим чистки метелкой (зеленой или красной). Так и задумано. Т.к. в других режимах чистки двойной щелчок используется по другому, он контекстно-зависимый.
 

Цитата:
__4) у меня для движения области используется комбинация клавиш  ctrl+M

Исправлю.  
Спасибо

Всего записей: 4435 | Зарегистр. 09-09-2002 | Отправлено: 08:04 01-03-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Имелось наверно в виду, что при таком поведении невозможно просто снять текущее выделение, находясь в режиме polygonal.

Это мне понятно.  
Я практически не сталкивался с цепочкой "удалить выделение и снова его начать", это ж полигон. Промазал с точкой - ну сделай новую правильную, или на крайний случай поправь потом узлы. Обычно - и мне даже часто - требуется "удалить ошибочно начатое полигональное выделение и переключиться на прямоугольный режим". Я просто тянусь к кнопке. Морально напрягает, линию тянуть, но работает
А так - двойной щелчок, чтобы снять выделение, это вполне удобно.

Всего записей: 3048 | Зарегистр. 15-07-2010 | Отправлено: 09:10 01-03-2023
xMARx

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
...
Для этого нужно, чтобы был активен режим чистки метелкой (зеленой или красной). Так и задумано. Т.к. в других режимах чистки двойной щелчок используется по другому, он контекстно-зависимый.
...
 

__Но ведь двойной щелчок и crtl+двойной щелчок - это разные вещи. Или я  чего-то не понимаю? Я иногда исправляю картинки: в одном месте что-то удалю, в другом - нарисую, в третьем - снова удалю. Было бы удобно, если бы была возможность быстро менять цвет ластика. Это даже важнее в данном случае, чем менять форму.  
bolega, TelecomUral
__Двойной щелчок для отмены полигонального выделения на первый взгляд должен подойти.  
 
__Есть ли в планах ввести в программу автовыравнивание положения букв в слове по средней линии? Чтобы те буквы, которые от нее сильно отходили вверх или вниз, сдвигались в правильное положение.
 
 

Всего записей: 66 | Зарегистр. 22-06-2009 | Отправлено: 11:08 01-03-2023 | Исправлено: xMARx, 11:18 01-03-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xMARx
а как выравнивание букв с выступающими частями делать? Это же целая наука, выровнять шрифт по вертикали. Одни полуокруглости чего стоят, да и кернинг пар тоже "даст прикурить" алгоритмически.

Всего записей: 3048 | Зарегистр. 15-07-2010 | Отправлено: 11:52 01-03-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я иногда исправляю картинки: в одном месте что-то удалю, в другом - нарисую, в третьем - снова удалю. Было бы удобно, если бы была возможность быстро менять цвет ластика

Тогда скажите конкретно, в каких режимах чистки у вас не меняется цвет при Ctrl-дв.щелчок. Я сейчас проверил, практически во всех режимах (кроме ластика и transparent-mode) цвет меняется при Ctrl-дв.щелчок.
 

Цитата:
Есть ли в планах ввести в программу автовыравнивание положения букв в слове по средней линии?

К сожалению у меня нет алгоритма определения базовой линии. Фича конечно полезная, но увы.
 

Всего записей: 4435 | Зарегистр. 09-09-2002 | Отправлено: 11:53 01-03-2023
xMARx

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Тогда скажите конкретно, в каких режимах чистки у вас не меняется цвет при Ctrl-дв.щелчок. Я сейчас проверил, практически во всех режимах (кроме ластика и transparent-mode) цвет меняется при Ctrl-дв.щелчок.

__Ну я как раз и говорил про ластик, что исправляю им картинки. Удалил им что-то в одном месте, дорисовал в другом. Иногда исправляю картинки с помощью линии. Допустим, имеется линия, некоторые участки которой отсутствуют или у которой край рваный. Я исправляю это дело черной линией. Если край рваный, то могу, наоборот нарисовать рядом белую линию и край будет лучше смотреться.  
__UPD: С линией ситуация лучше: я могу выбрать вместе с ней одну из метелок и ее цвет можно будет менять с помощью ctrl+двойной клик.  
 
 

Цитата:
а как выравнивание букв с выступающими частями делать? Это же целая наука, выровнять шрифт по вертикали. Одни полуокруглости чего стоят, да и кернинг пар тоже "даст прикурить" алгоритмически.

 __Да я просто как пользователь интересуюсь. Алгоритмист в области обработки текста из меня вообще никакой.
 

Цитата:
К сожалению у меня нет алгоритма определения базовой линии. Фича конечно полезная, но увы.

__Просто хотел уточнить один момент. Представим, что мы заменяем вообще все буквы в слове. Каждой букве соответствует глиф. Для этого глифа СК может определить нижнюю границу, ну или ее может задать пользователь. И тогда СК надо будет заменить буквы в слове так, чтобы нижние границы были на одной линии. Я пропустил какой-то сложный момент?    
 
TelecomUral
bolega
__А вы не выравниваете, получается, буквы по высоте при обработке книг?

Всего записей: 66 | Зарегистр. 22-06-2009 | Отправлено: 12:32 01-03-2023 | Исправлено: xMARx, 13:11 01-03-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
у меня нет алгоритма определения базовой линии

разве что проанализировать книгу и вычислить б.л. у каждого глифа. В предположении нормальности отклонения положения глифа от теоретического идеала.

Всего записей: 3048 | Зарегистр. 15-07-2010 | Отправлено: 12:50 01-03-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Для этого глифа СК может определить нижнюю границу, ну или ее может задать пользователь.

Строки выравниваются по базовой линии.  
Базовая линия описывается в каждом конкретном шрифте.
В предыдущем предложении первые четыре слова лежат нижним краем на базовой линии. В следующих словах низ букв д,р,ф лежит ниже базовой линии. Вот выравнивание таких букв и составляет
Цитата:
какой-то сложный момент?  

В некоторых шрифтах даже для обычных, а также заглавных букв, нижний край может лежать ниже БЛ, из-за всяких замысловатых серифов. Именно из-за того, что низ буквы "гуляет", и используется понятие воображаемой базовой линии, на которой как на жердочке сидят буквы, кое-кто "свесив ножки". Некоторые символы, наоборот, "парят" над линией, например математические знаки, кавычки и другие знаки.
 
 
Добавлено:

Цитата:
Ну я как раз и говорил про ластик, что исправляю им картинки.

Так бы сразу и сказали, что нужно в режиме ластика добавить переключение цвета, а не описывать проблему как глобальный косяк.

Всего записей: 4435 | Зарегистр. 09-09-2002 | Отправлено: 13:14 01-03-2023 | Исправлено: bolega, 15:45 01-03-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
Строки выравниваются по базовой линии.  
Базовая линия описывается в каждом конкретном шрифте.

А если попробовать предварительную настройку выравнивания?
Для определенного шрифта выравнить все буквы понизу по этой линии и дать возможность попиксельно поправить в вертикальном направлении. После такой поправки производить будущие выравнивания по этой поправке. При наличии нескольких шрифтов делать это для каждого отдельно.
Запоминать эти поправки для возможности передачи их в последующие задания.
 
Другой вариант без предварительной настройки.
Делать выравнивание по базовой линии, как это считает программа.
При визуальном обнаружении диспропорции дать возможность выделить плохо выравненное слово и переместить неверно расположенную букву по вертикали с запоминанием сдвига для последующих выравниваний.
Результаты сдвига запоминать для каждого шрифта.
По мере продвижения по тексту информация по выравниванию будет дополняться.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 13:49 01-03-2023 | Исправлено: shch_vg, 14:00 01-03-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
БЛ - фича шрифта, то есть автора его. А не произвол юзера, как вы предлагаете.
Вполне устоявшееся понятие.
 

 
Другой вопрос, что для ручных шрифтов докомпьютерной эры вряд ли возможно найти эталонное описание этой линии. Тогда никто не заморачивался этим, ИМХО. Поэтому можно попробовать рассчитать. В некоторых книгах руки чешутся подравнять все буквы.

Всего записей: 3048 | Зарегистр. 15-07-2010 | Отправлено: 17:57 01-03-2023 | Исправлено: TelecomUral, 18:16 01-03-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral

Цитата:
В некоторых книгах руки чешутся подравнять все буквы.

Дело скорее даже не в этом, а в том, что, например, бывает на сгибах старых газет стертости.
Текст просматривается или можно догадаться, но слова и даже предложения приходится набирать вручную. Вот здесь подставляемые буквы и начинают прыгать по вертикали, нужна какая-то горизонтальная линия, на которую садится очередная буква, с возможностью попиксельно двигать букву по вертикали, да и по горизонтали не помешало бы.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 18:59 01-03-2023 | Исправлено: shch_vg, 19:03 01-03-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
кто ж вам не дает aux rectangle наложить, он для того и создан. По ПКМ в Special, при наличии выделения.
 


Всего записей: 3048 | Зарегистр. 15-07-2010 | Отправлено: 19:22 01-03-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
А если попробовать предварительную настройку выравнивания?  

Единственный надежный метод - использовать глифы, для которых вручную задана БЛ. Алгоритм мне в целом понятен. Осталось найти время все это реализовать.
 

Цитата:
даже предложения приходится набирать вручную.

Тут подход можно применить похожий.  
 
 
Добавлено:
daa2013

Цитата:
Для некоторых книг, особенно если нет OCR, оказывается, бывает нужна постоянно повышенная точная позиционирования глифа (уменьшенная зона поиска).  Приходится постоянно зажимать контрол, а еще иногда это мешает тасканию глифов.   Нельзя ли на закладке преференсов сделать чекбокс, который как бы напостоянно её включает.  

Для случая изорванных или сильно поврежденных букв (когда от них остаются только части) я придумал отдельный способ поиска позиционирования глифа, работает с обычной зоной поиска, но медленнее. Только не знаю как его лучше включать/отключать.

Всего записей: 4435 | Зарегистр. 09-09-2002 | Отправлено: 08:02 02-03-2023
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мою проблему решил бы чекбокс, включающий контрол.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 08:37 02-03-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral

Цитата:
кто ж вам не дает aux rectangle наложить, он для того и создан.

Не понял удобства этой фичи.
Она что, задает только горизонтальное направление, а буквы все равно выравнивать по вертикали вручную?
Я же предлагал автоматическое выравнивание по низу буквы, а буквы, у которых есть снизу выход за общий уровень (их немного) устанавливать вручную с запоминанием ее новой позиции.
Наверное, это действительно проще задавать на глифе указанием на нем базового уровня глифа и возможностью вручную попиксельно изменять этот уровень.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 00:53 04-03-2023 | Исправлено: shch_vg, 00:55 04-03-2023
romanef



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 И все таки, пожалуйста, подумайте над вариантами

 
есть чудесная программа автоматизации mouse robot

Всего записей: 668 | Зарегистр. 14-11-2003 | Отправлено: 15:43 04-03-2023
TeXpert



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Господа мастера!
 
Прошу обработать одну книгу, плохо сделанную
 
Заранее благодарен

----------
Майкудук, Пришахтинск не предлагать!:)
А на Пирогова приходит снова весенний гомон...

Всего записей: 3604 | Зарегистр. 08-02-2003 | Отправлено: 16:56 04-03-2023
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru