Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я бы так делал
 
https://dropmefiles.com/WTbxr
 
(Белые буквы:
поставить ч/б пикчур зону, инвертировать, почистить, задать прозрачность белого через зеро-транспарент, инвертировать обратно)

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 06:58 22-01-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Возможно ли сейчас сделать Merge для внешних зон? Что-то у меня не вышло вчера в 6.2. В основном задании.

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 07:04 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Конечно можно. Обработку задания сделали после добавления внешних зон?

Всего записей: 4442 | Зарегистр. 09-09-2002 | Отправлено: 08:03 22-01-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Чёрт, нет. Поставил зону и сделал merge.

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 08:07 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sergiokapone
Переключаетесь в режим зон. Щелкаете мышкой Ctrl-Shift-Click внутри букв, чтобы выделить внутренность. КМ - Special - White transparent. Причем можно сначала нащелкать, потом один раз задать прозрачность.
Никаких инвертирований как предлагает daa2013 не надо.
У двух букв есть разрыв в контуре, вот тут и пригодится limiter. Поставить их на месте разрыва перед тем как выделять, чтобы выделение не вышло за пределы внутренности буквы.

Всего записей: 4442 | Зарегистр. 09-09-2002 | Отправлено: 08:21 22-01-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
у меня там был косячок, заметил поздно: одну зону не наложил куда следует. На однотипные участки скана. Обнаружил уже когда внешний вид страницы с оригиналом сравнивал, а это было после того как в VR зоны подчистил, цвета выправил. Подумал что раз зоны идентичные, можно влепить на скан внешнюю из файла уже имеющихся.
Бум знать.
 
---
в 6.4 кнопочки в визарде дежавю справа сверху торчат, какое-то доп.окошко без фактического наполнения. "EITabSheet4".
К слову, нетривиально зоны (step3) в визарде обрабатываются по новой кнопке. Я пока допёр - вспотел
 
---
ещё вопрос на понимание: если зона "few colors", то как будет отрабатываться раскраска Paint? Мне не удалось пока что получить в визарде дежавюшку с крашеным слоем, хоть ставь прозрачность, хоть не ставь. Это я пытаюсь обучиться по вотснью теме про учёт прозрачности ("при создании djvu учитывается текущее значение опции picture-зон transparent"). в MV раскраска видна, а дежавю её игнорит.

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 08:23 22-01-2019 | Исправлено: TelecomUral, 08:23 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Я же уже говорил. Зону поставили, но СК должен как минимум рассчитать ее положение на выходе, а если разворот, то еще и определить, к какой половинке зону прикрепить на выходе. Не говоря уже о том, что у зоны могут быть заданы какие-нибудь опции.

Всего записей: 4442 | Зарегистр. 09-09-2002 | Отправлено: 08:29 22-01-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
СК должен как минимум рассчитать ее положение на выходе

да, я усвою постепенно, как это устроено. извините.

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 08:35 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Подумал что раз зоны идентичные, можно влепить на скан внешнюю из файла уже имеющихся.  

Зоны можно не обрабатывать, если это окончательное задание для создания djvu/Pdf. А для merge нужно обязательно.
 

Цитата:
ещё вопрос на понимание: если зона "few colors", то как будет отрабатываться раскраска Paint?

Самую мозоль раскопали  
Я до сих пор не решил, что делать с раскраской зоны с опцией "few colors".  
С одной стороны можно раскрашивать для универсальности, с другой стороны - ее ведь и так готовили с нужным набором цветов, зачем же их менять на этой стадии.  
В общем, сейчас для таких зон раскраска фона не выполняется (игнорируется), а вот "текст" красится.
И еще раз повторю: белый фон для малоцветных зон - это тоже цвет, который будет закрывать собой то, что под ним. Если нужно, чтобы не закрывал, достаточно включить в зоне опцию transparent.

Всего записей: 4442 | Зарегистр. 09-09-2002 | Отправлено: 08:49 22-01-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
sergiokapone
Переключаетесь в режим зон. Щелкаете мышкой Ctrl-Shift-Click внутри букв, чтобы выделить внутренность. КМ - Special - White transparent. Причем можно сначала нащелкать, потом один раз задать прозрачность.
Никаких инвертирований как предлагает daa2013 не надо.
У двух букв есть разрыв в контуре, вот тут и пригодится limiter. Поставить их на месте разрыва перед тем как выделять, чтобы выделение не вышло за пределы внутренности буквы.  

 
Увы, но так не получится.  Там со страшной силой просвечивает текст с задней стороны обложки, а бэкграундклинер зачищает дизерный градиент.
Поэтому приходится раскрашенной зоной делать свой градиент, на неё отдельно  накладывать черные контуры и обустраивать прозрачность. Тут у меня 4 зоны (градиент, рамки букв, черный текст, + беленькое с маской прозрачности).
 
Добавлено:

Цитата:
Я до сих пор не решил, что делать с раскраской зоны с опцией "few colors".  
С одной стороны можно раскрашивать для универсальности, с другой стороны - ее ведь и так готовили с нужным набором цветов, зачем же их менять на этой стадии.  

Я сильно удивился, когда в 6.3. Paint сработал для цветной зоны. Чистых (цветов там было три, но тип был Original), а она в итоге при создании джву стала двухцветной.
Если цветные красятся, то и малоцветные по идее должны красится.
Ну например у меня один комплект пар цветов, а на выходе я хочу получить другой - я просто включаю им Paint.
Т.е. реальные цвета - это одно, а включённая раскраска - это другое.
 
Я даже не думал, что может быть по другому.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 09:13 22-01-2019 | Исправлено: daa2013, 09:15 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
Увы, но так не получится

Я открыл его задание (там уже все бинаризовано, оставшийся мусор был убран и ничего не просвечивает, откуда вы это взяли??) и добавил прозрачность. Все получилось.  
А просвечивающий фон был убран автоматом еще во время обработки фильтром background substract

Всего записей: 4442 | Зарегистр. 09-09-2002 | Отправлено: 09:29 22-01-2019 | Исправлено: bolega, 09:32 22-01-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Упс. Получается, я что-то не то и не так открывал.  
(Судя по всему, наложил клинер и попортил его задание, а потом сразу стал джву и пдф делать)
Действительно, всё ОК там.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 09:37 22-01-2019 | Исправлено: daa2013, 09:39 22-01-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
bolega

Цитата:
Если цветные красятся, то и малоцветные по идее должны красится

Да не факт. Я потому и стал пробовать на малоцветке, что это малоцветка, то есть специально созданная под конкретные цвета зона (а не как тот градиентный "эллипсоидный конус" с просвечиванием, что я в своей статейке про зоны показывал). На таких сложных примерах понимаешь быстрее, что к чему и как устроено внутри.
Только уж тогда логично блокировать галочки раскраски, которые не будут использоваться в визарде и pdf-ке.

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 10:22 22-01-2019 | Исправлено: TelecomUral, 11:19 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Чего еще не доделано в 6.4:
- не решен вопрос перекрытия few-color зон с раскрашенными зонами, да и просто с имеющимся на странице текстом (т.е. тоже передним слоем).  
- при импорте из Pdf страниц, в которых картинка (зона) развернута на +-90/180 градусов относительно медиа. Т.е. картинка хранится внутри pdf в портрете, а выводится на страницу ландшафтно или вверх ногами (такое мне встречалось). И это не то же самое, что поворот всей страницы со всем содержимым (с этим в СК все в порядке).  

Всего записей: 4442 | Зарегистр. 09-09-2002 | Отправлено: 10:59 22-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, daa2013 спасибо!
 
bolega, ловлю какой-то баг с tesseract-OCR

 
Вылет появился, когда я выбрал язык Ukrainian
 
 
 
 
 
 

Всего записей: 556 | Зарегистр. 07-06-2011 | Отправлено: 11:18 22-01-2019 | Исправлено: sergiokapone, 11:24 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sergiokapone
Используйте только ту версию dll, которую я когда-то выкладывал. Другие версии не совместимы.
А в какой момент это вылазит, в процессе обработки?

Всего записей: 4442 | Зарегистр. 09-09-2002 | Отправлено: 11:22 22-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, вылет появился, когда я выбрал язык Ukrainian, с Russian распознает без вылетов.
 

Цитата:
А в какой момент это вылазит, в процессе обработки?

Это уже после обработки, когда я захожу в MW Result->OCR
 
 
Добавлено:
ukr.traineddata брал здесь https://github.com/UB-Mannheim/tesseract/wiki
ocr.dll у меня с незапамятных времен 3 074 048 байт 2014 года

Всего записей: 556 | Зарегистр. 07-06-2011 | Отправлено: 11:27 22-01-2019 | Исправлено: sergiokapone, 11:34 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
tessdata тоже нужно от старой версии, 3.03
Возможно, подойдут это:
https://github.com/tesseract-ocr/tessdata/tree/3.04.00
 

Всего записей: 4442 | Зарегистр. 09-09-2002 | Отправлено: 11:52 22-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я до сих пор не решил, что делать с раскраской зоны с опцией "few colors".  
С одной стороны можно раскрашивать для универсальности, с другой стороны - ее ведь и так готовили с нужным набором цветов, зачем же их менять на этой стадии.  

 
А если на малоцветку нужно будет наложить градиентную заливку, например, как для B/W?
 
Добавлено:

Цитата:
Чего еще не доделано в 6.4:  
- не решен вопрос перекрытия few-color зон с раскрашенными зонами, да и просто с имеющимся на странице текстом (т.е. тоже передним слоем).  

 
А вот, только заметил пост, вопрос снимаю.

Всего записей: 556 | Зарегистр. 07-06-2011 | Отправлено: 12:12 22-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
tessdata тоже нужно от старой версии, 3.03  
Возможно, подойдут это:  
https://github.com/tesseract-ocr/tessdata/tree/3.04.00  

 
Да, подошло. Спасибо.

Всего записей: 556 | Зарегистр. 07-06-2011 | Отправлено: 17:54 22-01-2019
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru