Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 4)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Открыть новую тему     Написать ответ в эту тему

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Начало обсуждения - 1 часть, 2 часть, 3 часть
 
Текущая версия: ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом...

Всего записей: 7218 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: TelecomUral, 15:00 20-12-2018
daa2013

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я бы так делал
 
https://dropmefiles.com/WTbxr
 
(Белые буквы:
поставить ч/б пикчур зону, инвертировать, почистить, задать прозрачность белого через зеро-транспарент, инвертировать обратно)

Всего записей: 556 | Зарегистр. 13-06-2013 | Отправлено: 06:58 22-01-2019
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Возможно ли сейчас сделать Merge для внешних зон? Что-то у меня не вышло вчера в 6.2. В основном задании.

Всего записей: 506 | Зарегистр. 15-07-2010 | Отправлено: 07:04 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Конечно можно. Обработку задания сделали после добавления внешних зон?

Всего записей: 3679 | Зарегистр. 09-09-2002 | Отправлено: 08:03 22-01-2019
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Чёрт, нет. Поставил зону и сделал merge.

Всего записей: 506 | Зарегистр. 15-07-2010 | Отправлено: 08:07 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sergiokapone
Переключаетесь в режим зон. Щелкаете мышкой Ctrl-Shift-Click внутри букв, чтобы выделить внутренность. КМ - Special - White transparent. Причем можно сначала нащелкать, потом один раз задать прозрачность.
Никаких инвертирований как предлагает daa2013 не надо.
У двух букв есть разрыв в контуре, вот тут и пригодится limiter. Поставить их на месте разрыва перед тем как выделять, чтобы выделение не вышло за пределы внутренности буквы.

Всего записей: 3679 | Зарегистр. 09-09-2002 | Отправлено: 08:21 22-01-2019
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
у меня там был косячок, заметил поздно: одну зону не наложил куда следует. На однотипные участки скана. Обнаружил уже когда внешний вид страницы с оригиналом сравнивал, а это было после того как в VR зоны подчистил, цвета выправил. Подумал что раз зоны идентичные, можно влепить на скан внешнюю из файла уже имеющихся.
Бум знать.
 
---
в 6.4 кнопочки в визарде дежавю справа сверху торчат, какое-то доп.окошко без фактического наполнения. "EITabSheet4".
К слову, нетривиально зоны (step3) в визарде обрабатываются по новой кнопке. Я пока допёр - вспотел
 
---
ещё вопрос на понимание: если зона "few colors", то как будет отрабатываться раскраска Paint? Мне не удалось пока что получить в визарде дежавюшку с крашеным слоем, хоть ставь прозрачность, хоть не ставь. Это я пытаюсь обучиться по вотснью теме про учёт прозрачности ("при создании djvu учитывается текущее значение опции picture-зон transparent"). в MV раскраска видна, а дежавю её игнорит.

Всего записей: 506 | Зарегистр. 15-07-2010 | Отправлено: 08:23 22-01-2019 | Исправлено: TelecomUral, 08:23 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Я же уже говорил. Зону поставили, но СК должен как минимум рассчитать ее положение на выходе, а если разворот, то еще и определить, к какой половинке зону прикрепить на выходе. Не говоря уже о том, что у зоны могут быть заданы какие-нибудь опции.

Всего записей: 3679 | Зарегистр. 09-09-2002 | Отправлено: 08:29 22-01-2019
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
СК должен как минимум рассчитать ее положение на выходе

да, я усвою постепенно, как это устроено. извините.

Всего записей: 506 | Зарегистр. 15-07-2010 | Отправлено: 08:35 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Подумал что раз зоны идентичные, можно влепить на скан внешнюю из файла уже имеющихся.  

Зоны можно не обрабатывать, если это окончательное задание для создания djvu/Pdf. А для merge нужно обязательно.
 

Цитата:
ещё вопрос на понимание: если зона "few colors", то как будет отрабатываться раскраска Paint?

Самую мозоль раскопали  
Я до сих пор не решил, что делать с раскраской зоны с опцией "few colors".  
С одной стороны можно раскрашивать для универсальности, с другой стороны - ее ведь и так готовили с нужным набором цветов, зачем же их менять на этой стадии.  
В общем, сейчас для таких зон раскраска фона не выполняется (игнорируется), а вот "текст" красится.
И еще раз повторю: белый фон для малоцветных зон - это тоже цвет, который будет закрывать собой то, что под ним. Если нужно, чтобы не закрывал, достаточно включить в зоне опцию transparent.

Всего записей: 3679 | Зарегистр. 09-09-2002 | Отправлено: 08:49 22-01-2019
daa2013

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
sergiokapone
Переключаетесь в режим зон. Щелкаете мышкой Ctrl-Shift-Click внутри букв, чтобы выделить внутренность. КМ - Special - White transparent. Причем можно сначала нащелкать, потом один раз задать прозрачность.
Никаких инвертирований как предлагает daa2013 не надо.
У двух букв есть разрыв в контуре, вот тут и пригодится limiter. Поставить их на месте разрыва перед тем как выделять, чтобы выделение не вышло за пределы внутренности буквы.  

 
Увы, но так не получится.  Там со страшной силой просвечивает текст с задней стороны обложки, а бэкграундклинер зачищает дизерный градиент.
Поэтому приходится раскрашенной зоной делать свой градиент, на неё отдельно  накладывать черные контуры и обустраивать прозрачность. Тут у меня 4 зоны (градиент, рамки букв, черный текст, + беленькое с маской прозрачности).
 
Добавлено:

Цитата:
Я до сих пор не решил, что делать с раскраской зоны с опцией "few colors".  
С одной стороны можно раскрашивать для универсальности, с другой стороны - ее ведь и так готовили с нужным набором цветов, зачем же их менять на этой стадии.  

Я сильно удивился, когда в 6.3. Paint сработал для цветной зоны. Чистых (цветов там было три, но тип был Original), а она в итоге при создании джву стала двухцветной.
Если цветные красятся, то и малоцветные по идее должны красится.
Ну например у меня один комплект пар цветов, а на выходе я хочу получить другой - я просто включаю им Paint.
Т.е. реальные цвета - это одно, а включённая раскраска - это другое.
 
Я даже не думал, что может быть по другому.

Всего записей: 556 | Зарегистр. 13-06-2013 | Отправлено: 09:13 22-01-2019 | Исправлено: daa2013, 09:15 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
Увы, но так не получится

Я открыл его задание (там уже все бинаризовано, оставшийся мусор был убран и ничего не просвечивает, откуда вы это взяли??) и добавил прозрачность. Все получилось.  
А просвечивающий фон был убран автоматом еще во время обработки фильтром background substract

Всего записей: 3679 | Зарегистр. 09-09-2002 | Отправлено: 09:29 22-01-2019 | Исправлено: bolega, 09:32 22-01-2019
daa2013

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Упс. Получается, я что-то не то и не так открывал.  
(Судя по всему, наложил клинер и попортил его задание, а потом сразу стал джву и пдф делать)
Действительно, всё ОК там.

Всего записей: 556 | Зарегистр. 13-06-2013 | Отправлено: 09:37 22-01-2019 | Исправлено: daa2013, 09:39 22-01-2019
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
bolega

Цитата:
Если цветные красятся, то и малоцветные по идее должны красится

Да не факт. Я потому и стал пробовать на малоцветке, что это малоцветка, то есть специально созданная под конкретные цвета зона (а не как тот градиентный "эллипсоидный конус" с просвечиванием, что я в своей статейке про зоны показывал). На таких сложных примерах понимаешь быстрее, что к чему и как устроено внутри.
Только уж тогда логично блокировать галочки раскраски, которые не будут использоваться в визарде и pdf-ке.

Всего записей: 506 | Зарегистр. 15-07-2010 | Отправлено: 10:22 22-01-2019 | Исправлено: TelecomUral, 11:19 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Чего еще не доделано в 6.4:
- не решен вопрос перекрытия few-color зон с раскрашенными зонами, да и просто с имеющимся на странице текстом (т.е. тоже передним слоем).  
- при импорте из Pdf страниц, в которых картинка (зона) развернута на +-90/180 градусов относительно медиа. Т.е. картинка хранится внутри pdf в портрете, а выводится на страницу ландшафтно или вверх ногами (такое мне встречалось). И это не то же самое, что поворот всей страницы со всем содержимым (с этим в СК все в порядке).  

Всего записей: 3679 | Зарегистр. 09-09-2002 | Отправлено: 10:59 22-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, daa2013 спасибо!
 
bolega, ловлю какой-то баг с tesseract-OCR

 
Вылет появился, когда я выбрал язык Ukrainian
 
 
 
 
 
 

Всего записей: 489 | Зарегистр. 07-06-2011 | Отправлено: 11:18 22-01-2019 | Исправлено: sergiokapone, 11:24 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sergiokapone
Используйте только ту версию dll, которую я когда-то выкладывал. Другие версии не совместимы.
А в какой момент это вылазит, в процессе обработки?

Всего записей: 3679 | Зарегистр. 09-09-2002 | Отправлено: 11:22 22-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, вылет появился, когда я выбрал язык Ukrainian, с Russian распознает без вылетов.
 

Цитата:
А в какой момент это вылазит, в процессе обработки?

Это уже после обработки, когда я захожу в MW Result->OCR
 
 
Добавлено:
ukr.traineddata брал здесь https://github.com/UB-Mannheim/tesseract/wiki
ocr.dll у меня с незапамятных времен 3 074 048 байт 2014 года

Всего записей: 489 | Зарегистр. 07-06-2011 | Отправлено: 11:27 22-01-2019 | Исправлено: sergiokapone, 11:34 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
tessdata тоже нужно от старой версии, 3.03
Возможно, подойдут это:
https://github.com/tesseract-ocr/tessdata/tree/3.04.00
 

Всего записей: 3679 | Зарегистр. 09-09-2002 | Отправлено: 11:52 22-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я до сих пор не решил, что делать с раскраской зоны с опцией "few colors".  
С одной стороны можно раскрашивать для универсальности, с другой стороны - ее ведь и так готовили с нужным набором цветов, зачем же их менять на этой стадии.  

 
А если на малоцветку нужно будет наложить градиентную заливку, например, как для B/W?
 
Добавлено:

Цитата:
Чего еще не доделано в 6.4:  
- не решен вопрос перекрытия few-color зон с раскрашенными зонами, да и просто с имеющимся на странице текстом (т.е. тоже передним слоем).  

 
А вот, только заметил пост, вопрос снимаю.

Всего записей: 489 | Зарегистр. 07-06-2011 | Отправлено: 12:12 22-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
tessdata тоже нужно от старой версии, 3.03  
Возможно, подойдут это:  
https://github.com/tesseract-ocr/tessdata/tree/3.04.00  

 
Да, подошло. Спасибо.

Всего записей: 489 | Зарегистр. 07-06-2011 | Отправлено: 17:54 22-01-2019
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 4)

Имя:
Пароль:
Сообщение

Для вставки имени, кликните на нем.

Опции сообщенияДобавить свою подпись
Подписаться на получение ответов по e-mail
Добавить тему в личные закладки
Разрешить смайлики?
Запретить коды


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2018

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru