Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91

Открыть новую тему     Написать ответ в эту тему

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: сканирование, обработка, сборка
 
 
Текущая версия программы: ScanKromsator v6.71 Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  Устаревшие версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...
 


ВАЖНО ! Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом... и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: shch_vg, 18:02 14-10-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я бы так делал
 
https://dropmefiles.com/WTbxr
 
(Белые буквы:
поставить ч/б пикчур зону, инвертировать, почистить, задать прозрачность белого через зеро-транспарент, инвертировать обратно)

Всего записей: 735 | Зарегистр. 13-06-2013 | Отправлено: 06:58 22-01-2019
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Возможно ли сейчас сделать Merge для внешних зон? Что-то у меня не вышло вчера в 6.2. В основном задании.

Всего записей: 1554 | Зарегистр. 15-07-2010 | Отправлено: 07:04 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Конечно можно. Обработку задания сделали после добавления внешних зон?

Всего записей: 3937 | Зарегистр. 09-09-2002 | Отправлено: 08:03 22-01-2019
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Чёрт, нет. Поставил зону и сделал merge.

Всего записей: 1554 | Зарегистр. 15-07-2010 | Отправлено: 08:07 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sergiokapone
Переключаетесь в режим зон. Щелкаете мышкой Ctrl-Shift-Click внутри букв, чтобы выделить внутренность. КМ - Special - White transparent. Причем можно сначала нащелкать, потом один раз задать прозрачность.
Никаких инвертирований как предлагает daa2013 не надо.
У двух букв есть разрыв в контуре, вот тут и пригодится limiter. Поставить их на месте разрыва перед тем как выделять, чтобы выделение не вышло за пределы внутренности буквы.

Всего записей: 3937 | Зарегистр. 09-09-2002 | Отправлено: 08:21 22-01-2019
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
у меня там был косячок, заметил поздно: одну зону не наложил куда следует. На однотипные участки скана. Обнаружил уже когда внешний вид страницы с оригиналом сравнивал, а это было после того как в VR зоны подчистил, цвета выправил. Подумал что раз зоны идентичные, можно влепить на скан внешнюю из файла уже имеющихся.
Бум знать.
 
---
в 6.4 кнопочки в визарде дежавю справа сверху торчат, какое-то доп.окошко без фактического наполнения. "EITabSheet4".
К слову, нетривиально зоны (step3) в визарде обрабатываются по новой кнопке. Я пока допёр - вспотел
 
---
ещё вопрос на понимание: если зона "few colors", то как будет отрабатываться раскраска Paint? Мне не удалось пока что получить в визарде дежавюшку с крашеным слоем, хоть ставь прозрачность, хоть не ставь. Это я пытаюсь обучиться по вотснью теме про учёт прозрачности ("при создании djvu учитывается текущее значение опции picture-зон transparent"). в MV раскраска видна, а дежавю её игнорит.

Всего записей: 1554 | Зарегистр. 15-07-2010 | Отправлено: 08:23 22-01-2019 | Исправлено: TelecomUral, 08:23 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Я же уже говорил. Зону поставили, но СК должен как минимум рассчитать ее положение на выходе, а если разворот, то еще и определить, к какой половинке зону прикрепить на выходе. Не говоря уже о том, что у зоны могут быть заданы какие-нибудь опции.

Всего записей: 3937 | Зарегистр. 09-09-2002 | Отправлено: 08:29 22-01-2019
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
СК должен как минимум рассчитать ее положение на выходе

да, я усвою постепенно, как это устроено. извините.

Всего записей: 1554 | Зарегистр. 15-07-2010 | Отправлено: 08:35 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Подумал что раз зоны идентичные, можно влепить на скан внешнюю из файла уже имеющихся.  

Зоны можно не обрабатывать, если это окончательное задание для создания djvu/Pdf. А для merge нужно обязательно.
 

Цитата:
ещё вопрос на понимание: если зона "few colors", то как будет отрабатываться раскраска Paint?

Самую мозоль раскопали  
Я до сих пор не решил, что делать с раскраской зоны с опцией "few colors".  
С одной стороны можно раскрашивать для универсальности, с другой стороны - ее ведь и так готовили с нужным набором цветов, зачем же их менять на этой стадии.  
В общем, сейчас для таких зон раскраска фона не выполняется (игнорируется), а вот "текст" красится.
И еще раз повторю: белый фон для малоцветных зон - это тоже цвет, который будет закрывать собой то, что под ним. Если нужно, чтобы не закрывал, достаточно включить в зоне опцию transparent.

Всего записей: 3937 | Зарегистр. 09-09-2002 | Отправлено: 08:49 22-01-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
sergiokapone
Переключаетесь в режим зон. Щелкаете мышкой Ctrl-Shift-Click внутри букв, чтобы выделить внутренность. КМ - Special - White transparent. Причем можно сначала нащелкать, потом один раз задать прозрачность.
Никаких инвертирований как предлагает daa2013 не надо.
У двух букв есть разрыв в контуре, вот тут и пригодится limiter. Поставить их на месте разрыва перед тем как выделять, чтобы выделение не вышло за пределы внутренности буквы.  

 
Увы, но так не получится.  Там со страшной силой просвечивает текст с задней стороны обложки, а бэкграундклинер зачищает дизерный градиент.
Поэтому приходится раскрашенной зоной делать свой градиент, на неё отдельно  накладывать черные контуры и обустраивать прозрачность. Тут у меня 4 зоны (градиент, рамки букв, черный текст, + беленькое с маской прозрачности).
 
Добавлено:

Цитата:
Я до сих пор не решил, что делать с раскраской зоны с опцией "few colors".  
С одной стороны можно раскрашивать для универсальности, с другой стороны - ее ведь и так готовили с нужным набором цветов, зачем же их менять на этой стадии.  

Я сильно удивился, когда в 6.3. Paint сработал для цветной зоны. Чистых (цветов там было три, но тип был Original), а она в итоге при создании джву стала двухцветной.
Если цветные красятся, то и малоцветные по идее должны красится.
Ну например у меня один комплект пар цветов, а на выходе я хочу получить другой - я просто включаю им Paint.
Т.е. реальные цвета - это одно, а включённая раскраска - это другое.
 
Я даже не думал, что может быть по другому.

Всего записей: 735 | Зарегистр. 13-06-2013 | Отправлено: 09:13 22-01-2019 | Исправлено: daa2013, 09:15 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
Увы, но так не получится

Я открыл его задание (там уже все бинаризовано, оставшийся мусор был убран и ничего не просвечивает, откуда вы это взяли??) и добавил прозрачность. Все получилось.  
А просвечивающий фон был убран автоматом еще во время обработки фильтром background substract

Всего записей: 3937 | Зарегистр. 09-09-2002 | Отправлено: 09:29 22-01-2019 | Исправлено: bolega, 09:32 22-01-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Упс. Получается, я что-то не то и не так открывал.  
(Судя по всему, наложил клинер и попортил его задание, а потом сразу стал джву и пдф делать)
Действительно, всё ОК там.

Всего записей: 735 | Зарегистр. 13-06-2013 | Отправлено: 09:37 22-01-2019 | Исправлено: daa2013, 09:39 22-01-2019
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
bolega

Цитата:
Если цветные красятся, то и малоцветные по идее должны красится

Да не факт. Я потому и стал пробовать на малоцветке, что это малоцветка, то есть специально созданная под конкретные цвета зона (а не как тот градиентный "эллипсоидный конус" с просвечиванием, что я в своей статейке про зоны показывал). На таких сложных примерах понимаешь быстрее, что к чему и как устроено внутри.
Только уж тогда логично блокировать галочки раскраски, которые не будут использоваться в визарде и pdf-ке.

Всего записей: 1554 | Зарегистр. 15-07-2010 | Отправлено: 10:22 22-01-2019 | Исправлено: TelecomUral, 11:19 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Чего еще не доделано в 6.4:
- не решен вопрос перекрытия few-color зон с раскрашенными зонами, да и просто с имеющимся на странице текстом (т.е. тоже передним слоем).  
- при импорте из Pdf страниц, в которых картинка (зона) развернута на +-90/180 градусов относительно медиа. Т.е. картинка хранится внутри pdf в портрете, а выводится на страницу ландшафтно или вверх ногами (такое мне встречалось). И это не то же самое, что поворот всей страницы со всем содержимым (с этим в СК все в порядке).  

Всего записей: 3937 | Зарегистр. 09-09-2002 | Отправлено: 10:59 22-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, daa2013 спасибо!
 
bolega, ловлю какой-то баг с tesseract-OCR

 
Вылет появился, когда я выбрал язык Ukrainian
 
 
 
 
 
 

Всего записей: 526 | Зарегистр. 07-06-2011 | Отправлено: 11:18 22-01-2019 | Исправлено: sergiokapone, 11:24 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sergiokapone
Используйте только ту версию dll, которую я когда-то выкладывал. Другие версии не совместимы.
А в какой момент это вылазит, в процессе обработки?

Всего записей: 3937 | Зарегистр. 09-09-2002 | Отправлено: 11:22 22-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, вылет появился, когда я выбрал язык Ukrainian, с Russian распознает без вылетов.
 

Цитата:
А в какой момент это вылазит, в процессе обработки?

Это уже после обработки, когда я захожу в MW Result->OCR
 
 
Добавлено:
ukr.traineddata брал здесь https://github.com/UB-Mannheim/tesseract/wiki
ocr.dll у меня с незапамятных времен 3 074 048 байт 2014 года

Всего записей: 526 | Зарегистр. 07-06-2011 | Отправлено: 11:27 22-01-2019 | Исправлено: sergiokapone, 11:34 22-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
tessdata тоже нужно от старой версии, 3.03
Возможно, подойдут это:
https://github.com/tesseract-ocr/tessdata/tree/3.04.00
 

Всего записей: 3937 | Зарегистр. 09-09-2002 | Отправлено: 11:52 22-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я до сих пор не решил, что делать с раскраской зоны с опцией "few colors".  
С одной стороны можно раскрашивать для универсальности, с другой стороны - ее ведь и так готовили с нужным набором цветов, зачем же их менять на этой стадии.  

 
А если на малоцветку нужно будет наложить градиентную заливку, например, как для B/W?
 
Добавлено:

Цитата:
Чего еще не доделано в 6.4:  
- не решен вопрос перекрытия few-color зон с раскрашенными зонами, да и просто с имеющимся на странице текстом (т.е. тоже передним слоем).  

 
А вот, только заметил пост, вопрос снимаю.

Всего записей: 526 | Зарегистр. 07-06-2011 | Отправлено: 12:12 22-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
tessdata тоже нужно от старой версии, 3.03  
Возможно, подойдут это:  
https://github.com/tesseract-ocr/tessdata/tree/3.04.00  

 
Да, подошло. Спасибо.

Всего записей: 526 | Зарегистр. 07-06-2011 | Отправлено: 17:54 22-01-2019
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru