Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, pdf-импорт
затягиваю в SK файл https://yadi.sk/i/hpEQUg9UWUON8w
все картинки помещаются в зоны, а вот текст куда-то пропадает.

Всего записей: 556 | Зарегистр. 07-06-2011 | Отправлено: 09:39 25-01-2019 | Исправлено: sergiokapone, 09:43 25-01-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А какой вариант лучше оставить?

ой... а может, не надо править имена... Там так хорошо делилось на "show" для инструментов и "toggle" для режимов/процессов. Я когда-то давно это уяснил и влёгкую стал находить нужные хоткеи в списке.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 09:49 25-01-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 Там минусов больше чем плюсов: нет контроля базовой линии, ошибки распознавания, наклонные/жирные шрифты, разные семейства шрифтов и т.п. Я не уверен, что tesseract все это отдает. Текст он хорошо распознает, а вот правильно ли он детектирует шрифты и их размеры, большой вопрос.  

 
При ручном контроле за шрифтами. Например такие замены делать только для текущей закладки глифов и в выделенной пользователем на основном изображении участке. И только те буквы, которые на этой закладке есть.
Автозамена позиционирует в 99.9% случаях верно. Тессеракт опознает главное - ячейку, где она стоит, и саму букву. Базовая линия тут вообще не нужна. За разные шрифты согласен, но тут пользователь может руками выделить участок, где шрифт един.И переключиться на ту закладку глифов, где этот шрифт собран.
 
Да даже если по словам, а не по абзацам так делать - ускорение чистки на порядок. Уходят действия по выбору букв и их расстановке.  

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 09:54 25-01-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
проще перенабрать книгу на основе тессеракта, чем так утончённо работать со сканом.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 10:06 25-01-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мне не надо всю книгу, мне надо плохой участок.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 10:13 25-01-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
я про плохой участок и говорю. У вас будут скрытые ручные действия, bolega, на мой взгляд, верно отмечает - плохие распознавания и т.п. Если уж человек опознаёт участок как "плохой", то автоматика и подавно споткнётся. Овчинка выделки не будет стоить.
 
Upd
Сейчас ведь хорошо налажено: сканы публикуются чистенькие насколько возможно, и под них подкладывается распознанный слой. Его-то и можно отдельно выправить перед подкладыванием.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 10:19 25-01-2019 | Исправлено: TelecomUral, 10:22 25-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sergiokapone

Цитата:
вот текст куда-то пропадает

СК не импортирует векторный текст, только картинки.
Растеризация текста - это отдельная история, за которую даже браться не хочу. Все-таки СК нужен для обработки сканов, а смысла дербанить идеальный векторный шрифт нет никакого. Вот картинки из pdf достать куда ни шло, мало ли понадобятся.
 
Добавлено:
daa2013

Цитата:
Тессеракт опознает главное - ячейку, где она стоит, и саму букву.

Ну можно будет попробовать как-нибудь. Кстати, именно так я и планировал бороться с самым ужасным злом - марашками. Но все руки не дойдут.
 
Добавлено:
В 6.4 сам нашел 2 бага.  
В djvu-визарде неправильно копируются индивидуальные опции по команде copy state. А также намудрил при расщеплении блитов в случае контактирующих цветов в раскрашенных зонах. Оптимизировал эту фичу и привнес ошибку. Но она проявляется явно, путем выдачи диагностического сообщения при кодировании, в лог тоже пишется о неудаче, так что незаметно это не пройдет.

Всего записей: 4431 | Зарегистр. 09-09-2002 | Отправлено: 10:31 25-01-2019
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral

Цитата:
ой... а может, не надо править имена... Там так хорошо делилось на "show" для инструментов и "toggle" для режимов/процессов. Я когда-то давно это уяснил и влёгкую стал находить нужные хоткеи в списке.

Ключевое место здесь "когда-то давно это уяснил". Я вот не уяснил и тыкался с этим. В Вашем варианте есть одно лишнее звено - понимание, это инструмент или режим/процесс (Увы, для меня определить это не так просто), и лишь потом поиск нужного хоткея. Проще унифицировать и сразу его искать, не заморачиваясь.  
 
bolega
Лично для меня понятнее "Show/hide".
 
Кстати, у меня висели в 6.00.5 хоткеи на fit height и fit width.
Поместил 6.4 в ту же директорию и обнаружил, что хоткей fit height в новой версии на месте, а хоткей fit width оказался пустым. Свою комбинацию нашел на хоткее Toggle fit width, что не есть хорошо, т.к. по этому хоткею не только происходит переключение, но и простановка галочки в ниспадающем меню лупы+, чего я избегал, присваивая хоткеи.
Удалил в 6.4 Toggle fit width и активировал fit width, но в 6.00.5 этот хоткей (fit width) так и остался неактивированным.

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 14:57 25-01-2019 | Исправлено: shch_vg, 15:25 25-01-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
в окне RV
не ставятся вторые цифры 1 2 3 в окне "допустимое отклонение чистящего цвета", вместо этого переключается цвет заливки. Т.е. он реагирует как если бы контрол был зажат, а он не зажат. Попробуйте набрать 11, 22, 33.
 
 
 
Добавлено:
Сбросил все опции 4-ё маркировочной, установил зону во всю станицу, нажал процесс.
В RV пишет, что зона на пиксель меньше основной страницы и по вертикали и по горизонтали

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 15:50 25-01-2019
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
spt привязано к 6.00.5.
Делаю в 6.4 sub-task на выделенные сканы, каковой стартует в СК 6.4.
В этом СК делаю out-task для дежавю с галкой в open out task in new window, каковой стартует в 6.00.5. Почему не как в случае с sub-task?

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 16:39 25-01-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Это потому что у вас оба в одной папке.
У меня 6.4. лежит отдельно, так там оут в этом случае просто не стартует, о чем я уже тут писал.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 16:41 25-01-2019
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013
Не вижу смысла разводить их по разным папкам, если это не противопоказано для идеологии самой программы.
 
Добавлено:
daa2013

Цитата:
У меня 6.4. лежит отдельно, так там оут в этом случае просто не стартует, о чем я уже тут писал.

Поместил 6.4 в отдельную директорию, вызвал задание, сделал саб-таск, затем в нем оут-таск, который нормально стартовал.

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 19:43 25-01-2019
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Обратил сейчас внимание на такое событие, которое наблюдается как в 6.00.5, так в 6.4. Перетаскиваю  из библиотеки глифов фрагмент, который помещается в то место, где в момент опускания находится мышь. Если же перед перетаскиванием я создам маленькую прямоугольную область на принимающем скане, то куда бы я не перетащил фрагмент, он появится не там, где в этот момент находится мышь, а там, где была создана прямоугольная область.
Это так и задумано?
Дело в том, что иногда, нажимая клавишу мыши, непроизвольно дергаешь ее, создавая практически незаметную прямоугольную область, а затем удивляешься, почему фрагмент появляется не в том месте, где сейчас находится мышь.

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 14:04 26-01-2019 | Исправлено: shch_vg, 14:09 26-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
Это так и задумано?  

Да. И это связано вообще со вставкой из кармана. Если есть выделение - вставляется в его верхний угол.

Цитата:
непроизвольно дергаешь ее

Прошу всех более не просить меня подстраивать СК под "закидоны" пользователей. Ну чес слово, смешно. У одного рука дергается, у другого ногу сводит, третий юзает полудохлую мышку и хочет, чтобы СК за него ее кнопки нажимал, четвертый, извините, громко пукает, и ему надо чтобы в этот момент СК заглушал это и т.д. и т.п.  
 

Всего записей: 4431 | Зарегистр. 09-09-2002 | Отправлено: 14:32 26-01-2019
Olexiy71

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Есть такое задание:
имеется книга, в ней всего два цвета черный и красный. То есть основной текст чёрный а комментарии в скобках красным текстом. Вопрос к знатокам - по какому алгоритму это безобразие обработать, чтобы хорошо получилось?

Всего записей: 10 | Зарегистр. 21-11-2018 | Отправлено: 01:42 27-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Olexiy71
 
Про такие вопросы иногда злобно отшучиваются "телепаты в отпуске".
Вы как хотите увидеть алгоритм, в виде блок-схемы?
 
Давайте sub-task, или парочку типичных страниц для примера, тогда можно будет уже что-то отвечать.

Всего записей: 556 | Зарегистр. 07-06-2011 | Отправлено: 09:58 27-01-2019 | Исправлено: sergiokapone, 10:00 27-01-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Меня смутил пункт whats new для 6.4. про опцию "Do not check dpi equality", так как у меня всё в 600 дпи. Нового проекта у меня пока нет, я на уже обработанных попробовал. И всё повторилось.  Зона пачкой не копируется, при постраничном копировании  руками выход забивается копиями основной страницы. Прилагаю субтаск.
Здесь на 4-й странице стоит раскрашенная зона. Если попытаться её скопировать на все последующие, то пасте пажес даст мисматч и не сделает. Если скопировать руками, то после обработки появятся дубли.
 
https://yadi.sk/d/HoZhWsHdLtIWyA
 
PS
кстати, а почему в *.spt  заголовок 6.2 ???
 
Добавлено:

Цитата:
третий юзает полудохлую мышку и хочет, чтобы СК за него ее кнопки нажимал,

Хоткей на ПКМ - это супер-пупер классная идея, а не закидон. На ноутбуке с трекболом/тачпадом пробовали ск юзать ? Это же старый принцип, и в старых виндовых прогах всегда так было: на всякий пожарный сделать так, чтобы всё можно было с клавы реализовать без мышки. (И наоборот, кстати, тоже.) Отрубилась мышь - значит врубить режим, чтобы стрелки перемещали курсор. и т.п. Пусть медленно и неудобно, но всегда есть возможность выкрутиться.
 

Цитата:
чтобы в этот момент СК заглушал это и т.д.

Внедрите в опции звуки на события. Та же тревожная кнопка, например, может не просто загораться, а одновременно какое-нибудь  дын-дын-дын выдавать.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 13:19 27-01-2019 | Исправлено: daa2013, 16:33 27-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
при постраничном копировании  руками выход забивается копиями основной страницы. Прилагаю субтаск.

Не смог воспроизвести на вашем примере. Может все-таки у вас запустился экземпляр СК от предыдущей версии?
 

Цитата:
почему в *.spt  заголовок 6.2

У файлов нумерация своя.
 

Цитата:
Хоткей на ПКМ - это супер-пупер классная идея

ОК
 

Цитата:
Внедрите в опции звуки на события

Это есть в планах.
 
 

Всего записей: 4431 | Зарегистр. 09-09-2002 | Отправлено: 22:35 27-01-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Запускал я 6.4, по команде меню About он пишет 6.4., в заголовке окна тоже написано Version 6.4, но я так вас понимаю, что при всём этом может исполняться и другая версия.  
А как тогда точно проверить ?  (UPD Под WinXP я могу ProcMon из  wininternals задействовать, тем более что я хотел вызовы отследить, что вместо cpaldjvu задействовано)
 
У меня воспроизводится и на Win7, и на WinXP. Скачал сейчас свой же субтаск.
Порядок действий после открытия субтаска:
- иду на файл 4
- кликаю по зоне мышкой, вижу грипы
- через км копи зоне ту клипборд
- иду на пятую, делаю пасте  зонес через км
- иду на шестую, делаю пасте  зонес через км
- запускаю кнопку процесс с панели команд
- получаю дубли на 5, 6 (любые страницы, где делал пасте)
 
А мисматч на команде пасте ту пажес наблюдали ?

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 23:28 27-01-2019 | Исправлено: daa2013, 23:45 27-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
 

Цитата:
 
У меня воспроизводится и на Win7, и на WinXP. Скачал сейчас свой же субтаск.  
Порядок действий после открытия субтаска:  
- иду на файл 4  
- кликаю по зоне мышкой, вижу грипы  
- через км копи зоне ту клипборд  
- иду на пятую, делаю пасте  зонес через км  
- иду на шестую, делаю пасте  зонес через км  
- запускаю кнопку процесс с панели команд  
- получаю дубли на 5, 6 (любые страницы, где делал пасте)  
 
А мисматч на команде пасте ту пажес наблюдали ?
 

 
Сделал по Вашему алгоритму, на Win 8.1 все ок, никаких дублей
 
Мисиматчи получил при paste zone to pages
 


Всего записей: 556 | Зарегистр. 07-06-2011 | Отправлено: 23:42 27-01-2019 | Исправлено: sergiokapone, 23:49 27-01-2019
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru