Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 4)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

Открыть новую тему     Написать ответ в эту тему

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Начало обсуждения - 1 часть, 2 часть, 3 часть
 
Текущая версия: ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г. И более полная от 25.12.2018 Хрестоматия 2.1
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом...

Всего записей: 7378 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: TelecomUral, 17:03 29-06-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, pdf-импорт
затягиваю в SK файл https://yadi.sk/i/hpEQUg9UWUON8w
все картинки помещаются в зоны, а вот текст куда-то пропадает.

Всего записей: 493 | Зарегистр. 07-06-2011 | Отправлено: 09:39 25-01-2019 | Исправлено: sergiokapone, 09:43 25-01-2019
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А какой вариант лучше оставить?

ой... а может, не надо править имена... Там так хорошо делилось на "show" для инструментов и "toggle" для режимов/процессов. Я когда-то давно это уяснил и влёгкую стал находить нужные хоткеи в списке.

Всего записей: 583 | Зарегистр. 15-07-2010 | Отправлено: 09:49 25-01-2019
daa2013

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 Там минусов больше чем плюсов: нет контроля базовой линии, ошибки распознавания, наклонные/жирные шрифты, разные семейства шрифтов и т.п. Я не уверен, что tesseract все это отдает. Текст он хорошо распознает, а вот правильно ли он детектирует шрифты и их размеры, большой вопрос.  

 
При ручном контроле за шрифтами. Например такие замены делать только для текущей закладки глифов и в выделенной пользователем на основном изображении участке. И только те буквы, которые на этой закладке есть.
Автозамена позиционирует в 99.9% случаях верно. Тессеракт опознает главное - ячейку, где она стоит, и саму букву. Базовая линия тут вообще не нужна. За разные шрифты согласен, но тут пользователь может руками выделить участок, где шрифт един.И переключиться на ту закладку глифов, где этот шрифт собран.
 
Да даже если по словам, а не по абзацам так делать - ускорение чистки на порядок. Уходят действия по выбору букв и их расстановке.  

Всего записей: 574 | Зарегистр. 13-06-2013 | Отправлено: 09:54 25-01-2019
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
проще перенабрать книгу на основе тессеракта, чем так утончённо работать со сканом.

Всего записей: 583 | Зарегистр. 15-07-2010 | Отправлено: 10:06 25-01-2019
daa2013

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мне не надо всю книгу, мне надо плохой участок.

Всего записей: 574 | Зарегистр. 13-06-2013 | Отправлено: 10:13 25-01-2019
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
я про плохой участок и говорю. У вас будут скрытые ручные действия, bolega, на мой взгляд, верно отмечает - плохие распознавания и т.п. Если уж человек опознаёт участок как "плохой", то автоматика и подавно споткнётся. Овчинка выделки не будет стоить.
 
Upd
Сейчас ведь хорошо налажено: сканы публикуются чистенькие насколько возможно, и под них подкладывается распознанный слой. Его-то и можно отдельно выправить перед подкладыванием.

Всего записей: 583 | Зарегистр. 15-07-2010 | Отправлено: 10:19 25-01-2019 | Исправлено: TelecomUral, 10:22 25-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sergiokapone

Цитата:
вот текст куда-то пропадает

СК не импортирует векторный текст, только картинки.
Растеризация текста - это отдельная история, за которую даже браться не хочу. Все-таки СК нужен для обработки сканов, а смысла дербанить идеальный векторный шрифт нет никакого. Вот картинки из pdf достать куда ни шло, мало ли понадобятся.
 
Добавлено:
daa2013

Цитата:
Тессеракт опознает главное - ячейку, где она стоит, и саму букву.

Ну можно будет попробовать как-нибудь. Кстати, именно так я и планировал бороться с самым ужасным злом - марашками. Но все руки не дойдут.
 
Добавлено:
В 6.4 сам нашел 2 бага.  
В djvu-визарде неправильно копируются индивидуальные опции по команде copy state. А также намудрил при расщеплении блитов в случае контактирующих цветов в раскрашенных зонах. Оптимизировал эту фичу и привнес ошибку. Но она проявляется явно, путем выдачи диагностического сообщения при кодировании, в лог тоже пишется о неудаче, так что незаметно это не пройдет.

Всего записей: 3709 | Зарегистр. 09-09-2002 | Отправлено: 10:31 25-01-2019
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral

Цитата:
ой... а может, не надо править имена... Там так хорошо делилось на "show" для инструментов и "toggle" для режимов/процессов. Я когда-то давно это уяснил и влёгкую стал находить нужные хоткеи в списке.

Ключевое место здесь "когда-то давно это уяснил". Я вот не уяснил и тыкался с этим. В Вашем варианте есть одно лишнее звено - понимание, это инструмент или режим/процесс (Увы, для меня определить это не так просто), и лишь потом поиск нужного хоткея. Проще унифицировать и сразу его искать, не заморачиваясь.  
 
bolega
Лично для меня понятнее "Show/hide".
 
Кстати, у меня висели в 6.00.5 хоткеи на fit height и fit width.
Поместил 6.4 в ту же директорию и обнаружил, что хоткей fit height в новой версии на месте, а хоткей fit width оказался пустым. Свою комбинацию нашел на хоткее Toggle fit width, что не есть хорошо, т.к. по этому хоткею не только происходит переключение, но и простановка галочки в ниспадающем меню лупы+, чего я избегал, присваивая хоткеи.
Удалил в 6.4 Toggle fit width и активировал fit width, но в 6.00.5 этот хоткей (fit width) так и остался неактивированным.

Всего записей: 5461 | Зарегистр. 14-01-2005 | Отправлено: 14:57 25-01-2019 | Исправлено: shch_vg, 15:25 25-01-2019
daa2013

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
в окне RV
не ставятся вторые цифры 1 2 3 в окне "допустимое отклонение чистящего цвета", вместо этого переключается цвет заливки. Т.е. он реагирует как если бы контрол был зажат, а он не зажат. Попробуйте набрать 11, 22, 33.
 
 
 
Добавлено:
Сбросил все опции 4-ё маркировочной, установил зону во всю станицу, нажал процесс.
В RV пишет, что зона на пиксель меньше основной страницы и по вертикали и по горизонтали

Всего записей: 574 | Зарегистр. 13-06-2013 | Отправлено: 15:50 25-01-2019
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
spt привязано к 6.00.5.
Делаю в 6.4 sub-task на выделенные сканы, каковой стартует в СК 6.4.
В этом СК делаю out-task для дежавю с галкой в open out task in new window, каковой стартует в 6.00.5. Почему не как в случае с sub-task?

Всего записей: 5461 | Зарегистр. 14-01-2005 | Отправлено: 16:39 25-01-2019
daa2013

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Это потому что у вас оба в одной папке.
У меня 6.4. лежит отдельно, так там оут в этом случае просто не стартует, о чем я уже тут писал.

Всего записей: 574 | Зарегистр. 13-06-2013 | Отправлено: 16:41 25-01-2019
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013
Не вижу смысла разводить их по разным папкам, если это не противопоказано для идеологии самой программы.
 
Добавлено:
daa2013

Цитата:
У меня 6.4. лежит отдельно, так там оут в этом случае просто не стартует, о чем я уже тут писал.

Поместил 6.4 в отдельную директорию, вызвал задание, сделал саб-таск, затем в нем оут-таск, который нормально стартовал.

Всего записей: 5461 | Зарегистр. 14-01-2005 | Отправлено: 19:43 25-01-2019
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Обратил сейчас внимание на такое событие, которое наблюдается как в 6.00.5, так в 6.4. Перетаскиваю  из библиотеки глифов фрагмент, который помещается в то место, где в момент опускания находится мышь. Если же перед перетаскиванием я создам маленькую прямоугольную область на принимающем скане, то куда бы я не перетащил фрагмент, он появится не там, где в этот момент находится мышь, а там, где была создана прямоугольная область.
Это так и задумано?
Дело в том, что иногда, нажимая клавишу мыши, непроизвольно дергаешь ее, создавая практически незаметную прямоугольную область, а затем удивляешься, почему фрагмент появляется не в том месте, где сейчас находится мышь.

Всего записей: 5461 | Зарегистр. 14-01-2005 | Отправлено: 14:04 26-01-2019 | Исправлено: shch_vg, 14:09 26-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
Это так и задумано?  

Да. И это связано вообще со вставкой из кармана. Если есть выделение - вставляется в его верхний угол.

Цитата:
непроизвольно дергаешь ее

Прошу всех более не просить меня подстраивать СК под "закидоны" пользователей. Ну чес слово, смешно. У одного рука дергается, у другого ногу сводит, третий юзает полудохлую мышку и хочет, чтобы СК за него ее кнопки нажимал, четвертый, извините, громко пукает, и ему надо чтобы в этот момент СК заглушал это и т.д. и т.п.  
 

Всего записей: 3709 | Зарегистр. 09-09-2002 | Отправлено: 14:32 26-01-2019
Olexiy71

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Есть такое задание:
имеется книга, в ней всего два цвета черный и красный. То есть основной текст чёрный а комментарии в скобках красным текстом. Вопрос к знатокам - по какому алгоритму это безобразие обработать, чтобы хорошо получилось?

Всего записей: 10 | Зарегистр. 21-11-2018 | Отправлено: 01:42 27-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Olexiy71
 
Про такие вопросы иногда злобно отшучиваются "телепаты в отпуске".
Вы как хотите увидеть алгоритм, в виде блок-схемы?
 
Давайте sub-task, или парочку типичных страниц для примера, тогда можно будет уже что-то отвечать.

Всего записей: 493 | Зарегистр. 07-06-2011 | Отправлено: 09:58 27-01-2019 | Исправлено: sergiokapone, 10:00 27-01-2019
daa2013

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Меня смутил пункт whats new для 6.4. про опцию "Do not check dpi equality", так как у меня всё в 600 дпи. Нового проекта у меня пока нет, я на уже обработанных попробовал. И всё повторилось.  Зона пачкой не копируется, при постраничном копировании  руками выход забивается копиями основной страницы. Прилагаю субтаск.
Здесь на 4-й странице стоит раскрашенная зона. Если попытаться её скопировать на все последующие, то пасте пажес даст мисматч и не сделает. Если скопировать руками, то после обработки появятся дубли.
 
https://yadi.sk/d/HoZhWsHdLtIWyA
 
PS
кстати, а почему в *.spt  заголовок 6.2 ???
 
Добавлено:

Цитата:
третий юзает полудохлую мышку и хочет, чтобы СК за него ее кнопки нажимал,

Хоткей на ПКМ - это супер-пупер классная идея, а не закидон. На ноутбуке с трекболом/тачпадом пробовали ск юзать ? Это же старый принцип, и в старых виндовых прогах всегда так было: на всякий пожарный сделать так, чтобы всё можно было с клавы реализовать без мышки. (И наоборот, кстати, тоже.) Отрубилась мышь - значит врубить режим, чтобы стрелки перемещали курсор. и т.п. Пусть медленно и неудобно, но всегда есть возможность выкрутиться.
 

Цитата:
чтобы в этот момент СК заглушал это и т.д.

Внедрите в опции звуки на события. Та же тревожная кнопка, например, может не просто загораться, а одновременно какое-нибудь  дын-дын-дын выдавать.

Всего записей: 574 | Зарегистр. 13-06-2013 | Отправлено: 13:19 27-01-2019 | Исправлено: daa2013, 16:33 27-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
при постраничном копировании  руками выход забивается копиями основной страницы. Прилагаю субтаск.

Не смог воспроизвести на вашем примере. Может все-таки у вас запустился экземпляр СК от предыдущей версии?
 

Цитата:
почему в *.spt  заголовок 6.2

У файлов нумерация своя.
 

Цитата:
Хоткей на ПКМ - это супер-пупер классная идея

ОК
 

Цитата:
Внедрите в опции звуки на события

Это есть в планах.
 
 

Всего записей: 3709 | Зарегистр. 09-09-2002 | Отправлено: 22:35 27-01-2019
daa2013

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Запускал я 6.4, по команде меню About он пишет 6.4., в заголовке окна тоже написано Version 6.4, но я так вас понимаю, что при всём этом может исполняться и другая версия.  
А как тогда точно проверить ?  (UPD Под WinXP я могу ProcMon из  wininternals задействовать, тем более что я хотел вызовы отследить, что вместо cpaldjvu задействовано)
 
У меня воспроизводится и на Win7, и на WinXP. Скачал сейчас свой же субтаск.
Порядок действий после открытия субтаска:
- иду на файл 4
- кликаю по зоне мышкой, вижу грипы
- через км копи зоне ту клипборд
- иду на пятую, делаю пасте  зонес через км
- иду на шестую, делаю пасте  зонес через км
- запускаю кнопку процесс с панели команд
- получаю дубли на 5, 6 (любые страницы, где делал пасте)
 
А мисматч на команде пасте ту пажес наблюдали ?

Всего записей: 574 | Зарегистр. 13-06-2013 | Отправлено: 23:28 27-01-2019 | Исправлено: daa2013, 23:45 27-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
 

Цитата:
 
У меня воспроизводится и на Win7, и на WinXP. Скачал сейчас свой же субтаск.  
Порядок действий после открытия субтаска:  
- иду на файл 4  
- кликаю по зоне мышкой, вижу грипы  
- через км копи зоне ту клипборд  
- иду на пятую, делаю пасте  зонес через км  
- иду на шестую, делаю пасте  зонес через км  
- запускаю кнопку процесс с панели команд  
- получаю дубли на 5, 6 (любые страницы, где делал пасте)  
 
А мисматч на команде пасте ту пажес наблюдали ?
 

 
Сделал по Вашему алгоритму, на Win 8.1 все ок, никаких дублей
 
Мисиматчи получил при paste zone to pages
 


Всего записей: 493 | Зарегистр. 07-06-2011 | Отправлено: 23:42 27-01-2019 | Исправлено: sergiokapone, 23:49 27-01-2019
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 4)

Имя:
Пароль:
Сообщение

Для вставки имени, кликните на нем.

Опции сообщенияДобавить свою подпись
Подписаться на получение ответов по e-mail
Добавить тему в личные закладки
Разрешить смайлики?
Запретить коды


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2018

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru