Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93

Открыть новую тему     Написать ответ в эту тему

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: сканирование, обработка, сборка
 
 
Текущая версия программы: ScanKromsator v6.71 Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  Устаревшие версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...
 


ВАЖНО ! Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом... и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: shch_vg, 18:02 14-10-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня тут идея возникла, просьба только сразу в штыки не воспринимать.
 
Можно ли научить СК импортировать некий файл с координатами пикчур зон и выставлять зоны по заранее известным координатам ?
Если да, то каковы должны быть требования к этому файлу ?

Всего записей: 742 | Зарегистр. 13-06-2013 | Отправлено: 07:14 25-04-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
Можно ли научить СК импортировать некий файл  

Можно

Цитата:
Если да, то каковы должны быть требования к этому файлу

Текстовый файл в произвольном формате. xml не желателен, но не критично
 
 
Добавлено:
daa2013

Цитата:
при драфте все резаки ставятся вертикально/горизонтально.  и я задолбался их наклонять вручную.

А так ли это нужно? Я вот с этим не заморачиваюсь. Если из-за сильного наклона верт. резак не может отрезать всю грязь, то и фиг с ним. Контур может определиться неверно, но так как из-за финализации контур можно всегда подкорректировать  вручную после обработки, я так и делаю.
В драфте определять наклон резаков у меня не получилось, оказалось архисложно.
По хорошему, для этого нужно определить skew (а с этим у СК бывают проблемы даже после обрезки, а что уж говорить об исходном скане). В свою очередь, чтобы определить skew, нужно сперва разрезать. Напоминает СТ, не правда ли?
В СК и СТ по разному работает поиск контента. В СТ детектируется грязь на краях, затем она удаляется и получается по сути готовый контент, т.к. к этому моменту страница уже подверглась deskew. В СК задача сложнее: нужно не удалять грязь, а всунуть резак между грязью и контентом. Я скажу, что это гораздо сложнее, чем просто детектировать и удалять грязь. Если бы грязь можно было удалять, задача намного бы для СК упростилась, но к сожалению это делать нельзя.

Всего записей: 3937 | Зарегистр. 09-09-2002 | Отправлено: 09:48 25-04-2019
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
насчёт импорта координат. как я понял, имя файла зон должно совпадать с именем графического файла где эти зоны, а внутри просто перечисление вершин с переводом каретки на каждую новую зону? И это всегда полигональная зона получится? Ну, классно. Ещё опционально в конце подхватывать ссылку на номер зоны-образца, откуда свойства брать, и было бы весьма неплохо.

Всего записей: 1565 | Зарегистр. 15-07-2010 | Отправлено: 10:08 25-04-2019
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Поэтому сильно удивился, что в 6.41

 
А где сейчас новые версии выкладываются?
 
Насчёт расстановки резаков - в большинстве случаев работа с рамкой страницы была бы быстрее.

Всего записей: 2861 | Зарегистр. 17-09-2001 | Отправлено: 10:26 25-04-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
имя файла зон должно совпадать с именем графического файла где эти зоны

Можно по всякому. Можно в один файл все записать, впереди каждой порции зон писать имя файла-скана, к которому зоны относятся. Порции отделять тэгами какими-нибудь. Можно для каждого скана свои файлы-описания зон делать. Программно можно любой вариант переварить. Главное, чтобы бы была однозначность и возможность пакетной обработки

Всего записей: 3937 | Зарегистр. 09-09-2002 | Отправлено: 10:48 25-04-2019
Archivist

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Можно ли научить СК импортировать некий файл с координатами пикчур зон и выставлять зоны по заранее известным координатам?
Вы подразумеваете использование данных из FR? Там вроде бы информация о зонах хранится в доступном виде в xml, но вопрос не изучал. Вот картинка с их сайта:
 
   
https://abbyy.technology/en:features:ocr:xml

Всего записей: 194 | Зарегистр. 10-08-2018 | Отправлено: 14:01 25-04-2019 | Исправлено: Archivist, 14:02 25-04-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В проекте есть более светлые и более темные страницы.
 
Порог бинаризации Авто это видит, но уровень выставляет неточный.
Хотелось бы иметь возможность выделить группу страниц, у которых порог авто дал определенное значение, и назначить им другое.
 
Т.е. добавить в едит - селект груп - спешиал    опцию  "значение параметра бинаризации после авто".
 
PS
Сначала хотел попросить возможность задавать порог   авто + K, но мою проблему это не решило бы, так как там уже целая формула потребовалась бы.

Всего записей: 742 | Зарегистр. 13-06-2013 | Отправлено: 06:38 26-04-2019
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
А "change binarization threshold..." (ПКМ на виде бинаризации) вас не спасает? Там и галки отбора, и условия есть.

Всего записей: 1565 | Зарегистр. 15-07-2010 | Отправлено: 06:51 26-04-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ну да, это оно и есть. Просто т.к. новая фича, не знал про неё.
 
Хотя в случае выделения страниц в списке, я мог бы лишний раз по ним пробежаться, чтобы проверить, они на самом деле темные/светлые или нет.

Всего записей: 742 | Зарегистр. 13-06-2013 | Отправлено: 06:56 26-04-2019 | Исправлено: daa2013, 06:59 26-04-2019
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
т.к. новая фича

внимательно и целиком читайте what's new

Всего записей: 1565 | Зарегистр. 15-07-2010 | Отправлено: 07:07 26-04-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да уж слишком оно большое.

Всего записей: 742 | Зарегистр. 13-06-2013 | Отправлено: 07:09 26-04-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 (ПКМ на виде бинаризации) вас не спасает?  

 
не совсем спасает. Для самых бледных я бы адаптивный  highdark назначил, а там такой возможности нет.
А если было бы выделение, то я мог бы и soft, и  highdark задействовать. Хотя и его, видимо, можно как-то в это окошко воткнуть.
Или я мог бы на всех бледных автолевелы включить. (хайдарк мне не помог, а автолевел помог.)
 
Добавлено:
ПКМ на ячейках в этом окне ("change binarization threshold...") содержит команды  "управляющие символы Юникода", наверное их надо как-то отрубить ?

Всего записей: 742 | Зарегистр. 13-06-2013 | Отправлено: 01:06 27-04-2019 | Исправлено: daa2013, 02:10 27-04-2019
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Попробовал заюзать в VR кнопку изменения глубины цвета страницы. Перед этим сделал original-зону, постеризовав её до трех цветов, включая белый и чёрный. Слил зону со страницей. Закрыл/открыл СК (6.41). Выбрал на кнопке режим "4 bit", потом щёлкнул на ней. Галки на White и Black in palette - стояли включённые. Save сделал. Посмотрел, что сохранилось в папке. А там у файла в палитре (причём 8-битной, судя по info) нет белого, цвет 248-248-248.

Всего записей: 1565 | Зарегистр. 15-07-2010 | Отправлено: 09:46 30-04-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
6.41
 
когда прерываю задание, не задает вопрос "хотите ли потом продолжить"
и соответственно не позволяет потом запустить прерванное

Всего записей: 742 | Зарегистр. 13-06-2013 | Отправлено: 04:45 01-05-2019
asku



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день. Помогите, пожалуйста подобрать нормальные опции. Результат на выходе меня совсем не может удовлетворить. Пробую и так и эдак. /
 
Прилагаю архив test.
 
Ссылка

Всего записей: 222 | Зарегистр. 04-05-2016 | Отправлено: 09:51 01-05-2019
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku

Цитата:
Помогите, пожалуйста подобрать нормальные опции

А что не так у вас вышло-то ? Лично мне намного больше нравятся тонкие буквы, чем такие блямбы, но это на любителя. Укажите критерии "лучше-хуже".

Всего записей: 1565 | Зарегистр. 15-07-2010 | Отправлено: 13:32 01-05-2019
asku



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А что не так у вас вышло-то ? Лично мне намного больше нравятся тонкие буквы, чем такие блямбы, но это на любителя. Укажите критерии "лучше-хуже".

 
Ну я думал из исходного варианта можно было бы выжать больше. Чтобы буквы были более гладкие, шума поменьше.

Всего записей: 222 | Зарегистр. 04-05-2016 | Отправлено: 10:25 02-05-2019
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
вопрос: как идеологически верно работать с кнопочками preview на закладке Quality? Я никак не могу уловить систему использования. Какие-то фильтры применяются к окну preview немедленно по галке Enable, какие-то применяются к выделению на оригинале, какие-то параметры не оказывают видимого влияния (а хотелось бы понять, с чего это! например auto-levels на Contrast-закладке, там ещё своя кнопка превью), а в целом результат обработки обычно и близко не совпадает с видами preview-окна или выделенного куска. Может, я не учитываю, мысленно, применение порога бинаризации? Помогите разобраться. Возился с примером от asku.

Всего записей: 1565 | Зарегистр. 15-07-2010 | Отправлено: 12:47 04-05-2019
allo04

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня из теста от asku вот так вышло https://dropmefiles.com/jNtFZ

Всего записей: 176 | Зарегистр. 15-10-2009 | Отправлено: 16:08 05-05-2019 | Исправлено: allo04, 16:09 05-05-2019
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 Закрыл/открыл СК (6.41)

 
Где вы все их берёте?
по поводу сплита - его, по идее, вместе с разворотом лучше добавить в (ре)импорт, оставляя возможность переразбить страницу позже.
 
 
какие-то глюки в 5.96 - прогоняешь со стандартными настройками - проверяешь, видишь неверно исправленный перекос - снимаешь галку - переделываешь пол-страницы - ничего не меняется - галка возвращается обратно....
Аналогично с исправлением позиции резака - сдвигаешь с чёрного поля, прогоняешь еще раз - снова картинка с полем

Всего записей: 2861 | Зарегистр. 17-09-2001 | Отправлено: 18:09 05-05-2019 | Исправлено: niccolo, 19:15 05-05-2019
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru