Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть | 4 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v7.00 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


О Хрестоматии 2.1 SK
 
Чтобы русифицировать СканКромсатор
В ini-файле в секции Options должен присутствовать параметр LangInt=1. Вернуть в исходный язык: LangInt=0. Пока русифицировано только MW.
 
ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 39598 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: TelecomUral, 07:06 04-12-2024
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Хотел сделать распознавание в раскрашенных ч.б  пикчур=зонах (малоцветка), и обнаружил, что в зонах ОСR и нету.  
В принципе, понятно, координаты зон по ходу и измениться могут.
Может, туда (в зоны) можно передать как-то OCR-ячейки, найденные для input  файлов, т.е. выявленные ещё до захвата зон ????  
 

Цитата:
А вы вот эти опции используете? Я так с ними нормально и не разобрался.

Они предназначены для поиска и выявления плохих букв в больших массивах текста.
Я их, практически, не использую, так как, если глифирую, то пришёл к тому, что в 99% случаев делаю полную замену всех глифов на странице, а не отдельных букв.  
Думаю, что когда какую-нибудь энциклопедию буду делать, вот там потребуется.
 
Добавлено:
Кроме того, такая точная настройка полезна, если делать замену по всей книге сразу. Но для целей контроля я пока делаю глифирование страница за страницей.

Всего записей: 1174 | Зарегистр. 13-06-2013 | Отправлено: 16:33 15-08-2025 | Исправлено: daa2013, 16:36 15-08-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Регулярно получаю Invalid pointer operation. (в своём проекте) или Access violation (в субтаске "тест").
момент, после которого это происходит:   в проекте выполнены OCR тессеракт и проанализированы, составлены замены.  В это время я делаю возврат в MW и бинаризую с другим порогом.
 
Для субтаска порядок действий, порождающий регулярно воспроизводимую ошибку:
 
1. Открыл проект "тест".  
2. Перешел в RV
3.  Посмотрел список сомнительных слов.  
4. Вернулся в MW, Изменил порог бинаризации, выполнил процесс.
5. Оказавшись в RV  снова пытаюсь посмотреть список сомнительных слов -  ACCESS VIOLATION.
 
В оригинальном проекте   для списка некорректных слов в этот момент пишет, что нету соответствующих языку словарей hunspell, а при повторной попытке ребинаризации = Invalid pointer operation.
 
Субтаск:  https://disk.yandex.ru/d/Y1XyzOSUd6BCGw

Всего записей: 1174 | Зарегистр. 13-06-2013 | Отправлено: 23:56 15-08-2025 | Исправлено: daa2013, 00:12 16-08-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Пример глифирования для любителей было-стало:
 
https://disk.yandex.ru/i/t6uUD5UZ08aANQ

Всего записей: 1174 | Зарегистр. 13-06-2013 | Отправлено: 10:50 16-08-2025 | Исправлено: daa2013, 10:51 16-08-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
Регулярно получаю Invalid pointer operation

спасибо за пример. Баг найден и исправлен.
По поводу распознавания зон я так и не придумал, как это сделать. В своих обработках я временно сливаю все текстовые зоны, потом распознаю. В результате получаю полный текстовый слой,  но это не дает возможности глифировать зоны отдельно. Можно конечно, зная форму зоны, как-то переносить готовый слой из основного скана в зоны (или сразу подтягивать его с основного файла). Распознавать зоны по отдельности не желательно. Если там мало текста, распознавание может быть плохим. Я заметил, что меньше текста, тем хуже  распознавание, или я не прав?

Всего записей: 4732 | Зарегистр. 09-09-2002 | Отправлено: 08:14 18-08-2025 | Исправлено: bolega, 08:24 18-08-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
напрашивается распознавание исходного скана, и работа с зоной по вырезанному куску распознанного. Я думал, вы легко это сделаете, когда увидел что появилась опция "распознать входной файл".
Там только геморрой с неконтролируемым поворотом ФР будет, и наверное всё.

Всего записей: 3598 | Зарегистр. 15-07-2010 | Отправлено: 05:17 19-08-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
напрашивается распознавание исходного скана

на 100% не напрашивается

Всего записей: 4732 | Зарегистр. 09-09-2002 | Отправлено: 07:48 19-08-2025
Fire_Dragon



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Проблема:
когда магический цвет имеет первую компоненту RGB равную соответствующей компоненте очищаемого цвета, СК считает эти цвета равными и ничего не делает при mouse up деспекле и выделяет фактически разные цвета при выделении командой "Select pixels with this color" и при нулевом пороге.
 
В примере ниже, розовые пиксели цифр 3,9 не заменяются на оранжевые при mouse up деспекле магическим цветом, а "Select pixels with this color" выделяет как розовый так и оранжевый цвет; так происходит из-за равенства красной компоненты в цветах.

 
Ссылка на задание: https://www.upload.ee/files/18495341/near-colors_test.zip.html
Так и должно быть по задумке?

Всего записей: 58 | Зарегистр. 19-11-2010 | Отправлено: 23:12 19-08-2025 | Исправлено: Fire_Dragon, 23:15 19-08-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Fire_Dragon

Цитата:
Так и должно быть по задумке?

Судя по коду, сделано именно так. По идее, это неправильно. Поэтому исправил

Всего записей: 4732 | Зарегистр. 09-09-2002 | Отправлено: 00:17 20-08-2025
vilteb

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Каким допускается максимальное значение 'Frame size' на вкладке 'Background cleaner' окна 'Image enhance filters'?
Прошу возможности указания shortcut для кнопки 'Scroll cursor' на панели окна 'View result window'.
Спасибо.

Всего записей: 17 | Зарегистр. 23-05-2025 | Отправлено: 09:03 20-08-2025 | Исправлено: vilteb, 12:45 23-08-2025
leescott623

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
I am using v 5.93 here. Attached are the parameters and results, the red areas are the parts I am quite satisfied with.
However, I don’t know how to achieve the same excellent performance in v 6.75.
Thank you!
 
https://workupload.com/file/Mb6RGDAhZ9g
https://workupload.com/file/pSGNmc4RnkB

Всего записей: 16 | Зарегистр. 27-04-2017 | Отправлено: 07:06 22-08-2025 | Исправлено: leescott623, 07:13 22-08-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сurrent version is 7.03. The version 5.93 is from 06/24/2009.
I'm not sure if anyone here remembers what was workable 16 years ago.
 
Добавлено:
For version 6.00.5  I've issued a compilation of instructions (sorry, in Russian):
 
https://disk.yandex.ru/d/KaES_tO91Bu79g
 
Sorry, not able download from workupload now.

Всего записей: 1174 | Зарегистр. 13-06-2013 | Отправлено: 08:11 22-08-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
leescott623
занятно.
я поднял версию 5.6A, проверил - да, эти иероглифы сглаживаются так, как я не смог повторить в 7.03

Всего записей: 3598 | Зарегистр. 15-07-2010 | Отправлено: 09:43 22-08-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Увы, я не вижу пример (перелейте на яндекс-диск).
Первое что на ум приходит - смена в каком-то СК метода деспекла по умолчанию.  
Если он там был задействован, то он влияет.

Всего записей: 1174 | Зарегистр. 13-06-2013 | Отправлено: 10:24 22-08-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
перелейте на яндекс-диск

https://disk.yandex.ru/d/YPv0l2WfOZCl2g
 
upd
визуальное сравнение вопроса
https://disk.yandex.ru/i/5BOpjsWkF-Snwg

Всего записей: 3598 | Зарегистр. 15-07-2010 | Отправлено: 10:40 22-08-2025 | Исправлено: TelecomUral, 10:47 22-08-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
тут нет субтаска. только sktp файл.
Как понять какие параметры в 5.93 были ?

Всего записей: 1174 | Зарегистр. 13-06-2013 | Отправлено: 11:01 22-08-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
я просто в 5.6A загнал с нуля, проставил разрешение по входу 200 по выходу 600.

Всего записей: 3598 | Зарегистр. 15-07-2010 | Отправлено: 11:13 22-08-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
чистая бинаризация по дефолтному 150 порогу с апскейлом в три раза в 7.03 ИМХО даёт тоже самое, что у вас в 5.93:
 
https://disk.yandex.ru/d/P-qUpBq0KllW4A
 
Чтобы получить выщербины как у вас, что-то еще заюзать надо. (Деспекл ?).
А дефолтные обработки в старых и новых СК, насколько я помню и как я уже писал, различаются методом деспекла.
 
Добавлено:
leescott623
Unfortunately, there is no *.spt file in your archive.
 
The forum header contains instructions on how to create a so-called "subtask" for each user who requests help.  
I translated it for you:
 
1. Choose the most problematic scan in the task. If there are several of them, select them by pressing the space bar on each of them. (Their names will turn red.)
2. Then select "File" -> "Create Subtask" from the menu...
3. If you have selected several scans, then in the window that appears, select the value of the "All selected" group, otherwise leave the default value "Current". Click OK.
4. The "test" subdirectory will appear in the source scan directory. Archive it.
5. Upload the archive to the file storage, which is available in Russia.

Всего записей: 1174 | Зарегистр. 13-06-2013 | Отправлено: 12:38 22-08-2025 | Исправлено: daa2013, 13:16 22-08-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
у меня так как у вас тоже не выходит. странно.
 
задание
https://disk.yandex.ru/d/lHkqaoPiCaM1QA
Что-то я недопонимаю.

Всего записей: 3598 | Зарегистр. 15-07-2010 | Отправлено: 13:10 22-08-2025 | Исправлено: TelecomUral, 13:19 22-08-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Первое что вижу, что апскейл у вас не в 3, а в 6 раз. Точнее (с 96 до 600 дпи). Размер по вертикали 7994, а был 1500 .  
 
Добавлено:
Ха. У меня тут электричество отключали ровно в момент загрузки изображения. Не исключено, что я ранее как раз 5.93 и выложил.
Вот у меня, оказывается, еще одна утренняя картинка есть:
 
https://disk.yandex.ru/i/JCxEEn6trdA4kA  
 

Всего записей: 1174 | Зарегистр. 13-06-2013 | Отправлено: 13:28 22-08-2025 | Исправлено: daa2013, 13:46 22-08-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
проблему решит сравнительный скриншот и ваш субтаск, если скриншот действительно покажет совпадение.

Всего записей: 3598 | Зарегистр. 15-07-2010 | Отправлено: 13:45 22-08-2025
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru