Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171

Открыть новую тему     Написать ответ в эту тему

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: сканирование, обработка, сборка
 
Текущая версия программы : ScanKromsator v6.8 ScanKromsator v6.75
добавки и замечания к v6.75 от bolega
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate! Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.
 
Предыдущая версия программы: ScanKromsator v6.71 Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  Устаревшие версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее...
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...
 


ВАЖНО ! Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом... и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: TelecomUral, 12:36 25-11-2022
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
kamenkapenza
Через буфер обмена любую картинку вставляете или используете штамп

Всего записей: 774 | Зарегистр. 03-07-2005 | Отправлено: 17:08 07-01-2023
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 или используете штамп

bearjrgm, а как пользоваться функцией штампа? В каком меню она находиться и на какой стадии обработки вставлять?
 

Всего записей: 622 | Зарегистр. 23-05-2021 | Отправлено: 17:15 07-01-2023 | Исправлено: kamenkapenza, 17:17 07-01-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kamenkapenza
В любом графическом редакторе создаете свое изображение-штамп и сохраняете в Tif, желательно в ч/белом 2-битном формате, и желательно с dpi не менее 300.
В окне VR держа нажатым Ctrl, щелкаете на кнопке stamp, появится диалог выбора графического файла. Выбираете свою заготовку. Она появляется поверх скана. Двигаете ее в нужную часть страницы, при необходимости изменяете размер. В КМ  выбираете команду Stamp > Merge. Штамп сливается со страницей, но остается и над ней (на случай, если нужно повторно на другие страницы его вставить). Отжимаете кнопку stamp, штамп исчезает.
СК запомнит какой файл вы использовали в качестве штампа. Поэтому в последующие разы просто жмете на кнопке stamp (без Ctrl), и СК сразу загрузит и отобразит ваш штамп.
 
Добавлено:
Simonthe

Цитата:
Например шаги по получению оптимизированных картинок с разрешением в 300dpi, поскольку по указанию ув. niccolo:

По моему требование о 300dpi было актуально лет 5-10 назад, сейчас для последних версий FR dpi 600dpi будет только на пользу.
 
СК не занимается OCR, наоборот, он использует OCR от сторонних программ. Например, уже в процессе обработки с помощью встроенного в СК tesseract он может без проблем получить информацию о буквах, словах и строках (поэтому велосипед изобретать не требуется). Насколько правильно распознавание - это другой вопрос. Но тем не менее информацию о буквах он имеет. И использует ее, например, при бинаризации. Вы можете указать СК, какие буквы (и даже части их, например, в области перемычек), бинаризовать с увеличенным порогом - см. опции на закладке окошка page > special > protect. Это примерно то же самое, что вы описывали.

Всего записей: 4231 | Зарегистр. 09-09-2002 | Отправлено: 17:19 07-01-2023
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, спасибо за ответ!
 
 
Цитата:
Вы можете указать СК, какие буквы (и даже части их, например, в области перемычек), бинаризовать с увеличенным порогом - см. опции на закладке окошка page > special > protect.

 
Наверное,про это показано в ваших последних роликах (про новую версию, глифирование), я пока это побаиваюсь смотреть, надо настроиться, чтобы всё принять к сведению и запомнить.
 

Всего записей: 622 | Зарегистр. 23-05-2021 | Отправлено: 18:06 07-01-2023
xMARx

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
таймлайны к 4м роликам

 
__TelecomUral, может имеет смысл указать таймлайны в комментариях под четырьмя видеороликами?

Всего записей: 58 | Зарегистр. 22-06-2009 | Отправлено: 21:32 07-01-2023 | Исправлено: xMARx, 21:58 07-01-2023
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый вечер. Прошу подсказать, какую опцию подправить, чтобы не было внутри черной буквы белых пустот (см. буквицу на скрине):

 
Почему-то мне казалось, что здесь на форуме когда-то посоветовали на вкладке Page кнопку special..., и там в открывшемся меню на закладке More воспользоваться этой опцией:

 
Я там перепробовал разные значения, но ничего не меняется.

Всего записей: 427 | Зарегистр. 04-05-2016 | Отправлено: 23:19 07-01-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
речь о буквице? Если она в оригинале черная, то в задании похоже normal-метод illumination.

Всего записей: 4231 | Зарегистр. 09-09-2002 | Отправлено: 02:00 08-01-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xMARx
меня так взбесил рутуб в прошлом марте, что я вообще не хочу видео больше заниматься.
Впрочем, lis105 воткнул таймлайны прямо вовнутрь:
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1535746511/30#30
 
Да, вот ещё позавчера пришлось для индийца тупой ролик записать. Про совмещение ocr FR и СК. Интересно, что русский голос он как-то понимает, а прямые ссылки на инструкции почему-то не может "прочесть". Или он чисто на картинку смотрит, без перевода.
https://disk.yandex.ru/i/eopejlQ6Vb5Vvg

Всего записей: 2370 | Зарегистр. 15-07-2010 | Отправлено: 07:11 08-01-2023
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
речь о буквице? Если она в оригинале черная, то в задании похоже normal-метод illumination.

 
Да, буквица. В illumination стоит normal. Но я там сейчас все перепробовал (Safe и т.д.) — результат тот же.
У меня вообще normal по умолчанию стоит. Я меняю на safe когда скан не очень (темный и т.п.)

Всего записей: 427 | Зарегистр. 04-05-2016 | Отправлено: 11:46 08-01-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
asku
Да, буквица.

вот для вас, с вашим опытом, какие сложности были сразу же в первом сообщении выгрузить и приложить суб-задание? Ладно новичок, но вы-то.
 

Всего записей: 2370 | Зарегистр. 15-07-2010 | Отправлено: 12:04 08-01-2023
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Да, вот ещё позавчера пришлось для индийца тупой ролик записать.

 
Ну вот даже для индийцев академический курс открылся. Теперь всякие Чопры, Мехры, Мухандасы, Чакраборти, Пратаны, Кумары, Капурята будут счастливы! А для простого русского народа начальную школу по изучению Кромсатора открыть никто не хотит.

Всего записей: 622 | Зарегистр. 23-05-2021 | Отправлено: 12:23 08-01-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Но я там сейчас все перепробовал (Safe и т.д.) — результат тот же

сомнительно. ставьте safe

Всего записей: 4231 | Зарегистр. 09-09-2002 | Отправлено: 12:55 08-01-2023
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
приложить суб-задание

 
Я думал, там совсем просто — где-то галочку поставить и все )
Тест-папка

Всего записей: 427 | Зарегистр. 04-05-2016 | Отправлено: 12:55 08-01-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
просто, конечно. я так и предположил, что после моей "рекламы" адаптивной бинаризации по Вольфу вы её стали бездумно лепить везде
Надо ж соображать, что именно делает метод. А он "окошком" отбирает близлежащие пиксели и усредняет их плотность перед бинаризацией, приводя ее к половине диапазона, к 128. Вот вы и имеете при окошке 60 и ширине вертикальной палочки буквицы примерно 28, что для пикселей которые посредине черной полоски фон сильно высветляется перед бинаризацией.
Я, конечно, сильно утрировал - метод похитрее чем просто "взять близлежащее и усреднить фон". Но для практических целей достаточно понимать и это.

Всего записей: 2370 | Зарегистр. 15-07-2010 | Отправлено: 13:13 08-01-2023
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
после моей "рекламы" адаптивной бинаризации по Вольфу вы её стали бездумно лепить везде

 
Точно) Спасибо.

Всего записей: 427 | Зарегистр. 04-05-2016 | Отправлено: 13:18 08-01-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да, с AutoW надо осторожнее если есть протяженные темные объекты.
Раз уж его решили применить, увеличьте windows size=100 (сейчас 50) и тогда будет ок.

Всего записей: 4231 | Зарегистр. 09-09-2002 | Отправлено: 13:21 08-01-2023
Simonthe

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral,  
Замечательное видео
 
Вы написали:
Цитата:
Про совмещение ocr FR и СК.

В ролике - ФР15.
Для ФР12 - процедура такая же?

Всего записей: 45 | Зарегистр. 17-12-2009 | Отправлено: 22:23 08-01-2023 | Исправлено: Simonthe, 22:27 08-01-2023
AlVaKo

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
По поводу адаптивной бинаризации.
Метод Вульфа, это модификация метода Сауволы.
 
У Сауволы, исходя из формулы расчета порога, будет железобетонно страдать бледная перемычка у букв "Н" и "И". Для уменьшения такого негативного эффекта, надо уменьшать размер локального окна до длины перемычки и даже меньше. Но при уменьшении размера окна, начнут страдать жирные штрихи заглавных букв, и прочие обширные черные области.
 
В плане деградации перемычек, Вульф мало отличается от Сауволы. И ещё, меня терзают смутные сомнения, что различные реализации/применения метода Вульфа для бинаризации сканов книг соответствуют по сути тому, что писал Вульф в статье про локализацию и выделение текста на мультимедийном изображении.

Всего записей: 21 | Зарегистр. 06-07-2011 | Отправлено: 10:06 09-01-2023 | Исправлено: AlVaKo, 10:08 09-01-2023
esys

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вульф дает жирноватые буквы, но никогда не гробит мелкие детали и не скругляет излишне входящие углы как другие методы (по опыту работы в скантайлоре адвансед).

Всего записей: 138 | Зарегистр. 22-06-2016 | Отправлено: 13:07 09-01-2023
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день.
Книга с такими страницами

 
Правильно ли я понимаю, что такие страницы надо делать так:
создать picture-зоны и распространить их на все страницы?
 
А как нужно расположить зоны на всех страницах? Вроде недавно что-то такое читал здесь на форуме и забыл (

Всего записей: 427 | Зарегистр. 04-05-2016 | Отправлено: 17:04 09-01-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2023

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru

Рейтинг.ru