Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
asku
А что такое тип special?

См. выпадающий список Color на первой закладке свойств зоны.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 14:04 02-09-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, TelecomUral
Все получилось, спасибо. Теперь главное — запомнить это на будущее. )

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 23:13 03-09-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Есть ли какая-то причина при повороте скана на закладке Page на +-90 градусов не менять местами в левом нижнем углу главного окна пиксельные значения высоты и ширины скана? По-моему, более естественно, чтобы эти значения соответствовали виду в главном окне обрабатываемого скана, как это сделано, например, в Ирфанвью.

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 19:05 06-09-2022 | Исправлено: shch_vg, 21:52 06-09-2022
romanef



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Request for new feature
 
Вставка пустой белой страницы вместо (!) текущей. Желательно одним кликом мышки.
На этапе до обработки либо на этапе VR.
 
 
Обоснование:
Пустые страницы приходится сканировать для сохранения сквозной нумерации.
При этом Оптикбук 3800 имеет неотключаемую автоплотность и вытягивает "мусор".
Приходится чистить мусор до белой страницы и тратить время.
 

Всего записей: 668 | Зарегистр. 14-11-2003 | Отправлено: 12:01 08-09-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
romanef
Приходится чистить мусор

порог бинаризации в таких случаях ставлю вручную, очень низкий.
(замечу, что автоплотность у 3800 - отключаемая. В реестре ищите параметр.)

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 13:00 08-09-2022
romanef



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вставка пустой белой страницы никогда не помешает.  
Размеры ее  можно определять пресетами  в Options/Profiles.
 
Если вставка страницы технически невозможна - тогда хорошо бы сделать заливку белым содержимое текущей страницы (стереть контент)как дополнение к Rotate.
 
Или как вариант - сделать еще одну, новую опцию Mouse UP - сlear zone  
 
 
 
Добавлено:

Цитата:
 3800 - отключаемая. В реестре ищите параметр

 
не нашел.
а можно ссылку на ветку реестра ?

Всего записей: 668 | Зарегистр. 14-11-2003 | Отправлено: 15:38 08-09-2022 | Исправлено: romanef, 17:40 08-09-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 16:43 08-09-2022 | Исправлено: TelecomUral, 16:43 08-09-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Исправил.
 
romanef

Цитата:
новую опцию Mouse UP - сlear zone  

Есть же mouse-up clear. Мне всегда хватало. Выделил всю страницу, она очистилась.
Второй вариант, без режима: выделил всю страницу, нажал "С".
Третий способ: порог бинаризации задать 0.
Теоретически можно добавить новую опцию Blank page, чтобы СК сам ее чистил при обработке. Но учитывая что есть несколько простых альтернатив, даже и не знаю ... Неужели настолько лень вручную почистить парой движений?  

Всего записей: 4431 | Зарегистр. 09-09-2002 | Отправлено: 08:58 09-09-2022
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Если сканировалось на макоси и в названии папки или фалов есть й, то кромсатор, это не ест.

Всего записей: 2871 | Зарегистр. 22-03-2005 | Отправлено: 19:04 09-09-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Некий индиец через комменты в ютьюб и личную переписку просит добавить в список языков выбор "Odia". Говорит, тессеракт это поддерживает.
его почта ayasbaral@yandex.com, звать Ayaskanta Baral.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 12:41 12-09-2022 | Исправлено: TelecomUral, 12:46 13-09-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
А он представляет себе, что он будет делать с ocr?

Всего записей: 4431 | Зарегистр. 09-09-2002 | Отправлено: 19:56 13-09-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
я его не спрашивал.  
Но вроде не идиот, другие вопросы задает четкие. Например, запросил, почему у него при создании текстовой метки (Ctrl+L) выделение жёлтое, а при merge label изменяется жирность текста страницы. И на запрос "о чём это он??" моментально прислал адекватную видеозапись, я вам на свой фтп в корень положил. Я перепроверил, у меня не так.
Кстати, если неслитую метку выделить, изменить её размер и мышкой при этом зацепить зону рядом, возникает Access violation... но повторить этот фокус я не смог. Причем даже VR не закрылся, когда окно ошибки всплыло.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 00:30 14-09-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
почему у него при создании текстовой метки (Ctrl+L) выделение жёлтое,

У меня тоже так бывает. Причину не нашел. Помогает закрытие и открытие окна VR.

Цитата:
а при merge label изменяется жирность текста страницы

Текст набирается в пространстве экрана стандартным контролом windows, при его помещении в изображение (т.е. в другое медиа с другим dpi) он сильно меняется. Чтобы не менялся, нужно наверно делать свой собственный редактор текста с поддержкой wysiwyg (а ля word, когда текст выглядит одинаково на экране, принтере и т.д.), это очень сложная история, я не осилю.  Label в СК довольно примитивный, реализован на скорую руку, нужно работать с ним в строгой последовательности, иначе будут AV, защиты от некорректных действий нет никаких. Этим он сильно отличается от обычных зон, т.к. изначально рассчитан на минимальное применение в СК.

Всего записей: 4431 | Зарегистр. 09-09-2002 | Отправлено: 08:17 14-09-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
нужно наверно делать свой собственный редактор текста с поддержкой wysiwyg

я, конечно, дилетант... но неужто до сих пор никто в мире не состряпал бесплатную дллку, которой посылаешь (векторное?) окно стандартного контрола, а она возвращает его растром и в новом дпи. Задачка-то стандартная, по идее, мелкомягкие и сами могли бы чего-нибуь написать такое. Хотя, конечно, в СК у фичи "минимальное применение". Я ей помнится единственный раз в жизни пользовался, лет десять назад. Когда менюшки ПКМ впервые изучал.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 13:42 17-09-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день. Прошу помочь. Скан — печатная машинка. Можно ли еще улучшить качество на выходе. Файнридер что-то совсем плохо распознает.
 
Тест-файл

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 16:50 17-09-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
печатная машинка

всегда интересовался, нельзя ли пройти путём подмены: в ФР засунуть серый оригинал, чтоб распознавание получше прошло, а в СК нормальный ЧБ получить и затем готовый ocr файнридера заюзать. Можете попробовать.
Улучшать работу СК по бинаризации мало толку.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 17:11 17-09-2022
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
При распознавании, ФР скорее всего работает с ч/ б изображением. А значит, ФР сам будет бинаризировать серый скан. Тут вопрос, у кого кунфу круче по части бинаризации? У СК или ФР?  

Всего записей: 42 | Зарегистр. 06-07-2011 | Отправлено: 18:49 17-09-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп  
 

Цитата:
AlVaKo
ФР скорее всего работает с ч/ б изображением

где-то кто-то когда-то давно писал, а я запомнил, что ФРу лучше скармливать в оттенках серого/в цвете. Мол, чб он точно хуже кушает. Ещё в районе 2009-2011 годов писали. Там же возможны разнообразные кунштюки с математикой над цветовым пространством, а не только тупое весовое сравнение Ч/Б попиксельно.
 
И второй вариант для печатной машинки не надо забывать: матрица её букв крайне ограничена, можно попробовать провести обучение ФР. Должно помочь.
 
но это опять оффтоп

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 19:01 17-09-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
где-то кто-то когда-то давно писал, а я запомнил, что ФРу лучше скармливать в оттенках серого/в цвете. Мол, чб он точно хуже кушает. Ещё в районе 2009-2011 годов писали. Там же возможны разнообразные кунштюки с математикой над цветовым пространством, а не только тупое весовое сравнение Ч/Б попиксельно.
 
И второй вариант для печатной машинки не надо забывать: матрица её букв крайне ограничена, можно попробовать провести обучение ФР. Должно помочь.

 
1. Это было тогда - сейчас почищенные и обкромсаные кромсатором ч/б файлы FR распознаёт даже лучше и точно не хуже
2. В FR8 можно выбрать тип распознаваемого текста - печатная машинка.

Всего записей: 3673 | Зарегистр. 17-09-2001 | Отправлено: 20:44 17-09-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Уберите нафинг команду  Delete all glyphs     из  КМ глифов.   Работа трех дней псу под хвост.
Она же еще и сразу сохраняется. Закрыл без сохранения проект, открыл - глифов нет.
 
 
 
UPD   В bak  осталось сильно не всё.   При каком сценарии работы вообще нужна такая команда ? (Да еще на самом козырном месте в меню.)  
Можно же выделить все и удалить, если надо.   Ещё есть  Delete sheet
 
Если что, то я хотел удалить два глифа, тыкал вроде как в  Delete glyphs  и поэтому подтвердил удаление.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 01:59 02-10-2022 | Исправлено: daa2013, 02:50 02-10-2022
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru