Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Только я книгу отсканировал как чёрно-белый текст в PDF с очисткой фона сканером. Но подчёркивания все остались.

 
Теперь только руками. Более менее автоматом вычистить можно только из серого.
 

Цитата:
А когда размер текста меньше страницы — это признак того, что DPI указано меньше, или больше?  

 
У данной страницы разрешение выше чем у других. Проверить разрешение можно любым просмотрщиком.

Всего записей: 3677 | Зарегистр. 17-09-2001 | Отправлено: 09:46 10-02-2020 | Исправлено: niccolo, 09:48 10-02-2020
niksad31

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo

Цитата:
Теперь только руками

Попробовал руками в СканКромсаторе, по пособию нашёл функцию Ctr+Shift+Click на линии подчёркивания. Не пошло, т.к. почти все линии где-то задевают буквы текста, и при клике буквы удаляются вместе с линией. Можно как-то алгоритм этого метода улучшить?
 
А как ещё руками: ластиком в Фотошопе, или какие фильтры имеются?  Есть ли смысл перегнать книгу из PDF в DJVU для лучшего сжатия, и чем без потери качества?

Всего записей: 746 | Зарегистр. 16-09-2016 | Отправлено: 18:14 10-02-2020 | Исправлено: niksad31, 18:20 10-02-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niksad31
работает ли бэкграунд клинер на чб материале - это только разработчик СК подскажет. Я всегда на сером его использовал.
 
оффтоп
"Сами себе злобные буратино", в чб делать сканы. Уж сколько раз твердили миру...

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 19:22 10-02-2020
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Имеет смысл в цвете пересканировать.
Тот же Ктрл+шифт + Клик он же и на цветном работает.. Карандаш и ручка - они другие по цвету и часто можно неплохо порог подобрать, так что именно они и уходят, а буквы остаются.
 
Т.е. сначала почистить., сохраняя сканы цветными, а потом уже бинаризовать на втором проходе.
 
Это вот с черной ручкой или старыми темно-фиолетовыми чернилами засада.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 19:39 10-02-2020 | Исправлено: daa2013, 19:40 10-02-2020
niksad31

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Так в цвете или серым сканировать? Я думал, чип сканера лучше бэкграунд почистит, хотя там и чистить то нечего, кроме линий. Бинаризацию раньше пробовал, но качество текста ухудшалось, если фон грязный.
 
Непонятно, почему не работает бэкграунд клинер? Автор Кромсатора в той ветке по нейронным сетям упоминал, что использует распознавание текста для очистки фона. Цвет тогда при чём? Текст у меня и Ч/Б чистый без дефектов.

Всего записей: 746 | Зарегистр. 16-09-2016 | Отправлено: 02:24 11-02-2020 | Исправлено: niksad31, 06:04 11-02-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Так в цвете или серым сканировать?

Поэкспериментировал сейчас "от балды". Я, в общем-то, дилетант в обработке.  
Советую перед СК перевести свои чб сканы в 24-bit color, и помимо background cleaner задействовать blur. Кое-что тогда и с чб скана удаляется. Хотя, конечно, фиговенько. Метод "Horizontal", параметр "protect black pixels" снял, иначе линия только жирнее становится.
На чистом чб клинер не работает у меня. Наверное и не должен.
 
А если будете пересканировать, то лучше делайте в цвете. В серый перевести никогда не поздно. Тем более ручка синяя.

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 08:05 11-02-2020
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Цвет тогда при чём?  

руками кликаете по синему, синий и удаляется.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 08:53 11-02-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Попробовал руками в СканКромсаторе, по пособию нашёл функцию Ctr+Shift+Click на линии подчёркивания. Не пошло, т.к. почти все линии где-то задевают буквы текста, и при клике буквы удаляются вместе с линией. Можно как-то алгоритм этого метода улучшить?

 
 
Для рук сканкромсатор не всегда лучшее решение.  
Линии подчёркивания отличить от текста для автоматического удаления можно только по цвету/интенсивности, что и делается в сером или цвете. В Ч/Б это уже невозможно.
 
А вообще, если речь о карандаше и есть доступ к книге для неопытных товарищей может оказаться проще простой ластик и пересканирование.
Вариант 2 — просто исправить ошибки в распознанном и не мучиться с картинками.
 
А где сейчас последняя версия обитает?
 
И еще вопрос - есть ли где функция выделения глифов из текста (или просто системным шрифтом типа Литературная) с возможностью последующей  запечатки дефектов печати или сканирования? А то все равно когда проверяешь текст в SK исправить такие ошибки просто, чем потом их искать и исправлять в ФР.  
 
Или кто вообще как данный вопрос решает?

Всего записей: 3677 | Зарегистр. 17-09-2001 | Отправлено: 13:01 13-02-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
есть ли где функция выделения глифов из текста

вы о чём? глифы в СК уж тыщу лет применяются. Сначала набираете глиф в табличку, потом оттуда его ставите в нужное место.

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 21:03 14-02-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
вы о чём? глифы в СК уж тыщу лет применяются. Сначала набираете глиф в табличку, потом оттуда его ставите в нужное место.

 
О какой версии речь?  
 
После шапки ни одной новой версии в паблике не видел... Поэтому пока сижу на 5.96 или 6.00.05.

Всего записей: 3677 | Зарегистр. 17-09-2001 | Отправлено: 23:51 14-02-2020
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
niccolo
Тыщу не тыщу, а в 6.00.05 глифы есть.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 01:31 15-02-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Тыщу не тыщу, а в 6.00.05 глифы есть.

 
спасибо, изучаю документацию...Там вопросы по разделам и номерам, а не версиям....
Это есть в 6.00.05?
Работа с библиотекой глифов пополнилась рядом
усовершенствований: регулировка представления окошка с
глифами (количество колонок, авто-ширина), мульти-выделение и
мульти-перетаскивание глифов внутри окошка, авто-кроп
вставляемых глифов (удаление лишнего белого пространства
вокруг глифа), добавление заданного белого зазора со всех
сторон глифа.
Добавлена возможность авто-установки глифа в место вставки:
теперь не обязательно точно выбирать точку вставки глифа, СК
сам постарается найти оптимальное положение для вставки,
анализируя некоторую окрестность вблизи курсора.
- Новые hotkey для окна VR: Add glyph to library, Insert
glyph to library

 
По описанию, как понял, глифы в таблице не привязаны к клаве (т.е при нажатии m (например с модификатором - CTRL, ALT etc) — не вставляется глиф из ячейки m?)  
Тогда, как вариант, вместо пустой коллекции глифов можно использовать шрифт типа Литературная (или с выбором) с подбором кегля... (с особенностями вставки глифов типа залития белым фоном прямоугольника вокруг+1-3 пикс)
 
Да отстал я от развития программы... Каюсь...

Всего записей: 3677 | Зарегистр. 17-09-2001 | Отправлено: 02:37 15-02-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Можно ли автоматизировать изменение цвета для колонтитулов, находящихся в определенном участке на всех страницах?

Всего записей: 1367 | Зарегистр. 05-04-2010 | Отправлено: 08:01 10-03-2020 | Исправлено: D1D1D1D, 08:41 10-03-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D
непонятен вопрос. Что такое "колонтитул"? У СК же нет такого термина. У него есть зона.
У зоны может быть признак группы. Размножение свойств может быть сделано по этому признаку. То есть если вы колонтитул выделили зоной и назначили зонам одну и ту же группу, то пожалуйста, групповые операции будут работать.

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 10:46 10-03-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
СК — программа. Но мы же с вами люди, могущие общаться и понимать друг друга, применяя любые термины, в том числе описанные в словарях, потому что под колонтитулом имеется в виду обычное словарное значение. Хотелось бы изменить цвет выделенному колонтитулу и чтобы то же самое было применено ко всем последующим страницам в области этого выделения насквозь.

Всего записей: 1367 | Зарегистр. 05-04-2010 | Отправлено: 20:02 10-03-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А прикольная была бы фича в аут-задании Задать одинаковый номер зонам, расположенным в габаритах выделения мышкой. Или касающимся. Размеры-то страниц уже одинаковы.
Но именно прикольная - обработчик сам должен был при расстановке зон подумать о назначении группы.

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 06:42 11-03-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Так и не понял: это возможно или нет? Или я о чем-то заранее не подумал?

Всего записей: 1367 | Зарегистр. 05-04-2010 | Отправлено: 09:20 11-03-2020
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да, возможно.
 
 
шаг №1   Выделить колонтитулы в пикчур-зоны.   (предполагаем, что в зонах только колонтитулы)
 
(если страницы заранее правильно обрезаны, то и расставить зоны можно копированием. На одной страницы ее поставить, а затем сделать копи-пасте на все остальные страницы (или на все четные/ на все нечетные страницы). Если где-то колонтитулов нет, то там удалить.  Если где-то колонтитула смещены там зоны пододвинуть.
 
шаг №2 в любой зоне с колонтитулом назначить свойства. Зона "раскрашенная"  (т.е. ч.б., а на закладке PAINT свойств зоны ставите раскраску в желаемые цвета.)
 
шаг №3  назначаете всем зонам свойства  этой правильно раскрашенной  (Там в окне "свойства зоны"  есть кнопка "Копи ту групп" , выберите группу All marked)
 
UPDATE
можно также сразу поставить зону с правильными свойствами и уже её копировать, а не свойства переназначать.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 09:48 11-03-2020 | Исправлено: daa2013, 09:53 11-03-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D
По большому счету TelecomUral абсолютно прав: вы недостаточно ясно сформулировали условия вашей задачи. Если нужно расцветить уже обработанные сканы, то алгоритм будет один, если изначально имеем дело со сканами (разно размерными, перекошенными и т.д.) то алгоритм будет другой. В первом случае скорее всего все колонтитулы находятся примерно в одном месте, достаточно  сделать одну/две раскрашенные зоны и размножить их на все страницы или чет/нечет. Лишние потом удалить. Во втором случае это не прокатит, нужно будет ставить зоны ручками на каждой странице. Есть еще одно важное отличие.
Для первого случая (т.е. это out-задание или что то же самое, задание из bw файлов, не требующих обработки), тип зоны должен быть special, а не b/w! Тогда после расстановки зон можно в этом же задании сразу сделать djvu или pdf. Все остальные типы подразумевают что будет сначала выполнена обработка, и только потом через out-задание получать djvu/pdf. Это справедливо и для второго случая.
Если во втором случае обработку не сделать, то на этапе создания djvu такие зоны будут просто проигнорированы.

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 18:45 11-03-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
daa2013
bolega
Ясно, спасибо.  
 
Добавлено:
Пытаюсь отснятую на телефон книгу обработать, но никак не удаётся привести в соответствие разные страницы, текст на которых был на разном расстоянии, из-за чего размеры плавающие. На одной странице тест имеет заданные поля, на другой — правое поле чуть больше, а весь текст чуть меньше. Вот такая пара страниц — https://yadi.sk/d/-uxtlQ4uOCsDlw
 
Обрабатываются ли в программе такие случаи?

Всего записей: 1367 | Зарегистр. 05-04-2010 | Отправлено: 20:15 11-03-2020
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru