Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91

Открыть новую тему     Написать ответ в эту тему

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: сканирование, обработка, сборка
 
 
Текущая версия программы: ScanKromsator v6.71 Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  Устаревшие версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...
 


ВАЖНО ! Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом... и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: shch_vg, 18:02 14-10-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Только я книгу отсканировал как чёрно-белый текст в PDF с очисткой фона сканером. Но подчёркивания все остались.

 
Теперь только руками. Более менее автоматом вычистить можно только из серого.
 

Цитата:
А когда размер текста меньше страницы — это признак того, что DPI указано меньше, или больше?  

 
У данной страницы разрешение выше чем у других. Проверить разрешение можно любым просмотрщиком.

Всего записей: 2848 | Зарегистр. 17-09-2001 | Отправлено: 09:46 10-02-2020 | Исправлено: niccolo, 09:48 10-02-2020
niksad31

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo

Цитата:
Теперь только руками

Попробовал руками в СканКромсаторе, по пособию нашёл функцию Ctr+Shift+Click на линии подчёркивания. Не пошло, т.к. почти все линии где-то задевают буквы текста, и при клике буквы удаляются вместе с линией. Можно как-то алгоритм этого метода улучшить?
 
А как ещё руками: ластиком в Фотошопе, или какие фильтры имеются?  Есть ли смысл перегнать книгу из PDF в DJVU для лучшего сжатия, и чем без потери качества?

Всего записей: 710 | Зарегистр. 16-09-2016 | Отправлено: 18:14 10-02-2020 | Исправлено: niksad31, 18:20 10-02-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niksad31
работает ли бэкграунд клинер на чб материале - это только разработчик СК подскажет. Я всегда на сером его использовал.
 
оффтоп
"Сами себе злобные буратино", в чб делать сканы. Уж сколько раз твердили миру...

Всего записей: 1553 | Зарегистр. 15-07-2010 | Отправлено: 19:22 10-02-2020
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Имеет смысл в цвете пересканировать.
Тот же Ктрл+шифт + Клик он же и на цветном работает.. Карандаш и ручка - они другие по цвету и часто можно неплохо порог подобрать, так что именно они и уходят, а буквы остаются.
 
Т.е. сначала почистить., сохраняя сканы цветными, а потом уже бинаризовать на втором проходе.
 
Это вот с черной ручкой или старыми темно-фиолетовыми чернилами засада.

Всего записей: 734 | Зарегистр. 13-06-2013 | Отправлено: 19:39 10-02-2020 | Исправлено: daa2013, 19:40 10-02-2020
niksad31

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Так в цвете или серым сканировать? Я думал, чип сканера лучше бэкграунд почистит, хотя там и чистить то нечего, кроме линий. Бинаризацию раньше пробовал, но качество текста ухудшалось, если фон грязный.
 
Непонятно, почему не работает бэкграунд клинер? Автор Кромсатора в той ветке по нейронным сетям упоминал, что использует распознавание текста для очистки фона. Цвет тогда при чём? Текст у меня и Ч/Б чистый без дефектов.

Всего записей: 710 | Зарегистр. 16-09-2016 | Отправлено: 02:24 11-02-2020 | Исправлено: niksad31, 06:04 11-02-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Так в цвете или серым сканировать?

Поэкспериментировал сейчас "от балды". Я, в общем-то, дилетант в обработке.  
Советую перед СК перевести свои чб сканы в 24-bit color, и помимо background cleaner задействовать blur. Кое-что тогда и с чб скана удаляется. Хотя, конечно, фиговенько. Метод "Horizontal", параметр "protect black pixels" снял, иначе линия только жирнее становится.
На чистом чб клинер не работает у меня. Наверное и не должен.
 
А если будете пересканировать, то лучше делайте в цвете. В серый перевести никогда не поздно. Тем более ручка синяя.

Всего записей: 1553 | Зарегистр. 15-07-2010 | Отправлено: 08:05 11-02-2020
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Цвет тогда при чём?  

руками кликаете по синему, синий и удаляется.

Всего записей: 734 | Зарегистр. 13-06-2013 | Отправлено: 08:53 11-02-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Попробовал руками в СканКромсаторе, по пособию нашёл функцию Ctr+Shift+Click на линии подчёркивания. Не пошло, т.к. почти все линии где-то задевают буквы текста, и при клике буквы удаляются вместе с линией. Можно как-то алгоритм этого метода улучшить?

 
 
Для рук сканкромсатор не всегда лучшее решение.  
Линии подчёркивания отличить от текста для автоматического удаления можно только по цвету/интенсивности, что и делается в сером или цвете. В Ч/Б это уже невозможно.
 
А вообще, если речь о карандаше и есть доступ к книге для неопытных товарищей может оказаться проще простой ластик и пересканирование.
Вариант 2 — просто исправить ошибки в распознанном и не мучиться с картинками.
 
А где сейчас последняя версия обитает?
 
И еще вопрос - есть ли где функция выделения глифов из текста (или просто системным шрифтом типа Литературная) с возможностью последующей  запечатки дефектов печати или сканирования? А то все равно когда проверяешь текст в SK исправить такие ошибки просто, чем потом их искать и исправлять в ФР.  
 
Или кто вообще как данный вопрос решает?

Всего записей: 2848 | Зарегистр. 17-09-2001 | Отправлено: 13:01 13-02-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
есть ли где функция выделения глифов из текста

вы о чём? глифы в СК уж тыщу лет применяются. Сначала набираете глиф в табличку, потом оттуда его ставите в нужное место.

Всего записей: 1553 | Зарегистр. 15-07-2010 | Отправлено: 21:03 14-02-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
вы о чём? глифы в СК уж тыщу лет применяются. Сначала набираете глиф в табличку, потом оттуда его ставите в нужное место.

 
О какой версии речь?  
 
После шапки ни одной новой версии в паблике не видел... Поэтому пока сижу на 5.96 или 6.00.05.

Всего записей: 2848 | Зарегистр. 17-09-2001 | Отправлено: 23:51 14-02-2020
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
niccolo
Тыщу не тыщу, а в 6.00.05 глифы есть.

Всего записей: 6544 | Зарегистр. 14-01-2005 | Отправлено: 01:31 15-02-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Тыщу не тыщу, а в 6.00.05 глифы есть.

 
спасибо, изучаю документацию...Там вопросы по разделам и номерам, а не версиям....
Это есть в 6.00.05?
Работа с библиотекой глифов пополнилась рядом
усовершенствований: регулировка представления окошка с
глифами (количество колонок, авто-ширина), мульти-выделение и
мульти-перетаскивание глифов внутри окошка, авто-кроп
вставляемых глифов (удаление лишнего белого пространства
вокруг глифа), добавление заданного белого зазора со всех
сторон глифа.
Добавлена возможность авто-установки глифа в место вставки:
теперь не обязательно точно выбирать точку вставки глифа, СК
сам постарается найти оптимальное положение для вставки,
анализируя некоторую окрестность вблизи курсора.
- Новые hotkey для окна VR: Add glyph to library, Insert
glyph to library

 
По описанию, как понял, глифы в таблице не привязаны к клаве (т.е при нажатии m (например с модификатором - CTRL, ALT etc) — не вставляется глиф из ячейки m?)  
Тогда, как вариант, вместо пустой коллекции глифов можно использовать шрифт типа Литературная (или с выбором) с подбором кегля... (с особенностями вставки глифов типа залития белым фоном прямоугольника вокруг+1-3 пикс)
 
Да отстал я от развития программы... Каюсь...

Всего записей: 2848 | Зарегистр. 17-09-2001 | Отправлено: 02:37 15-02-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Можно ли автоматизировать изменение цвета для колонтитулов, находящихся в определенном участке на всех страницах?

Всего записей: 1036 | Зарегистр. 05-04-2010 | Отправлено: 08:01 10-03-2020 | Исправлено: D1D1D1D, 08:41 10-03-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D
непонятен вопрос. Что такое "колонтитул"? У СК же нет такого термина. У него есть зона.
У зоны может быть признак группы. Размножение свойств может быть сделано по этому признаку. То есть если вы колонтитул выделили зоной и назначили зонам одну и ту же группу, то пожалуйста, групповые операции будут работать.

Всего записей: 1553 | Зарегистр. 15-07-2010 | Отправлено: 10:46 10-03-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
СК — программа. Но мы же с вами люди, могущие общаться и понимать друг друга, применяя любые термины, в том числе описанные в словарях, потому что под колонтитулом имеется в виду обычное словарное значение. Хотелось бы изменить цвет выделенному колонтитулу и чтобы то же самое было применено ко всем последующим страницам в области этого выделения насквозь.

Всего записей: 1036 | Зарегистр. 05-04-2010 | Отправлено: 20:02 10-03-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А прикольная была бы фича в аут-задании Задать одинаковый номер зонам, расположенным в габаритах выделения мышкой. Или касающимся. Размеры-то страниц уже одинаковы.
Но именно прикольная - обработчик сам должен был при расстановке зон подумать о назначении группы.

Всего записей: 1553 | Зарегистр. 15-07-2010 | Отправлено: 06:42 11-03-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Так и не понял: это возможно или нет? Или я о чем-то заранее не подумал?

Всего записей: 1036 | Зарегистр. 05-04-2010 | Отправлено: 09:20 11-03-2020
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да, возможно.
 
 
шаг №1   Выделить колонтитулы в пикчур-зоны.   (предполагаем, что в зонах только колонтитулы)
 
(если страницы заранее правильно обрезаны, то и расставить зоны можно копированием. На одной страницы ее поставить, а затем сделать копи-пасте на все остальные страницы (или на все четные/ на все нечетные страницы). Если где-то колонтитулов нет, то там удалить.  Если где-то колонтитула смещены там зоны пододвинуть.
 
шаг №2 в любой зоне с колонтитулом назначить свойства. Зона "раскрашенная"  (т.е. ч.б., а на закладке PAINT свойств зоны ставите раскраску в желаемые цвета.)
 
шаг №3  назначаете всем зонам свойства  этой правильно раскрашенной  (Там в окне "свойства зоны"  есть кнопка "Копи ту групп" , выберите группу All marked)
 
UPDATE
можно также сразу поставить зону с правильными свойствами и уже её копировать, а не свойства переназначать.

Всего записей: 734 | Зарегистр. 13-06-2013 | Отправлено: 09:48 11-03-2020 | Исправлено: daa2013, 09:53 11-03-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D
По большому счету TelecomUral абсолютно прав: вы недостаточно ясно сформулировали условия вашей задачи. Если нужно расцветить уже обработанные сканы, то алгоритм будет один, если изначально имеем дело со сканами (разно размерными, перекошенными и т.д.) то алгоритм будет другой. В первом случае скорее всего все колонтитулы находятся примерно в одном месте, достаточно  сделать одну/две раскрашенные зоны и размножить их на все страницы или чет/нечет. Лишние потом удалить. Во втором случае это не прокатит, нужно будет ставить зоны ручками на каждой странице. Есть еще одно важное отличие.
Для первого случая (т.е. это out-задание или что то же самое, задание из bw файлов, не требующих обработки), тип зоны должен быть special, а не b/w! Тогда после расстановки зон можно в этом же задании сразу сделать djvu или pdf. Все остальные типы подразумевают что будет сначала выполнена обработка, и только потом через out-задание получать djvu/pdf. Это справедливо и для второго случая.
Если во втором случае обработку не сделать, то на этапе создания djvu такие зоны будут просто проигнорированы.

Всего записей: 3936 | Зарегистр. 09-09-2002 | Отправлено: 18:45 11-03-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
daa2013
bolega
Ясно, спасибо.  
 
Добавлено:
Пытаюсь отснятую на телефон книгу обработать, но никак не удаётся привести в соответствие разные страницы, текст на которых был на разном расстоянии, из-за чего размеры плавающие. На одной странице тест имеет заданные поля, на другой — правое поле чуть больше, а весь текст чуть меньше. Вот такая пара страниц — https://yadi.sk/d/-uxtlQ4uOCsDlw
 
Обрабатываются ли в программе такие случаи?

Всего записей: 1036 | Зарегистр. 05-04-2010 | Отправлено: 20:15 11-03-2020
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru