Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день.
Подскажите пожалуйста! Заранее скажу, что пдф-справочник смотрел и ответ не нашел.
 
Как выставлять резаки для книги с такими сканами? То есть, чтобы программа не захватывала ненужное пространство (то есть фрагмент соседней страницы).
Книга очень большая (более 1200 страниц), и если начну вручную поправлять каждую страницу, то на это уйдет очень много времени.
 
Спасибо!
 
 

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 16:27 17-10-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
а сканы по внешнему виду (положению линии корешка) - стандартны? Тогда размножьте положение "через один скан". ПКМ на головке резака для 6.00.5.
 
Кстати, тщательная проверка резаков, точно ли они стоят, всё равно необходима. Глазками.

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 18:01 17-10-2019
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
а сканы по внешнему виду (положению линии корешка) - стандартны?  

 
Стандартны. То есть -- то слева, то справа. Но я книгу в сканере клал не строго по одной линии (не знаю как это объяснить), так что резаки даже «через один скан» все равно не всегда верно выставляются.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 18:40 17-10-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
 

Цитата:
не всегда

мне кажется, такого инструмента нет, чтобы логически заблокировать кусок контента от опознавания. Алгоритм, как я понимаю, тупо ищет с края блок текста, с некоторыми особенностями. Сказать алгоритму "а если нашел узкую полоску то ты её пропусти" - нельзя.  
 
Во всяком случае 1200 страниц всё равно отсматривать Так что поставьте это примерное положение резака в наиболее массовое положение корешка, чтоб поменьше мышкой двигать. Не так страшен чёрт. Я 1800 страниц отсматриваю сейчас, и ничего.
 
Ещё есть галка "Ignore if the existing cutter closer to the text". Но что-то я не подберу версию её использования в вашем случае.

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 04:42 19-10-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
В draft на закладке Preprocess задайте опцию Pre-cut. Она работает именно для игнорирования куска слева или справа (либо попеременно для неч/чет страниц). Выделите все страницы где кусок слева, задайте precut = left и выполните draft при range = selected. Затем сделайте то же самое но для страниц right. Можно делать и для всего диапазона, если задать precut = left, right (или right,left в зависимости от того, с какой стороны начнется появление куска).  
Размер игнорируемого куска задается там же в долях ширины страницы. В вашем случае достаточно 1/6 или 1/7. Его стоит задавать с небольшим запасом, т.е. не стремиться подрезать очень близко к полезному тексту.
Кстати, размер доли можно посмотреть в главном окне: включить левый резак, подвести в место, до которого контент нужно игнорировать и в КМ резака выбрать команду Metric

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 08:51 19-10-2019 | Исправлено: bolega, 08:52 19-10-2019
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В draft на закладке Preprocess задайте опцию Pre-cut.

"Очевидно, Ватсон!" (с)

Всего записей: 2873 | Зарегистр. 22-03-2005 | Отправлено: 18:40 19-10-2019
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В draft на закладке Preprocess задайте опцию Pre-cut. Она работает именно для игнорирования куска слева или справа (либо попеременно для неч/чет страниц). Выделите все страницы где кусок слева, задайте precut = left и выполните draft при range = selected. Затем сделайте то же самое но для страниц right. Можно делать и для всего диапазона, если задать precut = left, right (или right,left в зависимости от того, с какой стороны начнется появление куска).  

 
Получилось. Спасибо!

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 10:35 20-10-2019
SVN75

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый вечер!
 
Хотелось бы попросить уважаемых гуру помочь советом в том как «эффективно разобраться» с книгой несколько страниц которой я выложил по этому адресу. Качество невысокое (возможно делали снимки экрана со страниц на сервере Google books или Amazon или чего-то подобного). Я добросовестно почитал инструкции к использованию функций, представленных на панели «Quality» СК, и поэкспериментировал с параметрами, вроде «Blur/Sharpness», «Illumination» и прочими, но мне так и не удалось добиться мало-мальски пристойного результата. Понятно, что из такого худого изображения конфетку не сделаешь, но хотелось бы понять до какого качества можно «дотянуть», поэтому я и прошу взглянуть профессиональным глазом и посоветовать куда копать. А если не поленитесь чуть объяснить, почему имеет смысл копать именно в эту сторону, то я буду очень признателен (именно эти функции во всех самиздатных руководствах описаны хуже всего, к тому же рискну предположить, что некоторые из них работают не совсем так, как можно ожидать из названия, или имеют столь ничтожный эффект, что никому пока не удалось обнаружить оный).

Всего записей: 31 | Зарегистр. 26-02-2014 | Отправлено: 23:31 24-10-2019
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
SVN75
Скриншоты в PDF не могут отображаться в масштабе 1:1 и замыливаются, вероятно в этом вся проблема.
Можно перепаковать их в CBR и смотреть в оригинальном размере.
 

Всего записей: 332 | Зарегистр. 10-08-2018 | Отправлено: 23:59 24-10-2019
SVN75

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Archivist
Спасибо за идею. Я конвертировал (в помощью Calibre). Две страницы могут быть найдены здесь и здесь. Но проблема всё же в низком качестве сканирования (или, как мне по-прежнему думается, снимков экрана с чего-то вроде Google books, где качество изображения занижают целенаправленно). Вопрос можно ли его хоть как-то улучшить с помощью СК остаётся. Кстати, если сосканировано качественно, то и в pdf более или менее смотрится, хоть формат и не для этого предназначен, разумеется.

Всего записей: 31 | Зарегистр. 26-02-2014 | Отправлено: 19:34 25-10-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня в два действия (обычная бинаризация без кволити, но есть апсемплинг) так получилось:
https://yadi.sk/d/hX0bMBMp1EmmVg

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 20:35 25-10-2019 | Исправлено: daa2013, 20:38 25-10-2019
SVN75

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
 
Спасибо. У меня такой эксперимент даёт чуть худшие, но, в принципе, похожие результаты (пробовал выходное разрешение ставить «twice greater» и 600, а resample filter — bicubic). Собственно вопрос сводится к тому, можно ли что-то улучшить, манипулируя параметрами на вкладке качества (методом тыка плохо получается, больно там много всего, надо всё же хотя бы качественное понимание иметь что там есть что).

Всего записей: 31 | Зарегистр. 26-02-2014 | Отправлено: 21:13 25-10-2019
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Не смог импортировать этот пдф (45,9 мб), СК просто молча создает выходную директорию и все.
Акробат импортировал нормально.
Похоже проблема в первых 8 сканах, т.к. СК 5.93 вытаскивает, начиная с 9-го скана.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 17:30 04-11-2019 | Исправлено: shch_vg, 18:06 04-11-2019
chesskom



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
(...)

Всего записей: 1083 | Зарегистр. 02-07-2005 | Отправлено: 19:41 04-11-2019 | Исправлено: chesskom, 03:11 05-11-2019
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
chesskom
Я же написал:
Цитата:
Акробат импортировал нормально.
, а выложил это я для автора программы, если ему это интерсно.
Что-то похожее уже было недавно.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 21:33 04-11-2019 | Исправлено: shch_vg, 21:37 04-11-2019
Kazakalitopus

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Коллеги, прошу не бить за совершенно тривиальный вопрос, но он сводит
с ума.  Только что обработал книжку целиком (нажал кнопку Process).
Открылось окно Result View.  Вижу обработанные страницы, еще не
финализированные, листаю.  Содержимое страницы выделено желтым
фоном.  Подправляю (двигаю мышкой поля, если надо).  Вижу какую-то
грязь, которую хочу удалить.  Рука тянется выделить прямоугольник мышкой
и нажать delete.  Но мышка не выделяет!  Пытаюсь сменить тип выделения
на эллипс - меняется, но мышка не выделяет.  Пытаюсь выбрать ластик
в ряду иконок - выбирается (кнопка становится как бы нажатой), но
форма курсора не изменяется, остается стрелка, а не прямоугольник.
И так же с метлой, magic wand и т.д.
Что не так?  Что-то изменилось в интерфейсе за последнее время?
(Я не пользовался кромсатором несколько лет, версия сейчас у меня
5.96.2, ей успешно пользовался, хотя уже не помню, чистил ли что-то
в Result view или и без того получалось).  Или я схожу с ума?
Полистал документацию, все советы и ответы обычно начинаются
со слов "выделите мышкой и..."  Но она не выделяет!
Или это происки Windows 10?
Помогите, не дайте пробить монитор головой!

Всего записей: 255 | Зарегистр. 24-11-2004 | Отправлено: 15:21 29-11-2019
SVN75

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Kazakalitopus
Так оно всё не будет работать, покуда финализация не завершена. Если все поля подвинуты куда надо, то закрываете Result view, далее Process / Finalise / All. Или по одной страницы финализировать через контекстное меню прямо в Result view. Тогда все инструменты заработают.
 
В 5.96.2 всё работало поскольку там финализация не была принудительной, как в последней версии.
 
Добавлено:
Не совсем удобно такое спрашивать, но меня что-то заклинило и не понимаю как сделать несложную (наверное) вещь. И таки-да я пробовал прочесть материалы, упомянутые в шапке этой темы, но там про подобную проблему не говорится (или я не понял, хотя честно пытался).
 
Итак, на странице помимо текста есть цветной рисунок, который помещён в picture-зону. При этом в зоне оказывается и часть белого пространства вокруг рисунка (он имеет сложную форму) с мелкими speckles (грязь). При обработке грязь вне зоны исчезает, но внутри оной, разумеется, остаётся. Далее в свойствах зоны есть параметр Despeckle (их даже два: Despeckle source area и просто Despeckle; я не понимаю, чем они отличаются и на всякий случай включил оба). Обрабатываю с этими параметрами. Эффекта — нуль! Грязь внутри зоны продолжает прекрасно себя чувствовать. Не то, чтобы было так уж сложно убрать её в руками Photoshop, но хочется понять как это должно работать.

Всего записей: 31 | Зарегистр. 26-02-2014 | Отправлено: 18:16 29-11-2019 | Исправлено: SVN75, 18:19 29-11-2019
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
SVN75
В RV в верхнем меню выберите вместо One page вариант Zones и там издевайтесь над картинкой, как хотите.
Другой вариант: сначала делаете merge зоне, а потом чистите на странице.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 21:08 29-11-2019 | Исправлено: shch_vg, 21:11 29-11-2019
SVN75

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Спасибо! Совет улучшил положение. Photoshop уже точно не понадобится. Но грязь всё же не убирается стандартным инструментом (Mouse-up despeckle). Её можно вычистить с помощью mouse-up clear или ластика, но мне хотелось бы понять почему же всё-таки не работает despeckle ни в каком варианте.

Всего записей: 31 | Зарегистр. 26-02-2014 | Отправлено: 22:04 29-11-2019
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день. В СК можно выставить текст по центру (Page h.align=С, Page v.align=С).
Но что делать если текст в книге выровнен не совсем по центру, а чуть вверх (см. рис.). Конечно, не велика ошибка будет все выровнять по центру страницы. Но хочется аутентичности?
Как быть? Вручную двигать на заданную величину?
Спасибо.
 
 

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 11:59 30-11-2019
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru