Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162

Открыть новую тему     Написать ответ в эту тему

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: сканирование, обработка, сборка
 
Текущая версия программы : ScanKromsator v6.8 ScanKromsator v6.75
добавки и замечания к v6.75 от bolega
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate! Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.
 
Предыдущая версия программы: ScanKromsator v6.71 Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  Устаревшие версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее...
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...
 


ВАЖНО ! Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом... и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: TelecomUral, 12:36 25-11-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А вы задали в опциях число ядер процессора ?

Всего записей: 969 | Зарегистр. 13-06-2013 | Отправлено: 22:18 09-03-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А вы задали в опциях число ядер процессора ?

 
Если вопрос мне - я не трогал дефолтные настройки, тем более что они сами подхватились с версии 6.5х
Медленнее по ощущениям даже на Драфте....

Всего записей: 3361 | Зарегистр. 17-09-2001 | Отправлено: 23:53 09-03-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Алгоритмы обработки и драфта в последних версиях не менялись. Так что это скорее только ощущения. Такое бывает, когда инструмент не любишь, кажется, что он работает все хуже и хуже
В 6.7x слегка изменилась обработка только для 1200dpi, она стала более устойчивой к нехватке памяти на 32 разрядной Windows.

Всего записей: 4198 | Зарегистр. 09-09-2002 | Отправлено: 09:27 10-03-2021
Benoni



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Так что это скорее только ощущения. Такое бывает, когда инструмент не любишь, кажется, что он работает все хуже и хуже  

!

Всего записей: 1697 | Зарегистр. 15-06-2006 | Отправлено: 10:09 10-03-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
я не трогал дефолтные настройки

Если хороший комп, рекомендую задать использовать несколько ядер. Скорость обработки вырастет в несколько раз. На драфт не влияет пока..
 
Добавлено:
Benoni
i

Всего записей: 4198 | Зарегистр. 09-09-2002 | Отправлено: 10:37 10-03-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Хочу поделиться очередной идеей полезного применения тессерактовских ячеек для букв.
 
Иногда такое бывает, что по всей книге при джву-кодировании вылезает ошибка transposed letters, именуемая инода на жаргоне "ошибкой ИНь". Это когда буквы И и Н перепутываются, и одна подставляется вместо другой. Объяснять и примеры приводить тут, наверное,  даже и не надо.
 
Ну, так вот.
 
Взять и объявить все ячейки для букв И и Н зонами лосслесс кодирования.  
Точнее, сначала провести OCR, а потом выбрать буквы, ячейки для которых станут такими зонами.  
Перепутывание, оно ведь по разному случается.

Всего записей: 969 | Зарегистр. 13-06-2013 | Отправлено: 16:51 16-03-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
зоны определяются нечетко.

Всего записей: 2270 | Зарегистр. 15-07-2010 | Отправлено: 17:12 16-03-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ну и что ?  
Какая разница в точности их границ, если внутри них гарантированно произойдет сохранение ч.б шейпов. Страдающие буквы-то они по любому захватывают.
 
Насколько я знаю, если лосслесс зона перерезает посередине какую-то букву, то она от этого не портится.

Всего записей: 969 | Зарегистр. 13-06-2013 | Отправлено: 19:50 16-03-2021 | Исправлено: daa2013, 19:52 16-03-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
И вот еще дополнение.
У меня есть словарь, где ИНь только в заголовках словарных статей, а в самом тексте нормально.
Но это всё равно тысячи слов.
 
Можно встроить проверку на размер. То есть не только чтобы И была опознана, а еще чтобы она скажем оказалась по высоте больше N пикселей. И только тогда выставлялась лосслесс зона по координатам ячейки.

Всего записей: 969 | Зарегистр. 13-06-2013 | Отправлено: 00:21 17-03-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Уточнение к дополнению.
 
Например, чтобы было условие   по высоте больше/меньше,  по ширине больше/меньше
Плюс возможное сочетание комбинации этих условий.  
Тогда ИМХО любую букву любого шрифта можно будет в лосслесс зоны поймать.

Всего записей: 969 | Зарегистр. 13-06-2013 | Отправлено: 01:23 19-03-2021 | Исправлено: daa2013, 08:57 19-03-2021
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013 можно еще так дополнить вашу идею:
1.  Исходный ч/б скан распознать tesseractом.  
2. Разделить скан на две части: первая - с буквами и,н,п на белом фоне, вторая - со всем остальным.
3. Вторую часть агресивно кодируем в djvu, а затем декодируем.
4. Объединяем  первую часть с декодированой. Получится файл с некоторыми одинаковыми шейпами, но буквы и, н, п будут исходного начертания.
5. Кодируем в djvu результирующий tif с умеренной агрессией.  
 

Всего записей: 798 | Зарегистр. 14-12-2005 | Отправлено: 09:51 19-03-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013
U235
Вы так интересно обсуждаете, как решить проблему инь и янь.
А можно привести пример исходного скана, результат его дежавуирования, на котором это проявляется, и обязательно (иначе предыдущее не имеет смысла) указать, какой программой и с какими параметрами создано дежавю?

Всего записей: 6751 | Зарегистр. 14-01-2005 | Отправлено: 15:46 19-03-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
del

Всего записей: 4198 | Зарегистр. 09-09-2002 | Отправлено: 20:34 19-03-2021 | Исправлено: bolega, 22:26 19-03-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сфотографированные книги с поочерёдно развёрнутыми влево и вправо страницами можно как-то в один проход исправить в оригинале в СК?

Всего записей: 3361 | Зарегистр. 17-09-2001 | Отправлено: 13:50 22-03-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
niccolo
Один неудачно заданный вопрос порождает минимум два встречных:
1. Что такое "с поочерёдно развёрнутыми влево и вправо страницами"?
2. Что понимается под "исправить в оригинале"?

Всего записей: 6751 | Зарегистр. 14-01-2005 | Отправлено: 14:17 22-03-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
 
1. поочерёдно развёрнутыми влево и вправо страницами  — чётные - повёрнуты по ч/с на 90, нечётные — против ч/с на 90°, или наоборот.
 
2. исправить в оригинале — повернуть именно оригиналы изображений (перезаписать оригиналы повёрнутыми), а не их представление в программе.
 
пример SINGLE PAGE ORIGINAL JP2 TAR  
https://archive.org/details/schlomannoldenbo1319schl/page/354/mode/2up
 
И есть ли пути ускорения работы с jp2?

Всего записей: 3361 | Зарегистр. 17-09-2001 | Отправлено: 14:25 22-03-2021 | Исправлено: niccolo, 14:28 22-03-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я обычно jp2 конвертирую при помощи ирфана в тиффы.
Наверное там же можно и повороты пакетно сделать.

Всего записей: 969 | Зарегистр. 13-06-2013 | Отправлено: 15:40 22-03-2021
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
niccolo
Выделяете нужную группу файлов и поворачиваете за один проход,
выделить можно через один автоматически

Всего записей: 772 | Зарегистр. 03-07-2005 | Отправлено: 17:43 22-03-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bearjrgm
 
Спасибо. Разобрался. За один проход, я так понимаю, нельзя

Всего записей: 3361 | Зарегистр. 17-09-2001 | Отправлено: 17:49 22-03-2021 | Исправлено: niccolo, 17:51 22-03-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Можно. Маркируете все файлы. Выделяете все те, что +90. Выставляете для них orientation +90. Затем инвертируете выделение и выставляете для них -90. Затем команду rotate and save, параметр get angle from ставите = orientation option.
Но СК очееень медленно работает с Jp2, поэтому правильно рекомендуют сначала конвертнуть в тиф.

Всего записей: 4198 | Зарегистр. 09-09-2002 | Отправлено: 18:03 22-03-2021
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2023

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru

Рейтинг.ru