Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega уже ответил на вопрос о Save as — все есть в файле sk.6.8.whats.new.txt:
 

Цитата:
Options, закладка Task добавлена опция Menu command. Если задано значение "Save as+Save", то в главном меню в дополнение к команде   Save task as добавится команда Save task, при вызове которой диалог выбора файла предлагаться не будет. На панели инструментов появится также дополнительная кнопка.

 
И будет в File оба пункта — и Save... и Save as...

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 15:56 29-07-2022 | Исправлено: asku, 15:58 29-07-2022
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Привет. В архиве sub-task. Как добиться, чтобы элементы Й-краткого не сливались, при этом сохранив оригинальную толщину букв?
 
 

Всего записей: 1367 | Зарегистр. 05-04-2010 | Отправлено: 20:20 29-07-2022 | Исправлено: D1D1D1D, 20:36 29-07-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Есть еще идея. Не знаю, насколько это трудно реализовать, но вещь была бы мегаполезная — экспорт txt-файла из СК (из текстового слоя).
Ведь в процессе работы над сканами в СК исправляются ошибки и в конце работы над проектом в СК имеется фактически безошибочный (или почти безошибочный) текст книги, и как было бы хорошо воспользоваться им. Достаточно экспорта в простой текстовый формат, но кодировке UTF-8 (Юникод).
 
 
И еще вопрос. Можно ли реализовать автоматическую замену знака ' (юникод 0027) на знак (юникод 2019) ?

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 22:09 29-07-2022 | Исправлено: asku, 23:26 29-07-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Как добиться, чтобы элементы Й-краткого не сливались, при этом сохранив оригинальную толщину букв?

играйтесь силой sharpen (я ставил 45) и порогом бинаризации (я не менял). Галку Blur уберите. Я вообще эти три галки на закладке Quality не ставлю никогда, больно они мощные.
 
В целом вы хотите противоречивой задачи: бледная грязь между кусочками буквы неизбежно ведёт к понижению порога, а значит утончению букв с краёв. Ну, ещё можете bw-зону на одну букву поставить Со своим порогом. Или заменить потом "й" на хороший глиф.
 
мой результат

 
Добавлено:
оффтоп для asku

Всего записей: 3046 | Зарегистр. 15-07-2010 | Отправлено: 04:03 30-07-2022 | Исправлено: TelecomUral, 04:11 30-07-2022
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Спасибо!

Всего записей: 1367 | Зарегистр. 05-04-2010 | Отправлено: 05:03 30-07-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мир всем!  
Вопрос первый, для всех простой (кроме меня )) ): как выделить (чтобы они покраснели) группу файлов последовательно или выборочно  в списке файлов (тот который главный в крайнем левом углу прораммы? Один файл выделяется через ЛКМ и нажатия пробела, так же можно выделять и другие, но это надо на каждый "вставать" и нажимать пробел. Чтобы выделить группу последующих файлов или в непоследовательности друг за другом файлов, а выборочно в программах обычно работает связка Ctrl+ЛКМ, Shift+ЛКМ. В данном случае для покраснения последовательных файлов или выборочного выбора файлов такая комбинация не работает.  
Вопрос второй (могут не все знать): в панели показа страниц  (Show tumbnails) есть возможность такого выделения файлов для функции "Выбранные файлы"? В отличие от простого списка файла на этой панели видно, что выделять (видны страницы) для групповой обработки. То есть через выделение нужных файлов на панели Show tumbnails выделялся (краснел) список файлов (в левом верхнем углу программы), и можно было эти выделенные файлы запускать в групповую обработку Process selected.

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 10:02 30-07-2022 | Исправлено: kamenkapenza, 10:13 30-07-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
как выделить (чтобы они покраснели) группу файлов последовательно или выборочно  в списке файлов

выделили красным начальный файл в будущем красном списке, перешли на последний, ПКМ/Select group/Up to previous selected. По-русски команда звучит Выделить группу/До предыдущего выделенного файла.

Всего записей: 3046 | Зарегистр. 15-07-2010 | Отправлено: 10:14 30-07-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral, спасибо!  
А про взаимосвязь (Show tumbnails) с простым списком файлов (слева вверху). Есть она? Хотелось бы, чтобы была. Нужные (визуально выбираем) страницы на панели Show tumbnails выделять выборочно (через Ctrl+ЛКМ) или последовательно (через Shift+ЛКМ) и в резульате этих действий эти выделения параллельно отображались в списке файйлов (тот который в левом верхнем углу), а затем эти выбранные страницы (простым и удобным путем обрабатывать через Process selected
И на панели Show tumbnails неплохо было бы сделать функцию отображения страниц. Сейчас она идет в один столбец вниз. Добавить кроме такого расположения расположение в два, три, четыре столбца при последовательности просмотра файлов слева направо (при четырех столбцах первые четыре, ниже вторые четыре и т.д.) Или сделать панель Show tumbnails растягивающейся с возможностью захвата ЛКМ тянуть вбок, и при этом один ряд преврещался в два, три, четыре по аналогии с просмотром паок на компьютере: чем шире папка, тем больше рядов просмотра файлов в режиме просмотра значков). Это было бы удобно, когда в книге идет череда картинок, они где то в одном месте книги, а в основном текст. В таком случае удобно было бы не выискивать их, запустить общую обработку, а потом, когда дойдем в панели просмотра до картинок, выйти на главную, установить зоны, выделить эти страницы и переобработать. Для такого случая было бы очень полезно то, что я предлагаю (если такого сейчас нет). Просто попалась сейчас книги 650 страниц, в основном один текст, а посередке затесалось 10 листов с фото. Чтобы не выискивать их, запустил общую обработку, а на панели результатов дошел до картинок и вернулся на главную панель для работы с этим истраницами и их переобработки.

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 10:36 30-07-2022 | Исправлено: kamenkapenza, 10:55 30-07-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я не знаю, никогда не пользовался.  
Мне не нужна панелька превьюшек, всю обрабатываемую книгу удерживаю в голове. Там не так уж много специальных блоков страниц. Текст, обложки с форзацами, и вклейки, ну текст бывает на разной бумаге или разной плотности печати, так это всё равно не требует особенной отдельной обработки, порог "auto" всё вытягивает. А если конкретные ляпы, непропечатки и тэ пэ - так они поодиночке встречаются, а не группой.

Всего записей: 3046 | Зарегистр. 15-07-2010 | Отправлено: 10:47 30-07-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Мне не нужна панелька превьюшек, всю обрабатываемую книгу удерживаю в голове.  

Вам проще, а я не сам сканирую и, открывая сканы, даже не ведаю, что там, есть там картинки или нет.

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 10:57 30-07-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Чтобы не выискивать их...

...надо было поставить им жирность или красноту в списке.
 
Добавлено:

Цитата:
Вам проще, а я не сам сканирую и, открывая сканы, даже не ведаю

и я не ведаю иногда. но в момент отсмотра правильности расстановки резаков формирую взгляд на книгу как на объект обработки. То есть до начала какой-либо бинаризации.

Всего записей: 3046 | Зарегистр. 15-07-2010 | Отправлено: 10:58 30-07-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
...надо было поставить им жирность или красноту в списке.

Я считаю, что в случае, когда много текста и мало картинок, и они где то находятся в книге, запускать общую обработку и находить эти страницы с картинками уже на панели результатов, возвратиться в главное меню, выделить эти страницы и переобработать, а чтобы выделить, нужно видеть, что выделять, и возможность выделения на панели Show tumbnails и её связь со списком файлов (выделяя на Show tumbnails краснели файлы в списке файлов)  была бы иной раз очень кстати.

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 11:04 30-07-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
запускать общую обработку и находить эти страницы с картинками уже на панели результатов

так я и тыкаю носом, образно выражаясь, в бессмысленность таких действий. Вы вообще не отсматриваете оригинальные сканы, и как же вы тогда боретесь за хорошо обработанную е-книгу. Одни громкие слова о превосходном СК, который фактически используется вслепую.
бог вам судья, разумеется.  
 
upd  
мне хотелось разобраться, откуда такая потребность в превьюшках

Всего записей: 3046 | Зарегистр. 15-07-2010 | Отправлено: 11:57 30-07-2022 | Исправлено: TelecomUral, 12:40 30-07-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подожду ответа от высшей инстанции, что на это начальник скажет, если посчитает нужным )).  
Моё предложение: в последующей версии сделать то, о чем я говорил выше (модифицировать вкладку Show tumbnails). Или сделать панель просмотра страниц всплывающей наподобии других панелей (например, панель глифов), но чтобы при выделении страниц на этой вкладке они так же выделялись в списке файлов для возможности внесение в процесс обработки выбранных страниц. Вреда от этого предложения никакого не будет,только польза

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 13:01 30-07-2022 | Исправлено: kamenkapenza, 16:00 30-07-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
насколько я уяснил работу с режимом thumbnails окна VR, нажимая в нём F2|F3 можно красить красным оригинальные сканы.

Всего записей: 3046 | Зарегистр. 15-07-2010 | Отправлено: 16:42 30-07-2022
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega спасибо за очередную версию, некоторые наблюдения:  
- tesseract вылетает при пакетном распозновании, но при этом работает распознавание этой же страницы из VR (где-то страниц 35-40, возможно по памяти?), но само распознование довольно неплохое, я бы даже сказал вполне на уровне
- замена букв работает хорошо (скорее отлично), но например не смог добавить в игнор нижние и верхние двойные кавычки, при этом СК прерасно съел польский язык с его диакритическиеми знаками. Что еще заметил, иногда почему-то точки над i, j оставались красными в режиме подсветки спеклом даже после перераспознавания страницы.
- при замене букв очень помогают фильтры (ширина и высота), а также марашки.
- очень полезная функция вставки зоны-картинки по горячей клавише.
- часть подсказок крякозябрами, что-то с кодировкой? Те же крякозябры для польского оказались в игнор. листе для деспекла (Win10)
 
Зачем верхние и нижние двойные кавычки в игнор листе?
Для корректного удаления марашек увеличиваю размер спекла (может это и не нужно???), при этом кавычки становятся марашками и если их много, то удаление марашек становится не таким быстрым.
 
Если возможно, хотелось бы когда-то для зоны-картинки принудительную ортогональность относительно страницы (так как получается при вставе через буфер обмена), чтобы не ломались диагональная штриховка на картинках.
 
Если возможно, то хотелось бы ролик по режимам бинаризации в разных сложных случаях в т.ч. и про AutoW.

Всего записей: 783 | Зарегистр. 03-07-2005 | Отправлено: 17:33 30-07-2022
bond012

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подробнее... для bolega[/more] [/more] [/more]

Всего записей: 4 | Зарегистр. 31-07-2022 | Отправлено: 20:06 31-07-2022 | Исправлено: bond012, 20:15 31-07-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
bond012
Столкнулся с книгой

в книге dpi=288, а число пикселей примерно соответствует dpi=600. То есть вы фактически обрабатывали книгу под 1200dpi.

Всего записей: 3046 | Зарегистр. 15-07-2010 | Отправлено: 06:02 01-08-2022
bond012

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подробнее...для TelecomUral  [/more]
 
Добавлено:

Цитата:
bolega

Уважаемый bolega!
Сейчас делаю книгу, все шло хорошо, просто отлично, но когда дошел до финализации файлов, программа профинализировала несколько первых файлов, а потом выдала сообщение об ошибке и не хочет остальные файлы финализировать. Как мне быть? Я снял для вас видео, чтобы Вы наглядно все увидели (видео в формате *.exe, просто запустите его, и оно откроется в своем проигрывателе с высоким качеством), сделал Ваш любимый субтаск, всё сложил в архив вместе с рабочей папкой книги, который можете скачать с адреса: https://disk.yandex.ru/d/CayQC8qgjFqtLw
Благодарю за возможность обращения. [/more]
 
Добавлено:

Цитата:
bolega

Уважаемый bolega!
Исследуя проблему с невозможностью финализации некоторых файлов, я обнаружил, что это производит на тех фалах, на которых включена иллюминация. При этом у меня была включена иллюминация на всех файлах, и при этом на части файлов финализация не происходила. Однако, как только я отключил иллюминацию на тех файлах, которые не желали финализироваться, финализация после этого, как только я перепроцессил их, прошла успешно. Вот такие дела!
 

Всего записей: 4 | Зарегистр. 31-07-2022 | Отправлено: 07:49 01-08-2022 | Исправлено: bond012, 11:50 01-08-2022
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bond012
"видео в формате *.exe" — это подозрительно, тем более в сообщении новичка с двумя комментами.  
 
"просто запустите его" — ага)

Всего записей: 1367 | Зарегистр. 05-04-2010 | Отправлено: 14:48 01-08-2022 | Исправлено: D1D1D1D, 14:50 01-08-2022
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru