Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
Можно ли ожидать в ближайшем будущем версию с обработкой штрихов между букв?

Всего записей: 1362 | Зарегистр. 05-04-2010 | Отправлено: 12:13 15-01-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
Может к 3? Там только Background subsample ratio

Нет, именно ко второму, на третьем аналогичный параметр называется несколько иначе. Сканы попадают ко мне уже со слитыми с текстом фото, поэтому зацепить 3 шаг они не могут. На втором шаге есть Background subsample ratio, в своих компиляциях я обычно использовал  значение этого параметра = 3 (200дпи), но здесь меня попросили, чтобы бэкграунд фото был повыше (600дпи). Вот здесь я и столкнулся с вылетом.  
Думал, что СК просто использует модуль DEE, но был удивлен, что DjVu Small на том же модуле успешно откомпилировал дежавю.
Информация о моей системе из "Сведения о системе":
Windows10Pro
Компьютер на базе х64
Доступно физической памяти - 20,3 ГБ

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 14:39 15-01-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
DjVu Small на том же модуле

модуль модулем, а параметров там два десятка.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 14:51 15-01-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Даже если step2, зон там точно нет? Тогда это действительно очень странно. Если там нет вообще никаких зон, то СК просто вызывает DEE, там и ошибке то неоткуда взяться ((
 

Цитата:
всякий раз компилировалось где-то до 30-35 скана

Как вы это узнали? СК на втором шаге не выводит информацию о количестве закодированных страниц.
 
D1D1D1D
Думаю, раньше февраля вряд ли. Кстати, спасибо за пример. Вот что пока получается: https://workupload.com/file/YQANATjnPcr
Первые три страницы повторяются 3 раза: 1 - стадия до удаления марашек, 2 - стадия после простого автоматического удаления марашек, 3 - стадия после окончательного удаления марашек (и реставрация букв) с использованием нового метода на базе OCR после tesseract. 3-я стадия, можно сказать, полу-автоматическая, т.к. требует контроля и нередко вмешательства со стороны пользователя. Степень этого контроля практически полностью зависит от того, насколько правильно tesseract распознал буквы. К сожалению, иногда он лажает.
Остальные 6 страниц повторяются только дважды, там простейший случай, и 3-я стадия не понадобилась.
 

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 14:59 15-01-2022 | Исправлено: bolega, 15:01 15-01-2022
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Спасибо, юзабельно. Наверно, если предварительно немного осветлять текст, чтобы мусорные штрихи отделились от букв — результат уже на второй стадии будет лучше.

Всего записей: 1362 | Зарегистр. 05-04-2010 | Отправлено: 16:14 15-01-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
а как быть, если шрифт на странице от разных языков? несколько раз прогонять?

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 16:37 15-01-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Думаю, раньше февраля вряд ли. Кстати, спасибо за пример. Вот что пока получается: https://workupload.com/file/YQANATjnPcr

 
Вот это результат!

Всего записей: 525 | Зарегистр. 04-05-2016 | Отправлено: 17:07 15-01-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
Даже если step2, зон там точно нет? Тогда это действительно очень странно.

Зон точно нет, все фото интегрированы с текстом.  
Вот и мне это очень странно, т.к. Дежавю Смолл откомпилировал нормально.

Цитата:
Как вы это узнали? СК на втором шаге не выводит информацию о количестве закодированных страниц.

Из выданного лога.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 17:24 15-01-2022 | Исправлено: shch_vg, 17:26 15-01-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
а как быть, если шрифт на странице от разных языков? несколько раз прогонять?

Можно и один. Можно и несколько.
Но как правило, марашки только на кириллических буквах.
 
 
Добавлено:
D1D1D1D

Цитата:
осветлять текст, чтобы мусорные штрихи отделились от букв  

ну-ну

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 17:28 15-01-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, от себя пожелания:
чтобы в новых версиях программы можно было закреплять в профиль настройки полей. Например, я установил настройки полей "none" и они после закрытия и открытия программы так и оставались в "none". Сейчас настройки полей не сохраняются, они всегда возвращаются в "auto "

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 18:20 15-01-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
вспомнил, как я пытался без создания out-task на XP запустить дежавю-визард. То есть на первичных цветных сканах. В Диспетчере задач было видно, DEE забирал ступеньками всю оперативную память, где-то по сто мегов на страницу, и примерно на 28-32 странице СК грохался с "out of memory". В зависимости от количества прочих программ в оперативке.
Может, у вас словарь стоит большой для такого случая? Или в small столько же?

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 18:36 15-01-2022 | Исправлено: TelecomUral, 18:36 15-01-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
чтобы в новых версиях программы можно было закреплять в профиль настройки полей

это уже сделал
и направление зума колесиком можно задать

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 18:52 15-01-2022 | Исправлено: bolega, 18:53 15-01-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral
Не понял, причем здесь DEE, если тот же DEE в рамках Дежавю Смолл отрабатывает нормально?
Я же писал, что в смолл повторил все параметры, представленные в логе СК, включая и размер словаря. Интересно, какой бы Вы поставили размер словаря при создании дежавю из 44 больших сканов размером А3?
Да и ожидать, что уже 35-й скан будет критическим при памяти в 24 гига, как-то несерьезно.
 
bolega
Если уж пошла речь о настройках, сделайте что-нибудь, чтобы управлять значением списка из окна "Открыть", в котором сейчас все время стоит Sort smart.
Периодически напоминает о себе ударом по мозгам

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 19:11 15-01-2022 | Исправлено: shch_vg, 19:11 15-01-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я же писал, что в смолл повторил все параметры

виноват, не уловил, что из лога.

Цитата:
Интересно, какой бы Вы поставили размер словаря при создании дежавю из 44 больших сканов размером А3

30.
Попробовал загнать 53 скана, А3, в 600дпи (может у вас больше?). Всё получилось. На скриншоте виден размер скана в пикселях и лог с вызовом.

дежавюшка:
https://disk.yandex.ru/d/Vm4yEnrUrf5YYQ
 
Посмотрел итоговый лог, есть занятная строчка:
Step 2 finished at 15.01.22 22:11
Encoding completed successfully but with WARNING(s)

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 20:27 15-01-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral
С Вашими параметрами у меня вылетело уже на втором скане.


Цитата:
Encoding completed successfully but with WARNING(s)

На такие сообщения я просто не обращаю внимания.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 00:16 16-01-2022 | Исправлено: shch_vg, 00:17 16-01-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
и направление зума колесиком можно задать

bolega
Это хорошо, а то по инерции как в визарде хочется изменить зум на главной странице колёсиком, а вместо увеличения (уменьшения) перескок на другую страницу.

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 00:23 16-01-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
в логе у вас - типичная ошибка, documenttodjvu что-то не нашёл в своём окружении. То ли имя профиля, то ли параметр в профиле какой отличается. Редкая но типичная ошибка конфигурации программы. Ведь small у вас не этот же самый файл вызывает? Копию небось.
 
+
Я ваш очень старый пост нашёл

Цитата:
В моем батнике documenttodjvu.exe используется с множеством параметров, которые не понимает ни documenttodjvu.exe из выложенной Вами ссылки, ни documenttodjvum.exe из Djvu Small.

http://forum.ru-board.com/topic.cgi?forum=5&topic=29984&start=1360

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 06:46 16-01-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я тоже подумал, что видимо, СК настроен на вызов другого documenttodjvu.exe, наверно из комплекта DEE, а про него был разговор, что там есть баги. А в модифицированной версии их нет
 
Добавлено:
kamenkapenza

Цитата:
Это хорошо, а то по инерции как в визарде хочется изменить зум на главной странице колёсиком, а вместо увеличения (уменьшения) перескок на другую страницу

Я вроде про другое написал: про инвертирование направления зума.
А то, что вы упомянули, нужно делать с зажатым Ctrl. Можно также в Files > Options отключить Scroll files by wheel

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 10:30 16-01-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
в модифицированной версии

я тут собирал  
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1336222925/261#261

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 10:51 16-01-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral

Цитата:
в логе у вас - типичная ошибка, documenttodjvu что-то не нашёл в своём окружении.

Интересно, а что он находит в своем окружении, стоит поменять значение Background subsample ratio с 1 на 2?
 
bolega

Цитата:
Я тоже подумал, что видимо, СК настроен на вызов другого documenttodjvu.exe, наверно из комплекта DEE, а про него был разговор, что там есть баги. А в модифицированной версии их нет

Чтобы отделить родной dee, нужно попотеть, т.к. он без своего окружения не работает. Гораздо проще взять из смолла екзешник с буквой м на конце, убрать эту букву и подсунуть его СК.
 
P.S. Кстати, для еще большего упрощения процесса нахождения этой программы в СК стоило бы добавить в поиск и вариант с М на конце, тогда появляется возможность непосредственно подключать модуль из смолла.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 13:20 16-01-2022 | Исправлено: shch_vg, 13:27 16-01-2022
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru