Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Начал сканировать разные старые каталоги шрифтов и возникли следующие соображения:
 
1. В одном каталоге одна страница была испорчена в типографии (замятие еще до печати), в другом - алфавит дан не полностью. Т.е. хотя цель - это собрать напечатанные в одинаковых условиях буквы  (а не пришедшие с разных страниц, где качество гуляло), всё равно могут возникать ситуации включения букв разного происхождения. Это я к чему. Возможно окажется полезным не только фильтр утоньшения, но и утолщения, причем применяемые не только ко всем глифам листа, но также и индивидуально.   (Особо оговорюсь и повторюсь, я пишу тут "возможно".)
 
2. С масштабированием цветных глифов. Хорошо бы иметь возможность делать его колесиком мышки. Ctrl+колесико. И еще в режиме прозрачности. И так чтобы результат после бинаризации+вклейки где-то запоминался и демонстрировался. Чтобы подобрав на одной букве "Н", например, его можно было к остальным применить.  Какое-нибудь окошко с индикацией (условных) +11% .
Вообще ALt + колесико, Shift + колесико  , как мне кажется, можно шире задействовать. Я несколько лет назад писал об автоматическом изменении уровня бинаризации колесиком. Ну, допустим, ко всей странице это применить, действительно, будет медленно и не пойдет. Но к крошечному глифу, мне кажется, можно сделать подбор порога бинаризации колёсиком с автоматической демонстрацией конечного результата.  
 
3. Описание шрифтов получается длинным     шрифт+начертание+ кегель+язык+источник оттиска+особенности (тип набора, например)+(возможно сканировщик / собиратель закладки). В хинт такое не засунуть, а если засунуть, то не увидеть. Хорошо бы для закладок предусмотреть либо какое-то развернутое текстовое описание (простыню), либо 6-7 разных строчек (полей). Возможно, демонстрируемые опционально.  Главное, чтобы они корректно импортировались.  Не могу сказать за последнюю версию, не проверял, но сколько-то версий назад я наблюдал, что СК при импорте терял названия закладок.  Вместо "Строчные" становилось +List1. Что-то такое. Счел это тогда фичей.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 20:05 05-02-2023
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Toggle zone visibility хоткей. Его же настроить надобно, если по умолчанию не работает

 
Получилось. Спасибо!
А делать невидимыми зоны одной конкретной группы видимо нельзя?..
 
 
Добавлено:
Я вот подумал по поводу OCR в СК. Такая идея для себя.
 
Можно ведь сканировать книгу как обычно с разрешением 300 Grayscal, НО несколько страниц книги сканировать с разрешением 600. И именно из этих страниц брать символы для библиотеки глифов, как наиболее качественные.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 11:48 06-02-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А делать невидимыми зоны одной конкретной группы видимо нельзя?..  

добавил такую возможность

Цитата:
как обычно с разрешением 300 Grayscal

В последние лет пять приходилось обрабатывать только 600dpi сканы. Так что для кого-то 300 - это совсем не "обычно".
 

Цитата:
Хорошо бы для закладок предусмотреть либо какое-то развернутое текстовое описание

Если устроит описание с поддержкой несложной html-разметки, то могу реализовать

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 08:01 08-02-2023
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Если устроит описание с поддержкой несложной html-разметки, то могу реализовать
 

Было бы неплохо
 
 
 
 
 

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 08:54 08-02-2023
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
У меня простой сканер, поэтому, если бы с разрешением 600 делал, то каждую книгу бы сканировал неделю)

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 09:27 08-02-2023
xMARx

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
__Всем привет.
bolega Имеется задание с одним файлом. В файле текст и картинка. Обработал текст, но потом решил сделать picture zone с картинкой и обработать с другим порогом бинаризации. B/W зона тоже подошла бы, но не нашел, как обрабатывать ее отдельно (без остального текста). Сделал прямоугольную picture zone, обработал только ее. В окне RV она почему-то съехала немного вниз и наехала на текст.  
__Ссылку на задание прикрепляю. Можно самому проделать все действия: 1) убрать зону (exclude zone), 2) обработать, 3) потом вернуть picture zone (разрешение х2, b/w) и увидеть съехавшую вниз зону.
https://transfiles.ru/je1e3
 
__Upd: Если границы зоны оттащить подальше от резаков, то зона съезжает, но слабее.
 
__2) Всё-таки не все хорошо с зумом. Отдаляю изображение в окне RV, соответствующее отображаемое значение зума уменьшается. Потом начинаю колёсиком приближать значение в начале уменьшается ?!, а потом уже увеличивается.  
 
__3) В окне Image adjustments на вкладке Selection если поднести мышку к кнопке Emulate shift press mode
появится всплывающая подсказка "Режим отображения двух страниц....". Вроде неверная подсказка.
 
__Пожелание
__4) Может имеет смысл сделать так, что бы при выделении области (move selected area) в окне RV, стрелки на клавиатуре отвечали за соответствующий сдвиг данной области на 1 пиксель в разные стороны. Величина сдвига может задаваться в настройках. Сейчас при выделении области и нажатии стрелок вверх и вниз, СК переходит на другую страницу.

Всего записей: 66 | Зарегистр. 22-06-2009 | Отправлено: 14:18 08-02-2023 | Исправлено: xMARx, 14:47 08-02-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
она почему-то съехала немного вниз и наехала на текст

потому что вы специально обошли работу по вычислению координат новой зоны.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 14:58 08-02-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xMARx
Скажите, какие у вас сейчас значения настроек в Files > Options >Zones > Processing:
- Restore zone position
- crop b/w picture zones
вкл/выкл ?
Проблема такая действительно существует, тогда, когда вновь созданная зона своим положением влияет на расчетный габарит страницы. Другими словами, начало координат габарита страницы после ее создания и переобработки отличается от начала координат, которое было вычислено в предыдущем расчете, когда зоны не было. Если создать новую зону где-нибудь полностью внутри габарита страницы, то такой проблемы вообще не возникнет.  
Чтобы минимизировать отклонение вновь созданной зоны после ее переобработки, старайтесь создавать ее максимально внутри прошлых габаритов, и включайте вышеупомянутую опцию crop b/w picture zones.
В рамках текущей версии СК проблему сдвига координат из-за изменении габаритов страницы в промежутке между двумя обработками к сожалению не решить. Я уже думал над этим. В todo у меня стоит разобраться с этим, путем расчета и хранения в задании матриц афинных преобразований, которыми подвергается страница в процессе обработки.
 

Цитата:
Всё-таки не все хорошо с зумом.  

Об этом уже писалось. Я исправил в новой версии.
 

Цитата:
__4) Может имеет смысл сделать так, что бы при выделении области (move selected area) в окне RV, стрелки на клавиатуре отвечали

Используйте для смещения участка не стрелки, а Ctrl+стрелки.
 
Поведение клавиш можно настроить в опциях окна VR
 
 
 

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 16:12 08-02-2023
xMARx

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Скажите, какие у вас сейчас значения настроек в Files > Options >Zones > Processing:
- Restore zone position
- crop b/w picture zones
вкл/выкл ?

__Обе  настройки были выключены.
 

Цитата:
Чтобы минимизировать отклонение вновь созданной зоны после ее переобработки, старайтесь создавать ее максимально внутри прошлых габаритов, и включайте вышеупомянутую опцию crop b/w picture zones.

__Спасибо за совет. Включил эти настройки. В crop b/w picture zones установил gap=0. B/W picture zone внутри резаков. Зона практически не отклонилась.
 

Цитата:
Об этом уже писалось. Я исправил в новой версии.

__Прошу прощения. Несколько запутался в версиях. Оказывается пользовался 6.8, т.е. не самой свежей.

Всего записей: 66 | Зарегистр. 22-06-2009 | Отправлено: 17:13 08-02-2023 | Исправлено: xMARx, 17:14 08-02-2023
xMARx

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega А почему, когда я вставляю в окне RV скопированную область при помощи ctrl+v, она вставляется сразу. А если нажать ПКМ и выбрать paste    ctrl+V, то у меня будет возможность это выделение подвигать. Последний вариант мне и был нужен; не сразу понял, как мне иногда удается двигать выделение. Можно ли сделать так, чтобы и при нажатии ctrl+v была возможность двигать выделение?
__Я не нашел шорткатов для движения слева направо и справа налево по тексту в окне RV. Они есть? Было бы удобно с помощью клавиатуры двигаться по тексту, а мышкой менять исправлять неудачные буквы.
__В окне Rotate selection кнопку paste, мне кажется, имеет смысл переименовать в rotate или apply.

Всего записей: 66 | Зарегистр. 22-06-2009 | Отправлено: 16:35 14-02-2023 | Исправлено: xMARx, 16:36 14-02-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xMARx

Цитата:
почему, когда я вставляю в окне RV скопированную область при помощи ctrl+v, она вставляется сразу. А если нажать ПКМ и выбрать paste    ctrl+V, то у меня будет возможность это выделение подвигать.

В options окна RV отключите опцию Editor > Merge immediately.  
При этом по идее и через paste должна была вставляться сразу же при включенной опции, почему я не сделал так, я не помню.
 

Цитата:
для движения слева направо и справа налево по тексту в окне RV

не понял, что такое движение по тексту клавиатурой.  
В СК подсветка OCR возможна только по положению указателя мышки. Другого пока не предусмотрено, т.к. это не текстовый, а графический редактор.

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 08:28 15-02-2023
xMARx

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
не понял, что такое движение по тексту клавиатурой.  

__Сейчас это делается с помощью полос прокрутки снизу и справа окна RV. В автокаде это называется панорамированием. Не нашел шорткатов для панорамирования слева направо и справа налево по тексту в окне RV.  
 

Цитата:
В options окна RV отключите опцию Editor > Merge immediately.

 
__Спасибо.
 

Всего записей: 66 | Зарегистр. 22-06-2009 | Отправлено: 11:03 15-02-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Сейчас это делается с помощью полос прокрутки снизу и справа окна RV

options RV >Actions > Special keys used for = image scroll
не оно?

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 13:24 15-02-2023
xMARx

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
options RV >Actions > Special keys used for = image scroll
не оно?

__Да оно, спасибо. До этого искал в главном окне в options-hotkeys. Единственное хотелось бы иметь возможность настроить скорость движения. Я приближаю текст, двигаюсь по нему, читаю и меняю неудачные буквы. При этом текст движется медленно.

Всего записей: 66 | Зарегистр. 22-06-2009 | Отправлено: 13:56 15-02-2023 | Исправлено: xMARx, 16:09 15-02-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Единственное хотелось бы иметь возможность настроить скорость движения.  

Да, мелковатый сейчас шаг. Увеличил и сделал настраиваемым

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 11:59 16-02-2023
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день. Прошу подсказать.
Что нужно сделать, чтобы красным подсвечивался мусор и неподсвечивались буквы.
 

 
На скрине подсвечены и буквы.
Включаю режим Marashki mode либо режим Outside letters mode (либо оба сразу) и красная подсветка отключается вообще.
 
Ссылка на тест

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 12:29 19-02-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Следил краем глаза за проблемой борьбы с "марашками", но сейчас этот вопрос встал всерьез.
Может ли кто-нибудь просветить меня по этому вопросу, как это обстоит на текущий момент.
Первый главный вопрос: возможно ли эту процедуру оуществлять в текущей (6.8) версии СК?
Если да, то есть ли где описание этого процесса, или в нем надо разбираться самому по разрозненным описаниям в теме и в "что нового в ..."?

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 13:11 19-02-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
видео от bolega есть. по таймлайнам найдете кусок про марашки.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 13:37 19-02-2023
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Да, есть видео, четвертая часть. Честно говоря, смотрел, но ничего не понял в этом моменте

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 14:25 19-02-2023
xMARx

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Включаю режим Marashki mode либо режим Outside letters mode (либо оба сразу) и красная подсветка отключается вообще.

__Подсветка не выключается. Просто подходящего мусора мало, а его подсветка имеет маленький размер. На второй строке снизу кое-что у вас все-таки выделено. В этом плане, мне кажется, имеет смысл сделать так, чтобы посветка маленьких спеклов в программе была лучше видна. Например, чтобы ее размер зависел от зума : при отдалении размер большой, а при приближении - уменьшается.  
__Если включить опцию "Исключать подсветку спеклов в областях, занимаемых символами из защищенного набора" (Marashki mode, Outside letters mode я выключил), то выделяется уже больше мусора, но не весь. Пусть мусор находиться в области, которую занимает буква (синие рамки в Edit OCRed word), а данная буква исключена из подсветки (то есть находится в Non-highlighted chars). Тогда такой мусор в этом режиме, наоборот виден не будет ?! Например, в слове "дзыхы" близко к центру страницы,  перестает быть виден мусор под буквой "х". Также мусор может возникнуть при замене символа (например, если в данном слове заменить букву "х"), и он тоже не будет виден при включении этой опции.
UPD: вспомнил, что мусор, о котором упомянул в конце, можно убрать выбрав опцию Remove speckles, that touch the pasted image перед заменой символа.
 
__Это не столько ответ на ваш вопрос, сколько мысли вслух ... Возможно, кто-нибудь меня поправит или уточнить.  
 
__Также хотел бы обратить внимание, что  
1) в окне RV почему-то не получается сделать так, чтобы комбинация ctrl+двойной клик меняла цвет ластика.
2) у меня для движения области используется комбинация клавиш  ctrl+M. Если я выделю область (например, с символом) и нажму эту комбинацию два раза (поторопился или по другой причине), то символ нельзя будет стереть ластиком. Если потом сохранить страницу, выйти из окна RV и войти, то символ пропадет. Может имеет смысл как-то исправить этот момент.

Всего записей: 66 | Зарегистр. 22-06-2009 | Отправлено: 14:45 19-02-2023 | Исправлено: xMARx, 20:01 19-02-2023
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru