Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
можно ли отключить колесико мыши от перехода на последующий файл в списке файлов

 
File - Options - Main win - Scroll files by wheel

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 10:00 21-07-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013, большое спасибо!

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 18:32 21-07-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral, спасибо за совет!  

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 21:15 21-07-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Версия СК 6.8
https://workupload.com/file/5NUBzqGwNCq

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 20:49 23-07-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
А в будущем появится возможность вставлять зону не в место, откуда она копировалась, а в место, указанное курсором?

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 22:44 23-07-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Почему-то не получается подключить ocr. Новая (6.8) версия его не видит. Те же самые действия делаю в предыдущей версии, и там ocr виден. Странно.
 
На закладку OCR окошка Image adjustments добавлен функционал поиска текста по ocr-слою страниц. Функционал располагается на   закладке Find.
 
А где находится закладка Find?

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 22:48 23-07-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А где находится закладка Find?

там же где и Words

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 06:24 24-07-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
А в будущем появится возможность вставлять зону не в место, откуда она копировалась, а в место, указанное курсором?

Было сделано в предыдущей версии, через хоткей.
 
asku

Цитата:
Почему-то не получается подключить ocr.  

А как именно не получается?
 
 
Добавлено:

Цитата:
А где находится закладка Find?

Чтобы были видны все закладки, рекомендую в КМ закладок самой панельки Image adjustments включить multiline.

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 07:39 24-07-2022
sirius12

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
[b]bolega
Версия СК 6.8[/q]
Благодарим за новую версию, она стабильно работает на Windows XP как и версия 6.75.5, тогда как версия 6.71 порою выдавала сообщения об ошибках.

Всего записей: 15 | Зарегистр. 10-07-2022 | Отправлено: 11:09 24-07-2022 | Исправлено: sirius12, 11:11 24-07-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Проверил загрузку файлов в СК для разных режимов.
Похоже, теперь загружается в нормальном порядке для экзотических наименований файлов, но возник вопрос, чем теперь отличается вариант Sort smart  от Do not sort?  
Не удалось найти никаких различий.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 12:43 24-07-2022 | Исправлено: shch_vg, 18:44 24-07-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega. большое спасибо за новую версию! Не успеещь с одной версией разобраться, как другая выходит ))
 
"MW: File > Options > View Result: новый параметр Scale. Увеличивает размеры всех визуальных элементов окна Result view в заданное"
Это хорошо, я про это говорил. Теперь значки команд можно будет сделать поболе, а то в такой куче не совсем было понятно, где какой.
 
Чтобы прикрепить Тессеракт в Кромсатору, что нужно сделать? Есть папка с установленной программой sk6.8. Есть папка (удалось раздобыть) tessdata2:
а) в разделе FILE - Profiles - Apps в строке Tesseract указать к какому то файлу папки tessdata2?
б) положить папку tessdata2 в папку sk6.8?
в) и то и это
 
В новой папке sk6.8 находятся всего три файла: md5, sk.6.8.whats.new и sk6.8. Чтобы программа задействовалась на полную мощь, что там ещё должно находиться?
 
Пожелания для версии 6.9:
1. Сделать фиксируемой в профиле пользователя настройки панели для обложки и цветных вкладок - Ecklusive page options.  
Каждый раз нужно вводить данные (я всегда ввожу 600 дпи и 24 бит). Эти настройки всегда для каждого пользователя постоянны: кто-то делает в 300, кто-то в 600, но с одними и теми же параметрами для себя. Сделать по умолчанию в профиль свои параметры, а если нужно изменить, то  вписать другие данные на месте.
 
2. Сделать во вкладке Ecklusive page options (или каким то иным образом) функцию обработки страниц с параметрами Ecklusive page options, т.е. обложки, форзацы и полностью цветные страницы. На практике как происходит? Ну,например, как делаю я. Смотрю, какой параметр установить для бинаризации ч/б страниц; если есть зоны выделяю зоны, устанавливаю параметры для зон и запускаю общую обработку. Т.е. обложки и форзаци пока игнорирую и обрабатываю скопом как ч/б страницы. Потом перехожу на полностью цветные страницы (обложки) и устанавливаю  для них специальные параметры Ecklusive page options, и для каждой делаю переобработку. Была бы кстати команда обработки страниц с параметрами Ecklusive page options. Особенно это бы пригодилось, когда полностью цветных вкладок больше, чем две (в обычном случае). Нажать на кнопку специальной обработки, и все цветные страницы разом обработались.

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 16:21 24-07-2022 | Исправлено: kamenkapenza, 19:23 24-07-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
А как именно не получается?

Делаю как обычно, как делал в предыдущей (6.75) версии.
 
Распознаю в ФайнРидер 15. Парсером создаю в папке out/ocr нужный файл.
В More2 указываю язык для всех страниц проекта.
Потом Result — OCR output files — All.
 
Открываю окно Result View и слова не выделяются рамочкой.
При этом в окошке Image adjustments/OCR/Words кнопка Analyse all работает.
Кнопка Doubtful words тоже работает, но при двойном щелчке на слово в списке Doubtful words ничего не происходит.
 
Тест-файл

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 22:16 24-07-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
-

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 04:17 25-07-2022 | Исправлено: daa2013, 04:26 25-07-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
у меня ваш тест-файл открывается исправно, всё подсвечивается и по щелчку на слове в списке Doubtful words мышка к слову сама едет.
Вы, может, кнопочку "подсвечивать буквы" не нажали? Если её отжать, тогда да, всё перестаёт работать.
 
Добавлено:

Цитата:
Каждый раз нужно вводить данные (я всегда ввожу 600 дпи и 24 бит). Эти настройки всегда для каждого пользователя постоянны

далеко не всегда и не постоянны. У меня не так часто, но возникают сканы в 400дпи. А для серых вкладок можно и нужно не 24 бита лепить, а 8. Если же обработчик берёт сканы с разных источников, то медианные значения не определить вовсе. Ненужное усложнение интерфейса.
 

Цитата:
Сделать во вкладке Ecklusive page options (или каким то иным образом) функцию обработки страниц с параметрами Ecklusive page options ...
На практике как происходит? Ну,например, как делаю я...

не усложняйте себе жизнь переобработками, и такая функция не понадобится вовсе. Задали все настройки, прогнали обработку единожды.
Кроме того, для поднаборов файлов есть закладочка subsets и выделения красным (selected). Я когда-то с bolega даже поспорил, что фича subsets нафиг не нужна, и уже потом понял прелесть частичных наборов для сложных пакетов сканов.
 
+
Как я понимаю, для выделения в группу красных selected можно задать их поиск по "special DPI" и "special color" как раз из настроек кнопки "special..." . Пользоваться самому не приходилось.

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 04:34 25-07-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Вы, может, кнопочку "подсвечивать буквы" не нажали?

Наверняка.  
asku
И отсутствие подсветки (т.е. визуализация) это совсем не
Цитата:
не получается подключить ocr

 
kamenkapenza

Цитата:
Сделать во вкладке Ecklusive page options (или каким то иным образом) функцию обработки страниц

В опциях - функцию обработки?  
Если вы задали особые опции, они и так учтутся при обработке всего задания, никакого повторного прогона ради этого не требуется.
На закладке main окошка exclusive options в КМ свободного пространства есть команда Book cover options. Она делает как раз то что надо: взводит особые значения для color, dpi и ignore gaps, а также отключает Enhance image на закладке Quality основных опций.
 
daa2013
Вы проверяли новый параметр scale на своем широком мониторе?  
 
 
 
 
Добавлено:
В поиске обнаружил баг: для разворотов список найденного формировался неправильно. И соответственно подсветка не срабатывала.
 
Если получится, сделаю подсветку и поиск в MW. Чтобы можно было пользоваться в out-заданиях. Сейчас out-task использует ocr только если задано помещать его в pdf.

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 08:01 25-07-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
у меня ваш тест-файл открывается исправно, всё подсвечивается и по щелчку на слове в списке Doubtful words мышка к слову сама едет.
Вы, может, кнопочку "подсвечивать буквы" не нажали? Если её отжать, тогда да, всё перестаёт работать.

 
Точно! Спасибо.
 
А вы тестировали функцию find в новой версии?
 
а) У меня не ко всем найденным словам идет курсор после двойного щелчка.
б) И СК кажется не чувствует пробел. То есть, например если искать "оп " (оп с пробелом), то он ищет все «оп», независимо, есть ли после этого буквосочетания пробел или нет. В регулярных выражениях пробел обозначается как \s. Но этого обозначения СК кажется не знает.
в) И поле Start from работает неудобно. Хотелось бы, чтобы после того, как будет указано, что искать надо с 1-й страницы, это значение и оставалось при других поисках, пока не будет указано другое.
г) После того, как найдя нужное слово/букву я исправлю его и снова ищу это слово, то в списке найденных слов оно опять показывается, хотя уже исправленно (ошибочная буква заменена на правильную).
д) в списке найденных слов в самом начале строки идет указание страницы (?) — напр. p.8. Но 8 — это файл из которого получился уже обработанный скан. Удобнее же иметь обозначение порядкового номера обработанного скана.
е) bolega, а трудно было бы сделать возможность не только поиска, но и замены? То есть, например, я ищу все вхождения оп и последовательно (или автоматически, «скопом»), нажимаю кнопку «заменить», меняю на (например) он.
 
Добавлено:

Цитата:
В поиске обнаружил баг: для разворотов список найденного формировался неправильно. И соответственно подсветка не срабатывала.

 
Да-да.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 08:12 25-07-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
но возник вопрос, чем теперь отличается вариант Sort smart  от Do not sort?  

Отличаются. Но могут совпадать:
1) они в реальности совпадают
2) в Win10, в отличие от предыдущих версий, диалоги выбора списка файлов наконец-то нативно возвращают список в smart-сортировке. В остальном новые версии windows как были тупыми со времен 3.0 так и остались. И это при сегодняшнем то развитии AI. А вся мощь AI используется исключительно в меркантильных целях - навязать юзеру тагетированную рекламу, на большее ума не хватает.
 
Добавлено:
asku

Цитата:
И СК кажется не чувствует пробел.

Да, если он в конце и после уже ничего не задано, то для обычного поиска он отбрасывается. Исправлю.
Но для регулярных выражений и сейчас работает например такая конструкция: "в[ ]"
И еще в СК есть опция end of word, это универсальнее, т.к. тогда найдутся кроме "в " и например "в, " или "в. ".  
Или вот как быть с последним словом на странице? Если задать опцию end of word, то найдется, а если искать с пробелом в конце, то нет. Или считать что после последнего слова на странице тоже пробел, как думаете?
 

Цитата:
Удобнее же иметь обозначение порядкового номера обработанного скана.  

Сейчас так и есть. Просто для разворотов из-за бага не то показывается
 

Цитата:
После того, как найдя нужное слово/букву я исправлю его и снова ищу это слово, то в списке найденных слов оно опять показывается, хотя уже исправленно

а список найденного после предыдущего поиска почистили?
 

Цитата:
И поле Start from работает неудобно. Хотелось бы, чтобы после того, как будет указано, что искать надо с 1-й страницы, это значение и оставалось при других поисках, пока не будет указано другое.  

Здесь алгоритмическая сложность. Если там будет всегда "1", то как СК поймет что по команде find next ему нужно продолжать поиск с последней найденной страницы, а не с той, которая задана в start from. И наоборот, если на какой-то странице захотите возобновить поиск с начала, а не с текущей позиции, как сказать об этом СК? Ведь единственное поле для этого - start from всегда содержит одно и то же к примеру "1".
Ну либо вообще убирать кнопку с командой find next, оставить только find all, тогда неопределенности не будет.
Чтобы упростить я и добавил две кнопки для быстрого присвоения start from значения "1" или текущей страницы.

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 08:13 25-07-2022 | Исправлено: bolega, 09:01 25-07-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
asku
А вы тестировали функцию find в новой версии?

нет.  
 
оффтоп
 
 
Добавлено:

Цитата:
Или считать что после последнего слова на странице тоже пробел, как думаете?

не-не-не это фантазии

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 09:15 25-07-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku

Цитата:
В регулярных выражениях пробел обозначается как \s. Но этого обозначения СК кажется не знает.

В СК пробел - это пробел " ", смысла в дополнительном "\s" нет.
 
Добавлено:

Цитата:
не-не-не  это фантазии

ну хуже то не будет. Пробел можно не добавлять, если в конце перенос. Впрочем, обычно последнее слово - это номер страницы.
 
P.S. СК знает только про буквы и слова. Про все остальное (предложения, абзацы, шрифты и т.п.) он не знает.

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 09:58 25-07-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вы проверяли новый параметр scale на своем широком мониторе?  

 
Первым делом    
 
Стало лучше.  Остановился на 1.3
 
Я еще высказывал пожелание, чтобы можно было сделать пользовательскую панель с совсем гигантскими кнопками (2+), куда дублем помещать те кнопки, что постоянно в работе.  
(У меня это - метелки, режим замены символов, режим качественного отображения, сетка.)
Это заодно сняло бы проблему мешающихся рядом "ненужных" кнопок типа ластика.
 
Для них картинку в центре можно раза в два увеличить.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 10:12 25-07-2022
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru