Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kamenkapenza
Вроде разобрался со штампом. После того как сделаете reset clone cursor, нажмите и отпустите кнопку мышки как можно аккуратнее, чтобы между нажатием и отпусканием она не сдвинулась ни на микрометр. Возможно, ваша мышка слишком чувствительна даже к малейшим сдвигам, в этом все дело. Т.е. нужно полностью исключить сдвиг между первым нажатием и отжатием.
А я подкорректирую код СК, чтобы убрать зависимость задания клонирующих курсоров от таких микросдвигов.
 

Цитата:
как менять местоположение страниц в Кромсаторе, например, когда их надо перетащить с десятка два (внизу все цветные фото в одном месте, а их надо разнести в разные места книги).  

Выделить диапазон красным. Затем Cut selected group в КМ списка файлов. Потом Paste special. Появится окошко со списком красных файлов. Выбираете в окошке нужный файл (или несколько подряд), становитесь в главном списке файле на нужное место и в окошке жмете paste. Файл переносится в выбранную позицию, из окошка убирается. Далее следующий файл в окошке и очередное место в главном списке, paste и т.д. пока все файлы не раскидаете.  

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 01:39 02-12-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Возможно, ваша мышка слишком чувствительна даже к малейшим сдвигам

проще уж уменьшить немного чувствительность мышки в настройках винды. Причем сейчас в винде есть - если память не подводит - индивидуальная подстройка свойств мышки к конкретной программе.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 08:29 02-12-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
проще уж уменьшить немного чувствительность мышки в настройках винды

Да нет, это я в коде накосячил. В предыдущей версии такого не было. Вдобавок прозрачность перестала отрабатываться при рисовании клона, появлялась только в момент окончания, так тоже не должно быть.

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 09:40 02-12-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
проще уж уменьшить немного чувствительность мышки в настройках винды

Этого делать никак нельзя! Я специально в настройках мыши делаю самую быструю скорость перемещения курсора, даже мышки покупаю всегда одни и те же, потому что скорость перемещения курсора зависит ещё и от модели мыши. Чтобы переместить курсор мыши от самого низа экрана до верха мне при моих настройках нужно проехать по столу мышью сантиметра 2-3, у меня уже на это рука настроена, перемещаться приходиться часто и быстро, особенно при групповом скачивании файлов.  Если я настрою скорость передвижения курсора по вашему совету, то я по всему столу буду мышью елозить, у меня за день рука устанет. ))
 

Цитата:
Да нет, это я в коде накосячил. В предыдущей версии такого не было. Вдобавок прозрачность перестала отрабатываться при рисовании клона, появлялась только в момент окончания, так тоже не должно быть.
 

 
Ну вот! Хорошо хоть выяснилась причина, а то я подумал, что Скан Кромсатор сломал или в очередной раз туплю от незнания.
 

Цитата:
Вроде разобрался со штампом. После того как сделаете reset clone cursor, нажмите и отпустите кнопку мышки как можно аккуратнее, чтобы между нажатием и отпусканием она не сдвинулась ни на микрометр. Возможно, ваша мышка слишком чувствительна даже к малейшим сдвигам, в этом все дело. Т.е. нужно полностью исключить сдвиг между первым нажатием и отжатием.
А я подкорректирую код СК, чтобы убрать зависимость задания клонирующих курсоров от таких микросдвигов.

bolega, спасибо! По вашему совету всё-таки удалось удалить позорное клеймо с "Марксизма-ленинизма".
 
Цитата:
Выделить диапазон красным. Затем Cut selected group в КМ списка файлов. Потом Paste special. Появится окошко со списком красных файлов. Выбираете в окошке нужный файл (или несколько подряд), становитесь в главном списке файле на нужное место и в окошке жмете paste. Файл переносится в выбранную позицию, из окошка убирается. Далее следующий файл в окошке и очередное место в главном списке, paste и т.д. пока все файлы не раскидаете.  

 
bolega, спасибо! Это мне надо с этим неделю разбираться,как это на практике происходит, но постараюсь.
 
 
Добавлено:

Цитата:
Выделить диапазон красным.

А как выделить диапазон красным?  

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 11:06 02-12-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
пробелом

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 11:23 02-12-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral, понятно. Спасибо!

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 11:58 02-12-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
По вашему совету всё-таки удалось удалить позорное клеймо с "Марксизма-ленинизма".  

однако...
 

Цитата:
А как выделить диапазон красным?  

стали на первый файл диапазона, нажали пробел. Стали ниже на последний файл диапазона, нажали Shift-пробел. Выделятся все файлы от текущего (т.е. последнего в диапазоне) вверх до предыдущего выделенного. Между первым и последним файлами в диапазоне не должно быть уже выделенных, иначе выделятся от последнего до крайнего уже выделенного (т.е. до самого первого не дойдет).

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 13:27 02-12-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, большое спасибо! Надо всё это записать, я все советы по Кромсатору записываю в документ Ворд. Про такие тонкости (например,что  Shift-пробел), мне кажется, никто и не знал, таперича будут в курсе)  
 
Хотел потихоньку приступать к процессу создания окр через Кромсатор, попробовал через меню Резалт - ОКР оутпут  файлс сделать что то, но ничего не получилось. И уже не первый раз всплывает какая то ошибка https://disk.yandex.ru/i/C_VXLmtz7flz4g
 
И вот тут мои пожелания для последующих версий,несение в профиль некоторых настроек https://disk.yandex.ru/i/9JFy-IeAfr_zcA

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 14:36 02-12-2022 | Исправлено: kamenkapenza, 16:03 02-12-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kamenkapenza

Цитата:
И уже не первый раз всплывает какая то ошибка  

Во-первых, это не ошибка, а предупреждение. О том, что OCR не выполнен для ряда файлов: цветных (напр., обложки), пустых или отсутствующих. Ничего критического.
Возможно, что вид окна я выбрал не самый удачный, и кажется, что какая-то ошибка.
Во-вторых, более подробно статус выполнения ocr можно посмотреть на закладке reports, если переключиться на нее по окончании ocr.
В третьих, тессеракт проигрывает FR в качестве и скорости распознавания. Лучше использовать его, если есть возможность.
Языки распознавания, чтобы каждый раз не задавать, можно внести в дефолтный профиль. Вы вроде бы должны знать, что такое профиль.

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 16:18 02-12-2022 | Исправлено: bolega, 16:21 02-12-2022
xMARx

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
bolega, большое спасибо! Надо всё это записать, я все советы по Кромсатору записываю в документ Ворд. Про такие тонкости (например,что  Shift-пробел), мне кажется, никто и не знал, таперича будут в курсе)  

 
__Чтобы для каждой страницы не задавать в поле "OCR languages" язык распознования "[rus]", нажмите на данное поле правой кнопкой мыши и выбирите "Apply option to all marked"

Всего записей: 66 | Зарегистр. 22-06-2009 | Отправлено: 16:31 02-12-2022 | Исправлено: xMARx, 16:31 02-12-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kamenkapenza
У меня не отрывается сайт mirknig, да даже если б и открывался, скачивать с обменников типа турбобит/депозит и т.п. все равно невозможно. Поэтому не могли бы вы выложить куда-нибудь на yandex свои обработки альманахов Круглый год (одним архивом), а ссылку скинуть мне в личку.

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 17:03 02-12-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В Хрестоматии по Кромсатору (вероятно, всё уже устарело) увидел, что для пдф нужно ставить какую то попугайскую программу (Какаду). Вроде, я как то пробовал (хотя пдф привык создавать конвертацией джву через Джву Той), пдф и так получился, какаду у меня не прицеплен. А зачем тогда нужен какаду?
 
Вот тут у меня злободневный видеовопрос про фильтры, с помощью которых можно улучшать текст  https://disk.yandex.ru/i/PYPArldGF6sCvA Возможно, что про эти инструменты мало кто знает.

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 22:31 03-12-2022 | Исправлено: kamenkapenza, 22:45 03-12-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
При включенном режиме remove speckles that touch the pasted image  часто удалаяются дефисы (переносы) и малые тире, опознанные как таковые. (иногда, впрочем, ошибочно опознанные как другие символы).
Они удаляются и в ручном режиме, но это видно. И в автоматическом . Это опаснее, можно и пропустить.
 
Нельзя ли:
 
1. Вообще встроить какую-то проверку на дефисы и тире, возможно опциональную. (Условно говоря, галочка "не удалять спеклы в виде дефисов").
 
2. Те спеклы, которые OCR чётко распознал, как некие (любые) знаки, не удалять.  
 
3. Как при подсветке спеклов (галочка Use OCR)  выключает подсветку защищаемых знаков, так и при автоматическом удалении в режиме remove speckles that touch the pasted image ,  если для спекла выключена подсветка (соответствующий ему знак включен в список защищенных), то и в этом режиме он не удаляется. (Возможно, по специальной галочке в опциях.)

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 01:14 04-12-2022 | Исправлено: daa2013, 01:16 04-12-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
часто удалаяются дефисы (переносы) и малые тире, опознанные как таковые. (иногда, впрочем, ошибочно опознанные как другие символы).

Сможете дать примеры, желательно разные и побольше?  
Я с таким не сталкивался еще.
 
Добавлено:
kamenkapenza

Цитата:
увидел, что для пдф нужно ставить какую то попугайскую программу (Какаду).

Не путайте "нужно" и "можно"

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 12:08 04-12-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Не путайте "нужно" и "можно"

А для чего оно это (этот) Какаду? С ней пдф получается покрасивше?
 
Можно ли бинаризировать часть страницы? Вот тут суть вопроса https://disk.yandex.ru/i/6UL38ChCBJ4aZQ

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 14:18 04-12-2022 | Исправлено: kamenkapenza, 15:17 04-12-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Часть - можно. Массой вариантов. b/w-zone, или exclude-zone, или picture-zone со своим порогом.
Также можно через выравнивание яркости: вкладочка Quality, субзакладка Correct illjumination, метод Soft.
 
результат

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 15:39 04-12-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral, спасибо!

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 17:09 04-12-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kamenkapenza
Тут надо не бинаризацией делать, а побороть затенение от изгиба. Это исправляется  
Ctrl-B > Correct illumination, метод safe например. Впрочем, у вас неестественный случай, из-за того, что тень имеет резкий переход слева в фон (из-за обработки в другой программе, был бы исходный скан, было бы лучше).
 

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 18:59 04-12-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
кто-то и метод Вольфа применяет. Тоже вытянется.
 
результат 2, при окошке 30
 

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 19:23 04-12-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Тут надо не бинаризацией делать, а побороть затенение от изгиба. Это исправляется  
Ctrl-B > Correct illumination, метод safe например. Впрочем, у вас неестественный случай, из-за того, что тень имеет резкий переход слева в фон (из-за обработки в другой программе, был бы исходный скан, было бы лучше).

bolega,спасибо!
 

Цитата:
кто-то и метод Вольфа применяет. Тоже вытянется.

TelecomUral!
Про такой и слыхом не слыхивал. Видимо, отец бывшего лидера ЛДПР приложил руку))
 
Значит выходит так, что, если делать обрезание и установку полей в другой программе (Тейлоре) , то это влияет на качество, т.е. вызывает его потерю. Обрезаю, устанавливаю полезную область, поля, сохраняю всё это в цвете и закладываю эти полусырые тифы в Кромсатор, то это уже не даст того, если бы я и резал, и устанавливал поля непосредственно в Кромсаторе?  
 
 
 

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 12:12 05-12-2022 | Исправлено: kamenkapenza, 12:51 05-12-2022
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru