Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
графический хелп по вставке ocr
 

 
https://disk.yandex.ru/i/9Xl4SKrfJ3E_uA если сервер с картинкой умрёт.
 
bolega
прошу сделать в визарде дежавю параметр "при вставке слоя ocr добавить к имени суффикс", можно _ocr. А то ведь ни черта не определишь - вставлен невидимый слой в файл, или не вставлен. Естественно, исходник при этом пусть останется нетронутым.

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 18:47 20-04-2023 | Исправлено: TelecomUral, 18:57 20-04-2023
SVK2I

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
За картиночку особенная благодарность... Попробую прогнать её через SK, предварительно разбив каждый пункт на отдельную картинку, потом выложу, а Вы уж перебросите туда, где будет лежать в шапке.
Но есть вопрос: если прогнали файлы для OCR в FR, а там уже языки распознавания установлены, и затем используем результирующий файл в SK, зачем после этого надо еще выставлять языки распознавания в SK, если Тессеракт использовать не будем?
 
Добавлено:
TelecomUral
В знак благодарности сделал вам всем из картинки Инструкцию в PDF-файле. Инструкция просто чудо и всё понятно, думаю многие поймут. Ещё раз благодарю Аллах Величайшего перед Вами и Вас всех за огромную помощь, проблем теперь у меня нет с созданием OCR в SK через FR.  
Качать  отсюда: https://disk.yandex.ru/i/m-xTY4KOjsJYhA
Но перезалейте на другой обменник, у меня уже заканчивается место, могу его удалить.
Версия SK 6.9 работает безупречно, зря удалили ссылку!

Всего записей: 92 | Зарегистр. 16-04-2023 | Отправлено: 20:17 20-04-2023 | Исправлено: SVK2I, 11:09 21-04-2023
SVK2I

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сделал более качественный вариант прекрасной инструкции "Как создавать OCR слой в PDF (и в DJVU) с помощью СканКромсатора", единственно понятной из всех, что мне приходилось читать на этом форуме: https://disk.yandex.ru/i/m-xTY4KOjsJYhA

Всего записей: 92 | Зарегистр. 16-04-2023 | Отправлено: 11:11 21-04-2023 | Исправлено: SVK2I, 11:16 21-04-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
SVK2I

Цитата:
стала выдаваться ошибка "Some files were not OCRed because they are not b/w, blank or not exists",  

Это не ошибка, а всего лишь предупреждение.
 

Цитата:
зачем после этого надо еще выставлять языки распознавания в SK, если Тессеракт использовать не будем?    

Для FR действительно можно не задавать, но в СК предусмотрена еще возможность проводить проверку орфографии с использованием hunspell (команда Doubtfull words на закладке OCR>Words окошка Image adjustments). Без указания языков такая проверка невозможна
 
В предоставленном примере часть грибов повреждена (выбелена) магической чисткой; как от этого защищаться, я показывал в ролике про обработку зон.  
 
TelecomUral

Цитата:
графический хелп по вставке ocr  

Туда бы еще маленький скриншотик Reports после ocr, чтобы знать где увидеть более подробный результат процесса распознавания
 

Цитата:
прошу сделать в визарде дежавю параметр "при вставке слоя ocr добавить к имени суффикс", можно _ocr

Лучше "(T)". Сделаю.  
В принципе можно еще сделать, чтобы СК по команде копировал утилиту NME в папку проекта FR (запрос папки - через диалог), запускал ее и результат помещал в out\ocr.
 
 
Добавлено:
И еще дополнение к фразе "крайне не рекомендуется править орфографию в FR". Это так, и к тому же абсолютно бессмысленно: утилита NME не умеет извлекать исправленный текст, т.к. он хранится отдельно от первоначально распознанного.
 
Добавлено:
Еще дополнение: после OCR с помощью функционала СК Find/Replace желательно найти все дефисы-переносы (см. whatsnew) и заменить их на мягкий перенос (в понимании FR). В большинстве случаев FR сам переносы детектирует и расставляет, но не всегда. Наличие мягкого переноса (а не просто дефиса) гарантирует, что слова с переносом будут правильно искаться, что в pdf, что в djvu.

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 11:27 21-04-2023
SVK2I

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Уважаемый bolega!
Благодарю, теперь все понятно, процесс создания OCR в SK с помощью FR освоил успешно, стало всё получаться, теперь я доволен, хвала для Аллаха Величайшего за всех вас! Доброго здоровья и долгих лет жизни да даст Он вам! Буду ждать новой версии SK, тогда, возможно, снова засыплю вас всех вопросами.

Всего записей: 92 | Зарегистр. 16-04-2023 | Отправлено: 12:04 21-04-2023 | Исправлено: SVK2I, 12:05 21-04-2023
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
копировал утилиту NME в папку проекта FR

не обязательно, парсеру достаточно путь до папки указать

Код:
ParserFR12.exe "D:\My Folder\data"

мне кажется удобнее будет сделать сделать команду что-то типа "добавить фр-ocr", по ней юзер должен будет указать только папку с проектом фр, а ск сам запустит парсер, дождется появления файла результ и скопирует что надо куда надо..

----------
DjVu Utils

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 13:49 21-04-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
bolega
Лучше "(T)". Сделаю.

в ini ещё лучше.
 
Как я понимаю, парсер структуру документа не расчухивает? Абзацы, таблицы...
 

Цитата:
Туда бы еще маленький скриншотик Reports после ocr

добавлю.

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 16:19 21-04-2023 | Исправлено: TelecomUral, 16:48 21-04-2023
Dimi7777



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 Версия SK 6.9 работает безупречно, зря удалили ссылку!

Нет, не зря, с WIN10 (и может еще при каких-то условиях)  работало небезупречно,  
а за Вас рад, что у Вас на семерке работает прекрасно,  
но я жду новой версии, а пока вернулся на 6.83

Всего записей: 303 | Зарегистр. 11-02-2011 | Отправлено: 17:51 21-04-2023 | Исправлено: Dimi7777, 17:54 21-04-2023
Dimi7777



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
+
Вот еще заметил в версии 6.9 (баг/не баг?):
когда в режиме удаления мусора с зажатой ЛКМ выделяешь какую-то область, раньше просто удалялся мусор в выделенной области (или вообще всё, если режим полной очистки), а в 6.9 появляются еще настраиваемые границы выделения (стрелки). Это очень неудобно и сильно мешает. Возможно ли отключение где-нибудь в опциях такого режима, чтобы было как раньше?

Всего записей: 303 | Зарегистр. 11-02-2011 | Отправлено: 07:09 22-04-2023 | Исправлено: Dimi7777, 07:10 22-04-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dimi7777
Что есть стрелки?  
Если вы про грипы, то в они появляются только если режимы чистки не активны. В режимах mouse-up-чистки никаких стрелок нет, не придумывайте.

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 09:54 22-04-2023
Dimi7777



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Что есть стрелки?  
Если вы про грипы, то в они появляются только если режимы чистки не активны. В режимах mouse-up-чистки никаких стрелок нет, не придумывайте.

 
что штриховая рамка не пропадает, когда отпускаю ЛКМ после завершения чистки
 
update
 
Я выделяю мышью участок для стирания, отпускаю ЛКМ, а внизу выделенного и очищенного участка справа остается двусторонняя стрелочка  . Она мешает. Раньше такого не было
 
 

Всего записей: 303 | Зарегистр. 11-02-2011 | Отправлено: 10:12 22-04-2023 | Исправлено: Dimi7777, 10:32 22-04-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
что штриховая рамка не пропадает, когда отпускаю ЛКМ после завершения чистки

не могу такое воспроизвести. Как и раньше, в момент отпускания клавиши штриховая рамка исчезает

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 10:23 22-04-2023
Dimi7777



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 не могу такое воспроизвести. Как и раньше, в момент отпускания клавиши штриховая рамка исчезает

Да, рамка-то исчезает, а стрелка    остается в нижнем правом углу выделения, пока не щелкнешь. Из-за этого приходится тратить время на лишние щелчки, чтобы ее убрать. а потом продолжить чистку.
Вы сравните, как было в 6.83 и 6.9: в 6.83 никаких стрелочек не оставалось
 
 
add:
Я бы не писал про это, если б не мешало,  а так, когда приходится чистить много мусора, сразу же на это наткнулся, и оно замедляет работу...

Всего записей: 303 | Зарегистр. 11-02-2011 | Отправлено: 10:30 22-04-2023 | Исправлено: Dimi7777, 10:35 22-04-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ага, воспроизвел, появляется только когда красная линия.
Спасибо

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 10:38 22-04-2023
SVK2I

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dimi7777

Цитата:
Нет, не зря, с WIN10 (и может еще при каких-то условиях)  работало небезупречно,  
а за Вас рад, что у Вас на семерке работает прекрасно,  
но я жду новой версии, а пока вернулся на 6.83

Тогда почему Вашей любимой 6.83 нет в шапке странички форума для скачивания, а есть только 6.8?
Что-то какая-то мутная вода у вас всех относительно  6.9 и 6.83 – обе версии отсутствуют в шапке для скачивания… Тем более, когда будет новая версия? Кстати, не дадите ссылочку на версию 6.83, буду благодарен Вам за неё, хочу тоже попробовать на ней поработать...

Всего записей: 92 | Зарегистр. 16-04-2023 | Отправлено: 10:49 22-04-2023
Dimi7777



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Кстати, не дадите ссылочку на версию 6.83, буду благодарен Вам за неё, хочу тоже попробовать на ней поработать...
 

Если только с разрешения автора, то без проблем
add: Почему 6.83 нет в шапке, я не знаю (по идее это та же 6.8 с устраненными багами)

Всего записей: 303 | Зарегистр. 11-02-2011 | Отправлено: 12:15 22-04-2023 | Исправлено: Dimi7777, 12:17 22-04-2023
SVK2I

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dimi7777

Цитата:
Если только с разрешения автора, то без проблем  
add: Почему 6.83 нет в шапке, я не знаю (по идее это та же 6.8 с устраненными багами

А как получить разрешение автора, и если там устранены баги, то почему не выложить ссылку на эту версию вместо 6.8?
Иначе получается, что в шапке лежит версия с багами, а исправленный вариант раздается по блату...
Странное какое-то общество у вас получается...

Всего записей: 92 | Зарегистр. 16-04-2023 | Отправлено: 12:53 22-04-2023 | Исправлено: SVK2I, 12:55 22-04-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А как получить разрешение автора

спросить, не?

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 13:21 22-04-2023
SVK2I

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
спросить, не?

Конечно спросить, ведь Вы же даете ссылку, а я буду благодарить Аллаха Величайшего за вас обоих, а если выложите публично ссылку, то Аллах Величайший засчитает вам это в добродеяние обоим, потому что жадничать - это грех!

Всего записей: 92 | Зарегистр. 16-04-2023 | Отправлено: 14:00 22-04-2023
Dimi7777



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Странное какое-то общество у вас получается...

У кого "у вас" ? Мы же все здесь одно дело делаем, все в одном обществе.
 
Попросите здесь bolega напрямую скинуть Вам ссылку на нужную версию
или попросите выложить в шапку

Всего записей: 303 | Зарегистр. 11-02-2011 | Отправлено: 14:22 22-04-2023 | Исправлено: Dimi7777, 14:24 22-04-2023
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru