Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
italia57
берете пальцами файнридер, берете другими пальцами кромсатор ... и вуаля!

 
И для кого видео писано?? Для кого я таймлайны делал??
 
UPD
 

Цитата:
Где найти эту папку c временными файлами FR?  

это не временные файлы, а обычные файлы проекта ФР. При выходе из программы ФР спрашивает "вам проект сохранить? Куда?" Вот там и будут *.dat в подпапке data. Например, так для 15го:
 

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 14:56 20-05-2022 | Исправлено: TelecomUral, 15:17 20-05-2022
italia57

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
 
Спасибо, буду разбираться...
Видео я смотрел, но сразу не разобрался.

Всего записей: 16 | Зарегистр. 25-11-2020 | Отправлено: 15:36 20-05-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как подключить, было показано в третьем видео.  
 
1. Распознать страницы в FR
2. Сохранить OCR-проект.
3. В подпапке data этого проекта запустить парсер, получить файл result.bookmarks
4. Поместить его в подпапку out\ocr  проекта СК
5. В окне MW на закладке page -> кнопка special -> закладка More2 включить язык/языки распознавания  
(русский или русский+английский для всех страниц)
6. "На все страницы" команда распространяется кликом ПКМ в ячейке и выбором Apply option to all marked
7. Перейти в RV, кликнуть ПКМ, в опциях выбрать закладку OCR, и там задать OCR mode=FR
8. Далее, как мне помнится, в том же RV по ПКМ команда Special - > OCR page   создаст много файлов *.focr, т.е. не только для текущей, но для каждой страницы.  Если я ошибаюсь, то выполнить пункт 11.
 
Однако, можно подключать FR, можно тессеракт. Иногда лучше срабатывает тессеракт.
Для задействования тессеракта следует:  
9. В опциях СК задать путь к файлу tessdata2\eng.traineddata   (меню File - Options - Apps)
10. Если этого не было сделано ранее, в More2 задать  языки распознавания
11. В том же окне MW из меню запустить команду Result -> OCR Outpiut files -> All
 
Можно вызывать распознавание и постранично в окне RV. Командой Special - > OCR page, когда OCR mode=Tesseract или Combined. Если для FR  создавались сразу все возможные файлы *.focr, то для этих методов  будет создан файл *.tocr только для текущей распознаваемой страницы. Но ИМХО, чтобы не ждать каждый раз, лучше заранее сделать сразу все tocr для всех страниц. То есть выполнить указанную в пункте 11 команду из MW. А уже потом в случае необходимости переключаться между вариантами OCR. Tesseract хуже распознает буквы, но FR иногда с ячейками лажает.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 15:44 20-05-2022
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, спасибо за новую версию.
 
Обнаружил баг. Мой старый ini-файл, после запуска 6.75 отображает не все кнопки Edit panel. Нету Highlight Recognized Chars и ряда других. Когда полностью снес ini, тогда все и заработало.  
 
   
 
Ссылка на ini

Всего записей: 556 | Зарегистр. 07-06-2011 | Отправлено: 19:04 20-05-2022 | Исправлено: sergiokapone, 19:10 20-05-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А по новой их включить не пробовали ? В списке кнопок они есть ?
 
Ведь все опции приходится по новой настраивать. Поэтому ИМХО и выключившиеся кнопки по-новой включить - это ИМХО нормально. (Но я сам последнюю версию еще не смотрел.)

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 19:21 20-05-2022
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013, пробовл. Не включаются.

Всего записей: 556 | Зарегистр. 07-06-2011 | Отправлено: 19:30 20-05-2022
italia57

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Благодарю daa2013 за туториал.
Что такое  окно МW?  Где его отыскать?
 У меня неустановлены языки следовательно не работает Doubtful Words

Всего записей: 16 | Зарегистр. 25-11-2020 | Отправлено: 19:58 20-05-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
italia57
Main Window, т.е. основное окно программы.  
 
VR - View Result - окно обработанного скана, т.е. бинаризованного и с отдельными зонами.
 
Добавлено:

Цитата:
У меня неустановлены языки следовательно не работает Doubtful Words

цитата:
- VR: При работе функционала реставрации "плохих" букв возможно применение словарей Hunspell. Поместите файлы hunspell-dicts.cfg и  
  libhunspell.dll в папку с исполняемым файлом СК. Файл hunspell-dicts.cfg содержит описание местоположения словарей hunspell для
  различных языков. Пути к словарям могут быть как абсолютными, так и относительными. Во втором случае путь задается относительно
  папки с исполняемым файлом СК. Каждая строка cfg-файла описывает один словарь и состоит из обозначения языка (сокращенного названия),
  двоеточия, имени aff-файла словаря (dic-файл должен находиться по тому же пути). Допускаются комментарии, которые начинаются с
  символа "!" и продолжаются до конца строки. Обозначения языков жестко зашиты в код СК и совпадают с именами, используемыми в
  Tesseract. Для одного и того же языка допускается указывать несколько словарей.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 20:18 20-05-2022
1234olexiy

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору


Цитата:
Новая версия 6.75

Спасибо дорогой bolega!
А будет ли когда-нибудь в кромсаторе автоматическое выделение картинок?
очень нужно.

Всего записей: 15 | Зарегистр. 18-11-2019 | Отправлено: 21:41 20-05-2022
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega спасибо за новую версию

Всего записей: 783 | Зарегистр. 03-07-2005 | Отправлено: 21:52 20-05-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
парсер версии 2.3.1

 
Сегодня днем на работе скачал его и после двойного щелчка началась инсталяция. Сейчас дома (мой основной комп для СК) скачал, и после двойного щелчка ничего не происходит. Ничего не устанавливается.

Всего записей: 525 | Зарегистр. 04-05-2016 | Отправлено: 22:03 20-05-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
Спасибо.
 
Я так понимаю, теперь будем выкладывать качественные наборы растровых шрифтов или растрированный вектор для исправления книг....
 
 
bolega, TelecomUral
 
В каком формате словари Hunspell должны быть? А то ведь одни программы, работают с ними только в Юникоде, другие в нативном KOI-8, про третьи вообще молчу.....
 
Вот здесь словари в Юникоде (UTF8) для разных языков....
https://github.com/wooorm/dictionaries
 
В сети можно найти комбо-словари - типа англо-русского (пролетал в ветке Emeditor)

Всего записей: 3671 | Зарегистр. 17-09-2001 | Отправлено: 22:08 20-05-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Сегодня днем на работе скачал его и после двойного щелчка началась инсталяция. Сейчас дома (мой основной комп для СК) скачал, и после двойного щелчка ничего не происходит. Ничего не устанавливается.

 
Так парсер - это, типа, программа командной строки. Он не должен "устанавливаться". Его надо внутри конкретной папки запускать. Я это под виндой через менеджер FAR делаю. Болега в ролике - через Total Commander.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 01:51 21-05-2022 | Исправлено: daa2013, 01:56 21-05-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Так парсер - это, типа, программа командной строки.

 
Понял. Получилось. Спасибо.
Смотрю видео 3 )

Всего записей: 525 | Зарегистр. 04-05-2016 | Отправлено: 10:37 21-05-2022
SorokaSV

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В январе в связи с поломкой компьютера поставил новое железо, и соответственно перешёл на 10 с семерки. В 7-ке худо бедно работал планшет  wacom в окне VR. В десятке не работает: ластик, не ластик, двигает изображение, и собственно всё. А жаль. Правда, так как размер ластика не регулируется, это так.

Всего записей: 15 | Зарегистр. 31-07-2010 | Отправлено: 18:27 21-05-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Спасибо автору программы за новую версию, за следующий нано-рывок вперед!  
К новой версии пока не решаюсь переходить. Скачал, но пока стесняюсь даже запускать. Досмотрю пока видео по  версии 6.71, апосля буду к 6.75 переходить.
 
 
Цитата:
Однако, можно подключать FR, можно тессеракт. Иногда лучше срабатывает тессеракт.

Неплохо было бы увидеть видеоролик: с азов работу в Тессеракте и Файнридере от момента их закладки в программу до момента получения готовых результатов.  Где тессеракт гож, а где Файнридер.  
Набираю в поиске слова "Тессеракт" и "Кромсатор", может, кто-то показал, как эта связка  работает....ничего нет, ни одного кина, только теория в умах просветленных.
 

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 18:56 21-05-2022
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
SorokaSV
Возможно, на семерке режим ввода планшета был переключен с пера (по умолчанию) на мышь.

Всего записей: 326 | Зарегистр. 10-08-2018 | Отправлено: 18:59 21-05-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Перво-наперво порадовала фиксация полей  и фиксация настроек зон в профиле. Смело перехожу на новую версию.
 https://www.youtube.com/watch?v=3Q9s0lga66Y

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 19:07 21-05-2022 | Исправлено: kamenkapenza, 21:39 21-05-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Господа! Некиим образом ( к лучшему,очень удобно) изменилась модификация значков на панели просмотра результатов. Кто-нибудь разъясните каждый значок, какие функции он несет, на что  влияет, когда и как пользоваться.
 
 При окончании обработки страниц открывается панель результатов с рамкой вокруг текста или желтое пятно. Режим кисточки и ластика не работает, то есть корректировать страницы нельзя. Похоже, что из-за нахождения этой рамки. Как приступить к удаления надписей, мусора? Раньше, как я помню, можно было щелкнуть ПКМ по странице и выбрать Finalize page, но теперь такого выбора нет. Непонятно, что делать в этом случае.
Так же не нашел значка режима отображения двух страниц. Вот тут видеовопрос https://disk.yandex.md/i/dzowUBX8UsWLKA

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 21:47 21-05-2022 | Исправлено: kamenkapenza, 23:29 21-05-2022
qwaxym



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Раньше, как я помню, можно было щелкнуть ПКМ по странице и выбрать Finalize page,

И сейчас есть, в меню вторая сверху))

Всего записей: 127 | Зарегистр. 19-12-2007 | Отправлено: 13:04 22-05-2022 | Исправлено: qwaxym, 13:09 22-05-2022
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru