Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
И ctrl ведь к ПКМ отношение не имеет

да.  
Я имел ввиду в целом - дополнительные возможности на элементах интерфейса, о которых не всегда упомнишь без визуальной напоминалки.
 

Цитата:
Можно взять рисование их на себя,

хм, а я считал, что это тупо "resource". И не проблема его внутри собственного проекта сохранить и передать винде для отрисовки на указанном месте. Неужели все-все кнопки вы нашли в стандартных дллках винды. Есть сильно специфичные.
Ладно, как-нибудь сделаю по whatsnew путеводитель.

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 20:48 23-04-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
хм, а я считал, что это тупо "resource".

Картинка на кнопке - да, из ресурса. Но есть кнопки без картинок, значит, там только рисовать самому.
 
Добавлено:
shch_vg

Цитата:
Нельзя ли синхронизировать эти два окна возможно по опции.  

Этот вопрос всплывает не первый раз. На текущий день у меня нет решения, которое бы позволило синхронить два изображения. Чтобы выполнить синхронизацию, надо иметь функцию, которая бы для заданной точки обработанного файла возвращала бы координаты на исходном скане, и наоборот. Сейчас такой функции в СК нет, теоретически такую информацию можно получить в процессе обработки, но после обработки она нигде в СК не сохраняется.

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 20:52 23-04-2023
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
Добрый вечер.
Есть проект СК (в новой версии — 6.9.).
Добавил туда OCR. Потом мне нужно было добавить еще один скан в проект.
На списке сканов слева жму правой кнопкой мыши, выбираю пункт Add images... и добавляю тифку.
Обрабатываю ее, хочу добавить и на новые страницы OCR. Делаю в Файнридере 15, создаю парсером result-файл и копирую его в соответсвующую папку (Out/Ocr)/
 
Потом в СК: Меню Result — OCR output files... — Current (В гл. окне СК, естественно, открыта нужный разворот).
СК дает сообщение:
 

 
Даю тест-папку (с файлом result от парсера):
Ссылка
 
Этот test я взял из проекта, который я сделал специально поэкспериментировать над таким добавлением OCR.
Дело в том, что я несколько дней назад работал с одной книгой. Много времени чистил в OCR, почти неделю работал над проектом. Потом мне понадобилось добавить страницу (первоначально среди сканов не было титула).
В итоге... я уже сам не помню что там понажимал... СК перестал видеть OCR во всем проекте.
На СК не грешу — сам накосячил, видимо.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 21:05 23-04-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
bolega
которая бы для заданной точки обработанного файла возвращала бы координаты на исходном скане, и наоборот

транзитная зона не поможет?
 
Добавлено:

Цитата:
есть кнопки без картинок

восклицательный знак ставить вначале текста на кнопке

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 21:22 23-04-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku

Цитата:
Делаю в Файнридере 15

Делаете что? Все страницы по новой или только добавленную?

Цитата:
первоначально среди сканов не было титула

А при чем тут титул, если на вашем скриншоте явно не титул.
В общем, не понятно, чего вы добавляли и куда, и что из этого дораспознавали.
 
Добавлено:
TelecomUral

Цитата:
транзитная зона не поможет?  

нет.  
Надо дорабатывать функционал, хранить в spt больше информации, в т.ч.  о трансформациях обработки.

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 21:57 23-04-2023
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
только добавленную?

Только добавленную.
 

Цитата:
А при чем тут титул, если на вашем скриншоте явно не титул.

Здесь не титул. Это тест отдельного, «экспериментального» проекта.
 
Когда работал с проектом, где полетел OCR, титул добавлял.
 
А в тесте, который я в прошлом сообщении здесь показал, я добавил вторую страницу (scan071.tif).

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 22:07 23-04-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
теоретически такую информацию можно получить в процессе обработки, но после обработки она нигде в СК не сохраняется.

А вариант с пиктограммами, как в режиме Zone, не прокатит?

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 22:30 23-04-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
создаю парсером result-файл и копирую его в соответсвующую папку (Out/Ocr)/  

а сколько страниц распознано в result-файле - одна-две?
а те файлы, что до этого лежали в Out/Ocr они там и остались, или исчезли?
 
Добавлено:
shch_vg
поясню на примере: от исходного скана отрезали резаком пусть сверху 50 и слева 70, затем развернули на 10 градусов, затем добавили поле 75 сверху и 10 отрезали слева. Чтобы перейти от точки обработанного скана к точке исходного скана, нужно все эти операции проделать в обратном порядке.

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 22:36 23-04-2023
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
а сколько страниц распознано в result-файле - одна-две?

В result-файле один добавленный разворот (scan071.tif), то есть после обработки Сканкромсатором (и разделения разворота) страниц две.
 

Цитата:
а те файлы, что до этого лежали в Out/Ocr они там и остались, или исчезли?

Остались.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 22:46 23-04-2023 | Исправлено: asku, 22:47 23-04-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я попозже опишу как лучше поступать в таком случае

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 22:53 23-04-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
А если добавить еще один режим, например, "Сравнение зон"? В правую часть выбирается зона по пиктограмме, как в режиме "Zones", а в левую та же зона, но только из исходного скана, естественно с выравниванием дпи и желательно на всю половину RV.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 23:22 23-04-2023
mvk2006



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
SK6.9 - При масштабе текста в системе (Win7-64) 125% в окошке Change word не помещаются для отображения кнопки:

 
В 6.83 такого нет

Всего записей: 515 | Зарегистр. 15-10-2005 | Отправлено: 06:55 24-04-2023 | Исправлено: mvk2006, 07:03 24-04-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
подправил схемку вставки ocr.
 

 
https://disk.yandex.ru/i/zo0K4JIoJQnmaw
 
 

Цитата:
asku
Дело в том, что я несколько дней назад работал с одной книгой. Много времени чистил в OCR, почти неделю работал над проектом. Потом мне понадобилось добавить страницу (первоначально среди сканов не было титула).  

Это дело известное. Надо заранее вставлять пустые листки на такой случай, листок же должен там быть. А если уж не вставил заранее, то после раздельной его обработки. Независимый djvu сделал, со слоем ocr, и потом скопировал в основную книгу.
Кстати, вероятно, это можно в визарде сделать. Наличие слоя не должно быть помехой.
 
 
bolega
 
И вот такой ещё вопрос насчёт подсказок на кнопки. Помнится, одно время в серьёзных программах существовал контекстный хелп: нажав кнопочку с пиктограммой "курсорная стрелка плюс вопросик" можно было затем щёлкнуть по элементу интерфейса и получить окошко с более-менее подробной справкой. Вероятно, это как-то на основе html или chm работало, чувствовался специфический дизайн окна. Нельзя ли нечто подобное сваять в СК? Причём - как вариант - чтоб юзер сам мог подправить этот хелп. Что-то такое было в начале нулевых годов в некоторых прогах, затем не стали делать. Навскидку это будет куда полезнее смены языка интерфейса.

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 07:01 24-04-2023 | Исправлено: TelecomUral, 07:20 24-04-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Это дело известное. Надо заранее вставлять пустые листки на такой случай, листок же должен там быть.

Это правильный подход. Я например так и делаю. Но бывает, что и сам не заметишь отсутствие страниц, и обнаруживаешь это уже после ocr. На такой случай я и предусмотрел команду attach bookmarks. По сути эта команда превращает номера, которые присутствуют в имени файла bookmark и являющиеся порядковыми номерами обработанных страниц (с точностью до смещения) в уникальные идентификаторы, привязанные к выходным файлам. После этого можно спокойно вызывать команду ocr даже после тасования файлов задания. Но вот добавление дополнительных bookmark-файлов после этого становится неочевидной процедурой. Сейчас я решил этот процесс максимально упростить. Во-первых, команда attach bookmarks будет выполняться автоматически, во-вторых, добавку (или частичную замену уже имеющихся ocr) достаточно положить туда же, в имени первый символ "+", в первой строке номера, куда вставить (т.к. внутри файла bookmarks нумерация с 1).  
 
 
 
Добавлено:

Цитата:
существовал контекстный хелп

Все визуальные элементы поддерживают его, имеют спец. поле, в котором по замыслу надо хранить уникальное число - идентификатор топика справки. Но я его для других целей использую ((
Да и создание html-справки это целое направление. Чур меня.

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 08:25 24-04-2023
Benoni



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я о версии 6.9.
В RV появляется стрелка  <-->. Что она значит?  
Мне кажется она мешает. Непревычно. Раньше такого не было.
 

Всего записей: 1795 | Зарегистр. 15-06-2006 | Отправлено: 15:50 24-04-2023
SVK2I

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору





Тему, где блокируют по собственному желанию Вы знаете. Благо не в первый раз.
Вас здесь никто не задерживает.

Всего записей: 92 | Зарегистр. 16-04-2023 | Отправлено: 17:16 24-04-2023 | Исправлено: Maz, 21:09 24-04-2023
Dimi7777



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Benoni
 

Цитата:
Я о версии 6.9.
В RV появляется стрелка  <-->. Что она значит?  
Мне кажется она мешает. Непревычно. Раньше такого не было.  

аналогично этому багу? :
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=3480#12
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=3480#15

Всего записей: 303 | Зарегистр. 11-02-2011 | Отправлено: 17:37 24-04-2023 | Исправлено: Dimi7777, 17:43 24-04-2023
Benoni



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dimi7777
да

Всего записей: 1795 | Зарегистр. 15-06-2006 | Отправлено: 18:12 24-04-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
bolega
в первой строке номера, куда вставить (т.к. внутри файла bookmarks нумерация с 1)

расшифруйте этот квест...
 
UPD
допустим, на примере asku с забытым титулом: что куда надо было скопировать, как проименовать.  
Ещё лучше если пропущенные страницы идут парой-тройкой, и в паре мест книги. Типа, прислали десяток выдранных из разных мест листков.

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 20:24 24-04-2023 | Исправлено: TelecomUral, 08:20 25-04-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
расшифруйте

Это будет так.
Пусть изначально есть одиночные сканы 1-10, out-файлы 1..10, out-focr-файлы и к ним bookmarks: result00001...result00010. Т.е. out-файлу с номером X соответствует bookmark-файл с таким же номером. Предположим, что к сканам надо добавить два новых файла и поместить их после 1 и после 6 номера. СК при добавлении и вообще при любом тасовании исходных файлов автоматически переименовывает out- и focr-файлы. Если файлы добавляются не в конец списка, то в итоге окажется, что соответствие между номерами out и номерами bookmarks будет нарушено, и повторно выполнить корректно OCR уже будет нельзя. Поэтому первым делом перед добавлением новых сканов пользователю необходимо самостоятельно дать команду Attach bookmarks. Эта команда "привяжет" текущие имена bookmark-файлов к их out-файлам, так что дальнейшая реорганизация файлов в списке не нарушит соответствие между ними. Кстати, что делать, если файлы добавили, а привязать все-таки забыли? В нашем примере имена out станут 1..12, а имена bookmarks останутся прежними, и например, скану с новым номером 3 (прежний 2) будет соответствовать bookmark с номером 3 (вместо правильного 2). Чтобы это исправить, достаточно переместить все вновь добавленные файлы в конец списка (это восстановит правильное соответствие имен), дать команду Attach bookmarks и после этого вернуть новые сканы на свои правильные места.
Далее мы распознаем в FR (в новом проекте) только вновь добавленные out-файлы: с номерами 2 и 8. Получаем новый result.bookmarks, в котором файлы имеют номера 1 и 2. Теперь нам надо сообщить СК, чтобы он подтянул в задание дополнительные bookmarks так, чтобы 1-й файл из result.bookmarks привязался к файлу 2, а 2-й – к файлу 8. Имена их станут result00011.bookmarks и result00012.bookmarks. То, что имена не соответствуют порядку следования сканов уже не имеет значения, т.к. после команды Attach bookmarks СК выдерживает соответствие по именам bookmarks (они уникальны), а не по порядковому номеру.
Чтобы СК сделал все правильно, нужно открыть новый result.bookmarks в любом текстовом редакторе (с поддержкой UTF-8), вставить перед самой первой строчкой новую строку с таким содержанием:
2,8
Затем переименовать новый «result.bookmarks» в «+resultЧ.bookmarks», где Ч в имени – строка из любых допустимых символов любой длины, в том числе и нулевой.  
Как и ранее, «+resultЧ.bookmarks» положить в папку out/ocr и в СК вызвать команду OCR (только для новых сканов! Например, выделив их красным и вызвав OCR selected), либо OCR для каждого файла по отдельности (например, прямо в окне VR), либо новую команду Update OCR, которая обработает все имеющиеся bookmark-файлы (их может быть и несколько), начинающиеся на «+». После переобработки СК переименует новые bookmark-файлы, добавив впереди знак подчеркивания.

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 14:38 26-04-2023
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru