Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
отвечу вашими словами

Цитата:
Чтобы добавлять, нужно это иметь.


Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 20:42 20-04-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
3-я часть получилась не очень удачной, я хотел бы ее переснять, поэтому попросил  TelecomUral повременить с выкладкой.
 
В процессе подготовки роликов выплыло несколько багов. После их исправления новая версия будет опубликована.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 20:46 20-04-2022
Benoni



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Спасибо за труд!

Всего записей: 1780 | Зарегистр. 15-06-2006 | Отправлено: 20:56 20-04-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Спасибо за ролики и за информацию в данном сообщении.
Непонятно, почему нельзя было выкладывающему просто это объяснить.
Я говорю в данном случае не о себе, а о тех, кто это тоже увидит и будет также удивляться.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 21:58 20-04-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

bolega, огромное спасибо за доблестный труд, за гениальную программу!!! И за подробные разъяснения!!!
 

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 22:14 20-04-2022 | Исправлено: kamenkapenza, 22:32 20-04-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Может быть, это уже и сделано, но из роликов мне такого не видно.
 
Хотелось бы иметь режим (возможно, включающийся по чекбоксу), чтобы при наведенном курсоре на букву, когда выделен ее контур и внизу в желтом квадратике показывается её OCR-результат (например, "н"), то по клику ЛКМ на ней  вставал её глиф с активной закладки (глиф, которому присвоена "н") и чистились ошмётки. Если же такого глифа нет, или их, вдруг, два и более   (хотя это, наверное, контролируется при присвоении значений букв), то не происходило бы ничего.  
 
В ролике для этого перетягивалась буква с панели. Но это лишние движения. Плохие буквы хотелось бы просто прокликать. И это уже головная боль пользователя, чтобы у него на активной закладке были правильные для этого глифы.
 
PS
Я бы вставил скриншоты, но этот порнографический рутуб дает похабные результаты. Хостинг - звездец. Своей рекламой он даже не дает мне их просмотреть до конца. Почему нельзя было залить оригинальные видео на яндекс-диск - загадка.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 00:04 21-04-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013

Цитата:
Почему нельзя было залить оригинальные видео на яндекс-диск - загадка.

А кто мешает Вам сделать это?
 
P.S. Подобные ролики лучше всего иметь всегда по рукой, т.е. на своем диске.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 00:23 21-04-2022 | Исправлено: shch_vg, 00:26 21-04-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А кто мешает Вам сделать это?  

 
А у меня они есть ? Только недоразумение с рутуба.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 00:39 21-04-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я извиняюсь за наглость, но публикацией только там я (заодно) поставил задачу "оттестить" рутуб.  
По идее, все баги и тэ пэ можете сообщать их команде поддержки. Ибо "никто кроме нас". Чем быстрее это убожество (или покажите иной хостинг) придёт в норму, тем лучше. Но для этого же попахать надо
 
оффтоп
 

Цитата:
daa2013
Хотелось бы иметь режим (возможно, включающийся по чекбоксу), чтобы при наведенном курсоре на букву, когда выделен ее контур и внизу в желтом квадратике показывается её OCR-результат (например, "н"), то по клику ЛКМ на ней  вставал её глиф с активной закладки (глиф, которому присвоена "н") и чистились ошмётки. Если же такого глифа нет, или их, вдруг, два и более   (хотя это, наверное, контролируется при присвоении значений букв), то не происходило бы ничего.

Это сделано: https://disk.yandex.ru/i/YkWqu8txuQkqxQ
 

Цитата:
daa2013
Почему нельзя было залить оригинальные видео на яндекс-диск - загадка.

А поиск и группировку видеоконтента как обеспечить? Сейчас на ютьюбе по слову "сканкромсатор" дофига материалов светится. Ссылки же из местной шапки не видны вообще нигде.
 

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 04:59 21-04-2022 | Исправлено: TelecomUral, 06:00 21-04-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Это сделано:

 
Насколько я вижу, он работает не совсем так, как я прошу, хотя и похоже.
В ролике сначала надо сделать список замен, и желтый квадратик с опознанным OCR-результатом в этот момент там мне не демонстрируется.    
Перетягивание же глифа с панели анализа списка не требовало. (Соответственно, как и запрашиваемое мной кликание.)
 
Для списка же было бы неплохо, если отобранные ячейки как-то будут на странице подсвечиваться. Например, рамки вокруг них станут ярко-сними.  
Сейчас (в ролике) надо встать на замену в списке, тогда контур буквы подсветится. ИМХО имеет смысл, чтобы контуры (рамки) всех отобранных букв одновременно были юзеру на странице показаны.  
 
Хорошо бы, чтобы это всё также работало и в режиме подсветки.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 06:03 21-04-2022 | Исправлено: daa2013, 06:15 21-04-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
Перетягивание же глифа с панели анализа списка не требовало

Я сам кроме роликов ничего не видел, и сходу все детали "не вкурил". Да там и наворочено нынче обалдеть сколько всего. Но мне кажется, что идеология списка замены неплоха, она от типографских особенностей печати идёт (ошибки-разрывы не во всех, а только в некоторых буквах). И она требует особого режима "включен ocr, при анализе скана буквы учитывай это". Если же идти как вы предлагаете, то могут возникнуть разнообразные неоднозначности при поиске глифа. Больно прямолинейное решение. Например, с ошибками распознавания как быть: опозналась "к", на самом деле "и", щёлкаем и получаем неверный глиф. А где исправить ошибку распознавания "к" - ? Приходится либо думать над вычитыванием заранее, либо предусматривать спецрежим полноценной работы со слоем текста. Вот он и сделан.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 06:17 21-04-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
идеология списка замены неплоха

 
Список замен - штука отличная.  
 
Но для ускорения работы нужны и альтернативные механизмы.
 

Цитата:
 с ошибками распознавания как быть

 
смотреть на жёлтый квадратик перед тем как кликать

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 06:36 21-04-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
смотреть

"смотреть" это не "быть", не "действовать".

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 06:40 21-04-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
Плохие буквы хотелось бы просто прокликать.

Такой режим есть. Я вроде демонстрировал его. Возможно, он как раз в не выложенном ролике. Список замен обязателен. Формируется очень быстро. Зато потом щелкай сколько хочешь. И при этом совсем не обязательно чтобы
Цитата:
И это уже головная боль пользователя, чтобы у него на активной закладке были правильные для этого глифы.  
.  

Цитата:
Для списка же было бы неплохо, если отобранные ячейки как-то будут на странице подсвечиваться. Например, рамки вокруг них станут ярко-сними.

Кстати, это и сейчас можно сделать, не режимом, а обходным способом, командой, которая превращает все буквы из списка в обычные limiter-зоны красного цвета (других типов постоянных подсветок просто нет в СК). Если таким способом выделить тысячу букв, в глазах будет рябить.  
 
А в принципе, сейчас можно добавлять какие угодно варианты-режимы, базис для этого имеется.
 
Я предусмотрел несколько фильтров, чтобы сужать кандидатов на попадание в список. Задача стоит в том, чтобы понять можно ли с помощью них отфильтровывать плохие/хорошие буквы. Или нужны еще какие-нибудь критерии. Здесь рассчитываю на советы и опыт пользователей.
Под фильтрами понимаются параметры, описывающие отклонение буквы от глифа-эталона. В ролике я демонстрирую использование только двух из них

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 08:21 21-04-2022 | Исправлено: bolega, 08:40 21-04-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Список замен обязателен.

 
а вот я как раз прошу без списка замен способ.
Перетаскивание же есть. Добавить клик.
 
Добавлено:

Цитата:
можно ли с помощью них отфильтровывать плохие/хорошие буквы. Или нужны еще какие-нибудь критерии. Здесь рассчитываю на советы и опыт пользователей.  

 
Это только после некоей эксплуатации станет видно про фильтрацию.
Так как и в режиме обычной подсветки у меня все ловилось, я думаю, что оно или сразу будет работать, или нужно будет обеспечить работоспособность списка в режиме подсветки.
 
У меня тут была книжка, где были бы полезны фильтры внутри/вне контура буквы (контур как очертание буквы, а не рамка) но мне кажется, что у вас что-то похожее как раз реализовано.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 08:30 21-04-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
Впечатляет. Хотя без части 3 абсолютно непонятно, в каком виде и от какой версии ФР используется OCR информация.
 
Второй момент - может быть с данной технологией решить наконец проблему искажения геометрии строк у корешка...
 
Третье - в стремлении к идеальным глифам самый лучший вариант - векторный шрифт. Шрифты абсолютного большинства гарнитур уже есть в интернет...  
Альтернатива - если вы разобрались с ФР — использование библиотеки глифов по данным распознавания... Набирать алфавиты вручную как-то совсем не комильфо.....

Всего записей: 3670 | Зарегистр. 17-09-2001 | Отправлено: 09:10 21-04-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo
Здесь упоминался парсер ФР12-15 от NME.  
 
 
оффтоп про шрифты

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 09:35 21-04-2022 | Исправлено: TelecomUral, 10:29 21-04-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013

Цитата:
А у меня они есть ? Только недоразумение с рутуба.

Этому помогает поиск в инете по "как скачать видео с рутуб"

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 12:09 21-04-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
 
Шрифты наиболее распространённых гарнитур находятся очень легко. Остальные - тоже вряд ли проблема особенно на этом форуме....
 
Единственная реальная проблема - отличие одинаковых гарнитур разных производителей, пока сами гарнитуры не были стандартизированы (ГОСТы 3489)

Всего записей: 3670 | Зарегистр. 17-09-2001 | Отправлено: 12:20 21-04-2022
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo
Говорится о бесплатных гарнитурах, а их нет. Создать свой шрифт - это лютый геморрой.
 
Некоторые гарнитуры есть бесплатные и свободно распространяемые, но в массе нет.
 
То что мы можем скачать любую - это о другом.
 
TelecomUral
С другой стороны, вы можете использовать подмножество (отдельные символы), а не весь шрифт... Хотя думаю и это запрещено.
 
Сами по себе все советские шрифты есть в электронном виде. Тем более оригинальных чисто советских, единицы.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4307 | Зарегистр. 18-09-2003 | Отправлено: 15:01 21-04-2022 | Исправлено: slava_kry, 15:01 21-04-2022
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru