Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я извиняюсь за наглость, но публикацией только там я (заодно) поставил задачу "оттестить" рутуб.  
По идее, все баги и тэ пэ можете сообщать их команде поддержки. Ибо "никто кроме нас". Чем быстрее это убожество (или покажите иной хостинг) придёт в норму, тем лучше. Но для этого же попахать надо
 
оффтоп
 

Цитата:
daa2013
Хотелось бы иметь режим (возможно, включающийся по чекбоксу), чтобы при наведенном курсоре на букву, когда выделен ее контур и внизу в желтом квадратике показывается её OCR-результат (например, "н"), то по клику ЛКМ на ней  вставал её глиф с активной закладки (глиф, которому присвоена "н") и чистились ошмётки. Если же такого глифа нет, или их, вдруг, два и более   (хотя это, наверное, контролируется при присвоении значений букв), то не происходило бы ничего.

Это сделано: https://disk.yandex.ru/i/YkWqu8txuQkqxQ
 

Цитата:
daa2013
Почему нельзя было залить оригинальные видео на яндекс-диск - загадка.

А поиск и группировку видеоконтента как обеспечить? Сейчас на ютьюбе по слову "сканкромсатор" дофига материалов светится. Ссылки же из местной шапки не видны вообще нигде.
 

Всего записей: 3067 | Зарегистр. 15-07-2010 | Отправлено: 04:59 21-04-2022 | Исправлено: TelecomUral, 06:00 21-04-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Это сделано:

 
Насколько я вижу, он работает не совсем так, как я прошу, хотя и похоже.
В ролике сначала надо сделать список замен, и желтый квадратик с опознанным OCR-результатом в этот момент там мне не демонстрируется.    
Перетягивание же глифа с панели анализа списка не требовало. (Соответственно, как и запрашиваемое мной кликание.)
 
Для списка же было бы неплохо, если отобранные ячейки как-то будут на странице подсвечиваться. Например, рамки вокруг них станут ярко-сними.  
Сейчас (в ролике) надо встать на замену в списке, тогда контур буквы подсветится. ИМХО имеет смысл, чтобы контуры (рамки) всех отобранных букв одновременно были юзеру на странице показаны.  
 
Хорошо бы, чтобы это всё также работало и в режиме подсветки.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 06:03 21-04-2022 | Исправлено: daa2013, 06:15 21-04-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
Перетягивание же глифа с панели анализа списка не требовало

Я сам кроме роликов ничего не видел, и сходу все детали "не вкурил". Да там и наворочено нынче обалдеть сколько всего. Но мне кажется, что идеология списка замены неплоха, она от типографских особенностей печати идёт (ошибки-разрывы не во всех, а только в некоторых буквах). И она требует особого режима "включен ocr, при анализе скана буквы учитывай это". Если же идти как вы предлагаете, то могут возникнуть разнообразные неоднозначности при поиске глифа. Больно прямолинейное решение. Например, с ошибками распознавания как быть: опозналась "к", на самом деле "и", щёлкаем и получаем неверный глиф. А где исправить ошибку распознавания "к" - ? Приходится либо думать над вычитыванием заранее, либо предусматривать спецрежим полноценной работы со слоем текста. Вот он и сделан.

Всего записей: 3067 | Зарегистр. 15-07-2010 | Отправлено: 06:17 21-04-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
идеология списка замены неплоха

 
Список замен - штука отличная.  
 
Но для ускорения работы нужны и альтернативные механизмы.
 

Цитата:
 с ошибками распознавания как быть

 
смотреть на жёлтый квадратик перед тем как кликать

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 06:36 21-04-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
смотреть

"смотреть" это не "быть", не "действовать".

Всего записей: 3067 | Зарегистр. 15-07-2010 | Отправлено: 06:40 21-04-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
Плохие буквы хотелось бы просто прокликать.

Такой режим есть. Я вроде демонстрировал его. Возможно, он как раз в не выложенном ролике. Список замен обязателен. Формируется очень быстро. Зато потом щелкай сколько хочешь. И при этом совсем не обязательно чтобы
Цитата:
И это уже головная боль пользователя, чтобы у него на активной закладке были правильные для этого глифы.  
.  

Цитата:
Для списка же было бы неплохо, если отобранные ячейки как-то будут на странице подсвечиваться. Например, рамки вокруг них станут ярко-сними.

Кстати, это и сейчас можно сделать, не режимом, а обходным способом, командой, которая превращает все буквы из списка в обычные limiter-зоны красного цвета (других типов постоянных подсветок просто нет в СК). Если таким способом выделить тысячу букв, в глазах будет рябить.  
 
А в принципе, сейчас можно добавлять какие угодно варианты-режимы, базис для этого имеется.
 
Я предусмотрел несколько фильтров, чтобы сужать кандидатов на попадание в список. Задача стоит в том, чтобы понять можно ли с помощью них отфильтровывать плохие/хорошие буквы. Или нужны еще какие-нибудь критерии. Здесь рассчитываю на советы и опыт пользователей.
Под фильтрами понимаются параметры, описывающие отклонение буквы от глифа-эталона. В ролике я демонстрирую использование только двух из них

Всего записей: 4446 | Зарегистр. 09-09-2002 | Отправлено: 08:21 21-04-2022 | Исправлено: bolega, 08:40 21-04-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Список замен обязателен.

 
а вот я как раз прошу без списка замен способ.
Перетаскивание же есть. Добавить клик.
 
Добавлено:

Цитата:
можно ли с помощью них отфильтровывать плохие/хорошие буквы. Или нужны еще какие-нибудь критерии. Здесь рассчитываю на советы и опыт пользователей.  

 
Это только после некоей эксплуатации станет видно про фильтрацию.
Так как и в режиме обычной подсветки у меня все ловилось, я думаю, что оно или сразу будет работать, или нужно будет обеспечить работоспособность списка в режиме подсветки.
 
У меня тут была книжка, где были бы полезны фильтры внутри/вне контура буквы (контур как очертание буквы, а не рамка) но мне кажется, что у вас что-то похожее как раз реализовано.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 08:30 21-04-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
Впечатляет. Хотя без части 3 абсолютно непонятно, в каком виде и от какой версии ФР используется OCR информация.
 
Второй момент - может быть с данной технологией решить наконец проблему искажения геометрии строк у корешка...
 
Третье - в стремлении к идеальным глифам самый лучший вариант - векторный шрифт. Шрифты абсолютного большинства гарнитур уже есть в интернет...  
Альтернатива - если вы разобрались с ФР — использование библиотеки глифов по данным распознавания... Набирать алфавиты вручную как-то совсем не комильфо.....

Всего записей: 3677 | Зарегистр. 17-09-2001 | Отправлено: 09:10 21-04-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo
Здесь упоминался парсер ФР12-15 от NME.  
 
 
оффтоп про шрифты

Всего записей: 3067 | Зарегистр. 15-07-2010 | Отправлено: 09:35 21-04-2022 | Исправлено: TelecomUral, 10:29 21-04-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013

Цитата:
А у меня они есть ? Только недоразумение с рутуба.

Этому помогает поиск в инете по "как скачать видео с рутуб"

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 12:09 21-04-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
 
Шрифты наиболее распространённых гарнитур находятся очень легко. Остальные - тоже вряд ли проблема особенно на этом форуме....
 
Единственная реальная проблема - отличие одинаковых гарнитур разных производителей, пока сами гарнитуры не были стандартизированы (ГОСТы 3489)

Всего записей: 3677 | Зарегистр. 17-09-2001 | Отправлено: 12:20 21-04-2022
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo
Говорится о бесплатных гарнитурах, а их нет. Создать свой шрифт - это лютый геморрой.
 
Некоторые гарнитуры есть бесплатные и свободно распространяемые, но в массе нет.
 
То что мы можем скачать любую - это о другом.
 
TelecomUral
С другой стороны, вы можете использовать подмножество (отдельные символы), а не весь шрифт... Хотя думаю и это запрещено.
 
Сами по себе все советские шрифты есть в электронном виде. Тем более оригинальных чисто советских, единицы.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4309 | Зарегистр. 18-09-2003 | Отправлено: 15:01 21-04-2022 | Исправлено: slava_kry, 15:01 21-04-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
slava_kry
Я прекрасно понимаю, куда вы клоните, и не прошу включать указанные шрифты в программный комплект.
Я говорю о том, что очень бы неплохо иметь такую возможность. А там каждый пусть сам решает - кому векторы нужны, а кому нравится с растром любиться.

Всего записей: 3677 | Зарегистр. 17-09-2001 | Отправлено: 16:05 21-04-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 видео с рутуб

вот вы сначала скачайте с рутуб и сравните с последним кусочком (3 хвостик), выложенным на яндексе.  
 
Добавлено:

Цитата:
 включать указанные шрифты в программный комплект

 
наверное можно включить пикселизированные наборы.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 16:44 21-04-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
наверное можно включить пикселизированные наборы.

 
Говорите прямо РАСТРОВЫЕ ШРИФТЫ....
 
Вряд ли это хорошая идея, учитывая насколько хуже дробное масштабирование у растра по сравнению с вектором.

Всего записей: 3677 | Зарегистр. 17-09-2001 | Отправлено: 18:08 21-04-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013

Цитата:
сравните с последним кусочком (3 хвостик), выложенным на яндексе.

А это что за чудо, м.б. я что-то пропустил?
Если Вы имеете в виду авишку, выложенную на яндексе, то как она будет выглядеть, если ее выложить на ютуб?

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 18:14 21-04-2022 | Исправлено: shch_vg, 18:21 21-04-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
на ютьюбе точно можно выбрать "скачать оригинал".

Всего записей: 3067 | Зарегистр. 15-07-2010 | Отправлено: 18:26 21-04-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral
Тогда другой вопрос: а что такое 3 хвостик?
Это добавка к неопубликованной 3й части?
Или сама 3я часть?
Прямо детектив какой-то!

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 18:33 21-04-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
что у вас за извивы мысли... какие-то фантазии, домыслы, практически инсинуации
Это просто хвостик, конечные минутки, от неопубликованной 3й части. Отрезан мной с помощью virtualdub для демонстрации daa2013. Там же цитата его приведена как причина.  
Я ещё и промахнулся в номере стартового фрейма, хвостик вдвое длинее вышел. 58000 поставил, надо было 59000.
 
Добавлено:
кстати, кто-нибудь мог бы взяться за таймлайны роликов.

Всего записей: 3067 | Зарегистр. 15-07-2010 | Отправлено: 18:54 21-04-2022
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Новые возможности СК 6.72: ролики от bolega  
1й - https://rutube.ru/video/e6414edaa09e6616246ed13625c5fd3f/
2й - https://rutube.ru/video/407270e2b887f590aca22557c1458909/
 
Будут ещё.
 
От себя скажу в третий раз  : охренеть!! По всей видимости, вопрос с глифированием закрыт окончательно, всё стало полноценно и удобно.  
Баги только надо выловить, без них не бывает.
 
---
Вопрос ещё такой, интернациональный: а получится ли подключить нестандартный (редкий) язык? Какие тут возможны препятствия со стороны словарей, ФР, самой винды?

 
А может кто-то перекинуть ролики на youtube или на облако. Смотреть на rutube под vpn адский ад. Спасибо.

Всего записей: 556 | Зарегистр. 07-06-2011 | Отправлено: 20:38 21-04-2022 | Исправлено: sergiokapone, 20:38 21-04-2022
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru