Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
lis105

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Всем доброго дня!
Для быстрой навигации по видеофайлам от bolega с новыми возможностями SK добавил непосредственно в видеофайлы таймлайны от TelecomUral:
https://disk.yandex.ru/d/EGAHs78LWtygrQ
 

Прошу прощение!
Произошло расхождение звука с видео .
Исправил.
Выложил по той-же ссылке - https://disk.yandex.ru/d/EGAHs78LWtygrQ

Всего записей: 2 | Зарегистр. 15-04-2006 | Отправлено: 08:16 25-05-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku

Цитата:
Вот страницы финализированы. И какие-то из них отличаются по размерам от других. А как их отсортировать, чтобы я мог сразу их  

В отчете вы можете увидеть какие отличаются.  
И в последних роликах я показывал, как изменить (увеличить) размеры страниц, если финализация уже выполнена с помощью команды Result > Resize output files. Там переключиться в режим New sizes, задать нужные размеры. Все страницы, у которых размер меньше заданного, будут увеличены. Остальные трогаться не будут.

Всего записей: 4431 | Зарегистр. 09-09-2002 | Отправлено: 08:18 25-05-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
И не забывайте что в отчетах (Reports) после расчета размера книги можно в отчете Book size calculation посмотреть какие страницы повлияли на размер.

 
А как посмотреть этот отчет? Я понимаю, вы скажете, что это есть в справочнике, но я там не нахожу.
Смотрю в:
ScanKromsator_Answers_1.0.2.pdf
и
SK_Compendium_v2.1.chm

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 08:57 25-05-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А как посмотреть этот отчет?

микрозкладка вверху списка сканов
а в хрестоматии как раз нету
 
Добавлено:

Цитата:
Ну и конечно ignore gaps в special не надо включать, т.к. опция как раз исключает страницу из расчета размеров.

Ааа!! Так вот чего я не догонял Пытался отключать эту average и получал непредсказуемый результат.
Наконец-то, срослось всё в голове про гапы и расчёты.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 09:28 25-05-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А как посмотреть этот отчет?

В главном окне закладка Reports, выбрать нужный из списка и нажать кнопку обновить
 
Добавлено:
если хотите, я сниму небольшой ролик на основе вашего задания, покажу как в таких случаях поступать. еще бы были зоны впритык к краям, еще лучше пример был бы.

Всего записей: 4431 | Зарегистр. 09-09-2002 | Отправлено: 10:08 25-05-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
если хотите, я сниму небольшой ролик на основе вашего задания

 
Да, было бы отлично.
——————
 
По поводу способов.
 
«А всего-то нужно было на закладке Book убрать галку Use average sizes. Тогда расчет размеров будет не по среднему, а по максимальному размеру, что в данной книге и требуется».
 
Получается, если так делать, то поля на всех страницах могут увеличиться слишком сильно (если тот самый «максимальный размер» слишком большой).
 
Я сделал способом, который упомянул выше:
«В режиме Result view нажимаю на правую кнопку мыши,
там в контекстном меню: Special..., дальше выбираю Resize, потом book size и Ok»

 
и все нормально получилось. )

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 15:59 25-05-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А как посмотреть этот отчет? Я понимаю, вы скажете, что это есть в справочнике, но я там не нахожу.

 
Ещё есть файлик  sk...whats.new.txt
 
И там написано, что эта функция добавилась в sk 6.42 в июне 2019 года, а упомянутые "справочники" были составлены в 2016 и 2018 годах относительно версии  6.00.5
 
 
Позаписывал бы кто из вновь осваивающих кромсатор свои наблюдения. Что он хотел в хрестоматии найти и не нашёл. И как в итоге сделать получилось. Глядишь, и удалось бы её дополнить новыми параграфами.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 05:58 27-05-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku

Цитата:
Получается, если так делать, то поля на всех страницах могут увеличиться слишком сильно (если тот самый «максимальный размер» слишком большой).  

но ранее писали:

Цитата:
Я хочу одинаковую ширину для всех страниц дежавю-файла.  

Вы уж определитесь, что хотите, одинакового размера или небольших полей. В вашем примере может только одно из двух.

Всего записей: 4431 | Зарегистр. 09-09-2002 | Отправлено: 14:59 27-05-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
одинакового размера или небольших полей

да тут речь скорее всего шла про неверное выставление габаритов при первом расчёте. Картинки в лист deskew часто поворачивает градусов на 35-40. И если щелкнуть "рассчитай размеры" сразу после обработки, то потом и приходится много выёживаться с закладкой Book и перевычислениями.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 17:06 27-05-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вы уж определитесь, что хотите, одинакового размера или небольших полей.  

 
Одинакового размера!

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 17:21 27-05-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
А как вы, например в word, набираете символ лигатуры ӕ ?
Интересно, есть ли для осетинского языка своя отдельная кодовая страница, типа как 1251 для русского?

Всего записей: 4431 | Зарегистр. 09-09-2002 | Отправлено: 07:58 28-05-2022 | Исправлено: bolega, 08:00 28-05-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
Кстати, об этой букве. Я вчера решил испытать новую функцию новой версии СК для осетинского скана. Я имею в виду ocr. И когда я создавал библиотеку глифов и присваивал глифам значения, тодля этой буквы не смог присвоить, вместо буквы вопросительный знак печатается.
 
А печатаю я ее используя осетинскую раскладку.
Но если на компе не установлена раскладка, то просто копирую и из буфера обмена вставлять могу.
Как правило используется буква из датского алфавита, насколько помню (я не за компьютером сейчас) в раскладке именно она.
Хотя в юникоде есть отдельная такая буква именно для осетинского алфавита (входит в расширенную кириллицу) и по внешнему виду идентичная датской букве.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 08:15 28-05-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
А пробовали мой пример test-nb.zip открыть, с которым я видео снимал. Там я без проблем задал лигатуру, в раскладке русской.  

Цитата:
Хотя в юникоде есть отдельная такая буква именно для осетинского алфавита (входит в расширенную кириллицу) и по внешнему виду идентичная датской букве.

FR похоже именно ее использует, т.е. кириллическую а не латинскую/датскую. Не пробовали скопировать символ из моего задания или из FR, может тогда без "?" будет.

Всего записей: 4431 | Зарегистр. 09-09-2002 | Отправлено: 08:28 28-05-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
Вставил эту букву без проблем из буфера обмена (копировать-вставить). Причем вставились и кириллическая и латинская буква "ае". А вот если просто с помощью раскладки нажимать на клавишу и пытаться впечатать в поле, то получается вопросительный знак.
 
Добавлено:

Цитата:
А пробовали мой пример test-nb.zip открыть, с которым я видео снимал.

 
Не пробовал. Я на середине третьего видео пока. Времени пока не было все ролики посмотреть. )

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 22:55 28-05-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый вечер.
Не могу разобраться с новыми функциями (OCR) в новой версии СК.
Вроде как надо делаю.
Вот тест-файл.
 
В тесте несколько страниц. Там же в папке есть файлы ФайнРидера.
 
Файнридером распознал.
Парсер в папку data закинул, сгенерированный файл скопировал в папку ocr в папке out.
Потом в СК в режиме Result View: Special — OCR Page.
 
Создается файл с расширением focr только для одной странице (не для всех!) и то берет данные распознавания не для этой страницы, а другой.
На видео говорилось о сдвиге и его корректировке (File—Option—Misc). Я там тоже поиграл значениями. Только не понял, а зачем мне делать сдвиг, если и в тесте (в СК) и в ФайнРидере одни и те же страницы в одном и том же порядке.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 23:54 30-05-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
вероятно, старый ФР. Я открыл ваш проект с портабельного ФР15, пересохранил проект в новой папке, и сгенерировал новый result.bookmarks. Подсунул его Кромсатору - и всё чётко с ocr слоем.
 
Об этом была переписка с NME и krestik
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1336222925/305#305
 
файл букмарков
https://disk.yandex.ru/d/J39_ilg8r2umww

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 06:34 31-05-2022 | Исправлено: TelecomUral, 06:47 31-05-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
 
Использовал ваш файл букмаков result. Опять файл с расширением focr создал только для одной страницы. Но зато слой для этой страницы получился как надо, все на месте.
Не знаю, почему только для одной страницы создает.
При этом в папке ocr (та, что внутри папки out) созданы файлы с расширением *.bookmarks для всех страниц.
 
Проверил версию Файнридера — у меня 15.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 07:36 31-05-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
asku
Опять файл с расширением focr создал только для одной страницы

Загадочно А у меня все focr создались. По одной команде из VR.
Зато тессеракт не создаёт вообще ничего по команде из MainWindow.
 
Я готовлюсь писать статейку про функции СК, связанные с ocr. Чтоб хоть самому разобраться, а то каша и у меня в голове. Потом вставим в неё ответы разработчика. Больно сложно организованы процессы. Нарисую диаграммки в Visio, скриншотики.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 07:51 31-05-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Потом в СК в режиме Result View: Special — OCR Page.    Создается файл с расширением focr только для одной странице (не для всех!)

Все правильно, в VR команда ocr только для текущей страницы.
Если нужно сразу для всех, то это надо делать из главного окна, я в видео вроде упоминал про это.

Всего записей: 4431 | Зарегистр. 09-09-2002 | Отправлено: 08:21 31-05-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Так вы же делаете OCR из RV. Это там так (только для текущей) и работает.
 
Для всех страниц сразу надо командой меню MW делать.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 08:22 31-05-2022
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru