Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99

Открыть новую тему     Написать ответ в эту тему

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: сканирование, обработка, сборка
 
 
Текущая версия программы: ScanKromsator v6.71 Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  Устаревшие версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...
 


ВАЖНО ! Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом... и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: shch_vg, 18:02 14-10-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А вы задали в опциях число ядер процессора ?

Всего записей: 811 | Зарегистр. 13-06-2013 | Отправлено: 22:18 09-03-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А вы задали в опциях число ядер процессора ?

 
Если вопрос мне - я не трогал дефолтные настройки, тем более что они сами подхватились с версии 6.5х
Медленнее по ощущениям даже на Драфте....

Всего записей: 2903 | Зарегистр. 17-09-2001 | Отправлено: 23:53 09-03-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Алгоритмы обработки и драфта в последних версиях не менялись. Так что это скорее только ощущения. Такое бывает, когда инструмент не любишь, кажется, что он работает все хуже и хуже
В 6.7x слегка изменилась обработка только для 1200dpi, она стала более устойчивой к нехватке памяти на 32 разрядной Windows.

Всего записей: 3972 | Зарегистр. 09-09-2002 | Отправлено: 09:27 10-03-2021
Benoni



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Так что это скорее только ощущения. Такое бывает, когда инструмент не любишь, кажется, что он работает все хуже и хуже  

!

Всего записей: 1608 | Зарегистр. 15-06-2006 | Отправлено: 10:09 10-03-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
я не трогал дефолтные настройки

Если хороший комп, рекомендую задать использовать несколько ядер. Скорость обработки вырастет в несколько раз. На драфт не влияет пока..
 
Добавлено:
Benoni
i

Всего записей: 3972 | Зарегистр. 09-09-2002 | Отправлено: 10:37 10-03-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Хочу поделиться очередной идеей полезного применения тессерактовских ячеек для букв.
 
Иногда такое бывает, что по всей книге при джву-кодировании вылезает ошибка transposed letters, именуемая инода на жаргоне "ошибкой ИНь". Это когда буквы И и Н перепутываются, и одна подставляется вместо другой. Объяснять и примеры приводить тут, наверное,  даже и не надо.
 
Ну, так вот.
 
Взять и объявить все ячейки для букв И и Н зонами лосслесс кодирования.  
Точнее, сначала провести OCR, а потом выбрать буквы, ячейки для которых станут такими зонами.  
Перепутывание, оно ведь по разному случается.

Всего записей: 811 | Зарегистр. 13-06-2013 | Отправлено: 16:51 16-03-2021
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
зоны определяются нечетко.

Всего записей: 1653 | Зарегистр. 15-07-2010 | Отправлено: 17:12 16-03-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ну и что ?  
Какая разница в точности их границ, если внутри них гарантированно произойдет сохранение ч.б шейпов. Страдающие буквы-то они по любому захватывают.
 
Насколько я знаю, если лосслесс зона перерезает посередине какую-то букву, то она от этого не портится.

Всего записей: 811 | Зарегистр. 13-06-2013 | Отправлено: 19:50 16-03-2021 | Исправлено: daa2013, 19:52 16-03-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
И вот еще дополнение.
У меня есть словарь, где ИНь только в заголовках словарных статей, а в самом тексте нормально.
Но это всё равно тысячи слов.
 
Можно встроить проверку на размер. То есть не только чтобы И была опознана, а еще чтобы она скажем оказалась по высоте больше N пикселей. И только тогда выставлялась лосслесс зона по координатам ячейки.

Всего записей: 811 | Зарегистр. 13-06-2013 | Отправлено: 00:21 17-03-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Уточнение к дополнению.
 
Например, чтобы было условие   по высоте больше/меньше,  по ширине больше/меньше
Плюс возможное сочетание комбинации этих условий.  
Тогда ИМХО любую букву любого шрифта можно будет в лосслесс зоны поймать.

Всего записей: 811 | Зарегистр. 13-06-2013 | Отправлено: 01:23 19-03-2021 | Исправлено: daa2013, 08:57 19-03-2021
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013 можно еще так дополнить вашу идею:
1.  Исходный ч/б скан распознать tesseractом.  
2. Разделить скан на две части: первая - с буквами и,н,п на белом фоне, вторая - со всем остальным.
3. Вторую часть агресивно кодируем в djvu, а затем декодируем.
4. Объединяем  первую часть с декодированой. Получится файл с некоторыми одинаковыми шейпами, но буквы и, н, п будут исходного начертания.
5. Кодируем в djvu результирующий tif с умеренной агрессией.  
 

Всего записей: 744 | Зарегистр. 14-12-2005 | Отправлено: 09:51 19-03-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013
U235
Вы так интересно обсуждаете, как решить проблему инь и янь.
А можно привести пример исходного скана, результат его дежавуирования, на котором это проявляется, и обязательно (иначе предыдущее не имеет смысла) указать, какой программой и с какими параметрами создано дежавю?

Всего записей: 6568 | Зарегистр. 14-01-2005 | Отправлено: 15:46 19-03-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
del

Всего записей: 3972 | Зарегистр. 09-09-2002 | Отправлено: 20:34 19-03-2021 | Исправлено: bolega, 22:26 19-03-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сфотографированные книги с поочерёдно развёрнутыми влево и вправо страницами можно как-то в один проход исправить в оригинале в СК?

Всего записей: 2903 | Зарегистр. 17-09-2001 | Отправлено: 13:50 22-03-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
niccolo
Один неудачно заданный вопрос порождает минимум два встречных:
1. Что такое "с поочерёдно развёрнутыми влево и вправо страницами"?
2. Что понимается под "исправить в оригинале"?

Всего записей: 6568 | Зарегистр. 14-01-2005 | Отправлено: 14:17 22-03-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
 
1. поочерёдно развёрнутыми влево и вправо страницами  — чётные - повёрнуты по ч/с на 90, нечётные — против ч/с на 90°, или наоборот.
 
2. исправить в оригинале — повернуть именно оригиналы изображений (перезаписать оригиналы повёрнутыми), а не их представление в программе.
 
пример SINGLE PAGE ORIGINAL JP2 TAR  
https://archive.org/details/schlomannoldenbo1319schl/page/354/mode/2up
 
И есть ли пути ускорения работы с jp2?

Всего записей: 2903 | Зарегистр. 17-09-2001 | Отправлено: 14:25 22-03-2021 | Исправлено: niccolo, 14:28 22-03-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я обычно jp2 конвертирую при помощи ирфана в тиффы.
Наверное там же можно и повороты пакетно сделать.

Всего записей: 811 | Зарегистр. 13-06-2013 | Отправлено: 15:40 22-03-2021
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
niccolo
Выделяете нужную группу файлов и поворачиваете за один проход,
выделить можно через один автоматически

Всего записей: 753 | Зарегистр. 03-07-2005 | Отправлено: 17:43 22-03-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bearjrgm
 
Спасибо. Разобрался. За один проход, я так понимаю, нельзя

Всего записей: 2903 | Зарегистр. 17-09-2001 | Отправлено: 17:49 22-03-2021 | Исправлено: niccolo, 17:51 22-03-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Можно. Маркируете все файлы. Выделяете все те, что +90. Выставляете для них orientation +90. Затем инвертируете выделение и выставляете для них -90. Затем команду rotate and save, параметр get angle from ставите = orientation option.
Но СК очееень медленно работает с Jp2, поэтому правильно рекомендуют сначала конвертнуть в тиф.

Всего записей: 3972 | Зарегистр. 09-09-2002 | Отправлено: 18:03 22-03-2021
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru

Рейтинг.ru