Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть | 4 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.99 | ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 38886 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: daa2013, 16:41 19-05-2024
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, TelecomUral, добрый день.
 
Подскажите пожалуйста, почему на второй странице рисунок «чернеет».
Вот тест:
Ссылка
 

 
В настройках обработки картинок отличие в галочке (указал стрелкой). Как я понимаю, на второй картинке галочка не нужна, чтобы маленький текст под картинкой сохранился (текст указал другой стрелкой). Излишнюю черноту на картинке указал желтой стрелкой. Чернота появляется на всей картинке, но наиболее заметно там, где стрелка.

Всего записей: 540 | Зарегистр. 04-05-2016 | Отправлено: 13:20 29-02-2024
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У вас же всё уже даже нарисовано.
 
Сняли галочку Clear Source Area. Рисунок остался в текстовом слое и бинаризовался. Потом он просвечивает через наложенную сверху картинку, в которой вычтен слой фона.

Всего записей: 1023 | Зарегистр. 13-06-2013 | Отправлено: 14:02 29-02-2024 | Исправлено: daa2013, 14:02 29-02-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
почему на второй странице рисунок «чернеет»

вероятно вы выполнили команду "get transparency mask from page", не удалив под картинкой "черное ненужное". Надо было в VR скрыть зону, удалить все кроме букв и только потом get... делать.
 
есть второе решение. поставить дублирующим контуром спец BW-зону с таким порогом, чтобы бинаризовалось как белое. Естественно, текст чтоб в эту зону не попал, уголок зоны подвинуть руками (edit vertexes).  
 
upd
и третье решение.
маленькую зону для букв добавить. Тогда галку надо снимать.

Всего записей: 3091 | Зарегистр. 15-07-2010 | Отправлено: 14:02 29-02-2024 | Исправлено: TelecomUral, 14:04 29-02-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
вероятно вы выполнили команду "get transparency mask from page", не удалив под картинкой "черное ненужное". Надо было в VR скрыть зону, удалить все кроме букв и только потом get... делать.  

В последней версии я не рекомендую пользоваться этой командой. Я по сути перенес этот функционал в виде новой опции ext.зоны: add transparency mask from page. Достаточно включить ее, и СК на лету сформирует маску прозрачности в момент вклейки зоны, при этом сам файл зоны останется неизменным. Большой плюс такого подхода в том, что в качестве маски берется не текст из обработанного тифа, а текст, который закодирован на step2. Понятно, что между ними при lossy-кодировании есть разница, поэтому в новой версии маска полностью соответствует текущему тексту djvu, а в старой версии - не полностью, из-за чего прозрачность получается неточной, с проплешинами по периметру.  
Ну и да, "черное ненужное" в любом случае следует зачищать.

Всего записей: 4458 | Зарегистр. 09-09-2002 | Отправлено: 12:55 01-03-2024 | Исправлено: bolega, 13:00 01-03-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
прозрачность получается неточной, с проплешинами

ого! то-то меня иногда смущали эти проплешины. теперь понятно.

Всего записей: 3091 | Зарегистр. 15-07-2010 | Отправлено: 13:00 01-03-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
теоретически небольшое расхождение и сейчас может остаться, если dpi зоны и текста разные, в этом случае ч/б маска ресэмплится вниз (до dpi зоны), а это тоже операция с потерями

Всего записей: 4458 | Зарегистр. 09-09-2002 | Отправлено: 13:39 01-03-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Забыл еще сказать, что add transparency mask from page - это опция зоны в out-задании. Но, чтобы не забыть включать ее для нужных зон, и не искать их после создания out-задания, достаточно в основном задании на закладке свойств зоны protect включить аналогичную опцию transparency from page. При обработке зоны эта опция не используется, но служит исключительно для того, чтобы при создании out-задания автоматом взводить add transparency mask from page

Всего записей: 4458 | Зарегистр. 09-09-2002 | Отправлено: 09:36 02-03-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Нет ли возможности сделать более доступной возможность изменения размера удаляемого спекла?
При обработке материала после ксерокса или ротапринтного издания этого добра на каждой странице предостаточно.
Но под одно значение этого параметра в большинстве случаев не удается получить приемлемый вариант обработки, поэтому приходится часто выходить из режима просмотра и лезть в свойства для изменения этого параметра. Но не факт, что удастся сразу найти приемлемое значение этого параметра, и снова приходится лезть в свойства.
Идеальным было бы получить доступ до изменения его прямо из режима просмотра с возможностью запуска переобработки скана из этого режима.

Всего записей: 6984 | Зарегистр. 14-01-2005 | Отправлено: 01:48 03-03-2024 | Исправлено: shch_vg, 01:51 03-03-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
панельки бинаризации в VR не хватает?

Всего записей: 3091 | Зарегистр. 15-07-2010 | Отправлено: 07:47 03-03-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral
Можно подробнее в ЛЯ пояснить, как в панели бинаризации решить мою проблему?

Всего записей: 6984 | Зарегистр. 14-01-2005 | Отправлено: 13:02 03-03-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
по идее это всё же должен быть "вариант 4": основную малоцветную страницу считать огромной зоной, саму страницу как-бы пустой, а к зонам применять настройки как на step3.

Добавил такую возможность. Надо просто создать special-зону с включенной опцией малоцветки и тогда цветной скан СК прикрепит на step3.
 
MZN

Цитата:
Заметил странную вещь.  При задании числа процессорных ядер более 8-10, работа SK практически замирает. Причем, чем больше задается ядер, тем ситуация хуже. Проверялось на 128 (Epic) и 44 (2011-3v4) ядерных машинах. Это поправимо, или я делаю что-то не то?

Когда-то я предвидел такую проблему, и даже наметил в коде ее решение. Но проверить нормально не смог, т.к. максимум что я имею, это 6-ядерный проц. На нем решение не дало выигрыша, а слегка даже замедлило. Поэтому я тот код просто отключил. Сейчас я его снова активировал, он начнет применяться если кол-во потоков будет задано >=8. Если будет возможность, проверьте на новой версии, когда выйдет. Если не поможет, значит причину я неправильно вижу, либо причина в дисковой подсистеме компа, она не соответствует стольким одновременно работающим заданиям СК.
 

Всего записей: 4458 | Зарегистр. 09-09-2002 | Отправлено: 08:28 13-03-2024 | Исправлено: bolega, 08:29 13-03-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Надо просто создать special-зону с включенной опцией малоцветки

ура, долго ждал.

Всего записей: 3091 | Зарегистр. 15-07-2010 | Отправлено: 08:43 13-03-2024
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Можно ли задать для Deskew черный фон вместо белого?

Всего записей: 332 | Зарегистр. 10-08-2018 | Отправлено: 00:29 14-03-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Можно ли задать для Deskew черный фон вместо белого?

а сканы ч/б или цветные? и зачем это?
если там такая страница, что фон черный, а текст белый, то для таких сканов лучше включать опцию invert, а после обработки инвертировать обратно командой в VR

Всего записей: 4458 | Зарегистр. 09-09-2002 | Отправлено: 08:13 15-03-2024 | Исправлено: bolega, 08:15 15-03-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
лучше включать опцию invert

эту?

Всего записей: 3091 | Зарегистр. 15-07-2010 | Отправлено: 08:25 15-03-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
да.
и при таком подходе и поля будут определяться нормально, и despeckle будет корректный и прочие фильтры.
У зон кстати есть своя такая же опция, только там можно выбрать в какой момент обработки инвертировать

Всего записей: 4458 | Зарегистр. 09-09-2002 | Отправлено: 08:58 15-03-2024 | Исправлено: bolega, 09:01 15-03-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
после обработки инвертировать обратно командой в VR

было бы разумно ввести рядом вторую галку "инвертировать снова в VR".  
Хотя на моей памяти я черных страниц с белым текстом видел штук восемь.

Всего записей: 3091 | Зарегистр. 15-07-2010 | Отправлено: 09:07 15-03-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
было бы разумно ввести рядом вторую галку "инвертировать снова в VR".  

я сначала ocr делаю, чистку крупного despeckle, а потом уже инвертирую вручную.
так что поверьте моему опыту, это совсем неразумно.

Всего записей: 4458 | Зарегистр. 09-09-2002 | Отправлено: 09:42 15-03-2024
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
а сканы ч/б или цветные? и зачем это?

Цветные сканы разобранных журнальных страниц на черном фоне.  
Коллега делает весь (упрощенный) процесс в ST, из-за чего результат страдает. Особенно ему там нравится автоопределение границ страницы, но оно не работает если подавать на вход повернутые страницы с белыми краями. Обходное решение нашел, просто было интересно узнать.

Всего записей: 332 | Зарегистр. 10-08-2018 | Отправлено: 09:44 15-03-2024
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день всем. Такой вопрос.
В книге на многих страницах под текстом (в виде фона) есть один и тот же рисунок.
 

 
Мне кажется, что когда-то здесь на форуме я прочитал, что можно использовать один рисунок (файл) для многих страниц, чтобы конечный файл был не такой большой по объему.
Подскажите пожалуйста, как это делать.
Вот на всякий случай test-архив

Всего записей: 540 | Зарегистр. 04-05-2016 | Отправлено: 12:24 15-03-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru