Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91

Открыть новую тему     Написать ответ в эту тему

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: сканирование, обработка, сборка
 
 
Текущая версия программы: ScanKromsator v6.71 Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  Устаревшие версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...
 


ВАЖНО ! Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом... и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: shch_vg, 18:02 14-10-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gentle так называется, потому что выполняет не сильное (деликатное), сглаживание.
Для его использования не нужно включать опцию contour smooth

Всего записей: 3936 | Зарегистр. 09-09-2002 | Отправлено: 09:26 05-12-2020 | Исправлено: bolega, 10:32 05-12-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D

Цитата:
Почему когда по CTRL или ALT во вкладке "C.Smooth", пытаюсь опцию "Gentle smooth" назначить всем страницам — этого не происходит?

Серьезный баг. Вместо gentle может скопироваться случайно выбранная опция
Для клонирования опции пользуйтесь контекстным меню этой опции.

Всего записей: 3936 | Зарегистр. 09-09-2002 | Отправлено: 21:22 11-12-2020
anion23

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Уважаемые специалисты-кромсаторы! Если у кого-то из вас найдется немного свободного времени, я был бы очень благодарен за помощь в подборе оптимальных настроек SK для обработки скана книги 30-х годов. Скан делал не я, поэтому возникли проблемы с качественной обработкой. Я сканирую в градациях серого с разрешением 600 dpi, и под свои сканы мне удалось нормально настроить SK для получения качественного результата (благодаря выложенным в шапке мануалам). Однако этот скан сделан цветным, с разрешением 300 dpi и пожат в jpg.
Возможно, вы сможете порекомендовать подходящие настройки, поскольку у меня не получается нащупать оптимальный режим обработки. Вот примеры страниц: https://anonfiles.com/zfLfm9ybp4/scan_zip

Всего записей: 394 | Зарегистр. 22-07-2010 | Отправлено: 20:32 12-12-2020
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
anion23
В вашем сообщении присутствуют два субъективных понятия: " оптимальный режим обработки" и "качественная обработка" - у каждого свои представления об этом.
Я бы остановился на понятии "приемлемая".
Для этого пометьте  в СК ваши три скана (слева внизу правая пиктограмма),поставьте на закладке Page в параметр Despeckle галку, на закладке Binarization для всех сканов Auto, на закладке Options параметр Despeckle=Fine и на закладке Files параметры DPI=600 и Color=B/W.
Если текст устраивает (а он будет приемлемым), занимаетесь далее резаками, автомарджином, дескью и т.п.

Всего записей: 6544 | Зарегистр. 14-01-2005 | Отправлено: 02:33 13-12-2020 | Исправлено: shch_vg, 03:03 13-12-2020
anion23

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Спасибо за ответ! Я, помимо описанных вами настроек, еще лез в раздел Quality и игрался с настройками улучшателей изображения. Результат получался в основном такой: https://anonfiles.com/5a82wcy0p2/result_zip
Просто обработать сканы без настроек Quality не пробовал, спасибо за наводку.
А как бы вы обработали такой скан при условии, что нет возможности пересканировать нормально и хочется выжать максимум качества? Или в данном случае это невозможно?

Всего записей: 394 | Зарегистр. 22-07-2010 | Отправлено: 10:19 13-12-2020
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
anion23
Опять вопрос о субъективности.
Мне приходилось обрабатывать гораздо худшие сканы.
Эти же я считаю вполне приемлемыми для обработки, и приведенных мной параметров вполне достаточно, чтобы получить нормально читаемый вариант.
Какие-то дальнейшие улучшения это чисто по вкусу обработчика.

Всего записей: 6544 | Зарегистр. 14-01-2005 | Отправлено: 21:41 13-12-2020 | Исправлено: shch_vg, 21:42 13-12-2020
anion23

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Ясно, спасибо!

Всего записей: 394 | Зарегистр. 22-07-2010 | Отправлено: 23:44 13-12-2020
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Прошлый раз я писал о том, что если есть ячейка буквы, и в ней опознаны спеклы заданного размера, то можно эту ячейку подсовывать пользователю и и предлагать на замену букву, которой сделан OCR в ячейке.
 
Сейчас вожусь с разрушенными буквами, и меня осенило, что это тоже можно автоматизировать.  
 
"Разрушенная буква" - это такая буква, часть которой не пропечаталась. Т.е. это не оторванный спекл, а как бы понадкусанная буква или буква с проплешинами.  
Что можно сделать:
 
а) есть ячейка и распознанная буква в ней.
 
 
б) рассчитать некий коэффициент полноты, то есть:  
 
Х = число пикселей в ячейке/число пикселей сопоставленного это букве глифа.
 
и если он вышел за заданный пользователем порог, то подсовывать ему эту ячейку для обработки и контролируемой замены глифа, предлагая ему это глиф.  
 
 
в) часто я правлю такие глифы не путем замены на идеальный, а путем вклеивания более тонкого глифа в режиме транспарентности белого. Так буквы получаются естественнее.  (Толщина и плотность букв на станицах могут гулять. И мой "идеальный" может смотреться где-то тонковато, а где-то толстовато. ). Соответственно при режиме автоподсказки по глифам (который когда-нибудь, возможно, появится) хорошо бы дать опцию перевода всей работы в режим транспарентности.
Возможно, дать два набора букв. Один для расчета коэфф. Другой для замены.  
(с разных закладок/страниц библиотеки глифов их брать)

Всего записей: 734 | Зарегистр. 13-06-2013 | Отправлено: 16:29 19-12-2020 | Исправлено: daa2013, 16:45 19-12-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Что-то не получается у меня использовать кнопку визарда дежавю "Create result djvu".  
Дочистил мусор на чб странице (в основном задании), пересобрал step2. По времени создания смотрю - да, он новенький. Жму вышеуказанную кнопку - а она мне подсовывает старый файл.
Прикольнее всего, что даже если я меняю имя файла, то он генерируется со старой датой

Всего записей: 1553 | Зарегистр. 15-07-2010 | Отправлено: 07:45 26-12-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
А step1 и step3 отсутствуют?

Всего записей: 3936 | Зарегистр. 09-09-2002 | Отправлено: 10:54 26-12-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
в обработке два скана, оба на step3 приписаны. Файл step3 конечно есть.
 
 
Добавлено:
bolega
И большое спасибо за инструмент Soft brush. Я наконец добрался его опробовать - мне понравилось. Края рисунка слегка размываются, и вид более приятный глазу.

Всего записей: 1553 | Зарегистр. 15-07-2010 | Отправлено: 11:45 26-12-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Файл step3 конечно есть.  

Если переделали step2, то переделка step3 обязательна. При наличии step3 в result берется именно он, т.к. step3=step2+зоны, т.е. это следующая стадия
Напомню, что кодируется на
STEP2: ч/б страница + ч/б зоны (раскрашенные, а также special с опцией separate b/w-coding). При этом раскрашенные bw кодируются, но пока не раскрашиваются. И они кодируются вместе со страницей, т.е. с использованием общего словаря. Special separate b/w-coding кодируются раздельно от страницы и затем полученный чанк встраивается в чанк страницы.
STEP3: цветные зоны (МПФ) целиком, few-color-зоны целиком (losseless), а также добавляется цвет для раскрашенных bw зон. Входным файлом для step3 является файл step2.djvu.
Result djvu = step3.djvu+вклейка на свои места страниц из step1.djvu и step4.djvu

Всего записей: 3936 | Зарегистр. 09-09-2002 | Отправлено: 12:28 26-12-2020 | Исправлено: bolega, 12:39 26-12-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
аа

Всего записей: 1553 | Зарегистр. 15-07-2010 | Отправлено: 13:16 26-12-2020
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите, ошибка это в SK или я что-то не так делаю:
Picture-зона BW, 600dpi, задан цвет фона. Создаю на ней рамку с помощью Draw frame, внешнюю белую область выделяю и делаю White transparent. Таким образом, содержимое рамки окрашено в какой-либо цвет.
Финализирую, затем out-task и генерируется pdf-файл.
При импорте такого pdf-файла в FR, страница, на которой имеется созданная вышеописанным способом рамка, не открывается и не обрабатывается — в области ее просмотра FR пишет:
"Image size exceeds limits (32512 x 32512)"
 
Задание: https://yadi.sk/d/cmCfrA2DP_jPAw

Всего записей: 3094 | Зарегистр. 29-09-2005 | Отправлено: 12:45 27-12-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DmitryKz
В ФР8 открылось и распозналось.

Всего записей: 1553 | Зарегистр. 15-07-2010 | Отправлено: 15:36 27-12-2020
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В ФР8 открылось и распозналось.

С FR8 могу подтвердить, что открывается.
Но я пользуюсь FR14 (лицензия) и там вот такая бяка (в FR15 вроде также, но наверняка не скажу — под рукой сейчас FR15 нету).

Всего записей: 3094 | Зарегистр. 29-09-2005 | Отправлено: 15:49 27-12-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DmitryKz
Тю. Зачем тогда тут спрашивать, пошлите в абби, в поддержку.

Всего записей: 1553 | Зарегистр. 15-07-2010 | Отправлено: 16:22 27-12-2020
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Здрасте
Если программа пишет, что размеры изображения в файле, полученном из СК, превышают лимит, значит она видит его таким по каким-то причинам. Т.е. не исключено, что СК не добавляет информацию о размерах изображения, и FR берет, скажем, произвольно какие-то максимальные значения — это может быть следствием изменения алгоритма парсинга pdf, ужесточением проверок корректности файла.
Я же не о любом файле, загружаемом в FR спрашиваю — а о файле, полученном из СК.
А здесь только автор СК может внести ясность, а никак не вы.

Всего записей: 3094 | Зарегистр. 29-09-2005 | Отправлено: 16:29 27-12-2020 | Исправлено: DmitryKz, 16:30 27-12-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DmitryKz
Именно что здрасьте. восьмерка-то берет pdf.  Ни один вьювер из четырех, что я использую, также не ругается на ваш файл.
 
Итого разница не внутри СК, а внутри алгоритма ФР. К кому вопросы, как не к разрабам ФР. Один и тот же файл два алгоритма, писанных одной командой, разбирают по разному. Вопрос к алгоритмам или к файлу - ? Ну не однозначно ли к алгоритмам? А вы спрашиваете bolega - "а подстроились ли вы под алгоритмы нового ФР?" Вы ещё потребуйте соответствующего тестирования от него
 
Я не защищаю bolega, моя цель - спрямить вам дорогу к правде.
 
upd
вот если бы вы сначала послали файл в абби, получили от них ответ " ваш pdf некорректен в таком-то месте" и написали тут "bolega, поправьте генерацию pdf, у вас ошибка потому-то и потому-то". Тогда другое дело.

Всего записей: 1553 | Зарегистр. 15-07-2010 | Отправлено: 17:23 27-12-2020 | Исправлено: TelecomUral, 17:32 27-12-2020
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А вы спрашиваете bolega - "а подстроились ли вы под алгоритмы нового ФР?"

Ну вот давайте вы все же не будете додумывать о чем я спрашиваю.
Мой вопрос был прост: "ошибка это в SK или я что-то не так делаю". Иными словами я вовсе не исключаю, что дело не в СК и тем более не прошу его автора что-либо сделать или починить.
 
Логические рассуждения ваши могут также быть однобокими, как и мои.
Я в свою очередь исхожу из того, что все файлы, созданные СК, ФР открывает вполне себе успешно. Но на страницах, где был применен White transparent, происходит упомянутая выше ошибка — и это единственная ошибка, с которой я столкнулся, работая со сгенерированными СК пдфками.
 
Поэтому я вполне могу посчитать, что СК тут отработал некорректно.
И поскольку оба варианта могут быть — ошибка в СК, или в ФР — таким и был мой вопрос. С этой позиции, как мне думается, неважно, кого спрашивать первым: автора СК или поддержку ФР. Потому что, уверен, если bolega будет несложно ответить — он вполне может это сделать и даст более устраивающий меня ответ, будучи автором СК.
 
В общем, я вполне допускаю, что вы правы — но дождусь ответа bolega, ежели таковой последует.

Всего записей: 3094 | Зарегистр. 29-09-2005 | Отправлено: 17:47 27-12-2020
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru