Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
Проблема в том, что despeckle для ч/б сканов выполняется до того, как вырезаются и формируются зоны. Т.е. к моменту создания зоны точек уже нет.


Цитата:
Если убрать Clear source area, точки останутся в зоне, но они останутся и на странице, а это возможно не то, что ожидает юзер.

Что-то я не понимаю взаимосвязь этих двух кусков. Если despeckle сработал ДО обработки самой зоны, то причем здесь Clear source area, который является параметром зоны? Задание этого параметра делает анти-деспекл всей страницы?
В примере TelecomUral видно, что Clear source area оказывает только локальное действие на свою зону.
И если верно указанное во втором куске, то есть обратное влияние параметра зоны на всю страницу? А что будет, если в одной зоне задан параметр Clear source area, а в другой нет?

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 16:43 18-12-2018 | Исправлено: shch_vg, 16:50 18-12-2018
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
то причем здесь Clear source area

=>

Цитата:
обратное влияние параметра зоны на всю страницу

вы встаньте на позицию юзера. он будет вынужден в разных условиях по-разному глядеть на одно и то же свойство зоны. она ему обычно нужна, чтоб сохранить то, что ПОД зоной, а на BW-скане - то, что _В_ зоне.

Всего записей: 3048 | Зарегистр. 15-07-2010 | Отправлено: 17:31 18-12-2018
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral

Цитата:
вы встаньте на позицию юзера

А я и есть юзер , но меня никогда не заботило, что есть ПОД зоной.
Как правило, я перед компиляцией делал слияние зон со страницей, и все, что ПОД зоной, исчезало. А там могло быть много чего, например, в варианте, когда сначала страница обрабатывается без зон, а только потом добавляются зоны, которые обрабатываются без переобработки страницы целиком.
С выползанием грязи из-под зоны столкнулся совсем недавно при создании дежавю в СК без слияния зон со страницей.
Кстати, до сих пор не понимаю, почему ПОД зоной появляется грязь, если зона задавалась ДО обработки страницы. Многократно рассматривал страницы после такой обработки, и всегда на месте зоны на странице были чистые места.
Пока же я вижу, что параметр Clear source area работает только для исходного черно-белого скана, или я не прав? Если это так, то м.б. лучше вообще его не показывать для не ч/б исходных сканов?

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 18:19 18-12-2018 | Исправлено: shch_vg, 18:29 18-12-2018
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
Что-то я не понимаю взаимосвязь этих двух кусков


Цитата:
 Если despeckle сработал ДО обработки самой зоны, то причем здесь Clear source area, который является параметром зоны?  

Попробую объяснить, хотя подозреваю, что вы опять сделаете вывод, что я не прав и все должно быть не так, как я объяснил.
Clear source area делает всегда то, что и должен делать: после вырезания зоны чистит область под ней. И это не зависит от того, ч/б скан или нет, есть ли там despeckle или нет, и т.п. При этом допускается, что участок в районе периметра зоны может остаться не очищенным. Я как-то объяснял, почему это происходит. Повторяться не хочу. Скажу только, что непрямоугольные зоны чистятся полностью.
 
Когда СК начинает обработку, он строит матрицу влияния разных типов зон на разные фильтры. При этом во внимание принимаются типы зон и некоторые их свойства. Например, если для страницы задано despeckle, то СК анализирует все заданные зоны на предмет того, нужно ли подвергать despecklу область скана, находящегося под зоной. Если зона типа exclude, то область должна быть исключена из действия despeckle. Если зона типа picture, то СК смотрит на ее параметр despeckle source area. Если он выключен (по умолчанию именно так) то СК по идее должен также исключить эту область. Но как мы видим, она не исключается. Почему? Все просто: СК видит, что при этом включена опция Clear source area, поэтому какой смысл защищать область скана от despeckle, если она все равно будет очищена. Ведь защита областей от действия фильтров расходует ресурсы и требует дополнительного времени.

Всего записей: 4434 | Зарегистр. 09-09-2002 | Отправлено: 19:28 18-12-2018
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
хоть кто-нибудь...
быстренько куда-нибудь это запротоколировать для инструкций и помощи!

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4308 | Зарегистр. 18-09-2003 | Отправлено: 20:45 18-12-2018
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
Попробую объяснить, хотя подозреваю, что вы опять сделаете вывод, что я не прав и все должно быть не так, как я объяснил.

Спасибо за разъяснения, теперь мне кое-что стало более понятным.
Что касается выделенного мной из Вашего ответа, то мне кажется, что Вы не совсем правильно воспринимали мои предыдущие сообщения.
Дело в том, что мы изначально находились (и находимся) в неравном положении.
Вы знаете всю внутреннюю механику программы, максимум можете забыть какую-то деталь. Для меня же (думаю, и для многих других) СК представляет "черный ящик" с минимумом информации, которая в основном преобретается путем задания тех или иных параметров и оценки результата их действия. Не уверен например, что все написанное в "Хрестоматии материалов про СК" из шапки соответствует реальному положению дел. На основе этого складывается мое представление о работе СК, которое, конечно же, не совпадает с реальным алгоритмом. Поэтому и все мои вопросы или предложения делались исходя из МОЕГО представления о работе программы в тот или иной момент.
 
Несмотря на все вышеизложенное рискну предложить свое видение решения проблемы обработки ч/б исходных сканов. М.б. стоит отказаться в этом случае от экономии времени обработки на деспекле, а при наличии галки в Clear source area не делать диспекл со страницы на область зоны?
Альтернативный вариант: в конце нынешней обработки для ч/б скана выполнить команду Reprocess из меню зоны для всех зон с включенным параметром Clear source area. Так, например, я восстановил нормальный вид зон в примере TelecomUral.

Цитата:
При этом допускается, что участок в районе периметра зоны может остаться не очищенным.  

Это объясняет появление в некоторых случаях правой вертикальной и нижней линий после слияния зоны со страницей.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 00:22 19-12-2018 | Исправлено: shch_vg, 00:30 19-12-2018
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
М.б. стоит отказаться в этом случае от экономии времени обработки на деспекле, а при наличии галки в Clear source area не делать диспекл со страницы на область зоны?  

Это поможет не всегда. Например, если пользователь включит опцию зоны despeckle source area и отключит Clear source area, т.е. он захочет, чтобы спеклы остались в зоне, но убрались бы со скана, он опять получит не то, что надо: спеклы останутся и там, и там. Т.е. опять баг.  
 
Добавлено:
Кстати, по чистой случайности я сейчас работаю над темой, которая очень близка к той, которую мы обсуждаем: проблема, возникающая при наличии в pic-зоне отключенной опции Clear source area (csa). Многие наверно заметили, что после обработки неочищенные (из-за опции csa) области под зонами выглядят отлично от соседних участков (по жирности и т.д). Это такой недостаток обработки, который упирается в принятый в СК ход обработки. Чтобы устранить его, надо обработку таких страниц выполнять не один, а два раза. Один раз с учетом зон, второй - как будто зон нет. Только так можно добиться адекватного результата. Можно этот процесс распараллелить, но я боюсь, что тогда появятся проблемы с нехваткой памяти. Поэтому я остановился на двухпроходной обработке одного и того же скана. Возможно, что в рамках решения этой задачи заодно удастся решить и тот баг, который мы обсуждаем.

Всего записей: 4434 | Зарегистр. 09-09-2002 | Отправлено: 09:35 19-12-2018
Nitrofest

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Хочу попросить кого-то из экспертов обработать скан (расшитый из чужого pfd) и скинуть сюда результат с настройками sk, если кому-то будет не лень потратить на это время. Изначально крупноформатная книга была отсканирована с фиговым разрешением. Пытаюсь играться с разнообразными настройками Enhance - contour smooth - blur - но результат все равно не очень мне нравится. Было бы неплохо сравнить с результатом профессионалов.
 
https://yadi.sk/d/N0gbZ7I6R7IbIw

Всего записей: 46 | Зарегистр. 04-09-2009 | Отправлено: 11:19 19-12-2018 | Исправлено: Nitrofest, 12:16 19-12-2018
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А нельзя ли каким-нибудь человеческим образом передать рисунок ?  
rghost или яндекс диск или дропмифайл  ? (Файлообменник а не радикал. И без дополнительных jpg-конвертаций ?)
 
И потом: что значит расшивка ? Вы его при помощи СК выковыривали или в Акробате Save As задействовали ?
Лучше вообще просто эту pdf-страничку положите.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 11:42 19-12-2018 | Исправлено: daa2013, 11:44 19-12-2018
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Nitrofest
Оригинал в студию!.. Самый-самый оригинал.
Ощущение современной книжки выложенной как превью с диким сжатием.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4308 | Зарегистр. 18-09-2003 | Отправлено: 12:11 19-12-2018
Nitrofest

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А нельзя ли каким-нибудь человеческим образом передать рисунок ?  
rghost или яндекс диск или дропмифайл  ? (Файлообменник а не радикал. И без дополнительных jpg-конвертаций ?)  
 
И потом: что значит расшивка ? Вы его при помощи СК выковыривали или в Акробате Save As задействовали ?  
Лучше вообще просто эту pdf-страничку положите.
 

 
Выложил на YD архив, страничка в pdf внутри. Я расшивал из pdf в png при помощи STDU viewer в 600 dpi.
 

Цитата:
Nitrofest  
Оригинал в студию!.. Самый-самый оригинал.  
Ощущение современной книжки выложенной как превью с диким сжатием.

 
Книжка 1991 года, кто сканировал не знаю, в инете уже 10 лет гуляет. Вот целиком, на всякий случай.
https://yadi.sk/i/AVrkC-3BiWYQ9A

Всего записей: 46 | Зарегистр. 04-09-2009 | Отправлено: 12:19 19-12-2018 | Исправлено: Nitrofest, 12:20 19-12-2018
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Nitrofest
Благодарствую.
Щаз попробуем.
 
Добавлено:
Nitrofest
Вообщем из оригинала можно вытянуть, но придётся сначала апскейл сделать, прежде СК
Получается вот что https://yadi.sk/i/95aUQElRLI34zw
 
Делается с помощью Топаз Гигапиксель вер.2 600% увеличения.
Конечно же, предварительно нормально разобрав ПДФ файл "как есть".

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4308 | Зарегистр. 18-09-2003 | Отправлено: 12:24 19-12-2018
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
slava_kry

Цитата:
но придётся сначала

ваши ответы в этом топике мне всегда напоминают анекдот про студента, который перед экзаменом успел выучить только одну тему - про блох, и когда на экзамене ему выпал билет про кита, он отвечал так: у кита не бывает блох, а что касается самих блох, то можно сказать, что ....
 
Т.е. относительно темы СК ваши ответы сводятся к нулю, но блеснуть знанием всяких плагинов к акробату и фотошопу вы никогда не упустите случая. Правда при чем тут топик про СК, не очень понятно...
Извините уж за прямоту.

Всего записей: 4434 | Зарегистр. 09-09-2002 | Отправлено: 13:12 19-12-2018 | Исправлено: bolega, 13:17 19-12-2018
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Да, спасибо за прямоту... только вроде бы задача-то получить результат и облегчить тяготы вопрошающим... так же воде бы?
А если ваша программа, в данном случае, нихрена не может, то что вам останется ответить?.. Прости дорогой, ничем не могу помочь! Так что ли?
 
А выход-то есть, только слегка другой чем вопрошающий знает, но зачем о нём говорить? Правда так?..
...Простите за прямоту.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4308 | Зарегистр. 18-09-2003 | Отправлено: 13:34 19-12-2018 | Исправлено: slava_kry, 13:35 19-12-2018
Nitrofest

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Nitrofest  
Вообщем из оригинала можно вытянуть, но придётся сначала апскейл сделать, прежде СК  
Получается вот что https://yadi.sk/i/95aUQElRLI34zw  
 

 
Спасибо! Ну я бы сказал, что результат похуже моего. Много мусора не вычищено из-за jpeg distortion.
 
А, стоп, у Вас же не бинаризованный файл. Наверное, результат будет лучше, если прогнать Ваш файл через SK.

Всего записей: 46 | Зарегистр. 04-09-2009 | Отправлено: 13:51 19-12-2018 | Исправлено: Nitrofest, 13:58 19-12-2018
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
slava_kry

Цитата:
А если ваша программа, в данном случае, нихрена не может

А вы пробовали? А вы уверены, что в СК вы настолько опытный эксперт, что можете утверждать это так безапелляционно? Тем более вы всегда для тяжелых случаев предоставляете не ч/б версии. Так любой дурак может, вы уж доведите до ума, т.е. до bw, без мусора и т.д. А демонстрировать работу профессиональных программ-улучшателей много ума не надо.  
Проверил.
При исходнике в 150dpi СК с Топаз Гигапиксель конечно бесполезно тягаться
Но думаю, что 900dpi все-таки хуже, чем найти и пересканировать книгу в нормальном dpi.
 

Всего записей: 4434 | Зарегистр. 09-09-2002 | Отправлено: 14:26 19-12-2018 | Исправлено: bolega, 15:36 19-12-2018
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Я вставил шпильку, извините.
И я всё время говорю именно о предварительной подготовке перед обработкой в СК, а не о самом СК. Если что-то СК не может, ему можно помочь, а дальше уже СК.
Я вот о чём.
Ещё раз простите за поддёвку, больше не буду.
 
 
Добавлено:
Nitrofest

Цитата:
А, стоп, у Вас же не бинаризованный файл. Наверное, результат будет лучше, если прогнать Ваш файл через SK.

Да, именно так, это подготовка материала перед обработкой в СК.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4308 | Зарегистр. 18-09-2003 | Отправлено: 16:17 19-12-2018
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
slava_kry

Цитата:
Я вставил шпильку

Да о чем разговор. Все нормально.
 
Для сравнения вот djvu: 1-я страница обработана в СК, 2-я - slava_kry в Топазе. dpi искусственно установлено в 600, в реальности оно 900
http://fayloobmennik.cloud/7341770
 

Всего записей: 4434 | Зарегистр. 09-09-2002 | Отправлено: 18:49 19-12-2018
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
del

Всего записей: 3048 | Зарегистр. 15-07-2010 | Отправлено: 03:59 20-12-2018 | Исправлено: TelecomUral, 09:40 20-12-2018
igogo22

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Обработка пикчур-зон от TelecomUral Подробнее...  

К сожалению две ссылки нерабочие. Можете обновить?

Всего записей: 45 | Зарегистр. 05-12-2011 | Отправлено: 13:50 20-12-2018
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru