Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор (Часть 2)

Модерирует : gyra, Maz

Widok (30-03-2009 18:08): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator: Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п. (есть FAQ). Автор: bolega. http://bolega.hotmail.ru/
 
Начало обсуждения - здесь.
 
Текущая версия: ScanKromsator v5.92 (2 МБ)
Предыдущая версия: ScanKromsator v5.91 full (3,26 МБ) зеркало
 
Старые версии: Подробнее...
Изменения в новой версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)

 
Самая краткая инструкция по работе с СК (включает "сборку" СК) от ghosty
 
ScanAndShare - инструкция в картинках от VadimirTT, + начальные установки SK.Использование ScanKromsator’а v5.91 от Melirius
 
Вопросы и ответы по работе со СканКромсатором:
http://abab.front.ru/QandA_SK.ZIP (80 КБ, от 20.06.06)
 
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ) и в HTM и DOC (537 КБ)
 
Пособие по Кромсатору от monday2000  
(Составлено на базе "Вопросов и ответов" + Хелп v1.0).  См. подробности. Обновлено 30.10.07

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 15:15 17-08-2007 | Исправлено: ghosty, 15:09 25-12-2008
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand
Спасибо огромное... Повторил последовательность действий, все получилось...  
Единственное - Корел у меня английский, а я в нем... поэтому хотелось бы уточнить термины:
 
1.1. Адаптивное (Интеллектуальное, так называется в Кореле) размытие - Smart blur
3.2. Тоновая коррекция (Увеличение контрастности). Contrast Enhancement
3.3. Сглаживание Blur>Smooth
 
И есть пара вопрсов.
 

Цитата:
При обработке обычных сканов далее было бы сглаживание и контурная резкость. Здесь приходится отказаться от контурной резкости - вылезает мусор от просвета.

 
Можно про это поподробнее? Я остальные страницы тоже буду делать в Кореле
 
И еще - какими параметрами можно варьировать, а какие оставить без изменений. Меня немного смущает "3.2. Тоновая коррекция" - подойдет ли для всех сканов примено одного качества (не считая самых бледных)?
 
Если не трудно, покажите на примере (если размер большой, прежму/обрежу)
 
http://rapidshare.com/files/55107377/Image_0019.rar.html (1680 KB)

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 13:25 12-09-2007
Melirius



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alexx S

Цитата:
Инетересно, а возможно ли сделать "ужирнение" теста, когда выделяется контур, выделение расширяется на заданное кол-во пикселей и сглаживается. Ну и заливка...

 
Можно, я в Photoshop так развлекался на одном оччень плохом скане. Там скрипты пишутся тоже элементарно.

Всего записей: 318 | Зарегистр. 01-04-2005 | Отправлено: 20:45 12-09-2007
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Melirius
Я имел в виду именно Кромсатор, в Фотошопе и я такое делал

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 21:14 12-09-2007
chesskom



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
(...)

Всего записей: 1083 | Зарегистр. 02-07-2005 | Отправлено: 21:14 12-09-2007 | Исправлено: chesskom, 06:27 14-11-2007
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alexx S
Цитата:
хотелось бы уточнить термины:
Все так, проверил на английской версии.
Цитата:
покажите на примере  
Это обычный по качеству скан. Немного смущает тень от сгиба у левого края. Если освещенность сканов раномерная, то я не использую Correct illumination в СканКромсаторе. В противном случае без нее не обойтись. Ваш пример обработал обычным образом как для случая равномерной освещенности сканов.
 
1. Кромсание в СканКромсаторе. Enhance image=off. На выходе gray.
 
2.  Обработка.
Скрипт:
1.1. Адаптивное размытие. Количество=25.
Обычно в диапазоне 20-40. Смотреть в первую очередь тонкие и поэтому бледные линии и перемычки в буквах. Если они есть и надо их сохранить - меньшие значения. Надо сильнее размыть фон - большие значения. Назначение - позволяет уменьшить количество мусора от фона.
1.2. Ресемплинг. Увеличение разрешения 300 дпи -> 600 дпи. Сглаживание и сохранение пропорций включено. Неансов нет.
1.3. Тоновая коррекция. Обрезка входных значений=95; 220.
Обычно гистограмма выглядит как небольшой подъемчик, широкое плато, подъем на максимум, небольшое плато и спад. Точка черного устанавливается немного правее подъемчика, точка белого на большом подъеме. Текст должен быть не очень жирным или тощим; не слишком темным или бледным (знание придет с опытом). Смотреть бледные фрагменты, чтобы не потерять или сделать слишком бледными и не пережирнить текст. Назначение - по возможности убрать фон (сделать его белым) а текст достаточно черным.
1.4. Сглаживание. Процент=100 (всегда). Мягкое сглаживание, особенностей не замечал. Назначение - сгладить контуры букв перед Контурной резкостью.
1.5. Контурная резкость. Радиус=3 (всегда, соответствует эмпирическому правилу радиус=дпи/200). Порог=0 (всегда). Процент=300.
Обработка делает контуры резкими с перехлестом, т.е. прилигающие к контуру светлые участки становятся светлее, темные - темнее. При этом подчеркиваются неровности. Обычно процент в диапазоне 150-350. Большие значения, чтобы вытянуть бледные перемычки (плюс сохранить промежутки между засечками), меньшие - когда последних нет и можно избежать появления неровностей. Побочный эффект - вытягивается мусор.
1.6. Сглаживание. Процент=100 (всегда), выполнить два раза. Нюансов нет (но надо следить, чтобы узкие перемычки не затянулись). Обычно обработка выполняется один или два раза подряд. Назначение - сгладить буквы перед бинаризацией.
1.7. Бинаризация. Метод преобразования=штриховой рисунок, порог=170 (можно было бы сделать и побольше, но появляются следы от тени, возможно потребуется чистить фон). Порог подбирается визуально по вкусу.
 
Далее, скрипт проверяется на нескольких сканах, загрузить скан в Корел и запустить выполнение скрипта кнопкой в окне докера записи. При необходимости тут же отредактировать не очень подходящую обработку.
 
3. Чистка мусора в СканКромсаторе.
 
ЗЫ: Запас прочности у обработок имеется. Поэтому, если сканы (и страницы в оригинале) визуально в отношении тона различаются не сильно, то все будет нормально.
Если имеется заметное различие между сканами по тону, то я делаю предварительную обработку: адаптивное размытие и автокоррекцию. Из основной обработки адаптивное размытие естественно убирается.
Предварительная обработка может понадобится и в случае других проблем со сканами (наличие просвета).
 
Найдете лучший вариант обработок, не забудьте отписать .

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 08:30 13-09-2007
vladal

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравствуйте, спасибо bolega за программу! Как начинающий хотел бы спросить по поводу резаков, доки и материалы monday2000 прочитал. Как я из них понял, синие резаки отделяют полезную от всякого мусора, красный резак показывает точную границу текста. Видимо я неправильно понимаю, что если стоят все синие резаки, то вся область внутри них должна быть включена в результирующий файл. Например, если есть страница с текстом только в начале (окончание главы) Если только ее выделить только синими резаками (то есть нижний резак выше половины страницы) или если нижний резак поставить вниз (то есть растянуть область внутри синих резаков, на примерный размер страницы без полей) то в результирующем файле область с текстом оказывается в конце страницы. Я бы понял, если такое происходило только в первом случае (кромсатор по своему алгоритму располагает эту область). А почему так получается во втором случае? С этим можно бороться только выставлением красного верхнего резака? Или я чего-то в них недопонял? Спасибо.

Всего записей: 69 | Зарегистр. 26-04-2004 | Отправлено: 14:46 13-09-2007
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vladal
Синие резаки действительно только обрезают мусор (как расположен текст между резаками, роли уже не играет). Затем кромсатор определяет контур текста и располагает его в соответствии с заданным выравниванием (!). Если для страницы задано выравнивать по нижнему краю, то невысокий абзац окажется внизу, т.е. в конце страницы. Видимо, так у Вас и происходит. Задайте выравнивание по верху v.align = T (top).
Бывает, что на странице имеется строка текста (или номер страницы из одной цифры), которую кромсатор не включает в контур текста, т.к. не может однозначно решить, текст это или мусор (тень к примеру). Точнее, он решает, но нередко не в пользу текста В результате после кромсания такой выступающий текст оказывается срезанным. Чтобы этого избежать, нужно отключить для данного резака под-опцию automargin, резак примет малиновый цвет и Вы должны выставить его максимально близко к краю этого выступающего обрезающегося текста. В этом случае малиновый резак трактуется кромсатором как заданный вручную контур текста (левый, правый, и т.п. в зависимости от резака) и обрезать текст в этом месте уже не будет.

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 15:23 13-09-2007
vladal

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega  
Большое спасибо за ответ! А подскажите, пожалуйста, как кромсатор определяет контур текста в случае синих резаков (малиновым я его определяю сам).  
Не совсем понятна фраза
Цитата:
как расположен текст между резаками, роли уже не играет
Что вне резаков (сейчас и далее я имею ввиду только синие), то точно отрезается, а что внутри все равно может быть отрезано? Так как в указанной Вами ситуации с одной цифрой можно было бы просто передвинуть синий резак, чтобы цифра попала внутрь области. Вы же пишете, что  

Цитата:
нужно отключить для данного резака под-опцию automargin
Получается, что если я ее не отключу, а просто подвину резак, то этого будет не достаточно, все равно эта одна цифра внутри области может быть образана. Если можно, поподробнее объясните, что происходят при обработке области ограниченной синими резаками. Спасибо.
 

Всего записей: 69 | Зарегистр. 26-04-2004 | Отправлено: 17:07 13-09-2007 | Исправлено: vladal, 17:11 13-09-2007
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
а что внутри все равно может быть отрезано?  

Об этом я и написал. Может. Если это одинокий символ или единичная строка. Вы спросите: если резаками мы отрезали весь мусор, то пусть кромсатор учитывает все, что внутри, за текст и тогда срезания одиноких символов можно избежать. К сожалению, скан есть скан. Часто отрезать мусор полностью не удастся, т.е. белых промежутков на скане не бывает никогда, поэтому sk все-равно проверяет его даже после отрезания реаками и контур текста (и иллюстраций) ищется всегда с учетом того, что мусор может быть (fuzzy-поиск). Однако если вы уверены, что мусора нет, то можете увеличить чувствительность определения контура изменением опций на закладке options2, в этом случае малиновые резаки можно и не использовать.
 

Цитата:
как кромсатор определяет контур текста в случае синих резаков  

Подробностей алгоритмов я никогда не разглашаю
 

Цитата:
Не совсем понятна фраза  

Имеется ввиду, что расстояние от резаков до текста уже не играют никакой роли, контур будет искаться внутри всей оставшейся области.
Выравнивание контуров, о котором я говорил, производится на заключительной фазе кромсания, и выполняется относительно габаритов книги (подсчитанных кромсаторм самостоятельно или заданных пользователем), а не относительно изначальных резаков.

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 17:32 13-09-2007
vladal

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Спасибо за подробные объяснения Последние уточнения. Алгоритм получается следующий: Запускаю draft kromsate. Проверяю резаки на каждой странице, если часть текста не попала в выделенную область, то сам указываю правильную границу малиновым резаком. Если же весь текст попал в выделенную область и там нет паразитного мусора у границ, оставляю как есть, если есть мусор, обрубаю его синим резаком. Такой вопрос: если кромсатор сам поставил малиновый резак, то его нужно вплотную подвести к границе текста, менять на синий (ставить соответствующий automargin) не надо. Еще вопрос: Резаки на исправление перекоса текста никак не влияют, их можно повернуть только для того, чтобы максимально избавиться от грязи. Я все правильно понял?

Всего записей: 69 | Зарегистр. 26-04-2004 | Отправлено: 11:31 14-09-2007
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vladal

Цитата:
оставляю как есть, если есть мусор, обрубаю его синим резаком

Все правильно. Но за мелким мусором особо охотиться не стоит, т.к. он будет убираться despeckl-ом при обработке.

Цитата:
Такой вопрос: если кромсатор сам поставил малиновый резак, то его нужно вплотную подвести к границе текста, менять на синий (ставить соответствующий automargin) не надо

Если он поставил малиновый, значит, при анализе он сам "почувствовал", что если этого не сделать, при кромсании возможно срезание. В большинстве случаев ничего править не надо, оставить как есть, но если на самом деле контур четкий (в смысле не сильно разреженный), то малиновость можно и убрать. Например, если имеется текст и далеко от него столбик цифр (напр, оглавление со столбиком из номеров страниц), то чаще всего кромсатор взведет малиновый резак, хотя в принципе он тут и не нужен. Это говорит о том, что кромсатор все-таки распознал столбик как текст, но уверен не на 100% (а может это все-таки ошметки тени от сгиба), и ставя малиновый резак (а также помечая файл жирным в списке файлов), привлекает тем самым ваше внимание.
 

Цитата:
Я все правильно понял?

Да
 
У monday в описании много путаницы и зачастую неверных сведений. Например, что опции чувсвительности из закладки options2 влияют на draft (это неверно, draft использует исключительно свои опции), что draft рассчитывает размеры книги и подставляет их в поля (тоже неверно, он их рассчитывает грубо, и поэтому в опции не передает, т.к. draft и обработка - это раздельные процессы, не зависящие друг от друга. Даже алгоритмы там абсолютно разные, задача drafta - отделить полезное содержимое от мусора, обнаружить тени, крупную грязь, границу раздела разворота, разбить страницу на абзацы и строки, определить размеры шрифтов и т.п. Обработчику же все это не нужно делать, т.к. предполагается, что все (или почти все) ненужное уже отсечено резаками.

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 12:21 14-09-2007
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Обрабатываю журнал, на каждой странице которого много серых и цветных picture-зон.
В окне Result view очень не хватает возможности сделать merge сразу для всех picture-зон этой страницы, приходится на каждой странице выходить в основное окно, затем возвращаться назад.
И еще. Здесь основную подчистку делаю в режиме Auto-magic clear, иногда переходя в режим Auto-clear и обратно.
Хорошо бы здесь этот переход делать по двойному щелчку мыши, как в случае черно-белых сканов переход между режимами Auto-clear и Auto-despecle.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 20:25 14-09-2007 | Исправлено: shch_vg, 22:50 14-09-2007
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Забавно западники на гигапедии интерпретируют

Цитата:
     
Hi
Does anyone know what is the password in english for the rar file for the new scankromsator version 5.81 NY. In russian it is something like "xpioxpio" but when I try to extract from the rar file, it does not work.


Цитата:
     
 Pw: "hryuhryu" in the English layout

Всего записей: 2873 | Зарегистр. 22-03-2005 | Отправлено: 22:44 14-09-2007
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот такую свинью уважемемый  bolega подложил нашим зарубежным коллегам

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 22:53 14-09-2007
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кстати, смех смехом, а мне вчера предложили пост модератора на закрытом международном форуме, родственном этой гигапедии и посвященном книгам и всему, что с ними связано. Попросили курировать ветку по ripping/processing Об СК они еще не знают. Вопрос: можно ли им рассказывать об СК, если да, то какую версию рекомендовать? Просто, помню, было уже здесь, по-моему, обсуждение по этому поводу. Кто-то был против распространения СК за пределы русскоязычного сообщества
Топик там можно сделать закрытым...

----------
пропадет-растает

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 23:11 14-09-2007 | Исправлено: ghosty, 23:12 14-09-2007
juvaforza

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT

 
Добавлено:
ghosty
Не думаю, что не знают. Если у них собирется сильное сообщество, то они сами распространят и освоют СК. Интерфейс же на английском. Вопрос только в том, кто начнет об этом рассказыть и в благословлении bolega этого дела.

Всего записей: 2895 | Зарегистр. 26-11-2005 | Отправлено: 09:54 15-09-2007
vladimirzaytsev

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
На сайте http://bolega.hotmail.ru/
лежит версия 5.81 NY но в виде rar архива с паролем
Никто не подскажет какой пароль
А то хотелось попробовать новую версию

Всего записей: 50 | Зарегистр. 28-03-2007 | Отправлено: 12:17 15-09-2007
vitaly1



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vladimirzaytsev
См. 4 поста выше.

----------
Топик по украинскому языку

Всего записей: 5415 | Зарегистр. 28-08-2004 | Отправлено: 13:13 15-09-2007
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
Если мне не изменяет память, то в предыдущих версиях был инструмент "magic wand". Сейчас, работая с зонами, я его не нашел, а ведь было бы очень удобно - если контур изображения без разрывов и достаточно темный, то фон можно было бы почистить одним кликом...

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 14:15 16-09-2007
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
В окне Result view очень не хватает возможности сделать merge сразу для всех picture-зон этой страницы, приходится на каждой странице выходить в основное окно, затем возвращаться назад

А почему Вы не используете команду в осн. окне, которая объединит зоны сразу для всех файлов?
 

Цитата:
Сейчас, работая с зонами, я его не нашел

Клик мышки при нажатых Ctrl+Shift

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 09:51 17-09-2007
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор (Часть 2)
Widok (30-03-2009 18:08): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru