Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор (Часть 2)

Модерирует : gyra, Maz

Widok (30-03-2009 18:08): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator: Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п. (есть FAQ). Автор: bolega. http://bolega.hotmail.ru/
 
Начало обсуждения - здесь.
 
Текущая версия: ScanKromsator v5.92 (2 МБ)
Предыдущая версия: ScanKromsator v5.91 full (3,26 МБ) зеркало
 
Старые версии: Подробнее...
Изменения в новой версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)

 
Самая краткая инструкция по работе с СК (включает "сборку" СК) от ghosty
 
ScanAndShare - инструкция в картинках от VadimirTT, + начальные установки SK.Использование ScanKromsator’а v5.91 от Melirius
 
Вопросы и ответы по работе со СканКромсатором:
http://abab.front.ru/QandA_SK.ZIP (80 КБ, от 20.06.06)
 
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ) и в HTM и DOC (537 КБ)
 
Пособие по Кромсатору от monday2000  
(Составлено на базе "Вопросов и ответов" + Хелп v1.0).  См. подробности. Обновлено 30.10.07

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 15:15 17-08-2007 | Исправлено: ghosty, 15:09 25-12-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Olive77

Цитата:
а можно ли это также в Editore (Light Edition) использовать?
Не знаю, никогда не пробовал использовать профили в едиторе.
 
Давайте все же оффтоп плавно перенесить в соседнюю ветку

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 13:42 07-08-2008 | Исправлено: ghosty, 13:43 07-08-2008
Diode2003



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
All
 

Цитата:
В общем, еще раз:  
В 95% случаев рекомендуется 300 Grey -> 600 BW  
Есть случаи, когда приходится делать 600 Grey -> 600 BW  
И есть случаи, когда вполне хватает 300 Grey -> 300 BW

 
Раз уж здесь небольшой офтоп прошел, то рискну спросить авторитетного мнения: в каком разрешении лучше сканировать (если нет никаких ограничивающих соображений, в т.ч. качество оригинала): 300 Grey ИЛИ 600 B&W?  
 
(Вопрос связан с тем, что на работе поставили копир с автоподачей, который умеет шустро сканировать в CCIT4 TIF. 600 дпи ч/б его не замедляет совсем, а серый режим он не знает - только полный цвет с jpeg компрессией.) Не вполне офтоп, т.к. это относится к обработке в СК (особенно на предмет deskew - ему вроде с серыми страницами полегче?). Ну, и само собой - к последующему перегону в djvu. Вопрос задан в предположении, что на выходе СК после всего кромсания и чистки файлы конвертируются в 600 B&W.  
 
ghosty
P.S. Инструкция отличная! Мне кажется, можно смело ставить в шапку.

Всего записей: 192 | Зарегистр. 14-03-2003 | Отправлено: 15:20 07-08-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Diode2003

Цитата:
300 Grey ИЛИ 600 B&W?
Однозначно 300 Grey лучше 600BW - проверено! До 90% всей обработки изображения производится в полутоновом режиме.  
Т.е. если брать СК, то в случае обработки BW-изображений он будет выполнять роль только кромсатора (с маленькой буквы ).
 
Какой бы пример привести... Ну вот представьте себе, что у Вас есть чертеж сложной детали в трех проекциях - представьте ее себе в ACADе. А потом Вы зачем-то берете, и делаете некое сечение просто от фонаря и это сечение сохраняете как чертеж. При этом Вы считаете, что человек, для которого этот чертеж предназначен, вполне способен по сечению восстановить всю деталь (возможно Вы преследуете цель "сжатия информации"). Иногда это действительно будет возможно, но чаще всего (особенно если деталь сложная) бОльшая часть информации будет утеряна.
То же самое и со сканированием в режиме BW. Ведь в этом случае либо Вы сами выставляете порог бинаризации - один для всей сканируемой книги (спрашивается, а как Вы могли его определить, если не видели сканов всех страниц), либо в особо продвинутых случаях он выставляется автоматически. Но в обоих случаях мы получаем все то же "сечение": часть элементов символов, которые были значительно бледнее остальных будут просто отфильтрованы, т.е. пропадут; а вот мусор, различные пятна которые по яркости отличались от основного текста, и которые в полутоновом режиме можно было бы запросто отфильтровать, наоборот станут черными.
Вот, надеюсь, доходчиво объяснил

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 15:58 07-08-2008
Diode2003



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
ЗдОрово, спасибо большое! Объяснение действительно доходчивое. Придется теперь думать есть ли какой-то толк от нового скоростного сканера на работе. Можно сканировать в цвете, а потом перегонять в серый, но помимо огромных размеров файлов - довольно ощутимы артефакты  
jpeg компрессии. Не доработали ребята в Xerox'e.

Всего записей: 192 | Зарегистр. 14-03-2003 | Отправлено: 16:19 07-08-2008 | Исправлено: Diode2003, 16:20 07-08-2008
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Diode2003

Цитата:
копир с автоподачей

это подразумевает, что книга разодранна, т.е. грязи у разворота не будет, так что, скорее всего, по моему, можно смело гнать в 600 ч/б, впрочем, эксперимент покажет, а так, как по мне, качество самих букв, примерно не зависит от пути к 600 (но я не  эстетствую как ghosty или Arcand), просто сканирование в сером позволяет избавляться от грязи автоматом.

Всего записей: 2871 | Зарегистр. 22-03-2005 | Отправлено: 17:12 07-08-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT
Я не эстетствую, а утверждаю на основании опыта, который у меня был. 5 томов энциклопедии были расшиты и скормлены именно такому сканеру в 600dpi BW. Получилась полная фигня, пришлось пересканировать в 300dpi Grey
И дело не в наличии/отсутствии тени возле корешка, а в пропадании элементов символов (перемычек) на одних страницах и проявлении большого кол-ва мусора на других...
 
Опять-таки все зависит от оригинала: если очень крупный шрифт на мелованной бумаге без переплета (в расшитом виде) - хоть в 300BW можно сканировать.
 
Добавлено:
Обновил "сборку", добавив еще один профиль - теперь для старых книг. От профиля по умолчанию он отличается тем, что увеличена сила коррекции освещенности (Ill.Corr.). Это связано с тем, что в старых книгах довольно много проблем, связанных с неравномерностью фона (мятая, покоробленная бумага, пятна и т.п.). Завышенный параметр компенсируется, с одной стороны, включенной автокоррекцией, а, с другой, - отключением стандартных фильтров Blur/Sharpen и включением более щадящих и аккуратных Gauss Blur/Enhance Contour.
 
В этом профиле уже 2 основных параметра, с которых можно начать настройку при работе со старой книгой:
1. Порог бинаризации (о котором уже говорилось);
2. Коррекция освещенности (Quality->Grey Enhance->Illumination). Очень хороший метод отделения текста от неравномерного фона. Но использовать его нужно осторожно. Начинать лучше с метода Normal. К примеру, метод Safe, несмотря на названия, позволяет сохранять больше мелких деталей символов, но может оказаться довольно "коварным" - если блок текста примыкает к краю страницы (часто случается на OpticBook), то часть текста близко от края может исчезнуть (т.н. "краевой эффект").
 
Профиль опробован мной на большом количестве старых книг. И не так давно bolega говорил, что для старых книг использует подобный набор опций, поэтому я спокоен
Не стоит забывать, однако, что старые книги требуют индивидуального подхода, и профиль - лишь общее "руководство к действию". Начнете с двух параметров, в конце концов, разберетесь со всеми
 
Собственно "сборка": http://rapidshare.com/files/135566411/Kromsator_ghosty.rar.html

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 17:45 07-08-2008 | Исправлено: ghosty, 17:46 07-08-2008
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ghosty
Два вопроса по Вашим сборкам:
1. Есть ли смысл каждый раз выкладывать полную сборку, изменив в ней несколько байтов(килобайтов)?
2. Нашел в первой сборке файл Zones.txt, а в нем такие слова "Загрузите задание _test_2.spt", и теперь думаю, как это сделать - где его взять?

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 21:29 07-08-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
1. Есть ли смысл каждый раз выкладывать полную сборку, изменив в ней несколько байтов(килобайтов)?
Да не так уж часто я буду что-либо в ней менять...

Цитата:
2. Нашел в первой сборке файл Zones.txt, а в нем такие слова "Загрузите задание _test_2.spt", и теперь думаю, как это сделать - где его взять?
Я тоже думаю, где взять Офсайт приказал долго жить...

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 22:47 07-08-2008
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
о5 25 или 300 vs 600
на том что у меня завалялось (из сырых сканов) провел эксперимент, в целом, получилось что 300 меньше 600 примерно в 2,5 раза, это без учета ОЦР, с текстовым слоем как раз и получается среднестатистическое отличие в 2 раза.
статистика тут  
Подробнее...

Всего записей: 2871 | Зарегистр. 22-03-2005 | Отправлено: 09:29 08-08-2008
kontiky

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT
У меня, кстати, на чисто текстовых сканах получаеться примерно похожая цифра.
Свои же текущие 600 дпишные djvu по 4Мб я думаю переделать ухудшив качество обложки и страниц с фотографиями - на этом думаю сэкономить минимум 500Кб на книжку.

Всего записей: 320 | Зарегистр. 14-09-2003 | Отправлено: 09:36 08-08-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kontiky

Цитата:
ухудшив качество

Делаете ведь и для себя тоже? Тогда это называется мазохизм, "пусть мне будет хуже", зато на 10 книгах выиграю аж 5 мегабайт. И ничего, что фотографии будут выглядеть как будто на них смотрит человек со зрением +5, забывший надеть очки
 
Добавлено:
Убедительная просьба, перенести обсуждения преимущества 300dpi в другой топик.
 
VadimirTT,monday2000
Убедили, пошел выкидывать из кромсатора из списка dpi значения 600 и twice

Всего записей: 4435 | Зарегистр. 09-09-2002 | Отправлено: 10:13 08-08-2008 | Исправлено: bolega, 10:19 08-08-2008
VovIK



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kontiky

Цитата:
думаю сэкономить минимум 500Кб на книжку
и не ломает Вас переделывать книгу из-за каких-то мизерных 500 Кб
 
 
это уже даже не смешно, а грусно

----------
"Влада боїться свободи в серцях набагато більше, ніж голодного бунту. Бо голодного можна купити, а вільного — тільки вбити". (Любомир Гузар)

Всего записей: 7149 | Зарегистр. 31-03-2004 | Отправлено: 10:40 08-08-2008
kontiky

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Делаете ведь и для себя тоже? Тогда это называется мазохизм, "пусть мне будет хуже", зато на 10 книгах выиграю аж 5 мегабайт.

Речь не идет о том, что вы имеете ввиду. Я говорю не о занижении качества изображния, а об усиление степени сжатия, до появления видимых артефактов
VovIK

Цитата:
и не ломает Вас переделывать книгу из-за каких-то мизерных 500 Кб  

"А десять старушек - уже рубль"
Нет, не ломает, т.к. у меня сборка книг сделана скриптом - достаточно только поменять одну цифру и запустить скрипт - вот и вся работа. Так что не грустите

Всего записей: 320 | Зарегистр. 14-09-2003 | Отправлено: 11:38 08-08-2008 | Исправлено: kontiky, 11:44 08-08-2008
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
У нас получается разговор слепого с глухим или наоборот Выбирайте, что Вам ближе .

Цитата:
если обрабатывать книги по ScanAndShare - или же по СorelScan - то что лучше?
Это зависит, в чьих руках эти инструменты окажутся

Цитата:
ScanAndShare и СorelScan - это взаимоисключающие методики в плане улучшения grey-сканов
ИМХО это две близкие по духу методики. Это как два стиля плавания. Плывете тем, который вы освоили лучше или вам удобнее.

Цитата:
Есть ли возможность делать в СК 5.91 такие же обработки по улучшению grey-сканов, о которых говорится в СorelScan? Или же sas-апсемплинг - потолок того, что можно выжать из СК 5.91 в плане улучшения grey-сканов  
Вы словно не читаете мои посты. Есть, Blur+Sharpen. Это или подобное осуществляет сглаживание в СК. Повторюсь, мы же не задаемся вопросом какой стиль плавания лучше, поэтому не спрашивайте, что лучше. Нюанс, СК - специализированная программа по кромсанию и обработке сканов. Корел - графический редактор. Поэтому, в Корел нет специфицеских функций по кромсанию сканов, СК проигрывает Корелу в плане широты спектра фильтров и гибкости в их применения.

Цитата:
Просто для удобства - чтобы не повторять каждый раз фразу: "тот апсемплинг, который делается посредством sk - с 300 dpi grey до 600 dpi grey с одновременным применением (сканкромсаторных) Blur + Sharpen  
Вы же не считаете, что прописанные в скриптах Корела обработки выполняются одновременно. С чего Вы взяли, что в СК они выполняются все сразу, т.е. являются по сути неким суперфильтром. Совершенно уверен, что в СК ресемплинг Blur и Sharpen выполняются последовательно. Поэтому никакого смысла в термине sas-апсемплинг нет. Конечно, повышающий ресемплинг в разных прогах несколько отличаются по причине различных алгоритмов интерполяции - добавляемым пикселям надо присвоить какие-то значения тона/цвета. Вопрос, в какой проге делается ресемплинг, ИМХО практического значения для обработки сканов не имеет.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 11:48 08-08-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT

Цитата:
раз и получается среднестатистическое отличие в 2 раза.  

Что и требовалось доказать.
 
Попробуйте (если есть возможность) ещё методику CorelScan - на тех же самых сканах - и сравните с sas-апсемплингом. Это очень ИМХО интересно.
 
Добавлено:
Arcand

Цитата:
Совершенно уверен, что в СК ресемплинг Blur и Sharpen выполняются последовательно.

Да, это понятно.

Цитата:
Поэтому никакого смысла в термине sas-апсемплинг нет.

Термин нужен, чтобы подчеркнуть, что всё это делается именно в СК. И с точки зрения юзера эти обработки делаются одновременно - это просто игра слов тут получается.
 
В общем, надо бы постараться сравнить на одних и тех же сканах ScanAndShare и CorelScan - интересно, что же получится (сравнить бы качество и размер результирующих ЧБ DjVu-600).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 12:58 08-08-2008
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Цитата:
В общем, надо бы постараться сравнить на одних и тех же сканах ScanAndShare и CorelScan - интересно, что же получится (сравнить бы качество и размер результирующих ЧБ DjVu-600).
Как же Вы не заметили - ИМХО в этом топике и топике по сканированию постоянно идет негласное соревнование, кто кому утрет нос
Последняя схватка: хук слева и хук справа .
 
ЗЫ: В целом же
Цитата:
если обрабатывать книги по ScanAndShare - или же по СorelScan - то что лучше?  
Это зависит, в чьих руках эти инструменты окажутся  


Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 13:47 08-08-2008 | Исправлено: Arcand, 14:10 08-08-2008
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Прошу прошения у bolega, но хотел бы все же высказать свое мнение о двух вариантах обработки книги, т.к. основная обработка происходит именно в Сканкромсаторе.
После объективных результатов сравнения вариантов (размеры полученных книг) мое субъективное (основанное на зрительном восприятии) мнение, которого я придерживался ранее и буду придерживаться впредь такое:
для себя можно делать книгу в любом разрешении от 50 до 1200 dpi, но для выкладывания для всеобщего пользования вариант 600 dpi ОБЯЗАТЕЛЕН (за небольшими исключениями, которые указывались ранее в обсуждении, и в которых нет практического (субъективного) различия между 300 и 600 dpi кроме размера).
Если размер книги книги в 600 dpi сравнительно небольшого размера (для меня это до 3 мб), то этого достаточно. При бОльших размерах ЖЕЛАТЕЛЕН дополнительный вариант этой книги в 300 dpi (визуально худший), чтобы дать возможность желающему ознакомиться с книгой самому решить (скачивая оба или умозрительно), какой вариант его больше устроит.
 
P.S. Еще раз повторяю, что это мое личное субъективное мнение.
Дальнейшее мое обсуждение этого вопроса в этой теме исключено, готов его продолжить только через Личный Ящик.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 13:59 08-08-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
ИМХО в этом топике и топике по сканированию постоянно идет негласное соревнование, кто кому утрет нос

Лично я к сожалению уже стал слишком стар для соревнований (не в смысле возраста).
Поэтому участвовать в них перестал. Приму любой результат. Если конечно этот результат в пользу sk

Всего записей: 4435 | Зарегистр. 09-09-2002 | Отправлено: 14:42 08-08-2008 | Исправлено: bolega, 14:43 08-08-2008
kontiky

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
Последняя схватка: хук слева и хук справа

Ваш вариант как раз и делался в CorelScan? Т.е. практически, в умелых руках, что ScanAndShare и CorelScan - результат приблизительно одинаков?
Если так, то я двумя руками за sk only. Люблю, знаете ли, удобство и единообразие.
 
Добавлено:
bolega

Цитата:
Приму любой результат. Если конечно этот результат в пользу sk

Маэстро, мысленно я вам рукоплещу

Всего записей: 320 | Зарегистр. 14-09-2003 | Отправлено: 14:44 08-08-2008
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Цитата:
Поэтому участвовать в них перестал.
Жаль . Я отношусь к сравнению вариантов не как кто кого, а чтобы поразмыслить, что можно улучшить у себя. Хотя, пожалуй, я тоже залягу на печку, тепло и спокойно
 
kontiky
Цитата:
Если так, то я двумя руками за sk only.
Ну, ну... Никогда не говори никогда. В жизни пригодится и крестовая и шлицевая отвертка, рожковый и торцевой ключ и т.д. и т.п.
 
ЗЫ: Прогресс питает дух соревнования, а так стагнация. За сим умолкаю.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 14:58 08-08-2008 | Исправлено: Arcand, 15:27 08-08-2008
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор (Часть 2)
Widok (30-03-2009 18:08): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru