Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор (Часть 2)

Модерирует : gyra, Maz

Widok (30-03-2009 18:08): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator: Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п. (есть FAQ). Автор: bolega. http://bolega.hotmail.ru/
 
Начало обсуждения - здесь.
 
Текущая версия: ScanKromsator v5.92 (2 МБ)
Предыдущая версия: ScanKromsator v5.91 full (3,26 МБ) зеркало
 
Старые версии: Подробнее...
Изменения в новой версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)

 
Самая краткая инструкция по работе с СК (включает "сборку" СК) от ghosty
 
ScanAndShare - инструкция в картинках от VadimirTT, + начальные установки SK.Использование ScanKromsator’а v5.91 от Melirius
 
Вопросы и ответы по работе со СканКромсатором:
http://abab.front.ru/QandA_SK.ZIP (80 КБ, от 20.06.06)
 
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ) и в HTM и DOC (537 КБ)
 
Пособие по Кромсатору от monday2000  
(Составлено на базе "Вопросов и ответов" + Хелп v1.0).  См. подробности. Обновлено 30.10.07

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 15:15 17-08-2007 | Исправлено: ghosty, 15:09 25-12-2008
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty

Цитата:
Тогда после обработки получаем следующее в режиме VR:  
мы видим необрезанную страницу полностью, на ней видим мусор, оставшийся за резаками (его можно дать серым, чтобы глаза особо не мозолил )

 
Так я это и предлагал ранее
 

Цитата:
Alexx S  
 
Цитата:При обработке без финализации не вычищать области за резаками, а маскировать их  
 
 
В при любом режиме перед обработкой идет обрезка по резакам! (именно по резакам, а не по контуру) Это аксиома, идеология программы (отрезать мусор и тени). Иначе зачем тогда они нужны?? Представьте, что исходный файл - разворот, если ничего не отрезать, а маскировать - sk так и будет его "таскать" по всем алгоритмам и окнам (целиком разворотом) ??? И какие объемы памяти для этого нужны, страшно подумать (не забывайте о 300dpi gray->600dpi gray)  
 

 
Собственно, после этого и зашла речь о СТ и упрощенной отрисовке
 
Добавлено:
bolega, такой вопрос - а сложно будет показывать изображение после обработки поверх оригинального скана, повернутого и растянутого до нужного размера? Качество изображения совершенно не важно, важно видеть что ничего лишнего не отрезано.

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 14:45 26-12-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
Идея понятна. Принцип хороший.
 
1.

Цитата:
мы видим необрезанную страницу полностью

Что мы увидим в случае разворота?
 
2. если не обрезать разворот, то при апсэмплинге до 600dpi его размер достигнет 200-250 мегабайт. Учитывая фильтры, умножим на 2-3. Система просто упадет... При этом никакой речи о параллельности тоже не может быть. Каждому потоку потребуется по 600-700 метров как минимум.
 

Цитата:
обработка будет произведена уже только в выделенной рамке

Я себе это плохо представляю. Проблема еще и в том, что после deskew уже не будет точного соответствия между координатой на выходе и координатой на входе. Т.е. нет формулы, по которой, зная ко-ту на выходе, можно посчитать ко-ту на входе. Это из-за того, что мои алгоритмы поворота не описываются формулами (типа x2=x1*cos+y1*sin). Они, грубо говоря, в некотором роде итерационные.
 
Идея неплохая. Вы в точности описали принцип работы ST
 

Всего записей: 4007 | Зарегистр. 09-09-2002 | Отправлено: 15:11 26-12-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alexx S

Цитата:
Так я это и предлагал ранее
Ага, получилось, что я не въехал Но у меня в любом случае несколько иной вариант - Вы предлагаете "отрезанные" части скана вообще не обрабатывать (оставив оригинальный скан в виде отдельного слоя), а я предлагаю всю обработку производить только в пределах резаков, а то, что за резаками - только бинаризовать и ресемплить...
Видимо, так?

Всего записей: 6792 | Зарегистр. 21-09-2002 | Отправлено: 15:16 26-12-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alexx S

Цитата:
bolega, такой вопрос - а сложно будет показывать изображение после обработки поверх оригинального скана, повернутого и растянутого до нужного размера? Качество изображения совершенно не важно, важно видеть что ничего лишнего не отрезано.

Да уж, не просто...  
И не забывайте одну вещь. Многие усовершенствования только кажутся что облегчат жизнь, а на поверку 99% пользователей они не устраивают. Вспомните идею с подсветкой спеклов и "аферу" с их миганием На практике оказались совсем бесполезными...

Всего записей: 4007 | Зарегистр. 09-09-2002 | Отправлено: 15:16 26-12-2008
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Ага, получилось, что я не въехал  Но у меня в любом случае несколько иной вариант - Вы предлагаете "отрезанные" части скана вообще не обрабатывать (оставив оригинальный скан в виде отдельного слоя), а я предлагаю всю обработку производить только в пределах резаков, а то, что за резаками - только бинаризовать и ресемплить...  
Видимо, так?

 
Нет, не так. Я предлагал  обрабатывать все, это было отвергнуто, теперь пытаюсь найти альтернативный вариант.
 

Цитата:
спомните идею с подсветкой спеклов и "аферу" с их миганием  На практике оказались совсем бесполезными...

Мигание - да, бесполезно, зато подстветкой текста пользуюсь постоянно и очень доволен
 
В любом случае, хотелось бы перед Вами извиниться, самого жутко бесит подобное поведение.  
Изначально я просил возможность менять разаеры полей и всего листа в любое время после обработки. Это сделано или будет сделано. Огромное спасибо.
Проскочив это я тут же начал говорить о совершенно другом - предварительный просмотр и корректировка драфта.

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 15:21 26-12-2008 | Исправлено: Alexx S, 15:22 26-12-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
И еще одно. Чтобы мы ни придумали, но смысл проверки от этого не изменится: все равно в мозгу нужно будет соотносить исходный и обработанный скан (в этом ведь принцип проверки, иначе как еще увидишь, что что-то лишнее, или наоборот, чего-то не хватает). Я хочу сказать, что Ваши предложения все-равно потребуют проведения нудного постраничного сравнения, поменяется лишь форма отображения, что в принципе ничего не меняет и вряд ли снизит усталость от этой процедуры.
Так есть ли смысл все усложнять и замедлять, если результат будет такой же?
Я предложил оптимальный на мой взгляд вариант: кто хочет быть на 100% уверен в правильности, тот все равно вынужден будет проверять все страницы. Кому лень, пусть проверит только самые первые и самые последние файлы в отсортированном списке VR, т.е. те, где вероятность ошибки максимальна. И не отвлекаясь на те, где ошибка практически исключена

Всего записей: 4007 | Зарегистр. 09-09-2002 | Отправлено: 15:27 26-12-2008
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мне кажется, надо сначала определиться - нужно ли контролировать драфт в окне VR.
Мне кажется, что нужно. Если нет возможности таскать по всем изображениям большой скан, то имеет смысл сделать ему "спутника" - со сниженным дпи.  
Тогда в окне VR будет два режима - упрощенный, в коротом можно будет корректировать границы области текста и, одновременно с этим, выполнять простую чистку и нормальный, аналогичный теперешнему.

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 15:28 26-12-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Что мы увидим в случае разворота?

Разворот мы все-таки разрезаем на половинки. Поэтому видим те же отдельные страницы, обрезанные до Inner Cutters. Так будет нормально?
 

Цитата:
Они, грубо говоря, в некотором роде итерационные.
Да, но разве нельзя померить угол до Deskew? Особой точности тут не нужно - можно просто накинуть немного к координатам прямоугольника с учетом поворота.
 

Цитата:
Идея неплохая. Вы в точности описали принцип работы ST
Давно его не видел, но там, по-моему, тоже на сырых сканах устанавливаются границы...
В любом случае, я был за двухэтапный метод обработки (поддерживая Alexx S, который подбросил идею с наложением полей постфактум) еще в то время, когда СТ не было даже в проекте

Всего записей: 6792 | Зарегистр. 21-09-2002 | Отправлено: 15:32 26-12-2008
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Так есть ли смысл все усложнять и замедлять, если результат будет такой же?  
Я предложил оптимальный на мой взгляд вариант: кто хочет быть на 100% уверен в правильности, тот все равно вынужден будет проверять все страницы. Кому лень, пусть проверит только самые первые и самые последние файлы в отсортированном списке VR, т.е. те, где вероятность ошибки максимальна. И не отвлекаясь на те, где ошибка практически исключена

 
Меня лично полностью устроил бы режим показа миниатюр оригинальных сканов с резаками и настраиваемым размером, наподобие того, что я на прошлой странице выложил. И наглядно, и в разы сокращается время просмотра всех страниц.
 
А последние предложения Вы сами спровоцировали - как было бы удобно, потянув за рамочку желтого прямоугольника, увидеть обрезанный номер страницы....

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 15:34 26-12-2008 | Исправлено: Alexx S, 15:38 26-12-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Кому лень, пусть проверит только самые первые и самые последние файлы в отсортированном списке VR, т.е. те, где вероятность ошибки максимальна. И не отвлекаясь на те, где ошибка практически исключена
Могу лишь предсказать, что в тех случаях, когда разброс в размерах блока текста на страницах очень велик (много рисунков и заглавий, таблиц больших и маленьких - все это на отдельных страницах), этот метод с сортировкой списка совсем не будет работать...

Всего записей: 6792 | Зарегистр. 21-09-2002 | Отправлено: 15:38 26-12-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alexx S

Цитата:
самого жутко бесит подобное поведение.

Ни в коей мере! Наоборот, я все внимательно изучаю и мотаю на ус.  
Вообще-то, друзья называют меня мастером отмазок

Всего записей: 4007 | Зарегистр. 09-09-2002 | Отправлено: 15:40 26-12-2008
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Разворот мы все-таки разрезаем на половинки. Поэтому видим те же отдельные страницы, обрезанные до Inner Cutters. Так будет нормально?

 
В принципе, согласен. Не совсем корректно, но терпимо. Да и редко Кромсатор так ошибается, чтобы разворот неправильно определить, можно небольшой перехлест сделать, на всякий случай. В любом случае, с половиной разворота уже можно работать.

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 15:41 26-12-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Могу лишь предсказать, что в тех случаях, когда разброс в размерах блока текста на страницах очень велик (много рисунков и заглавий, таблиц больших и маленьких - все это на отдельных страницах), этот метод с сортировкой списка совсем не будет работать...

Да, Вы правы. Поэтому Ваши с Alexx S предложения я буду обдумывать, с поправкой конечно на быстродействие и увязки с ядром и структурой SK

Всего записей: 4007 | Зарегистр. 09-09-2002 | Отправлено: 15:43 26-12-2008
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Ни в коей мере! Наоборот, я все внимательно изучаю и мотаю на ус.  
Вообще-то, друзья называют меня мастером отмазок

 
Я имел в виду то, что правка полей, ради котрой все затевалось, не имеет никакого отношения к редактированию результатов драфта в окне VR , о котором и не говорили никогда.

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 15:44 26-12-2008 | Исправлено: Alexx S, 15:45 26-12-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alexx S

Цитата:
А последние предложения Вы сами спровоцировали - как было бы удобно, потянув за рамочку желтого прямоугольника, увидеть обрезанный номер страницы....
Подождите, а зачем мне как пользователю тянуть что-то куда-то, если я там ничего не вижу (а имею возожность увидеть, только потянув)? Т.е. зачем Вы предлагаете именно маскировать то, что отрезано? (я предлагаю серым его давать).
 
Добавлено:

Цитата:
Я имел в виду то, что правка полей, ради котрой все затевалось, не имеет никакого отношения к редактированию результатов драфта в окне VR , о котором и не говорили никогда.
Да, Alexx S хотел сказать, что изначально он все-таки предлагал (я помню) возможность многократной правки полей постфактум - т.е. после финализации он хотел бы иметь возможность повторно изменять размеры полей

Всего записей: 6792 | Зарегистр. 21-09-2002 | Отправлено: 15:52 26-12-2008 | Исправлено: ghosty, 15:56 26-12-2008
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Т.е. зачем Вы предлагаете именно маскировать то, что отрезано? (я предлагаю серым его давать).

 
Такая возможность предполагает два режима: чистка мусора и, условно, проверка драфта.
 
Для чистки мусора серый текст, который будет отсутствовать на реальном изображении, только  вреден. Т.е нужен дополнительный режим.
 
Против показа отрезанного я ничего не имею. да и сам это предлагал ранее.
 

Цитата:
Что это даст:  
-появиться возможность реализовать скрытие обрезанного текста и корректировку положения резаков. Да и обрезанный текст можно будет не полнстью скрывать, а сделать серым  

 

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 15:58 26-12-2008 | Исправлено: Alexx S, 16:04 26-12-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alexx S

Цитата:
Меня лично полностью устроил бы режим показа миниатюр оригинальных сканов с резаками и настраиваемым размером, наподобие того, что я на прошлой странице выложил. И наглядно, и в разы сокращается время просмотра всех страниц.
Тогда получилось бы, что опять-таки имеем удвоение контура (резаки и граница блока текста), а это скверно в плане юзабилити

Всего записей: 6792 | Зарегистр. 21-09-2002 | Отправлено: 15:59 26-12-2008
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Тогда получилось бы, что опять-таки имеем удвоение контура (резаки и граница блока текста), а это скверно в плане юзабилити

 
Я имел в виду что-то наподобие этого:
 

 

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 16:06 26-12-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alexx S

Цитата:
Я имел в виду что-то наподобие этого:
И я о том же - какой смысл проверять контур на thumbnail'ах, если отсутствует возможность его изменять - в силу их невысокого разрешения и неточности, связанной с этим?
Значит, придется этот контур показывать еще и на полноразмерных сканах (сырых или конечных), и это, ИМХО, неоправданное усложнение.
 
Добавлено:

Цитата:
Для чистки мусора серый текст, который будет отсутствовать на реальном изображении, только  вреден. Т.е нужен дополнительный режим.
Возможно, но если пользователь включит режим невидимости для мусора за резаками раньше времени, то он рискует не заметить ошибок ДК (к примеру, забыв его включить обратно). Поэтому, с одной стороны, можно было бы заставить пользователя просматривать полученные сканы в два прохода (блокировав перед финализацией возможность ручной обработки, как это сделано сейчас), а, с другой стороны, можно попробовать отображать мусор за резаками всегда - мне пока кажется, что при чистке он мешать не будет, особенно если будет дан бледно-серым.

----------
пропадет-растает

Всего записей: 6792 | Зарегистр. 21-09-2002 | Отправлено: 16:22 26-12-2008 | Исправлено: ghosty, 16:23 26-12-2008
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty

Цитата:
И я о том же - какой смысл проверять контур на thumbnail'ах, если отсутствует возможность его изменять - в силу их невысокого разрешения и неточности, связанной с этим?

Смысл в том, что алгоритмы драфта в очередной раз улучшены и количество ошибок невелико. Какой смысл при этом отсматривать по одной 500-600стр? Сколько людей, не найдя ошибок на первой сотне страниц, бросят это дело?  
А ошибки таким образом отлично находятся - проверено

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 17:17 26-12-2008 | Исправлено: Alexx S, 17:18 26-12-2008
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор (Часть 2)
Widok (30-03-2009 18:08): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru

Рейтинг.ru