Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор (Часть 2)

Модерирует : gyra, Maz

Widok (30-03-2009 18:08): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator: Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п. (есть FAQ). Автор: bolega. http://bolega.hotmail.ru/
 
Начало обсуждения - здесь.
 
Текущая версия: ScanKromsator v5.92 (2 МБ)
Предыдущая версия: ScanKromsator v5.91 full (3,26 МБ) зеркало
 
Старые версии: Подробнее...
Изменения в новой версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)

 
Самая краткая инструкция по работе с СК (включает "сборку" СК) от ghosty
 
ScanAndShare - инструкция в картинках от VadimirTT, + начальные установки SK.Использование ScanKromsator’а v5.91 от Melirius
 
Вопросы и ответы по работе со СканКромсатором:
http://abab.front.ru/QandA_SK.ZIP (80 КБ, от 20.06.06)
 
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ) и в HTM и DOC (537 КБ)
 
Пособие по Кромсатору от monday2000  
(Составлено на базе "Вопросов и ответов" + Хелп v1.0).  См. подробности. Обновлено 30.10.07

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 15:15 17-08-2007 | Исправлено: ghosty, 15:09 25-12-2008
BooBoo



Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Не уверен, что русификация упростит работу с программой.
Поверьте оно не надо.

Всего записей: 61 | Зарегистр. 26-03-2006 | Отправлено: 22:07 20-12-2008
Poltava_PGS

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Но всеже хотелосьбы а хочеться оно извесно хуже чем болит!

Всего записей: 2 | Зарегистр. 20-12-2008 | Отправлено: 00:27 21-12-2008
MIHMIH007



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Poltava_PGS
ресторатор в руки и вперёд))))
Я начал переводить и даже русик выкладывал к старой версии.... но слилось много недогований))) никому тут русская версия не нужна....
А если честно то уже привыкаешь к английской..... так что лучше посетите все ссылки которые в шапке весят это будет для вас поучительнее и быстрее)))

Всего записей: 743 | Зарегистр. 05-12-2006 | Отправлено: 02:08 21-12-2008
vitaly1



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Если подвести мышку к иконкам в сабже, то во всплывающих окошках нередко написана подсказка и на русском.

----------
Топик по украинскому языку

Всего записей: 5415 | Зарегистр. 28-08-2004 | Отправлено: 10:32 21-12-2008
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Poltava_PGS
посмотрите инструкцию ScanAndShare там все на картинках показано

Всего записей: 2464 | Зарегистр. 22-03-2005 | Отправлено: 10:40 21-12-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Не пойму, баг это, или я что-то не так делаю.
1. Делаю DK c такими опциями (выделен первый файл в списке):
Kromsate = From current alternate
Pre-rotate = -90 | Odd |Save after rotate
 
Все кросает и поворачивает правильно.
 
2. Теперь выделяю второй файл в списке и вызываю DK, выставив такие опции:
Kromsate = From current alternate
Pre-rotate = 90 | Odd |Save after rotate
(все то же самое, но крутим в другую сторону)
 
Кромсает, но не поворачивает.
 
Что делать?

Всего записей: 6794 | Зарегистр. 21-09-2002 | Отправлено: 14:01 24-12-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
Я посмотрю.
А пока можете выделить все нужные через один (Edit->Select group->...)  и применить к ним поворот (Service->Rotate and save->selected)

Всего записей: 4078 | Зарегистр. 09-09-2002 | Отправлено: 16:23 24-12-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Видимо, это я перемудрил - дублировал опции: "From current alternate" и "Odd".
Наверно, можно либо удалить один из этих выпадающих списков, либо если задействован один из них, делать недоступным другой.

Всего записей: 6794 | Зарегистр. 21-09-2002 | Отправлено: 16:50 24-12-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сейчас разбираюсь с финализацией.
Пока самое неудобное - отсутствие возможности post-processing'a.
 
Вы пишете:

Цитата:
Более того, не выходя из окна VR, можно командой контекстного меню Book properties вызвать специальный диалог, в котором разрешается менять значения размеров книги, полей, а также способа выравнивания для текущего файла. Можно тут же просмотреть, как это будет выглядеть применительно к текущему отображаемому файлу, и если изменения устраивают, применить их.

Я не смог найти команду Book properties в контекстном меню VR.
 
В контекстном меню команды Select Book size и Rotate selection не могут быть выбраны. В то время как соответствующие им кнопки работают. Попробовал повернуть, но получилось, что блок текста вышел за пределы контура, а контур стал неизменяемым.
 
Добавлено:
Однако за двухпроходным режимом - будущее  
К примеру, намного удобнее удалить всякие мелкие пометки, примыкающие к блоку текста, путем передвижения границы контура на уже выровненном по горизонтали блоке, чем пытаться сделать то же самое на этапе выставления резаков - на невыровненном...
 
Добавлено:
Заметил намного больше ошибок Deskew по сравнению с 5.91. Сканы чистые без таблиц и рисунков (взяты отсюда).
Субтаск
 
Добавлено:
После того, как я сделал финализацию, нужно было переобработать одну страницу. Когда я ее решил финализовать в режиме VR, просто исчез контур, и ничего более не произошло...
 
Добавлено:
Снял галочку с первого файла, ответил, что да, исправить нумерацию. При этом обработанный ранее первый файл остался в папке "Out" с именем "0001.tif_".

Всего записей: 6794 | Зарегистр. 21-09-2002 | Отправлено: 19:07 24-12-2008 | Исправлено: ghosty, 20:02 24-12-2008
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Попробовал финализацию - функция обещает быть интересной, с ней работать стало удобнее.  
 
Пока, после первого знакомства, есть одно предложение.
 
При обработке без финализации не вычищать области за резаками, а маскировать их. Расширение области текста в VR открывает "отрезанные" номера страниц и прочее, одновременно с этим корректируется положение резаков. Очистка этих областей производится при финализации.
 
По моему мнению, такое поведение программы было бы более логично.

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 20:40 24-12-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty

Цитата:
Я не смог найти команду Book properties в контекстном меню VR

Правильно. Эта команда доступна только тогда, когда уже расчитаны размеры страниц. Сразу после обработки (при page width/height=auto) эти размеры еще не известны, поэтому и команда недоступна.
 

Цитата:
В то время как соответствующие им кнопки работают

Rotate selection не должен работать. Это я забыл заблокировать значит.
 

Цитата:
Когда я ее решил финализовать в режиме VR, просто исчез контур, и ничего более не произошло

Все правильно! Когда известны размеры книги, VR сразу же перключается в режим Book preview (кнопка с книгой вверху). Поэтому на экране Вы видите то, как будет выглядить страница, как будто ее уже финализировали! Это кажется, что только исчез контур, на самом деле меняется физически и сам выходной файл (добавляются поля).
 

Цитата:
Снял галочку с первого файла, ответил, что да, исправить нумерацию. При этом обработанный ранее первый файл остался в папке "Out" с именем "0001.tif_".

Этот вопрос не так давно обсуждался. Я объяснял, почему он остается.
 
Хочу также всем еще раз напомнить, что контур, который отображается - это не линия, по которой страница будет отрезаться! Сначала прибавятся поля, и только потом отрежется! Поэтому не стоит подгонять контур идеально под каждую бородавку на буквах. Плюс-минус десяток-другой пикселей (при 600dpi) абсолютно ни на что не влияет.
 
Alexx S

Цитата:
При обработке без финализации не вычищать области за резаками, а маскировать их

В при любом режиме перед обработкой идет обрезка по резакам! (именно по резакам, а не по контуру) Это аксиома, идеология программы (отрезать мусор и тени). Иначе зачем тогда они нужны?? Представьте, что исходный файл - разворот, если ничего не отрезать, а маскировать - sk так и будет его "таскать" по всем алгоритмам и окнам (целиком разворотом) ??? И какие объемы памяти для этого нужны, страшно подумать (не забывайте о 300dpi gray->600dpi gray)
 

Цитата:
По моему мнению, такое поведение программы было бы более логично

Тогда Вам прямая дорога к CT. Там так и сделано. С одним отличием (если я не ошибаюсь), при просмотре показываются не реальные файлы, а с уменьшенным до 150dpi разрешением, иначе было бы медленно и затратно по памяти. У такого подхода на мой взгляд есть один крупный недостаток - вы уже не видите, каков файл в реальности, и не можете достоверно визуально оценить его качество (точнее, вы оцениваете качество 150dpi-файла, что может значительно отличаться от оригинала)

Всего записей: 4078 | Зарегистр. 09-09-2002 | Отправлено: 09:02 25-12-2008
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Мне сложно что-либо возразить, не зная дальнейших планов по развитию этой функции. С другой стороны, при длительной работе над проектом зачастую глаз "замыливается", по себе знаю - начинаешь цепляться за устаревшее решение вместо того, чтобы полностью его откинуть (это не про кромсатор, а про мою конструкторскую работу). На данный момент лично для меня наиболее удобной была бы следующая последвательность действий:
1. Работа с макетом страницы.  
-расстановка резаков, проверка правильности их положениея, выравнивание блока на странице, определения размера полей.  
2. Подбор параметров бинаризаци.
3. Обработка и чистка мусора.
 
В этом случае, я, действительно, считаю нормальным снижение качества отображения страниц. Вплоть до последней версии правильность расстановки резаков мы вообще определяли по небольшой серой картинке в окре программы.  
 
Для того, чтобы мои доводы были более понятны приведу пример того, как я работал вчера.
Обрабатывалась книга с большим количеством таблиц, повернутых на 90град.
В результате, на всех таблицах резаки были расставлены неверно, кроме того, каждая 10я-20я страница имела отрезанные номера.  
Поскольку я, прежде, всего, хотел опробовать новый режим, то проверку правильности расстановки резаков в основном окне я не производил.  
В итоге, мне понравился режим отображения миниатюр в VR , но при обраружении неправильно обрезанных страниц мне приходилось выходить в основное окно, править расположение резаков и заново обрабатывать эти страницы по полному циклу. Более того, поскольку я не видел уже обрезанный текст, то обнаружить ошибку стало сложнее.
 
Таким образом, положение резаков, а заодно и выравнивание блока на странице, удобнее править в основном окне, а режим без финализации использовать исключительно для подбора размера полей, несмотря на то, что в VR это делать удобнее.
 
СТ я пока не смотрел, да и вряд ли в ближайшее время буду это делать.
 
Основные разногласия у нас с Вами (причем я не настаиваю на том, что я прав, поскольку опыта у меня на несколько порядков меньше) - в подходе к обработке книги. Я считаю, что анализ макета книги, отсечение мусора, поворот и т.п и бинаризация - это два отдельных этапа обработки, которые между собой практически не связаны.  С другой стороны, навязывать другим свои привычки я не собираюсь. Можно подумать, как совместить два разных подхода в СК. Например:
 
К пункту "Do not finalize" добавить пункт "Do not resample". Получится, фактически, аналог "Preview" на вкладке Quality. Качество отображения можно снизить и до 150дпи.  
Что это даст:
-появиться возможность реализовать скрытие обрезанного текста и корректировку положения резаков. Да и обрезанный текст можно будет не полнстью скрывать, а сделать серым
-обработка будет  гораздо более быстрой, самые ресурсоемкие алготирмы не выполняются.
-финализация, помимо окончательного добавления полей будет в себя включать и ресемлинг с бинаризацией.  
-можно будет добавить команду "Preview with resample",  для правки параметров бинаризации и визуальной оценки качества страницы не надо будет перезаписывать файл на диске.  
-при этом существующий метод не затрагивается, отличия только в том, что при финализации выполняется дополнительный набор команд.
-отсуствует основное существующее противоречие - для исправления положения резака требуется выполить полный цикл с чисткой мусора, поворотом, резапмлингом, бинаризацией и прочими алгоритмами.
 

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 10:25 25-12-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alexx S

Цитата:
В этом случае, я, действительно, считаю нормальным снижение качества отображения страниц

А я лично это считаю очень ненормальным (по крайней мере если сканы - не ч/б). Мне нужно точно видеть качество скана (букв): гладкие они или рваные (от этого будет зависеть какой despeckle), корявые ли (нужно ли использовать сглаживающий фильтр), есть ли дырки, блеклости и т.д. Это все будет влиять на то, какой мне профиль применить.  
 
Вы правы, 2-х этапный режим не решает проблем драфта, он для этого и не предназначен. Драфт - это отдельная, независимая от обработки операция, и вопрос автоматизации контроля правильности драфта пока открыт.
 

Цитата:
В итоге, мне понравился режим отображения миниатюр в VR , но при обраружении неправильно обрезанных страниц мне приходилось выходить в основное окно

В финальной версии я ввел возможность просмотра результата обработки прямо в главном окне: Result->Show output files in win. Поверх основного окна появится либо одно, либо два (если есть развороты) окна, в которых будут отображаться выходные файлы, эти файлы автоматически синхронизируются с текущим выбранным сканом. Попробуйте, может это Вам поможет
 
Добавлено:

Цитата:
отсуствует основное существующее противоречие - для исправления положения резака требуется выполить полный цикл с чисткой мусора, поворотом, резапмлингом, бинаризацией и прочими алгоритмами

 
Тут нет противоречия. Дело в том, что некоторые алгоритмы, используемые при обработке - интегральные, т.е. они зависят от параметров, вычисляемых исходя из всего изображения. Эти параметры могут измениться при изменении резаков (поверьте мне). Это может (хоть и не сильно) повлиять на качество, контур, зоны. Поэтому полный пересчет необходим. Например, в SK есть команда пересчета зоны. По этой команде все равно идет полный цикл обработки страницы (но без сохранения ее), иначе получится либо другое качество, либо местоположение зоны на выходе съедет.
 
Добавлено:

Цитата:
по себе знаю - начинаешь цепляться за устаревшее решение вместо того, чтобы полностью его откинуть (это не про кромсатор

Это мне знакомо, да, думаю, и каждому знакомо

Всего записей: 4078 | Зарегистр. 09-09-2002 | Отправлено: 12:07 25-12-2008
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А я лично это считаю очень ненормальным (по крайней мере если сканы - не ч/б). Мне нужно точно видеть качество скана (букв): гладкие они или рваные (от этого будет зависеть какой despeckle), корявые ли (нужно ли использовать сглаживающий фильтр), есть ли дырки, блеклости и т.д. Это все будет влиять на то, какой мне профиль применить.  

 
Вот! что и требовалось доказать - случаи разные бывают Лично я очень редко меняю эти опции. Да и всегда можно сделать Preview, о котором я писал
 
 

Цитата:
Тут нет противоречия. Дело в том, что некоторые алгоритмы, используемые при обработке - интегральные, т.е. они зависят от параметров, вычисляемых исходя из всего изображения. Эти параметры могут измениться при изменении резаков (поверьте мне). Это может (хоть и не сильно) повлиять на качество, контур, зоны. Поэтому полный пересчет необходим. Например, в SK есть команда пересчета зоны. По этой команде все равно идет полный цикл обработки страницы (но без сохранения ее), иначе получится либо другое качество, либо местоположение зоны на выходе съедет.

 
Крыть нечем, развче что... речь ведь шла больше о проверке ошибок драфта, смене выравнивания, ошибках поворота - во всех этих случаях погрешность несущественна.
 
Т.е предлагалось не менять основной метод, а дополнить "упрощенным" режимом проверки драфта.
 

Цитата:
 Драфт - это отдельная, независимая от обработки операция, и вопрос автоматизации контроля правильности драфта пока открыт.

 
Мне кажется, что сильно поможет развитие Thumbnails, что-то вроде этого:
 

 
По двойному клику на миниатюре отерывается окно с резаками, либо, еще лучше - сделать отдельное окно с миниатюруми, а по двойному клику переключаться на этот файл в основном окне.

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 13:46 25-12-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Постараюсь говорить о том, что кажется абсолютно очевидным. На данном этапе концепция кажется еще не совсем устоявшейся, и если будем высказывать смутные предположения, быстро запутаемся.
Вначале скажу, что мне кажется принципиальным в новом подходе:
  1. Метод призван увеличить удобство и скорость работы со сканами, а это значит, что он, как минимум, не должен удваивать (с точки зрения пользователя) некоторые этапы – т.е. мне кажется очевидным, что любого рода границы (резаки это или контуры блока текста) пользователь должен выставлять только один раз. Иначе путаницы не избежать, да и ускорения не получится.
  2. Этот метод вряд ли можно сделать универсальным для всех возможных сканов. Он хорошо подойдет для сканов, полученных с ОптикБука, и вряд ли подойдет для разворотов. Т.к. в случае последних проверка правильности расстановки резаков – как правило, обязательный этап. (Т.е. опять-таки придется два раза контролировать границы). Он также не подойдет и для книг с полутоновыми изображениями, т.к. и в этом случае нам придется просматривать все страницы книги.
    Иными словами, данный метод действительно позволит сэкономить кучу времени только в том случае, если пользователю не придется просматривать все сырые сканы один за другим.Подробнее...
  3. Если пп. 1,2 верны, то весь процесс принятия решения относительно границ стоит перенести с этапа проверки работы DK на этап постобработки.

Таким образом, алгоритм работы будет примерно таким:
  1. Делаем DK. Полностью автоматический – т.е. результаты его работы не проверяем.
  2. Устанавливаем параметры обработки на нескольких выбранных страницах книги.
  3. Обрабатываем.
  4. На этапе постобработки проверяем границы блока текста, определяем ориентацию блока текста на странице, очищаем мусор вручную и т.п.
  5. Рассчитываем средние фиксированные размеры страницы и производим «финализацию».

 
bolega

Цитата:
А я лично это считаю очень ненормальным (по крайней мере если сканы - не ч/б). Мне нужно точно видеть качество скана (букв): гладкие они или рваные (от этого будет зависеть какой despeckle), корявые ли (нужно ли использовать сглаживающий фильтр), есть ли дырки, блеклости и т.д. Это все будет влиять на то, какой мне профиль применить.
Да, но дело в том, что мы, как правило, стараемся установить параметры обработки, которые подошли бы в равной степени для всех страниц в книге. А это значит, что для того, чтобы установить параметры, нам не (всегда) нужно просматривать все сырые сканы один за другим в оригинальном качестве.
К примеру, книга может быть отсканирована в 600dpi и в цвете (см. пример выше за тегом [more]). Размер одной такой страницы может превышать 20 Мб. А это значит, просматривать все эти страницы в хорошем качестве будет сущей мукой.
Так что в этом случае я соглашусь с Alexx S и предложу сделать переключаемый режим рендеринга страниц - к примеру, очень быстро, средне, качественно.
А еще интересно узнать, по какому принципу работает FastPictureViewer  
Кстати, в СК есть предварительное кэширование просматриваемых сырых сканов?

Всего записей: 6794 | Зарегистр. 21-09-2002 | Отправлено: 16:18 25-12-2008 | Исправлено: ghosty, 16:33 25-12-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty

Цитата:
Да, но дело в том, что мы, как правило, стараемся установить параметры обработки, которые подошли бы в равной степени для всех страниц в книге

Это верно. Я так и делаю. Только после обработки просматриваю весь результат, меняю для непонравившихся страниц параметры, мечу их и снова переобрабатываю все меченые.

Цитата:
Так что в этом случае я соглашусь с Alexx S и предложу сделать переключаемый режим рендеринга страниц - к примеру, очень быстро, средне, качественно

1-е и 3-е уже есть (начиная с 1-й верии). Поэтому Ваше предложение я не понял. Как сделать средне - я не знаю, т.е. не знаю другого алгоритма, кроме тех, которые исп-ся в 1-м и 3-м варианте. Кстати, рендеринг - это тоже по сути downsample в размер окна.
 

Цитата:
Таким образом, алгоритм работы будет примерно таким

А чем он отличается от того, что используется сейчас?? Я так и делаю. Контроль обрезания номеров страниц на этапе DK (!) проверяю так: в окне VR сортирую иконки по высоте контента, просматриваю иконки сверху списка (чтобы выявить те, в контур которых попало что-то лишнее), затем - снизу списка (чтобы выявить те, которые имеют наименьшую высоту, возможно из-за того, что резак стоял неправильно). Достаточно просмотреть по 10-20 файлов с каждой из сторон. Те файлы, которые располагаются в середине списка, имеют примерно одинаковую высоту и практически гарантированно имеют правилтный контур и расположение резаков).
 
Добавлено:

Цитата:
А еще интересно узнать, по какому принципу работает FastPictureViewer  

В принципе существует только 3 способа ускорить любой алгоритм, будь то вьюер или еще что:
- применять asm через MMX, SSE
- распараллелить процесс  
- использовать упреждающее кэширование (чуть медленнее будут операции с текущим, но быстрее загрузка следующих). Используется во всех djvu-просмотрщиках.
У меня рендеринг идет через MMX, т.е. здесь уже потолок. Ускорить можно только 2-м способом, при условии что ядро у проца не одно. 3-й вариант тоже может помочь, правда, если просматривать файлы не по порядку, то будет наоборот, еще медленнее.

Всего записей: 4078 | Зарегистр. 09-09-2002 | Отправлено: 16:35 25-12-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Изменения в новой версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)

Вот это уже похоже на некий прототип хелпа. Что мешало делать аналогичные описания раньше? Не так уж трудно / долго набросать подобную текстовку...

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:12 25-12-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Контроль обрезания номеров страниц на этапе DK (!)
Т.е. теперь в том случае, если сканы представляют отдельные страницы (не развороты), DK можно доверять и не проверять? Точнее можно смело проверять на этапе постобработки?
Хотя, с другой стороны, я видел, что если поля на сыром скане слишком велики, резаки иногда вообще не ставятся (захватываются темные области) - т.е. интегральные алгоритмы могут не очень корректно работать...

Цитата:
А чем он отличается от того, что используется сейчас?? Я так и делаю.
Мне было важно понять, правильно ли я следую за Вашей мыслью
Отличается следующим (по ходу перечисления отличий возникли новые вопросы ):
  1. Сейчас на этапе проверки контура постобработка невозможна - только после "финализации". Можно ли совместить и то, и другое? Кстати, нужен аналог функции Automargin - т.е. чтобы можно было сделать так, чтобы после одной из указанных сторон контура все стиралось - было бы очень удобно в том случае, когда куча пометок примыкает непосредственно к блоку текста.
  2. Почему сразу после обработки не рассчитать фиксированные размеры автоматически (думаю, удобно было бы сделать в виде опции)? Тогда в режиме VR можно открывать Book properties также автоматически - удобнее даже в виде ToolBar'a сбоку.
  3. Если мы доверяем DK, то и его тоже можно делать автоматически непосредственно в ходе обработки, причем процессы DK и собственно обработки можно было бы в этом случае распараллелить.

 
Таким образом, алгоритм был бы таким:
  1. Устанавливаем параметры обработки на нескольких выбранных страницах книги.
  2. Нажимаем кнопку "Process", появляется окно DK с дополнительными опциями, вроде "Рассчитывать фиксированные размеры автоматически". После установки опций и нажатия "ОК" начинается обработка.
  3. На этапе постобработки проверяем границы блока текста, определяем ориентацию блока текста на странице, очищаем мусор вручную и т.п.  
  4. Производим «финализацию».

 

Цитата:
1-е и 3-е уже есть (начиная с 1-й верии). Поэтому Ваше предложение я не понял.
Подождите, но ведь Вы совсем недавно сказали, что отключили опции рендеринга (и они действительно отключены в Options -> Main win).

Цитата:
Ускорить можно только 2-м способом, при условии что ядро у проца не одно.
Ну, сейчас, по-моему, уже у большинства не одно

Цитата:
3-й вариант тоже может помочь, правда, если просматривать файлы не по порядку, то будет наоборот, еще медленнее.
Вроде, можно сделать предсказывающий алгоритм - если, к примеру, пользователь открыл 3 страницы подряд, включить упреждающее кэширование, если 3 открыл произвольно - отключить. Но т.к. чаще люди открывают подряд, упреждающее кэширование было бы очень кстати - с 20-меговыми сканами совсем беда

----------
пропадет-растает

Всего записей: 6794 | Зарегистр. 21-09-2002 | Отправлено: 20:53 25-12-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty

Цитата:
DK можно доверять и не проверять? Точнее можно смело проверять на этапе постобработки?  

Иногда можно Думаю, полностью доверять нельзя ни одной программе.
 

Цитата:
Хотя, с другой стороны, я видел, что если поля на сыром скане слишком велики, резаки иногда вообще не ставятся (захватываются темные области) - т.е. интегральные алгоритмы могут не очень корректно работать...  

Нет, здесь дело как правило в другом. SK не расчитан на такие сканы, я честно говоря не особо прорабатывал такие случаи. Они довольны редки, а анализировать их очень сложно. Сейчас SK "рассуждает" примерно так: если грязи по краям тааак много, значит, это для чего-то нужно, пусть остается"
 

Цитата:
Сейчас на этапе проверки контура постобработка невозможна - только после "финализации". Можно ли совместить и то, и другое?

Да, я так и написал: "пока нельзя". Не успел просто.
 

Цитата:
Почему сразу после обработки не рассчитать фиксированные размеры автоматически

Как я писал, размеры расчитываются по команде мгновенно, т.к. все исходные данные для расчета готовы, никакого анализа сканов уже не требуется. Поэтому особой проблемы тут я не вижу. Но в принципе можно и сразу же расчитать.
 

Цитата:
Если мы доверяем DK, то и его тоже можно делать автоматически непосредственно в ходе обработки

Нет, мы еще не доверяем настолько
 

Цитата:
Подождите, но ведь Вы совсем недавно сказали, что отключили опции рендеринга

Эта была опция для того упомянутого Вами "среднего" метода. Т.к. я в итоге перешел на asm, то она стала бессмыслена, т.к. при оптимизированной реализации что средние, что наилучшие дают одинаковое время. Так что остались только 1-й и 3-й. Напомню, что 1-й (быстрый) - это когда отключен фильтр Image->No zoom filter (для серых/цветных 600dpi - то что надо).
Более того, основной вклад в скорость показа теперь вносит не рендеринг, а время считывания файла с диска и декодирование. Думаю, что распараллеливание самого рендеринга практически не даст никакого выигрыша. Ну и объем конечно. Например, цветной скан 600dpi, который занимает на диске мегов 10-20, после загрузки в память (а в ней он хранится как 24-ьитный windows bitmap + возможно 8бит для прозрачности) занимает уже 100-120 мегов! Это много даже для internal-cpu-кэша. А учитывая, что при обработке для ряда фильтров создается 1-3 копии скана, представляете, какая идет нагрузка на проц и шину.

Всего записей: 4078 | Зарегистр. 09-09-2002 | Отправлено: 22:09 25-12-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Нет, мы еще не доверяем настолько
Надолго вчера задумался
А что если... сделать так:  
 
DK все-таки выполняем вместе с основной обработкой (как писал ранее). При этом область за пределами резаков не обрезается, но и не обрабатывается - она участвует только в бинаризации и апсемплинге.  
Тогда после обработки получаем следующее в режиме VR:
мы видим необрезанную страницу полностью, на ней видим мусор, оставшийся за резаками (его можно дать серым, чтобы глаза особо не мозолил ), видим блок текста в рамке.
 
Таким образом, мы можем действительно контролировать работу DK уже после обработки. Для этого в режиме VR у нас должна быть кнопочка Reprocess. Есть два случая ошибки DK - когда отрезается часть текста и когда оставляется слишком большая часть полей.
Если DK отсек часть текста (к примеру, часть таблицы), мы это увидим - такая часть окажется за резаками, т.е. будет серой и довольно жуткой Исправляем рамку, нажимаем Reprocess.
Если, к примеру, DK оставил слишком много мусора, но при этом координаты блока текста определились правильно, ничего не меняем и жмем Reprocess - обработка будет произведена уже только в выделенной рамке (понятно, что при апсемплинге нужно будет пересчитывать координаты рамки, но это, думаю, не сложно).
 
Это решает сразу три проблемы:
1) Двухэтапный метод становится универсальнее, т.е., возможно, теперь он подойдет и для разворотов.
2) Пользователь все-таки будет контролировать только один контур, причем уже на черно-белых сканах. Он не будет тратить время на контроль работы DK перед обработкой, когда необходимо делать это на сырых сканах, загружая их один за другим по порядку.
3) Мой последний алгоритм из 4-х пунктов, предложенный выше, становится возможным
 
Не отбрасывайте такой вариант сразу, мне действительно кажется, что в этом что-то есть (хотя, конечно, это может оказаться в терминологии психиатрии "сверхценной идеей", но все же ).

----------
пропадет-растает

Всего записей: 6794 | Зарегистр. 21-09-2002 | Отправлено: 14:39 26-12-2008 | Исправлено: ghosty, 14:57 26-12-2008
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор (Часть 2)
Widok (30-03-2009 18:08): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru