Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я залил последние изменения в SVN.  Думаю изменения тянут на новый релиз.  Как только кто-нибудь соберет версию для винды, выложу релиз на сайт.
 
Изменения такие:
* Перед бинаризацией делаем выравнивание освещения.  Теперь затененные участки бинаризуются как надо.
* Режим вывода Mixed, в котором происходит автовыделение картинок (по методу U235).  Кртинки выводятся в сером / цветном режиме, остальное бинаризуется.  В этом режиме также используется выравнивание освещения, причем оно делается даже для цветных картинкок.
* Despeckling (удаление мелких пятен) отключено от греха подальше.  Частично его функции взяло на себя сглаживание перед выводом.
 
Стадия Select Content по прежнему не переносит затененного контента.  Теперь доведение до ума этой стадии будет первоочередной задачей.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 17:39 12-12-2008
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
При компиляции на п.9 ошибка. Вот лог:
C:\build\scantailor-0.9.1\filters\page_split\VertLineFinder.cpp: In static member function `static std::vector<QLineF, std::allocator<QLineF> > page_split::VertLineFinder::findLines(const QImage&, const ImageTransformation&, int, DebugImages*, QImage*)':
C:\build\scantailor-0.9.1\filters\page_split\VertLineFinder.cpp:73: error: `morphGradientDetect' undeclared (first use this function)
C:\build\scantailor-0.9.1\filters\page_split\VertLineFinder.cpp:73: error: (Each undeclared identifier is reported only once for each function it appears in.)
mingw32-make[2]: *** [filters/page_split/CMakeFiles/page_split.dir/VertLineFinder.cpp.obj] Error 1
mingw32-make[1]: *** [filters/page_split/CMakeFiles/page_split.dir/all] Error 2
mingw32-make: *** [all] Error 2
 
Добавлено:
Что делать дальше?  
Надо ли что-то удалить из каких-то папок для возобновления процесса?
Если будут ошибки и далее, буду писать на почту. Наверное так правильней будет.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 00:37 13-12-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Забыл обновить один файл в SVN.  Обновил.
 
Теперь обновитесь из SVN и продолжайте с того шага, где произошла ошибка, то есть с девятого (он же и последний).
 
Libtiff вы кстати патчили?  Если нет, пропатчите согласно инструкциям, и прогоните шаг 7.  Перекомпиляцию Qt я думаю можно пропустить, так что когда попросит принять лицензию - жмите N.   Потом переходите к девятому шагу.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:29 13-12-2008
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Программа скомпилирована. Смотри почту.
 
Вопросы:
1. "Режим вывода Mixed". Пока не понял где это. Как он работает? В конечном файле будет основа - с бинаризацией, а картинка "в сером / цветном режиме"? Если так, то это просто фантастика. Я после обработки в СК это совмещение делал вручную в PhotoShop (картинку тянул из скана-оригинала).
2. "Despeckling (удаление мелких пятен) отключено от греха подальше". Не понял, ты вообще отключил функция очистки сканов? Или только какую-то часть этой функции? Очистка-то является одним из важных этапов автообработки сканов. Благодаря ей в СК, я в несколько раз сократил время посточистки в PhotoShop. И уже возвращаться к этому не буду.
3. Почему-то только сейчас заметил: а можно сделать возможность регулировать ширину правой колонки (предпросмотр). А то там иногда широкие пустые поля остаются, неэкономно. Да и вообще чтобы гибко было.
4. Сейчас сравнил mingwm10.dll последней сборки и у себя. У тебя новее на 2,5 года. Как у меня так получилось? Нужно ли заменить на твой файл?
 
(повтор просьбы, которую в почту писал)  
В интерфейсе программы прошу добавить информацию о версии рядом со "Scan Tailor", как у всех программ.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 11:33 13-12-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22

Цитата:
Я после обработки в СК это совмещение делал вручную в PhotoShop (картинку тянул из скана-оригинала).  

Интересно, а чем Вас не устраивала в SK команда merge picture-zones, которая делала автоматическое совмещение??

Всего записей: 4390 | Зарегистр. 09-09-2002 | Отправлено: 12:57 13-12-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22

Цитата:
Программа скомпилирована. Смотри почту.

Получил.  Пришлось правда идти на gmail и доставать его из папки Spam
Сегодня сделаю релиз.
 

Цитата:
1. "Режим вывода Mixed". Пока не понял где это. Как он работает? В конечном файле будет основа - с бинаризацией, а картинка "в сером / цветном режиме"? Если так, то это просто фантастика. Я после обработки в СК это совмещение делал вручную в PhotoShop (картинку тянул из скана-оригинала).  

Это там где выбор между черно-белым и серым / цветным режимом.
 

Цитата:
2. "Despeckling (удаление мелких пятен) отключено от греха подальше". Не понял, ты вообще отключил функция очистки сканов? Или только какую-то часть этой функции? Очистка-то является одним из важных этапов автообработки сканов. Благодаря ей в СК, я в несколько раз сократил время посточистки в PhotoShop. И уже возвращаться к этому не буду.  

Не было у меня времени доводить Deskecling до ума, а в нынешнем виде он только мешал.  Вот я его и отключил пока-что.  На серых сканах он в принципе не особенно нужен.  С совсем мелкими пятнами сглаживание достаточно хорошо справляется.
 

Цитата:
3. Почему-то только сейчас заметил: а можно сделать возможность регулировать ширину правой колонки (предпросмотр). А то там иногда широкие пустые поля остаются, неэкономно. Да и вообще чтобы гибко было.  

Может в одной из следующих версий, но это низкоприоритетная задача.
 

Цитата:
4. Сейчас сравнил mingwm10.dll последней сборки и у себя. У тебя новее на 2,5 года. Как у меня так получилось? Нужно ли заменить на твой файл?  

Заменять не нужно.  У меня просто версия MinGW другая.  Брать нужно от той версии, которой собиралась программа.
 

Цитата:
В интерфейсе программы прошу добавить информацию о версии рядом со "Scan Tailor", как у всех программ.

Да, надо сделать окно About.  Может кто логотип придумает и нарисует?  А я вас в этом самом About упомяну.  Желательно в векторном формате конечно.
 
Добавлено:
Выпустил версию 0.9.1 - качайте и пробуйте.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 13:49 13-12-2008 | Исправлено: Tulon, 14:00 13-12-2008
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Если "merge picture-zones" была ещё в ScanKromsator 5.6А Full, которую я ну хоть сколько-то времени изучал, то значит попросту не знал про такую возможность. Новые версии я уже пользовал на том уровне, что знал. Теперь посмотрю, спасибо.
 
Tulon
1. Тогда ответь мне просто, ты полностью выключил очистку?
Я ведь большей частью не с серыми сканами работаю (например, когда чищу чужие книги), поэтому заранее уточняю, чтобы для меня сюрпризом не стало.
2. Не только в About, на в верхней строке, где указывается название проекта и Scan Tailor. Т.е. чтобы отображалось например Scan Tailor 0.9.2.
 
Добавлено:
На сайте программа выложена в том виде, что я скинул или нет? Мне её заново качать у тебя?

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 17:55 13-12-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
1. Тогда ответь мне просто, ты полностью выключил очистку?
Я ведь большей частью не с серыми сканами работаю (например, когда чищу чужие книги), поэтому заранее уточняю, чтобы для меня сюрпризом не стало.  

Полностью, за исключением полей, которые просто заливаются белым во всех режимах кроме Color / Grayscale.
 

Цитата:
2. Не только в About, на в верхней строке, где указывается название проекта и Scan Tailor. Т.е. чтобы отображалось например Scan Tailor 0.9.2.

ОК, сделаю.
 
Добавлено:

Цитата:
На сайте программа выложена в том виде, что я скинул или нет? Мне её заново качать у тебя?

В том же виде, просто архив переименовал.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 17:59 13-12-2008
dma200899

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ну вот, опять. В обеих версиях.
 
На этапе "output" ничего не выполняется, кнопка "батч" недоступна.
Всё время горит надпись:
"ю кант оутпут
фёст ю нид ту процесс олл оф зем виз зе пэйж лейоут филтер"
 
А все файлы отпроцессены на предыдущей стадии.
И ничего не помогает (перещёлкивание между этапами).
 
Причем на 3 страничках - все нормально. На 600 - такая байда.
 
Порядок действий. 1) Гружу файлы. 2) Иду в Пэж Лейоут 3) Батч. 4) Иду в оутпут - и пустота.
 
 
И еще. Делал как-то ч/б файлы. Так там прога в тех местах, где исходной страницы не хватало, залила все поля черным. И что ? Как эту черную рамку удалять ?
Также почему-то и в новой версии, с "улучшенным алгоритмом бинаризации" изначально черно-белые сканы чистятся. А если я хочу файл таким как есть. Где кнопка "не применять фильтры" ?
 
Для 300 стр. тоже все нормально.
Там где-то переполнение памяти, видно, происходит.  

Всего записей: 126 | Зарегистр. 29-06-2008 | Отправлено: 22:38 13-12-2008 | Исправлено: dma200899, 22:51 13-12-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Порядок действий. 1) Гружу файлы. 2) Иду в Пэж Лейоут 3) Батч. 4) Иду в оутпут - и пустота.  

Возможно баг проявляется только на определенном файле.
Попробуйте вот что:
После Batch Processing на Page Layout переключитесь на любой другой этап и потом обратно на Page Layout.  Теперь медленно прокрутите ленту предпросмотра от начала до конца в поисках страницы с вопросительным знаком.  Если найдете такую - заливайте этот файл на обменник а ссылку сюда или мне в личку.
 

Цитата:
И еще. Делал как-то ч/б файлы. Так там прога в тех местах, где исходной страницы не хватало, залила все поля черным. И что ? Как эту черную рамку удалять ?  

Должна белым по идее.  Если опять наткнетесь на такое - шлите пример.  Код вывода в черно-белом режиме был переписан (теперь это частный случай режима Mixed), так что если там баг и был, то вполне возможно что его уже нет.
 

Цитата:
Также почему-то и в новой версии, с "улучшенным алгоритмом бинаризации" изначально черно-белые сканы чистятся. А если я хочу файл таким как есть.

Дайте пример что ли - типа вот файл, и вот эту деталь я хочу сохранить, а она удаляется.
 

Цитата:
Где кнопка "не применять фильтры" ?  

Пришлось поискать в этом треде, зачем вам такое понадобилось.  Оказалось, что таким образом вы хотите справиться с пропаданием настроек на этапе Page Layout.  Но ведь они не должны пропадать - и соответственно нужно искать причину проблемы, а не бороться с ее следствием.  Кстати это вполне может быть та же проблема, из-за которой вам не дают делать Output.  В общем постарайтесь найти именно те файлы, из-за которых возникает проблема.  Можете конечно весь проект куда-нибудь залить, если траффика не жалко.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:19 13-12-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал новую заметку:                
               
30. Бинаризация Gatos Thresholding
               
http://www.djvu-soft.narod.ru/bookscanlib/030.htm
 
Добавлено:
Подправил небольшой глючок в:
 
25. Бинаризация Sauvola Thresholding http://www.djvu-soft.narod.ru/bookscanlib/025.htm
 
28. Бинаризация Niblack Thresholding http://www.djvu-soft.narod.ru/bookscanlib/028.htm
 
Убрал одну лишнюю функцию из:
 
29. Фильтр Adaptive Wiener http://www.djvu-soft.narod.ru/bookscanlib/029.htm

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 00:17 14-12-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Тут кто-то говорил что хорошо бы завести отдельный форум для СТ.   А тут как раз SourceForge начал предоставлять новую услугу - Hosted Apps.  Они поставили и сконфигурировали несколько вэб приложений таким образом, что каждый проект получает как бы отдельную копию, с админским доступом и все такое.  И среди этих приложений есть phpBB.  В общем я сделал на нем форум и поместил ссылку на сайт.  Не знаю, будут ли им пользоваться - не будут, так прикрою его.  Регистрироваться надо не на самом форуме, а на главной странице sourceforge.net

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 17:20 14-12-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал новую заметку:                
                 
31. Бинаризация White Rohrer Thresholding
                 
http://www.djvu-soft.narod.ru/bookscanlib/031.htm

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:41 14-12-2008
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Может не совсем в тему. Только сказал, что в основном ч/б книги обрабатываю, как сразу попались 2 книги в сером, которые надо оптимизировать. Но они в 300 dpi.  
Вопросы такие:  
1. Scan Tailor сейчас готов к работе с такими сканами (я декодирую их до серых tiff)? Имеется ввиду разрешение.
2. Есть ли смысл при декодировании переводить их в 600 dpi?
Прошу сами вопросы не критиковать (я не претендую на профи уровень скан-обработки), а просто ответить на них.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 11:15 15-12-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
1. Scan Tailor сейчас готов к работе с такими сканами (я декодирую их до серых tiff)? Имеется ввиду разрешение.  

Готов.
 

Цитата:
2. Есть ли смысл при декодировании переводить их в 600 dpi?  

Подавайте СТ на вход файлы в том разрешении, в котором сканировали.  Практически любое преобразование изображения ведет к потере четкости.  В СТ делается всего одно комбинированное преобразование (масштабирование + вращение + сдвиг) - так что потери четкости минимальны.  А если вы предварительно отмасштабируете свои сканы в 600 dpi - это уже будет два преобразования.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 13:04 15-12-2008
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Преамбула:  
Как узнал об удалении Despeckling, решил эту программу не тестировать до её восстановления, т.к. с ч/б сканами мне она нужна. Но раз появились парочка книг в сером, возвращаюсь к ней.
 
Что замечено:
1. Не замечает номеров страниц, даже текст в некоторых случаях. При этом включает черные полосы по крайям (и даже просто светлые) в рабочую область. ИМХО, спотыкается иногда почти на пустом месте.
2. Режет текст вертикальными резаками (этого никак не ожидал). Довольно часто. Опять же ИМХО без особых на то оснований, т.к. по яркости текст не меняется.
3. Много случаев, когда текст (особенно у номеров страниц) "подрезается". Т.е. низ текста (несколько пикселей) обрезаются. Посмотрел результирующий эффект - это ошибка сразу бросается в глаза. Сверху тоже часто наблюдается подрезка.
4. Даже умудрился спутать сторону скана: вместо левого, хватанул правый. В результате вместо текста я получил полосу изгиба книги.
 
По пп. 1-4 могу скинуть сканы. Надо? По п.3 кину только 1 скан, на самом деле их очень много.
 
Догадываюсь, что возможно сказалось заниженное разрешение (300 dpi). Возможно часть из этих проблем тебе известна. Я лишь отчитываюсь о результатах.
Для интереса прогнал обработку в 0.9.0. Результат тот же.
 
Вопрос по программе:
Сделана обработка на Select content полностью. Хочу заменить 2 скана на другие. Точнее уже сделал. Прошу описать как это делать оптимально.
 
Попутно просьба, включить в горячие клавиши переход по сканам где-нибудь на левой стороне клавиатуры, например Q (предыдущий) и A (следующий). Так удобней работать.
 
Добавлено:
Вот и проблемные сканы: http://narod.ru/disk/4401898000/Test.zip.html (3,54 Мб). По папкам разложены в соответствии с вышеуказанными проблемами.
 
Посмотри, пожалуйста качество полученных ч/б сканов. Такое ощущение, что они стали совсем не читаемы. Что посоветуешь? Может не бинаризировать?
 
Добавлено:
Я в шоке. Несколько сканов стали чисто черными.
Вот несколько из них и пример полученного результата - http://narod.ru/disk/4402566000/Test2.zip.html (912 Кб)
Для информации: декодирование делал в DjVu Small 0.3.2.
 
Добавлено:
Попробывал оставить серый. И честно говоря не понял что изменилось. Всё, что вошло в конечный размер скана: грязь, прогибы книги и прочее - осталось.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 16:08 15-12-2008 | Исправлено: denver 22, 17:03 15-12-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
1. Не замечает номеров страниц, даже текст в некоторых случаях. При этом включает черные полосы по крайям (и даже просто светлые) в рабочую область. ИМХО, спотыкается иногда почти на пустом месте.  

Select Content - слабое место на данный момент.  Но я бы не сказал, что проблемы там на пустом месте.
Вот, посмотрите:

Черное обрамление - это не проблема, но только в том случае, если оно касается краев, а у вас оно не не касается.  Чем вы этот скан обрабатывали?  Или это такой хитрый режим у сканера?
 

Цитата:
3. Много случаев, когда текст (особенно у номеров страниц) "подрезается". Т.е. низ текста (несколько пикселей) обрезаются. Посмотрел результирующий эффект - это ошибка сразу бросается в глаза. Сверху тоже часто наблюдается подрезка.

Ну это думаю будет несложно поправить.
 

Цитата:
4. Даже умудрился спутать сторону скана: вместо левого, хватанул правый. В результате вместо текста я получил полосу изгиба книги.  

Это скорее всего из-за черных полей, которые как бы есть и в то же время их как бы и нет - огрызки одни.  СТ такое не любит.
 

Цитата:
Сделана обработка на Select content полностью. Хочу заменить 2 скана на другие. Точнее уже сделал. Прошу описать как это делать оптимально.  

Подменить эти два файла на другие.
 

Цитата:
Посмотри, пожалуйста качество полученных ч/б сканов. Такое ощущение, что они стали совсем не читаемы. Что посоветуешь? Может не бинаризировать?  

Сканировать в сером режиме, потому что этот я не назвал бы серым.  Ваши сканы фактически черно-белые, только каждая буквы покрашена в свой оттенок серого.  От такого скана хорошего качества не получите.
 

Цитата:
Попутно просьба, включить в горячие клавиши переход по сканам где-нибудь на левой стороне клавиатуры, например Q (предыдущий) и A (следующий). Так удобней работать.  

Если руки дойдут - сделаю.
 

Цитата:
Для информации: декодирование делал в DjVu Small 0.3.2.  

А, ну теперь понятно кто так испоганил эти сканы.  С таким исходным материалом ничего хорошего у вас не получится.
 

Цитата:
Я в шоке. Несколько сканов стали чисто черными.  

Не смог воспроизвести.  Шлите файл проекта.
 

Цитата:
Попробывал оставить серый. И честно говоря не понял что изменилось. Всё, что вошло в конечный размер скана: грязь, прогибы книги и прочее - осталось.

Серый режим вывода чтоли?  А он ничего и не чистит.  Чистит Mixed и черно-белые режимы.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 19:49 15-12-2008
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
А, ну теперь понятно кто так испоганил эти сканы.  С таким исходным материалом ничего хорошего у вас не получится.  

Сканы испоганил похоже FR, это он любил делать белую рамку своим автовыравниванием.  
Одно непонятно, если исходный файл djvu, то зачем делать двойную работу: сначала сливать слои DjVu Small, а затем упорно пытаться их разделить Scan Tailor'ом. Не проще ли сразу в djvudecode использовать опцию --layer=mask?

Всего записей: 881 | Зарегистр. 14-12-2005 | Отправлено: 20:28 15-12-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал новую заметку:
                 
32. Бинаризация Abutaleb Thresholding
                 
http://www.djvu-soft.narod.ru/bookscanlib/032.htm

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 23:27 15-12-2008
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Но я бы не сказал, что проблемы там на пустом месте

были сканы, где просто светлые места включались в область. возможно из высланных таких не оказалось. Я выборку  делал хаотично.

Цитата:
Ну это думаю будет несложно поправить.  

Очень надеюсь. А то как-то не в кайф такой результат получать.

Цитата:
Сканировать в сером режиме, потому что этот я не назвал бы серым.  Ваши сканы фактически черно-белые, только каждая буквы покрашена в свой оттенок серого.  От такого скана хорошего качества не получите.  

Я же писал, что в последнее время занимаюсь облагораживанием чужих книг. А то они ценные, а пользоваться просто невозможно.
Честно говоря моих знаний не хватает понять, что значит ч/б, но подкрашенные. Было бы полезней услышать совет как мне действовать. Если конечно это входит в пределы темы этого топика и программы СТ.

Цитата:
А, ну теперь понятно кто так испоганил эти сканы.  С таким исходным материалом ничего хорошего у вас не получится.  

Опять не понял. Что именно плохого в DjVu Small? Он вроде декодирует на основе Document Express Enterprise.
Ну могу декодировать программой DjvuOCR. Ею пойдет? Или что-то посоветуете с программой или настройками декодирования? Может вам пару страниц самой книги выслать, чтобы понятно было каков оригинал?
 
Проект вышлю. Он на работе.
 
U235
А есть возможность использовать эту опцию в ГУИшных программах? Я не программист, а обычный пользователь. В консоли обрабатывать книги не хочу.
И опиши, пожалуйста, как тогда мне эту книгу обработать? Начиная с самого начала, имея книгу djvu. Меня сам алгоритм интересует, и особые настройки. Похоже я с трудным случаем столкнулся.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 00:11 16-12-2008
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru