Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Adaptive Thresholding using the Integral Image
 
http://jgt.akpeters.com/papers/BradleyRoth07/
 
Добавлено:
MATLAB and Octave Functions  
for Computer Vision and Image Processing
 
http://www.csse.uwa.edu.au/~pk/Research/MatlabFns/
 
Добавлено:
Кое-что по бинаризации есть даже тут:
 
http://www.codeproject.com/KB/graphics/cximage.aspx
 
Добавлено:
ImageJ plugins::Thresholding
 
http://www.pvv.org/~perchrh/imagej/thresholding.html
 
Добавлено:
А вот весьма любопытные линки не о бинаризации:
 
http://www.pvv.org/~perchrh/imagej/smooth.html
 
http://www.pvv.org/~perchrh/imagej/orientation.html

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:08 28-11-2008 | Исправлено: monday2000, 10:12 28-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Но такого интересного алгоритма бинаризации, как в Book Restorer 4.1, пока нет.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 12:19 28-11-2008 | Исправлено: monday2000, 12:28 28-11-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Но такого интересного алгоритма бинаризации, как в Book Restorer 4.1, пока нет.
 

Мой гибридный алгоритм выравнивания освещения с последующей бинаризацией по Otsu дает результаты, очень похожие на BR.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 03:21 29-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Вы сами делали Otsu и Sauvola или откуда-то взяли? Кто бы мог подумать - я пока не могу найти работающую реализацию Otsu - в AForge.NET она не работает, в ImageJ - тоже. Вот только в Ocropus нашёл пока работающую Otsu - но блин, там лицензия Apache - а мне нужно GPL.
 
Sauvola вообще пока обнаружилась только в Ocropus.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 22:14 29-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал новую заметку:        
         
23. Бинаризация Otsu Thresholding
         
http://www.djvu-soft.narod.ru/bookscanlib/023.htm

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 15:34 30-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Небольшой OFFTOP:
 
Если кого интересует идея разработки самодельного автоматического книжного сканера - заходите сюда: http://natahaus.info/forums/showthread.php?t=5951
 
Или проще начать с моей новой статьи:
 
http://www.djvu-soft.narod.ru/scan/roboscanner.htm

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 21:18 30-11-2008 | Исправлено: monday2000, 21:20 30-11-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вы сами делали Otsu и Sauvola или откуда-то взяли? Кто бы мог подумать - я пока не могу найти работающую реализацию Otsu - в AForge.NET она не работает, в ImageJ - тоже. Вот только в Ocropus нашёл пока работающую Otsu - но блин, там лицензия Apache - а мне нужно GPL.  

Если устраивает GPL3 - то можете взять из СТ.  Если нет, то Otsu под GPL2 есть в Gimp'е: Colors -> Threshold -> Auto - это он и есть.  Моя реализация сделана под впечатлением Gimp'овской.  Sauvola я бы сказал даже проще Otsu.  Формула там такая:

Код:
threshold = mean * (1 + k * (stddev / R - 1)

mean - среднее арифметическое окружения.
stddev - стандартное отклонение окружения.
k - просто константа.  Сам Sauvola рекомендовал 0.5, другие товарищи рекомендуют 0.34
R - тоже константа.  Походу все используют 128
Плюс есть способ реализации этого алгоритма, при котором производительность не зависит от размера окружения.  Вот например: http://pubs.iupr.org/DATA/2007-IUPR-11Sep_1129.pdf
У меня он как раз таким способом и реализован.
 
 
Да, у меня будет просьба: для тестов нужен скан, где тень от корешка наезжает на цветную картинку.  Скан должен быть цветной, и желательно чтобы цвет бумаги был погрязнее.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:27 01-12-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Вот например: http://pubs.iupr.org/DATA/2007-IUPR-11Sep_1129.pdf  
У меня он как раз таким способом и реализован.  

Это же Sauvola из окропуса. Исходники там есть (в окропусе). Они же под Apache License - можно ли их как GPL делать? Хотя руки просто чешутся передрать оттуда.
 
Добавлено:

Цитата:
Otsu под GPL2 есть в Gimp'е: Colors -> Threshold -> Auto - это он и есть

Ага, увидел - gimphistogram.c. Что-то он такой здоровенный и сложный на вид - неужели там что-то принципиальное иное, чем окропусовский (обычный) Otsu?

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 11:31 01-12-2008 | Исправлено: monday2000, 11:53 01-12-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Они же под Apache License - можно ли их как GPL делать? Хотя руки просто чешутся передрать оттуда.

Apache License 2.0 совместима с GPL3 но не с GPL2.  Кстати моя реализация гораздо чище - посмотрите как у меня строятся интегральные изображения, и как в Ocropus.
 

Цитата:
неужели там что-то принципиальное иное, чем окропусовский (обычный) Otsu?

По результатам - Otsu есть Otsu, разве что одна реализация может быть быстрее другой.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 12:32 01-12-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
По результатам - Otsu есть Otsu

Ну то есть номер порога должен получаться одинаковым на одной и той же картинке - правильно? У той реализации Otsu, что я сделал, номер порога получается во всех случаях такой же, как и у Ocropus Otsu. Интересно, совпадёт ли с Вашей.
 
Добавлено:
Ура, нашёл под GPL:
 
http://gamera.sourceforge.net/doc/html/binarization.html

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 13:57 01-12-2008
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Вашу увлеченность бинаризацией нахожу э... тратой времени. ИМХО удаление фона, потом автокоррекция и пороговая бинаризация - лучше всего этого. Хотя интересных ссылок Вы накопали, пригодится
Если на то пошло, то бинаризация из lu-binarization.pdf (ссылка в топике приводилась) мне кажется наиболее интересной. Кстати, вопрос к Tulon, Вы реализовали этот алгоритм? Если да, то каковы результаты по Вашему мнению.

Всего записей: 2495 | Зарегистр. 28-05-2004 | Отправлено: 14:42 01-12-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Если на то пошло, то бинаризация из lu-binarization.pdf (ссылка в топике приводилась) мне кажется наиболее интересной. Кстати, вопрос к Tulon, Вы реализовали этот алгоритм? Если да, то каковы результаты по Вашему мнению.

Да, реализовал.  Не в чистом виде, а даже лучше.  В методе lu-binarization.pdf я вижу проблему - если на скане имеются картинки, в особенности темные, они потянут на себя полиномиальную поверхность, в результате чего она станет темнее, и может местами слиться с полезным контентом.  В моем варианте сначала делается морфологическое выделение фона, потом определение явного не-фона, и уже потом построение полиномиальной поверхности с игнорированием явного не-фона.  В общем то же, что и в lu-binarization.pdf, только там дважды строится полиномиальная поверхность, а у меня в первом случае - морфологическое выделение фона.
Результаты этого алгоритма очень напоминают нормализацию освещения в BR.
 
Кстати я до сих пор жду скана с тенью на цветной картинке - сделайте кому не влом.  Скан этот мне нужен для тестирования цветной версии этого алгоритма.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 16:11 01-12-2008 | Исправлено: Tulon, 16:19 01-12-2008
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Кстати я до сих пор жду скана с тенью на цветной картинке
Старался сделать как можно хуже
http://abab.front.ru/0003.jpg

Цитата:
Да, реализовал.  Не в чистом виде, а даже лучше.  В методе lu-binarization.pdf я вижу проблему - если на скане имеются картинки, в особенности темные, они потянут на себя полиномиальную поверхность, в результате чего она станет темнее, и может местами слиться с полезным контентом.
Хорошо, а как в случае, клгда область сканировании больше странице, т.е. в случае черной окантовки (или очень глубокой тени от корешка)? Она ведь потянет за собой поверхность.

Всего записей: 2495 | Зарегистр. 28-05-2004 | Отправлено: 16:46 01-12-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Старался сделать как можно хуже
http://abab.front.ru/0003.jpg  

В принципе подойдет, хотя не отказался бы от чего-нибудь поцветастие.
 

Цитата:
Хорошо, а как в случае, клгда область сканировании больше странице, т.е. в случае черной окантовки (или очень глубокой тени от корешка)? Она ведь потянет за собой поверхность.

В общем случае это была бы проблема, но в случае СТ она легко решается - полиномиальная поверхность строится только в зоне прямоугольника контента.  Поля в таком случае вполне можно заливать белым - проверял, границы не видно.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 17:03 01-12-2008 | Исправлено: Tulon, 17:09 01-12-2008
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
хотя не отказался бы от чего-нибудь поцветастие
Завтра или послезавтра поищу среди детских книг, у меня с цветными напряженка

Всего записей: 2495 | Зарегистр. 28-05-2004 | Отправлено: 17:29 01-12-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
Вашу увлеченность бинаризацией нахожу э... тратой времени.  

Да ладно, всё в хозяйстве пригодится.

Цитата:
бинаризация из lu-binarization.pdf (ссылка в топике приводилась) мне кажется наиболее интересной

Вот эта ссылка: http://www.comp.nus.edu.sg/~tancl/Papers/ICDAR07/lu-binarization.pdf
Я пока не собираюсь самостоятельно создавать алгоритмы по их словесным описаниям. Ведь ещё много есть чего чужого готового и интересного - что можно передрать себе. За то время, пока я буду выдумывать из бумажки свой алгоритм - я успею передрать чужих 2-3. Вот когда чужие интересные алгоритмы закончатся - тогда начну писать свои (по PDF-описаниям).
 
Кстати - а Вы сами не хотите этим же заняться? По-моему, это более продуктивно, чем делать кореловские плагины.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 18:08 01-12-2008 | Исправлено: monday2000, 18:10 01-12-2008
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Цитата:
Кстати - а Вы сами не хотите этим же заняться? По-моему, это более продуктивно, чем делать кореловские плагины.
Мне неловко клянчить кое-какой код у Tulon - это раз. То, что я хочу сделать, нет в готовом виде. Это выделение картинок, сглаживание букв и выделение цветного текста (не постеризация, вроде так называется, - это не то). Сейчас я переезжаю с Билдера на Вижуал (уже перехал) и надо довести до ума удаление фона.

Всего записей: 2495 | Зарегистр. 28-05-2004 | Отправлено: 18:25 01-12-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Автоматическое выделение картинок у меня есть и работает, правда еще нет в SVN, потому как в том файле постоянный work-in-progress.  Сейчас например пытаюсь совместить автовыделение картинок с выравниванием освещения, потому что без него слишком хорошо заметны неровные края маски, которую генерирует алгоритм автовыделения картинок от U238.  Для серых картинок уже совместил, для цветных - work-in-progress.
 
Добавлено:
Кстати код для генерации полиномиальных поверхностей могу хоть сейчас залить в SVN.  Код там уже вычищен.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 20:39 01-12-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
То, что я хочу сделать, нет в готовом виде.

Я Вам совершенно серьёзно предлагаю попробовать свои силы в деле реализации недостающих алгоритмов. Ну хотя бы попытайтесь - "для очистки совести".
На всякого рода выделение (картинок и текста) есть уйма готовых алгоритмов. Я то и дело на них натыкаюсь в своих поисках. Начать можно хотя бы с Лептоники - там это есть. Вот тут это есть: http://gamera.sourceforge.net/ . Очень оригинальная вещь в этом отношении - GOCR (там реально разобраться). У меня вообще возникло общее ощущение, что по Pattern Recognition гораздо больше всего, чем по Color Enhance (именно поэтому я и занимаюсь сейчас не Pattern Recognition, а Color Enhance - в первую очередь нужно развивать самое слабое звено).

Цитата:
Сейчас я переезжаю с Билдера на Вижуал (уже перехал) и надо довести до ума удаление фона

Надеюсь, Вы будете использовать лицензию "GPL 2 и выше"? Чтобы мы могли друг с другом свободно кодами обмениваться. А какую графическую библиотеку Вы избрали?
Вот ещё бы U235 соблазнить перейти с "бессмысленного" матлаба на что-то более толковое (т.е. низкоуровневое) - вот было бы здорово - нас стало бы уже четверо.

Цитата:
Да, у меня будет просьба: для тестов нужен скан, где тень от корешка наезжает на цветную картинку.  Скан должен быть цветной, и желательно чтобы цвет бумаги был погрязнее.

Чем богаты:
http://w18.easy-share.com/1702641736.html (32 МБ)

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 22:38 01-12-2008 | Исправлено: monday2000, 22:41 01-12-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Робофорум -> Компьютерное зрение -> Алгоритмы
 
http://www.roboforum.ru/viewforum.php?f=37

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 11:55 02-12-2008
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru