Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty, не спорю, что запас в области сканирования был превышен. Но делал я это сознательно, из-за особенностей самой книги. Чтобы в процессе сканирования не пришлось корректировать эт область.
Так или иначе задачу-то все равно надо решить. Я описал поведение обеих программ в конкретном случае.
 
Добавлено:
Tulon
"Exclude zone" позволяет исключить зону (рисунок или что-то ещё) от очистки. Все остальное на этом скане обрабатывается как обычно. Т.о. можно заранее "спасти" на рисунках места, которые воспринимаются как грязь.
 
По поводу SVN. Я этим никогда не занимался. Но если после скачивания всего упомянутого сам процесс компиляции будет автоматическим (не надо будет пялиться под часа в экран), то можно и попробывать . Но только когда сольешь последний SVN .
А зависимости в 100 метров надо будет качать с каждой новой версией SVN?
Когда сольешь, свисни. Попробую сделать. Если кто-то из знатоков раньше меня этим не займется.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 16:33 05-12-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А зависимости в 100 метров надо будет качать с каждой новой версией SVN?  

Нет, только один раз.  Да, я еще забыл сказать что этот бегемот Qt компилится несколько часов.  Это тоже к счастью всего один раз надо сделать.  Сам процесс компиляции в достаточной степени автоматизирован, но пунктов в инструкции хватает:
Инструкция по сборке

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 17:12 05-12-2008 | Исправлено: Tulon, 17:14 05-12-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал новую заметку:          
           
25. Бинаризация Sauvola Thresholding
           
http://www.djvu-soft.narod.ru/bookscanlib/025.htm

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 00:12 06-12-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал новую заметку:            
           
26. Бинаризация Maximum Entropy Thresholding
           
http://www.djvu-soft.narod.ru/bookscanlib/026.htm

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 20:02 07-12-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал новую заметку:            
             
27. Бинаризация Mixture Modeling Thresholding
             
http://www.djvu-soft.narod.ru/bookscanlib/027.htm

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 22:44 08-12-2008
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
На сколько я понял, все, что надо качать, указано в инструкции. Если меня хватит на скачивание, и смогу QT скомпилить, дам знать. Я никогда этого не делал, равно как не компилил QT-программы под Винду.
Так что как зальешь обновленный SVN, свисти. Чтобы тут тему не засорять, прошу сказать про обновление на мою почту denver-22 [puppy] narod [point] ru.
Если, конечно, тебе это интересно. Мне новую версию попробывать явно интересно. А заодно посмотрю как QT-программы компилятся под Винду.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 11:45 09-12-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
OK, как обновлю SVN - дам знать.  Думаю до конца недели сделаю это.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 13:34 09-12-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Background Correction
 
http://rsb.info.nih.gov/ij/plugins/background.html
 
Добавлено:
Там - http://rsb.info.nih.gov/ij/plugins/index.html - вообще много чего интересного:
 
http://bigwww.epfl.ch/thevenaz/UnwarpJ/

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 22:35 09-12-2008 | Исправлено: monday2000, 23:00 09-12-2008
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Скидываю обещанные файлы, на которых ST не смог распознать правильно разворот, а также удалил часть информации на выносных линиях (img025):
http://narod.ru/disk/4292238000/for-ST.zip.html
Ты видел моё сообщение в личке? Я вроде даже разобрался как исходники слить. Пока на нынешней версии попробывал. Остается дождаться твоей помощи по скачиванию из п.5 и новую версию SVN.
 
Для других:
Качество сканирования уже обсуждалось. Но такие сканы встречаются не редко. Поэтому всё скидывать на неправильное сканирование неуместно.
 
Добавлено:
Tulon
Обрати внимание как ST обрабатывает область с названием насосов на сканах (затемненная область с текстом). Я понимаю, что это очень сложное место.
Сейчас обрабатываю эти сканы в ScanKromsator-е и вижу большую разницу. После ST остается эффект грязи вокруг текста, а после SK - остаточное затенения явно говорит об изначальном оформлении страницы. И такой результат я даже дочищать не буду. Он мне нравится (после SK). Это только к сведению, моё ИМХО.
 
P.S. Доволен изменениями в работе SK 5.91. Заметил мелочи, но приятно. Надеюсь многие из этих идей будут реализованы в ST, но в более интуитивно понятном виде.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 09:42 10-12-2008 | Исправлено: denver 22, 10:41 10-12-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да, с черно-белыми сканами всегда тяжело.  Были бы они серыми, линия сгиба хоть в каком-то виде была бы видна, и СТ ее бы нашел.  Впрочем я вижу решение этой проблемы.  Надо ввести эвристику, чтобы в режиме разворота игнорировались линии, которые слишком близко к краю.  В этом случае вообще никаких линий не было бы найдено, и произошел бы откат на старый алгоритм, который ищет не линии, а свободное пространство.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 13:16 10-12-2008
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Согласен с таким алгоритмом.
Хоть программа и развивается, но все же не могу не сказать, что мне не хватало при обработке последней книги "зон исключения".
 
Вот на днях начал прочитал "ScanAndShare 1.07". Обращаюсь к Tulon и monday2000, вы все таки рекомендуете сканировать в сером?
Если ДА, то в CT аналогично при обработке переводить 300dpi серого в 600dpi ч/б?
 
P.S. Письмо получил. Спасибо. Скачаю и буду ждать новый SVN. Может успею на старом потренироваться.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 14:17 10-12-2008
are



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
думаю, всегда будет лучше сканировать в сером и потом повышать разрешение вдвое. Это экономит время сканирования, а качество лучше, чем при сканировании сразу в высоком разрешении, но в ч-б.
 
кромсатор сглаживает при upsampling, получается хорошо.

Всего записей: 552 | Зарегистр. 06-03-2005 | Отправлено: 14:42 10-12-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сканировать нужно конечно в сером.  Насчет разрешения - чем больше, тем в принципе лучше.  Вопрос только в том, сколько времени уйдет на сканирование и сколько на обработку.  Кстати СТ поддерживает несимметричные DPI, например 600x300.  Сам я не пробовал, но мне кажется что увеличение разрешения в одном из направлений (в направлении, перпендикулярном движению каретки) не должно замедлять сканирование.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 14:58 10-12-2008
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
are, Tulon
Спасибо за ответ. Когда я начинал изучать книгопроизводство, с серым ещё понимания не было. (Изучал я это мастерство по мануалам monday2000) И много книг сделал, работая только с ч/б.
Потом начал встречать рекомендации сканировать в сером. Но какие-то расплывчатые. Да и дополнительно много настроек в программах надо новых изучить. А мне уже кайфолом было .
Сейчас похоже уже этот механизм одобрен массами. Учту.
 
Тогда сразу вопрос по СТ:
1. С учетом советов вышеуказанного руководства. Если исходники будут в сером с 300 dpi, какие настройки оптимальны на выходе?
600 dpi и bitonal?
2. Чем "Black and White" отличается от "Bitonal"?

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 16:31 10-12-2008 | Исправлено: denver 22, 16:33 10-12-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22

Цитата:
вы все таки рекомендуете сканировать в сером?  

Конечно. Это много лет как известная истина.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 16:47 10-12-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
2. Чем "Black and White" отличается от "Bitonal"?

Ну я подумал, а почему бы не дать возможность скажем чуть затемнить цвет фона, а то от ярко белого глаза устают.  Вот и получился режим Bitonal.  То есть это тот же черно-белый, только с возможностью указать свои цвета вместо черного и белого.  Вообще я подумываю над тем, чтобы убрать его.  Во первых вряд-ли кто будет им пользоваться, а во вторых он не совместим с автовыделением картинок, которое будет в следующей версии.
 

Цитата:
1. С учетом советов вышеуказанного руководства. Если исходники будут в сером с 300 dpi, какие настройки оптимальны на выходе?
600 dpi и bitonal?

600 dpi и Black  and White

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 18:34 10-12-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал новую заметку:              
             
28. Бинаризация Niblack Thresholding
             
http://www.djvu-soft.narod.ru/bookscanlib/028.htm

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 21:53 10-12-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я сделал новую заметку:              
             
28. Бинаризация Niblack Thresholding  

У вас в описательной части есть неточности.  В этой реализации интегральные изображения не используются, хотя вполне могли бы использоваться.
Интегральное изображение - это матрица, размером с исходную матрицу (изображение), где в каждой ячейке записана сумма значений всех ячеек исходной матрицы, которые не ниже и не правее данной ячейки.
Построить интегральное изображение можно за один проход по исходному, а потом оно позволяет за константное время получить сумму ячеек в произвольном прямоугольнике.  В алгоритмах типа Sauvola и Niblack, интегральные изображения используются для мгновенного вычисления среднего значения и стандартного отклонения пикселей в аппертуре.
Вот как оно у меня реализовано:
IntegralImage.h
Binarize.cpp

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:37 11-12-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Т.е. матрица кумулятивных сумм? Хорошо, я напишу "вспомогательные" изображения.
 
Добавлено:
Я вообще-то практически не вникаю в эти алгоритмы - ради экономии времени. Сначала я их нашлёпаю побольше - а вникать может уже кто-то другой. Самое главное, на что я обращаю внимание - я стараюсь правильно "перебить" очередной алгоритм, т.е. чтобы он получился как можно более идентичным исходному.
 
Добавлено:
Пускай эти алгоритмы и не идеальны, и их описания не идеальны - главное - та скорость, с которой мы приближаемся к светлому часу СК-независимости.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:54 11-12-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал новую заметку:              
               
29. Фильтр Adaptive Wiener
               
http://www.djvu-soft.narod.ru/bookscanlib/029.htm
 
Добавлено:

Цитата:
Хорошо, я напишу "вспомогательные" изображения.

Сделал это.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 22:10 11-12-2008
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru