Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235

Цитата:
Нет это не определитель зон, это лучше

Смотря для чего лучше. Зависит от того, что дальше делать с фоном. На мой взгляд автосегментация все-таки лучше, т.к. оставляет только иллюстрации, а остальное заменяет на белое (!). В Вашем же варианте остается весь фон (неизбежен при сканировании), который абсолютно не нужен, увеличивает размер djvu и ухудшает его качество. Т.е. выполняет работу, которую хорошо делает и djvu-кодек. Или я не прав?
Т.е. перечисленные Вами недостатки являются на самом деле его преимуществами, главное из которых - избавление от ненужног содержимого.
Если нужен именно весь фон, т.е. все, что не текст, то можно просто посмотреть как это реализовано в djvulibre. Определить фон - это вообще не проблема (напр., corr.illum в sk как раз и делает эту операцию - определяет фон), другое дело - вычленить из этого фона действительно полезные рисунки, а не просто паразитные тени, разводы и цветные аберрации, вызванные дефектами сканирования.

Всего записей: 3708 | Зарегистр. 09-09-2002 | Отправлено: 11:17 17-09-2008 | Исправлено: bolega, 11:23 17-09-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
На мой взгляд автосегментация все-таки лучше, т.к. оставляет только иллюстрации, а остальное заменяет на белое (!).

Так в этом как раз весь смысл алгоритма от U235.  Определить маску картинок, чтобы оставить их в покое, а остальное бинаризовать.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 12:11 17-09-2008
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
В Вашем же варианте остается весь фон (неизбежен при сканировании), который абсолютно не нужен, увеличивает размер djvu и ухудшает его качество. Т.е. выполняет работу, которую хорошо делает и djvu-кодек. Или я не прав?  

Нет, не совсем так. Скрипт тоже, как и SK заменяет фон на белое и оставляет только иллюстрации. Т.е. разница в том что SK использует маскирование растровых рисунков с помощью векторных объектов (прямоугольник, полигон, овал), скрипт - растровых (бинарная маска).  
Деление происходит не текст/фон, а растровые рисунки/все остальное. Рисунки - слегка размываются, чтобы удалить растр, а все остальное бинаризируется, затем все снова собирается в один тиф. Постараюсь в ближайшее время выложить примеры работы скрипта, для наглядности.  
Причем в скрипте  используется то, что растровый рисунок состоит из множества близко расположенных точек - растра.  
Выравнивание освещенности перед выделением рисунков - это совсем другая задача и, насколько я знаю, автор ST над этой проблемой тоже работает.

Всего записей: 635 | Зарегистр. 14-12-2005 | Отправлено: 12:21 17-09-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235
Спасибо. Теперь понял

Всего записей: 3708 | Зарегистр. 09-09-2002 | Отправлено: 12:49 17-09-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235
Не могли бы Вы реализовать на Матлабе технологию, описанную в http://www.djvu-soft.narod.ru/scan/corel_scan.htm ?

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 12:30 19-09-2008
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Нет, во-первых дело в том, что, например, название фильтра "Интеллектуальная размытость" ничего не говорит об используемом алгоритме, анализировать "как оно там работает" - можно, но слишком накладно, есть более интересные вещи. Во-вторых, будут сложности с интерфейсно-программной частью (менюшки, низкая скорость работы).  
И какой смысл в этом и кому это может быть нужно?

Всего записей: 635 | Зарегистр. 14-12-2005 | Отправлено: 14:21 19-09-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Выложил TODO на сайт.  С одной стороны, меньше будет одних и тех же вопросов и пожеланий, а с другой - может кто какую идею подкинет по тому или иному пункту.  Была мысль включить комментарии, но на данный момент из-за ограничений SourceForge, невозможно реазиловать уведомления.  Так что пока решил не делать.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 16:10 19-09-2008
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235
У меня к Вам просьба. Разбираться во всем времени сейчас особо нет. А Вам, возможно, моя просьба будет не очень обременительной. Сможете что-то посоветовать или посодейстовать - хорошо, нет - отложу до лучших времен.
Есть мысль прикрутить автоматическое выделение растровых рисунков (Вашу разработку) к макросам Корела. Пусть выделение будет не идеальным, править будет все же легче, чем выделять вручную.
Что требуется - сохранить маску выделения некоторого скана (или для всех сканов) в отдельный файл, если найдены растровые рисунки. Например, скан 0016.tif, его маска - файл m0016.tif.
Пусть это будет некая прога, которую я буду запускаеть из Корела (как сделать лучше, надо смотреть). Она создаст маску. Потом эту маску я добавлю в сканы в качестве альфа-канала. Вот такая задумка.
 
ЗЫ: Как вариант, ссылки на графические библиотеки и примерный код на каком-нибудь языке по созданию файла маски. Остальное, думаю, я смог бы быстро сделать сам.

Всего записей: 2492 | Зарегистр. 28-05-2004 | Отправлено: 07:56 20-09-2008 | Исправлено: Arcand, 08:03 20-09-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235

Цитата:
И какой смысл в этом и кому это может быть нужно?

Если бы перенести с Корела на Матлаб, то наверное, потом проще было бы с Матлаба на СТ перенести. Корел - это хорошо, но не может быть массово-популярным по определению.
 
Добавлено:
В идеале хорошо бы иметь Corel PHOTO-PAINT, Matlab и пр. в качестве некоего полигона, где обкатывать новые алгоритмы и идеи по сканобработке, затем тем или иным путём раздобывать их исходники (или аналогичные исходники) и реализовывать всё это уже в СТ.
 
А иначе - какой смысл что в Corel PHOTO-PAINT, что в Matlab? Только "игрушка для избранных".

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:01 21-09-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Большая часть того, что есть в Кореле, есть и в Gimp'е.  Например интеллектуальное размывание - это скорее всего ни что иное, как выборочное размывание, то есть размывание везде, кроме как в зонах резких перепадов яркости.  Так что если что куда переносить, то лучше всего прямо из Gimp в СТ.  И то и другое open source, лицензии совместимы.
Вот только никто толком не скажет, какие именно функции из Корела он хотел бы видеть в СТ.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 17:14 21-09-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235
Arcand
Обратите внимание на графическую библиотеку FreeImage http://freeimage.sourceforge.net/ . Библиотека исключительно проста, понятна и удобна в использовании.
 
Вы, U235, могли бы брать некие интересные Matlab-алгоритмы и "перебивать" их под FreeImage.
 
Вы, Arcand, могли бы пытаться реализовать интересные Вам возможности Corel PHOTO-PAINT на FreeImage.
 
Эти алгоритмы могут выглядеть как консольные программы на языке СИ или Делфи, обращающиеся к FreeImage.dll.
 
FreeImage может послужить в роли "общего знаменателя", к которому можно привести всякие разношёрстные Интернет-алгоритмы по работе с растром. А уже имея какой-либо алгоритм на базе FreeImage, его потом нетрудно "перебить" под любую другую платформу - будь то хоть СТ, хоть СК, или что угодно.
 
Не пожалейте 15-20 минут и почитайте PDF-хелп к FreeImage http://downloads.sourceforge.net/freeimage/FreeImage3110.pdf - сразу увидите, насколько FreeImage проста, понятна и удобна.
 
Чтобы работать с FreeImage, достаточно иметь самые минимальные навыки программирования. Идею использовать FreeImage мне подал AndyZ.
 
Добавлено:

Цитата:
то лучше всего прямо из Gimp в СТ.

В общем, тот или иной "общий знаменатель" нужен - если FreeImage, скажем, не всем нравится, то пусть общим знаменателем будет СТ - дело вкуса. Но мне кажется, что проще чем FreeImage, трудно что-либо придумать.
 
Добавлено:
Tulon

Цитата:
Вот только никто толком не скажет, какие именно функции из Корела он хотел бы видеть в СТ.

Это надо у Arcand спросить - как у специалиста по Корелу. Лично мне хотелось бы видеть в СТ такой инструментарий, который позволял бы делать обработку Grey 300 -> BW 600 с минимальными издержками по увеличению размера результирующего DjVu. Короче, чтобы DjVu распухал на выходе не в 2 раза, как сейчас по методу ScanAndShare, а не более чем на 50 процентов (хотелось бы 30% в идеале). Arcand уже как-то исхитрился достигать этой цели в http://www.djvu-soft.narod.ru/scan/corel_scan.htm - вот если бы СТ так умел бы тоже...

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:28 21-09-2008 | Исправлено: monday2000, 17:35 21-09-2008
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
Пусть это будет некая прога, которую я буду запускаеть из Корела

Я думаю, что все можно попробовать сделать штатными средствами Корела, без дополнительных программ. На днях погляжу.
monday2000

Цитата:
А иначе - какой смысл что в Corel PHOTO-PAINT, что в Matlab? Только "игрушка для избранных".

В Matlab/Scilab/Octave можно быстро реализовать и отладить и потестировать тот или иной алгоритм. Если результат удовлетворительный, тогда уже можно думать о реализации его на C++ или другом языке.

Всего записей: 635 | Зарегистр. 14-12-2005 | Отправлено: 12:06 22-09-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235

Цитата:
Если результат удовлетворительный, тогда уже можно думать о реализации его на C++ или другом языке.

Я именно об этом и говорю.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 12:56 22-09-2008
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Цитата:
Вот только никто толком не скажет, какие именно функции из Корела он хотел бы видеть в СТ
Какая-то обработка сканов после Page Layout и перед или вместо Output нужна. На основании моего опыта обработки сканов, в первую очередь с Корелом, обработка могла бы выглядить так.
В СТ добавлен пункт Процессинг и в соответствующем поле чекбоксы и регулировки фильтров. Их очередность можно сделать нерегулируемой.
1. Адаптивное размытие. Уменьшает мусор, потом после фильтра резкости не вылезают неоднородности фона.
2. Коррекция освещенности. Убирает неоднородности освещения, в первую очередь у корешка. Позволит потом не морочиться с адаптивной бинаризацией.
3. Ресемплинг.
4. Автокоррекция. В Корел тоновый диапазон растягивается на всю ширину. Лучше задать тон самого черного регулируемым - чтобы было не 0 а, скажем, 20.
5. Сглаживание. Сглаживание вдоль контуров.
6. Контурная резкость (нерезкая маска). Делает контуры букв четкими а сами буквы более черными.
7. Сглаживание. Имеет смысл ее делать перед бинаризацией. Сглаживает еще раз плюс можно варьировать жирность букв при бинаризации.
8. Бинаризация. Достатосно пороговой.
 
Включаем по очереди чекбоксы, смотрим и корректируем результат.
 
monday2000
Цитата:
Обратите внимание на графическую библиотеку FreeImage
Хорошо.
 
U235
Цитата:
Я думаю, что все можно попробовать сделать штатными средствами Корела, без дополнительных программ.
Увы, я ничего подходящего не нашел. Было бы здорово добавить свой плагин в подключаемые модули выделения (в меню Выделение). Вроде бы фотошоповские можно подключать к Корелу. Но я не знаю, есть ли в Фотошопе подходящие.

Всего записей: 2492 | Зарегистр. 28-05-2004 | Отправлено: 13:25 22-09-2008 | Исправлено: Arcand, 13:28 22-09-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
Хорошо.

Загляните ещё сюда: http://www.djvu-soft.narod.ru/bookscanlib/001.htm . Это простейший примерчик: загрузить картинку и сохранить её в другой формат. Код прост и понятен, как пареная репа. Смысл работы с FreeImage прост:
 
1. Открываем файл в любом поддерживаемом графическом формате (их десятки, причём тот же TIF великолепно поддерживается - любые подвиды TIF, и даже метатеги и многостр. тифы) с диска и загружаем его в память во внутрибиблиотечный универсальный формат FIBITMAP* (расширенный аналог несжатого BMP, и на PBM тоже похож).
 
2. Делаем, всё что нам нужно, с матрицей пикселей, доступных через FIBITMAP* (т.е. реализуем любой нужный алгоритм).
 
3. Сохраняем обработанный FIBITMAP* в любой поддерживаемый FreeImage граф. формат.
 
Таким образом, работа программиста упрощается до предела. Кстати, по PDF-хелпу можно легко разобраться с приёмами работы с FreeImage - т.к. в хелпе есть готовые характерные куски кода, иллюстрирующие работу с библиотекой.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 14:21 22-09-2008
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вроде бы фотошоповские можно подключать к Корелу. Но я не знаю, есть ли в Фотошопе подходящие.  
Пошарился на форуме и в инете и пришел к выводу - надо писать свой плагин. Те, которые есть, не то.
 
ЗЫ: Блин, в инете, куда не сунься, везде порнушка - напомнили, чем наши люди занимаются в свободное время . Как скучно мы здесь живем

Всего записей: 2492 | Зарегистр. 28-05-2004 | Отправлено: 17:48 22-09-2008
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand
Последовательность действий  в Corel Photo Paint для маскирования растровых рисунков. Скрипт для матлаба работает немного по другому, но релультат на моем тестовом изображении получился похожий.
Подробнее...
Образец и результаты тут: http://rapidshare.com/files/147606258/test.rar.html (в jpg ~1 Mb)  
В принципе в Corel я представляю как можно делать и выравнивание неоднородности фона, но число операций будет ~ 100, без VBA точно не обойтись.

Всего записей: 635 | Зарегистр. 14-12-2005 | Отправлено: 08:42 23-09-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
Как скучно мы здесь живем  

Ничего, зато у нас есть мощнейшая идея - создание развитой и популярной книгосканировочной технологии. Ради этого можно и поскучать. И перспективы ведь неплохие (особенно если пойти "путём FreeImage" или аналогичным).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:40 23-09-2008
metrolog



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Помогите пожалуйста поставить её в Ubuntu 8

Всего записей: 19 | Зарегистр. 20-02-2005 | Отправлено: 22:49 23-09-2008 | Исправлено: metrolog, 22:50 23-09-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Помогите пожалуйста поставить её в Ubuntu 8

Придется собирать из исходников.  Попробую дать инструкции, расчитаные на того, кто никогда ничего не собирал.  Итак:
Система -> Администрирование -> Менеджер пакетов Synaptic
Настройки -> Репозитории -> Обновления -> включить "Официально неподдерживаемые обновления".
Закрыть
Обновить
 
То что мы делали до сих пор - это для того, чтобы получить Qt 4.4, тогда как в репозитории только 4.3.
 
Найти "libqt4-dev"
Правой клик по нему -> отметить для установки (или для обновления).
Применить
 
Теперь можно выключить "Оффициально неподдерживаемые обновления".
 
Таким же образом (найти, отметить для установки, применить) устанавливаем следующие пакеты:
build-essential, cmake, zlib1g-dev, libpng12-dev, libjpeg62-dev, libtiff4-dev
Некоторые из них могут и так стоять.
 
Теперь распаковываем архив с исходниками scantailor.
Запускаем Приложения -> Cтандартные -> Терминал
Там (с помощью комманды cd) идем в директорию, куда распаковались исходники.
Даем комманду "cmake ."
После чего "make"
И наконец "sudo make install"
 
Если все прошло успешно, можно прямо в терминале, либо по Alt+F2 набрать scantailor, и он запустится.
 
Возможно когда-нибудь у меня дойдут руки до сборки бинарного пакета, а пока придется вот так ставить.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:22 24-09-2008 | Исправлено: Tulon, 00:24 24-09-2008
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2018

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru