Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
terminat0r
Вы думаете он на этом успокоится?  То есть по вашему человек, который изо дня в день поливает грязью автора ST, получив диаграмму классов, начнет работать над улучшением ST?
 
Уточнение: то, что написано выше, предполагает, что chotarajkumar и ramanujan - одно лицо.  Я бы дал процентов 90, что так оно и есть.  chotarajkumar кстати тоже интересовался насчет диаграммы.
Если это не так, рисовать диаграмму опять-же никакого смысла нет, потому что:
1. chotarajkumar'у от этого ни жарко ни холодно.
2. ramanujan никогда и не собирался ничего писать для ST.  Почитайте его самый первый пост - там он говорит, что исходники он открывать не собирается.
 
Ликбез:
Диаграмма классов - это графическое представление структуры и отношений между собой разных сущностей внутри программы.  Диаграмму можно либо создать в специальном редакторе (долго), либо сгенерировать автоматически из исходных кодов (результат - не очень).  Диаграмму я не создавал - не было особого смысла.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:49 03-10-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Это только мне кажется, что romanpolansky и ramanujan -- одно и то же лицо?

Может быть и нет. А может и да. Меня вот тоже когда-то обвиняли, что я зарегистрировался под другим ником, чтобы покритиковать СК. Причём все были в полной уверенности, что это так и есть. И ошиблись.
 
А ник такой избран видимо потому, что на днях был арестован некто Роман Полански http://lenta.ru/news/2009/09/27/polanski/ - т.е. человек увидел в новостях это имя и сделал его своим ником.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 19:08 03-10-2009 | Исправлено: monday2000, 19:15 03-10-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ну... почти как интриги Мадридского двора  
Если так дело пойдет и дальше, Tulon'у надо подумать о телохранителе
Надеюсь, нервы у Tulon крепкие и с истинного пути его не собьют всякие там происки и угрозы

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 19:40 03-10-2009
terminat0r



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Вы думаете он на этом успокоится?  То есть по вашему человек, который изо дня в день поливает грязью автора ST, получив диаграмму классов, начнет работать над улучшением ST?  

Конечно нет, не думаю. Все эти его мысли о том что gpl код  можно просто забрать и продать, показывают убогость его,  извините за выражение, задротного мышления. Тоесть, там сказано скорее всего как бы поступил он на вашем месте.
Но если есть диаграмма классов, то у вас будет на все его нападки убойный ответ, вот она  диаграмма. Бери и смотри. К тому же она все таки была б неплохим подспорьем для тех кто возможно могут и хотели бы присоединиться к вашему проекту, но не могут охватить так сказать всю картину целиком. Возможно я ошибаюсь, так как у меня мало опыта в разработке. Но как говорят, программу надо начинать писать всегда с докумментации.

Всего записей: 2084 | Зарегистр. 31-03-2002 | Отправлено: 20:18 03-10-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Ну... почти как интриги Мадридского двора

А не добавить ли нам интриги?  Я смотрю публика созрела.
Итак, а почему-же я его заподозрил в связях с правоохранительными органами?  Я кстати никогда на этом не настаивал, и в открытую не обвинял его в этом, но процентов 50 я запросто дам в пользу этого.  Итак, перечисляем странности в его поведении:
* Предлагает поучавствовать в разработке ST, просит поговорить по скайпу, и через три часа разговоров выясняется, что он никогда даже не запускал ST.
* Поговорить три часа по скайпу в рабочее время (у него рабочее - по его словам он живет в Лос Анжелесе) для него не проблема, а вот запустить ST прямо во время разговора - почему то проблема.  Извини, мол - не могу сейчас его запустить.  Кстати три часа по скайпу в рабочее время - не единичный случай.  Три раза это было.
* Весьма нелестно отзывался о bolega, а потом вдруг заявил, что bolega описал ему принцип работы некоторых из своих алгоритмов.
* Просит дать почитать книг на тему обработки изображений.  Показываю ему одно из зеркал колхоза - единственное, известное мне.  Спрашивает, какие конкретно книги оттуда я прочел.  Отвечаю, что полностью ни одной, и что например такая тема, как морфология изображений, гораздо лучше описана на leptonica.com.  Продолжает просить, чтобы я посоветовал ему конкретных книг.
* Спрашивает, какие у меня есть сырые сканы, которые я использую для тестирования.
* Вызывается улучшить деспекл, говорит что он Ph.D (соответствует нашему кандидату наук - аналога доктора наук в большинстве западных стран вообще нет).  Рассказыват принцип работы алгоритма deskew, который он якобы изобрел еще до того, как его описали в литературе.  Алгоритм очень простой, очень мощный, и очень известный - настолько известный, что даже я его использую в ST.  После этого всячески избегает говорить об улучшении деспекла, и даже отказывается отвечать на простой и прямой вопрос - какие у вас есть идеи по улучшению деспекла.
 
В общем странностей в его поведении было предостаточно, и я решил, что пусть лучше я отошью человека, который действительно хочет помочь, чем повторю судьбу вот этого парня.  Ну и отшил, точнее написал, что пока он мне не пришлет таки свои идеи по улучшению деспекла, никаких разговоров с ним не будет.
 
Для тех, кому лень идти по ссылке, или кто не дружит с английским:
У Microsoft в свое время утек код Windows 2000 и распространился по всем P2P сетям.  И значит получает один чувак такое сообщение: помоги мол найти этот код, я тебе даже заплачу.  На что получает ответ: так он ведь на всех P2P сетях лежит - бери нехочу.  А тот другой ему: я не шарю в технологиях, помоги плиз, плачу двацатку.  Ну чувак скачал и отдал этот код, и в результате был арестован за продажу кода Windows 2000.
 
В общем в Америку я ни ногой, а в остальном - жизнь продолжается.
 
Добавлено:
P.S: то зеркало колхоза до сих пор живо, что не может не радовать

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 22:55 03-10-2009
terminat0r



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
* Спрашивает, какие у меня есть сырые сканы, которые я использую для тестирования.  

Да, с этим надо быть очень осторожным. Копирасты не спят. А ваша программа может стать бельмом  на глазах.  
 

Цитата:
У Microsoft в свое время утек код Windows 2000 и распространился по всем P2P сетям.  И значит получает один чувак такое сообщение:

В лохматом но 200х году через пол часа после того как я инициировал закачку этого кода в осле, пришло письмо от провайдера подписаное микрософтом о первом и последнем предупреждении. Так что охотно Вам верю. Это была для меня еще одна огромная мотивация перейти на линукс. Хотя в то время я стягивал этот код чтобы просто посмотреть на стиль кодирования парней с редмонда.  
 

Всего записей: 2084 | Зарегистр. 31-03-2002 | Отправлено: 23:21 03-10-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Да, с этим надо быть очень осторожным. Копирасты не спят. А ваша программа может стать бельмом  на глазах.  

А я ему ничего не сказал, и не дал.  Вот он теперь и бесится.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:38 03-10-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
По поводу деспекла. Может Вам будет интересна его реализация с помощью морфологии
http://abab.front.ru/Despeckle.ZIP

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 07:57 04-10-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
По поводу деспекла. Может Вам будет интересна его реализация с помощью морфологии
http://abab.front.ru/Despeckle.ZIP

Довольно примитивный алгоритм - просто убивает все соединенные компоненты, куда не помещается черный квадрат определенного размера.  Моя первая версия деспекла делала что-то похожее.  Крупный мусор, размером хотя бы с типографскую точку, такой алгоритм не удалит.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 10:56 04-10-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
terminat0r

Цитата:
Копирасты не спят. А ваша программа может стать бельмом  на глазах.

А ничего они с СТ не сделают. Сама по себе программа является свободно-бесплатной. Вредоносной её не назовёшь. А сканировать книги и обрабатывать сканы - это не запрещено - если речь идёт о книгах с истёкшим копирайтом (более 70 лет по российским законам).
 
Возможно, не запрещено также (с точки зрения закона) сканировать любые книги для самого себя с условием нераспространения полученных сканов (точно не знаю).
 
Единственное наше уязвимое место - это documenttodjvu. Но даже в самом крайнем случае его можно на 70-80% заменить связкой miniDjVu+DjVu Imager.
 
PS Да, СканКромсатор-то не имеет никакой явно показанной лицензии. Также точно известно, что он использует коммерческую платную программную Делфи-библиотеку ImageLib 6.0 (для работы с растровой графикой). Её взломанная версия есть у меня: http://djvu-soft0001.nxt.ru/imagelib_corp_suite_6_0.rar (9.20 МБ) Официальный сайт: http://skylinetools.com/imagelib/index.html .
 
Я думаю, что СканКромсатор - это варез.
 
Добавлено:

Цитата:
Весьма нелестно отзывался о bolega

А и правильно. Потому что вот это многолетнее ненаписание элементарного хелпа к программе иначе как изощрённым глумлением не назовёшь.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 12:10 04-10-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Цитата:
Довольно примитивный алгоритм - просто убивает все соединенные компоненты, куда не помещается черный квадрат определенного размера.  
Либо Вы не поняли работу алгоритма либо я чего-то не понимаю . Причем здесь квадрат? Я прогнал этот деспекл на последней своей книге. По моим впечатkениям работает не хуже (или ненамного хуже), чем у bolega. Пропажи полезного контента не заметил (знаки препинания, отточия и т.п.). Чистит нормально.
Вы смотрели его работу в плагине?
Ладно, мое дело предложить, а там как Вам будет угодно.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 13:08 04-10-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А и правильно. Потому что вот это многолетнее ненаписание элементарного хелпа к программе иначе как изощрённым глумлением не назовёшь.  

Да нет, неправильно.  От существования Кромсатора можно получать пользу, даже не используя его и вообще не зная о его существовании.  Другие будут его использовать, а вы будете просто пожинать плоды их труда.
Кстати этот же аргумент можно привести в ответ на "чем мне помогут открытые исходники, если я не программист?".  Помогут тем, что кто-то другой может внести изменения, нужные вам.
 
Добавлено:

Цитата:
Вы смотрели его работу в плагине?  

Не смотрел, но смотрел исходники.  Там делается итеративный erode 3x3 пиксела (колличество проходов задается в настройках) - это удалит все соединенные компоненты, в которые не помещается данный квадрат (3x3 в случае одного прохода, 9x9 в случае двух, и.т.д), и покромсает те компоненты, где помещается.  Потом делается морфологическая реконструкция, которая восстанавливает покромсанные, но не полностью удаленные компоненты к первоначальному виду.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 13:11 04-10-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
 

Цитата:
Копирасты не спят. А ваша программа может стать бельмом  на глазах.  
 
А ничего они с СТ не сделают. Сама по себе программа является свободно-бесплатной.  
 
Единственное наше уязвимое место - это documenttodjvu.
 
PS Да, СканКромсатор-то не имеет никакой явно показанной лицензии.
 
Я думаю, что СканКромсатор - это варез.

 
Вы поосторожнее со вбросом г-на в вентилятор.

Всего записей: 6487 | Зарегистр. 31-08-2008 | Отправлено: 13:50 04-10-2009
AlexShag

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравствуйте.
 
Обработка сканов. Выполнен пакетно этап "4. Полезная область". Ширина ВСЕХ полезных областей ~одинакова.  На этапе "5. Макет страницы" заданы поля 5 и 10 мм (сверху-снизу и справа-слева соответственно) для всех страниц. Однако размеры страниц по ширине  гораздо больше "самая широкая полезная область + удвоенное поле слева-справа", т.е. страница по ширине наполовину из текста полезной области и наполовину белая.  
 
Выполнял заново "5. Макет страницы". Использование функции "Самая широкая страница" не направляет к самой широкой странице -> ширина макета страницы, показанного этой  функцией, превышает "размер полезной области + поля".
 
При выключении опции "Выровнять с другими страницами" -> неодинаковый размер ВСЕХ обработанных сканов, определяемых только полезной областью и полями
 
Как сделать "ширина всех листов = ширина самой широкой полезной области + поля"? Спасибо за ответ.

Всего записей: 23 | Зарегистр. 24-02-2007 | Отправлено: 16:02 04-10-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexShag
Это похоже на баг с залипанием размеров страниц.  В последней сборке он исправлен, но там поломан драг.  Баг можно обойти сохранением и последующей загрузкой проекта.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 16:08 04-10-2009
AlexShag

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я так и сделал, спасибо. Заново открыл проект, перемакетировал -> функция перешла к "самым  страницам". Вопросов нет.
 
Добавлено:
Добавлю, как получился такой баг. В КОНЦЕ проекте изначально была очень широкая страница и по ней проведено макетирование всех листов. Удалил её, перемакетировал, но функция "самая страница" не работала и все макеты залиапали по её размерам.
 
Добавлено:
В последней версии scantailor-2009-06-29-U235-Rev.386 если играться с опцией "Удаление пятен" в окне просмотра макета не скрываются программные Tab-ы режимов скана (despeckled, original и т.п.) и, похоже, перестает работать пакетный "6. вывод".

Всего записей: 23 | Зарегистр. 24-02-2007 | Отправлено: 16:19 04-10-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexShag

Цитата:
В последней версии scantailor-2009-06-29-U235-Rev.386 если играться с опцией "Удаление пятен" в окне просмотра макета не скрываются программные Tab-ы режимов скана (despeckled, original и т.п.) и, похоже, перестает работать пакетный "6. вывод".

Ну во первых под последней версией я имел в виду не эту - у U235 почему-то перестали собираться последние версии.  Там проблема не с самим ST, а с Qt - так что поправить это быстро не получится - разбираться надо.  Последняя сборка была не так давно среди сообщений - страницы этак 4 назад.  Эти "програмные табы" служат для отладки, и появляются, если включить "Инструменты -> Режим отладки".  Пакетный режим все равно должен работать.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 17:35 04-10-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ndch

Цитата:
Вы поосторожнее со вбросом г-на в вентилятор.

Эту Вашу мысль я не понял. Если Вы имеете в виду, что следует замалчивать наши копирайтно-уязвимые места, "чтобы враги не догадались, где наше слабое место" , так это явно неправильная политика.
 
А СК лишний раз дискредитировать не страшно: как ни крути, а в плане дальнейшего развития общественного DjVu-книгосканирования СК совершенно необходимо заменить на какую-либо аналогичную, но более вменяемую программу со статусом "свободно-бесплатная", с открытыми исходниками и с хелпом.
 
СК - в исторической перспективе не жилец.
 
Увы, я не думаю, что такой заменой выступит СТ. Пока что нет никаких оснований так думать. Если Tulon попытается при помощи СТ перекромсать 1-2 десятка чужих поганейше сделанных книг, то он это и сам увидит воочию. А вот СК на такие задачи вполне способен.
 
СК - это как бы дешёвенький джип-вездеход, типа уазика, который проедет по любой непролазной деревенской грязи, а СТ - это "шикарный дорогой лимузин", который застрянет в первой же луже.
 
Поэтому, разумеется, пока что даже и речи не может быть о том, чтобы СТ выступил как реальная замена СК.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 19:27 04-10-2009 | Исправлено: monday2000, 19:29 04-10-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Цитата:
Там делается итеративный erode 3x3 пиксела (колличество проходов задается в настройках) - это удалит все соединенные компоненты, в которые не помещается данный квадрат (3x3 в случае одного прохода, 9x9 в случае двух, и.т.д), и покромсает те компоненты, где помещается.  Потом делается морфологическая реконструкция, которая восстанавливает покромсанные, но не полностью удаленные компоненты к первоначальному виду.
Неверно поняли - это про квадрат, его размеры и проходы. А радиус зоны созранения где? и его назначение?
Выложите скан, обработайте его своим деспеклом, я предложенным. Там и посмотрим что и как.
 
ЗЫ: Я не пользуюсь и не планирую пользоваться СТ. У меня другая метода. Мне бы хотелось видеть еще одну качественную программу помимо СК.
Пока СК вне конкуренции, увы...

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 19:32 04-10-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
Неверно поняли - это про квадрат, его размеры и проходы. А радиус зоны созранения где? и его назначение?  

Ну так объясните мне, как оно в реальности работает.  Я конечно могу поподробнее покопаться в исходниках, но вы же автор, вам всяко проще это объяснить.  А я в ответ, и даже не в ответ, а просто так, даю описание моего алгоритма.  На английском правда.  Я его для chotarajkumar в свое время написал.  Не пропадать же добру.  Ах да, он в .odt формате.  Если эта проблема, могу конвертнуть в .doc.
 

Цитата:
Выложите скан, обработайте его своим деспеклом, я предложенным. Там и посмотрим что и как.  

А что толку.  Я уверен, что есть сканы, где ваш алгоритм справится лучше, и есть такие, где мой.  Что с того?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 20:01 04-10-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru