Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
woodyfon

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
Не противоречят. Авторские права необходимо писать в исходниках. В бинарниках - по усмотрению автора проекта. Поэтому второй Tulon может и не писать в окошке About данные о авторских правах.

Всего записей: 417 | Зарегистр. 03-08-2007 | Отправлено: 21:25 07-02-2010
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
GUI-версии от U235 не за горами.

http://alexrey036.narod.ru/LayerTailor/LayerTailor.zip
Описание внутри .pas и .au3 файлов.

Всего записей: 884 | Зарегистр. 14-12-2005 | Отправлено: 08:08 08-02-2010
amz01

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235  
Цитата:
.au3  

А этот файл к чему прикладывать?
 
Проверил я твою шнягу. Обомлел. Все тексты получились белыми буквами на черном фоне. Куски текста уходят в картинки. И что потом с ентим делать?
Что-то тут не то...
И во время работы никакой видимости процесса, даже счётчика нет, у Тулона хоть картинки меняются. А если сканов будет 2000?
 
Может ещё проверять и глубину соседних пикселей? Если вокруг однотонный фон, то буква, если спектр, то картинка. Хотя это тоже проблемно.
 
Если хочешь, я переделаю твою прогу на Билдере с выводом на форму картинок.

Всего записей: 171 | Зарегистр. 15-09-2005 | Отправлено: 08:45 08-02-2010 | Исправлено: amz01, 08:50 08-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amz01
Ссылка1, Ссылка2
Вы точно уверены, что вы не Monday2000? И что это за тяга такая к запутыванию топиков? ST_XmlPatch выкладывался здесь.

Цитата:
Нужна прога, которая выцарапывает из ST файлы, обработанные до предпоследнего шага и сохраняет их для дополнительной обработки, которую ST не делает.  
А потом можно их прогнать в ST по последнему этапу .

Делаете вывод в режиме только изображения, производите нужную обработку, открываете обработанные файлы через XmlPatch и проходите последний этап на созданном патчем проекте.
 
Добавлено:
По поводу метода U235 можете пока использовать мой сепаратор. Только предварительно, во избежание ненужных вопросов пожалуйста rtfm

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 09:37 08-02-2010 | Исправлено: StanFreeWare, 09:40 08-02-2010
amz01

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
Уверен.
Что ты гоняешь постоянно то туда, то сюда. Я уже окончательно запутался что - где.
 
А что, обработанные файлы без XmlPatch нельзя будет открыть в ST? А что будет?
 
Посмотрел ссылки про Monday2000. Что, получается, всех тех, кто не "одобрямс!" в одну кучу сваливаем? Нехорошо-с...

Всего записей: 171 | Зарегистр. 15-09-2005 | Отправлено: 10:13 08-02-2010 | Исправлено: amz01, 10:21 08-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amz01
Может сделать поворот не туда (что маловероятно), и полезную область задать не по границам, полученным при первом прогоне в СТ (а это скорее всего так и будет). В каких-то случаях так и нужно. В других лучше оставить углы и границы неизменными, и тогда предлагается использовать патч.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 10:21 08-02-2010
amz01

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
Да, но ведь, согласно описанию, на входе будут тогда одни картинки, а как с текстом?
 
Было бы хорошо, если бы ты описал весь процесс применения по этапам, с сначала исходного ввода в ST до твоего патча, а потом - про патч. Что он даёт и что без него мы теряем? Я уже совсем запутался и ничегонепонимаю...  
Может он жутко полезный, но я этого не увидел. В силу своей природной малограмотности.

Всего записей: 171 | Зарегистр. 15-09-2005 | Отправлено: 10:26 08-02-2010 | Исправлено: amz01, 10:29 08-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amz01
Действительно, ошибся в формулировке. Я имел в виду первый проход в режиме вывода Цветной/Серый СТ.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 10:32 08-02-2010
amz01

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
Т.е. сначала стандартно выводим цветной/серый пакет.
Потом правим на стороне.
Потом твоим патчем закидываем обратно, пропуская первые 4 этапа, чтобы ST не портил границы.
А потом?
 
А зачем править на стороне комбинированные сканы, если есть смысл править только  разделённые на текст и графику? Я лично в этом уверен.
 
Или я опять не понял?

Всего записей: 171 | Зарегистр. 15-09-2005 | Отправлено: 10:37 08-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amz01
Вы все правильно поняли. Возможно, в данном виде патч может пригодиться при коррекции геометрических искажений.
Но, по большому счету он является демонстрацией возможностей правки xml-файла проекта как подхода, альтернативного выпрашиванию фич. Изначально задумывался именно как патч, т.е. утилита, которая получает на входе проект ST, и выдает на выходе тот же проект, но с групповой корректировкой параметров той или иной стадии. Теперь интересно услышать, какие стадии и в каких случаях реально нужно пропускать или как-то править.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 10:48 08-02-2010 | Исправлено: StanFreeWare, 10:48 08-02-2010
amz01

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
Хорошо, но тогда получается, что придётся 3 раза прогонять этап 6, вместо двух при окончательном разделении в STA. Это жутко долго. 3-4 часа на каждый заход при 1000 страницах. Геометрию можно исправить и на исходных сканах.

Всего записей: 171 | Зарегистр. 15-09-2005 | Отправлено: 10:56 08-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amz01
Есть предположение, что в случае сканов разворотов лучше править геометрию на уже разрезанных сканах.
И все-таки попробуйте еще разок метод U235. С предварительной коррекцией тем же Корректором или каким-нибудь вьюером (см инструкцию). Глядишь, проход-другой скостите.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 11:09 08-02-2010
amz01

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
Метод U235 больше проверять не буду. Это всё сырое и непригодное для пакетной обработки. Буду пока по-старому делать, хоть и долго. А параллельно сам что-нибудь наваяю. Но сыряк не буду выставлять - сначала доведу до минимальной кондиции.
 
Я вообще думаю, что постоянное втавление своих 3-к копеек, в виде сырых,  непродуманных алгоритмов, только запутывает всех. Тяжело юзать примочки, которые меняются по 10 раз на дню, и, иногда, с разворотом на 180 градусов. Ничего личного.
 
Кстати, насчёт моего скана. Получилось улучшение картинки при лучшем сжатии, или нет?

Всего записей: 171 | Зарегистр. 15-09-2005 | Отправлено: 11:17 08-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amz01

Цитата:
Это всё сырое и непригодное для пакетной обработки.

Уверен, что вы пытались применить методику не ознакомившись с инструкцией и не произведя предварительную коррекцию.  
Методика U235 имеет большое значение и как самостоятельное решение, и как идея выделения текстового слоя на выходе смешанного режима через коррекцию яркости области иллюстраций на -1 (вместо многослойных tif-ов, анализа зон в xml и прочего).
Если не выставлять "сыряк", а говоря корректно, если не делиться с сообществом своими идеями, то есть очень большой шанс довести до кондиции идею, которая никому никогда не понадобится.
По поводу вашего скана. Это ndch обещал в лицах изобразить, как его улучшить. Мне тоже интересно было бы крайне интересно почитать этот сценарий. На всякий случай вот ссылка на мой пост с вариантами грубой обработки этого и еще одного скана.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 11:49 08-02-2010 | Исправлено: StanFreeWare, 11:49 08-02-2010
woodyfon

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
Несмотря на требования, выложите изображения, которые нужно обработать. Пожалуйста.
 
Такое ощущение, что как только появилось что-то рабочее, так это уже никому не нужно. Не нужно так не нужно. Если все-таки это никому уже ненадо, скажите, чтобы зря автору голову не морочил.
Предлагаю уже создать новую тему, где обсуждать модификации Scan Tailor - a.

Всего записей: 417 | Зарегистр. 03-08-2007 | Отправлено: 11:51 08-02-2010 | Исправлено: woodyfon, 11:57 08-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
woodyfon
Прошу прощения за небольшую задержку. При внимательном рассмотрении оказалось, что мои сканы не так уж и искажены. Максимум - так.  
Лучше всего, конечно попытаться включить алгоритм в СТ, тогда свое мнение выскажет большее количество народа.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 12:30 08-02-2010 | Исправлено: StanFreeWare, 12:31 08-02-2010
woodyfon

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А исходных изображений с искажений именно строк текста у вас нету?
Если алгоритм dewarp и будут внедрять в ST, то только усилиями ОДНОГО Tulona-a. Чтобы человек не делал лишнюю работу, нужно определиться сразу нужно ли нам это или обойдемся.

Всего записей: 417 | Зарегистр. 03-08-2007 | Отправлено: 13:11 08-02-2010 | Исправлено: woodyfon, 13:14 08-02-2010
amz01

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
Цитата:
Уверен, что вы пытались применить методику не ознакомившись с инструкцией  

Справку принести?
Я же писал сегодня, что у него на выходе белые буквы на чёрном фоне. Мне что, сканы в негатив перевести, сначала? Крутая методика...

Всего записей: 171 | Зарегистр. 15-09-2005 | Отправлено: 13:29 08-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amz01

Цитата:
Справку принести?  

Вполне достаточно просто архив с проблемным сканом на входе СТ, результатом на выходе СТ и результатами, получаемыми на выходе сепаратора (желательно моего сепаратора, пока U235 не поправит свой). Можно на всякий случай приложить проект СТ. Сразу все станет ясно.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 14:10 08-02-2010
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
то ndch обещал в лицах изобразить, как его улучшить.

На словах - поправить уровни, убрать шум, уменьшить число цветов. Постараюсь изобразить в лицах сегодня.
 
Добавлено:
Надеюсь Вы понимаете что на "скриншоте" очень маленькое разрешение и книга напечатана на плохой бумаге не самой хорошей краской. отсюда и ожидаемое качество результата.
 
Но читабельнее можно сделать.

Всего записей: 6516 | Зарегистр. 31-08-2008 | Отправлено: 14:38 08-02-2010
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru