Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Черные полосы я пару дней назад исправил, но только для черно-белого и смешанного режимов.
 

Цитата:
Кстати, а что с прокручиванием ленты при зажатом контроле ?

Ускорение сколла при зажатом контроле идет от Qt - похоже стандартное поведение во многих системах.  Посмотрю, что можно с этим сделать.
 

Цитата:
Может в новой сборке и отражение ID в ленте сделаете (идентичность имени файла - названия миниатюры в ленте) ?  

В этой версии скорее всего все останется как есть, а в следующей нумерация файлов на выводе видимо вообще изчезнет.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 09:31 24-07-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Rsbr

Цитата:
Абсолютно согласен.Вообще отдельные утилиты некоторые и так есть,раньше,до появления СТ пользовался bash/perl/lisp + imagemagik,Gimp,unpaper и т.д и т.п. Неудобно было отслеживать процесс и исправлять неверно обработанные страницы.

Все эти утилиты не предназначены напрямую для сканобработки - именно отсюда и неудобство.

Цитата:
Отдельные утилиты это всё равно что конвеер по разным предприятиям расташить...

Нет, это в корне неправильная аналогия. Конвейер - это когда на входе одно и то же. А здесь на входе - всегда разное. Подходящая аналогия - это горно-обогатительный комбинат, где, в зависимости от вида руды, используется разный набор независимых стадий обработки руды. Например, в одном аппарате руду обрабатывают кислотой, в следующем аппарате - прокаливают (а не в одном и том же аппарате обрабатывают кислотой и прокаливают - потому что при другой руде на входе после кислоты потребуется флотация, скажем).
 
Так и тут - в зависимости от вида сканов нужно применять разный набор независимых друг от друга простейших (визуальных и непременно специализированных для сканобработки) утилит (такие сейчас не существуют).
 
Есть такое понятие - "вредный универсализм". В СТ и СК он как раз имеет место.

Цитата:
Пользоваться этим станет гораздо труднее,тот кому это нужно (и кто знает зачем это нужно) будет пользоваться.

Действительно, общий объём телодвижений увеличится. Но всё же общая простота всей сканобработки значительно возрастёт - потому что на каждом этапе будет "отсекаться" некая часть общей сложности - которая сейчас "тащится" в СТ-СК через всю сканобработку. Яркий пример - сдвоенные развороты. Вместо того, чтобы изначально разрезать их и превратить в единообразные одиночные - нет, они "тащатся" через всю сканобработку - вынуждая усложнять интерфейс СТ-СК.
 
Другой пример - deskew. Лучше сразу сделать оптом deskew, внимательно проверить, что получилось - и тогда дальше (на следующих этапах) мы уже практически забудем о проблеме deskew (концентрируясь лишь на проблемах следующих этапов). (Но для страховки некоторые "последующие" утилиты тоже могут иметь deskew).

Цитата:
А остальные будут ругаться и искать программу "всё в одном"

Вся фишка-то в том, что для сканобработки программа "всё в одном" пока невозможна в принципе - в том виде, как это понимают СК и СТ. Главная причина - несовершенство алгоритмов, что делает последовательность сканобработки непредсказуемой. Это только на качественных сканах нужно 1-2-3-4-5, а на сложных потребуется, скажем, 1-2-3-2-3-2-5 и т.п. - т.е. гибкая схема (в СТ и СК - жёсткая схема).
 
Жёсткая схема была бы возможна только в том случае, если бы на любых сканах применяемые алгоритмы давали бы результат, гарантированно удовлетворяющий определённым критериям. Сейчас этого нет (и возможно ли?).
 
Другое дело - что можно сделать набор независимых-простейших утилит - а потом постараться сделать некую управляющую программу "визард" - которая будет последовательно вызывать нужную простейшую утилиту и управлять ею. Естественно, такой "визард" должен быть программируемым, а ещё можно будет на него делать профили (в зависимости от вида сканов). Но визард - это потом (если он вообще возможен), для начала простейшими утилитами можно будет полностью вручную управлять.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 11:51 24-07-2009 | Исправлено: monday2000, 14:20 24-07-2009
terminat0r



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Кажется мне, что Вы  рассказываете о Book Restorer, где операции с книгой  можно раскладывать в очередь. Это, в общем, там хорошо реализовано. Возможно Вы и правы,  и автору следовало бы подумать о возможности отключения или смены очередности операций, которые сейчас жестко заданы в СТ.
Но это все можно реализовать не разбивая программу на отд. утилиты.  
 
 
 

Всего записей: 2084 | Зарегистр. 31-03-2002 | Отправлено: 14:27 24-07-2009
Rsbr

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Подходящая аналогия - это горно-обогатительный комбинат, где, в зависимости от вида руды, используется разный набор независимых стадий обработки руды. Например, в одном аппарате руду обрабатывают кислотой, в следующем аппарате - прокаливают (а не в одном и том же аппарате обрабатывают кислотой и прокаливают - потому что при другой руде на входе после кислоты потребуется флотация, скажем).  

 
Но при этом эти аппараты расположены максимально плотно и сделано всё для удобства транспортировки руды между ними,не так ли? Плюс уровень автоматизации этого процесса.А несколько утилит запускаемых отдельно да каждый раз загружать...
Важно следующее: Сейчас в 95% случаев я получаю на выходе СТ то что мне нужно,автоматически.И это меня устраивает.
А времени на управление 3-4 утилитами по отдельности у меня во многих случаях нет.
 
Вот разве исправление ориентации я не раз хотел отключить. И собрать одну сборку СТ специально без этой функции.
Иногда оно действительно мне не нужно.Насколько при этом теряется качество?

Всего записей: 10 | Зарегистр. 17-04-2009 | Отправлено: 15:18 24-07-2009 | Исправлено: Rsbr, 15:25 24-07-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
terminat0r

Цитата:
Но это все можно реализовать не разбивая программу на отд. утилиты.  

Можно. Но вряд ли это хорошо и нужно. Пример - СК. Там "не-разбивание программы на отд. утилиты" привело к следующим негативным последствиям:
 
1. Чудовищно перетяжелённый интерфейс.
 
2. Наличие "паразитных" дополнительных "связей" между отдельными "логическими компонентами" (типа флажки "не учитывать то-то" если "включено это").
 
3. Обилие глюков. (из-за высокой сложности)
 
4. Негарантированность получения желаемого результата (просто путаешься в многочисленных флажках-кнопках-"тонкостях").
 
5. Сложность освоения программы новичками (для них - это монстр, один вид которого пугает).
 
6. Сложность выбора оптимальной программной архитектуры (это для такого-то монстра).
 
Можно привести ещё и ещё таких доводов. Проще говоря - всё излишне-неоправданно сложное - есть плохое. В природе динозавры вымерли. СК ещё просто не успел.
 
Это всё равно, как если скрестить в единую программу MS Word, MS Excel, MS PowerPoint и MS Outlook - можно, но вряд ли нужно.
 
Добавлено:
Rsbr

Цитата:
Но при этом эти аппараты расположены максимально плотно и сделано всё для удобства транспортировки руды между ними,не так ли? Плюс уровень автоматизации этого процесса.А несколько утилит запускаемых отдельно да каждый раз загружать...  

Да, таковы издержки. Точнее говоря - издержки лишь в том, чтобы лишние разы выгрузить-загрузить сканы. Но разве это так уж тяжко сделать?
 
Зато ведь каждая такая утилита будет внутренне исключительно проста, как валенок (несравнимо проще, нежели чем СТ или СК) - с ней любой чайник справится.
 
Плюс - можно будет выбирать, какой утилитой воспользоваться (или Irfan View, скажем).
 
Про автоматизацию - забудьте. В сканобработке почти всё нуждается в человеческом контроле. Разрезка разворотов - только под контролем человека, никакая полная автоматизация невозможна. Deskew - скорее всего тоже должен быть проверен человеком (буду рад ошибиться - но даже файнридер лажается с deskew в крайне редких случаях). Draft kromsate в СК и "Полезная область" в СТ - тоже требуют после себя контроля человека.
 
Впрочем, я не исключаю некий общий "визард" - упрощающий работу с этими простейшими утилитами. Быть может, удастся свести каждую загрузку-выгрузку к 1-2 щелчкам мыши. Тут можно что-то придумать. Главное, чтобы эти утилитки были полностью взаимно-независимы (чего сейчас нет ни в СТ, ни в СК). Это будет по смыслу напоминать Hi-Fi DjVu http://www.djvu-soft.narod.ru/soft/hi_fi_djvu.htm

Цитата:
Важно следующее: Сейчас в 95% случаев я получаю на выходе СТ то что мне нужно,автоматически.И это меня устраивает.

А чем обрабатывать оставшиеся 5% сложных сканов?
И потом - это Вас устраивает; я же ориентируюсь на широкий хлещущий поток некачественно сделанных DjVu-книг. Очевидно, что просто нет максимально простого инструмента для сканобработки.  
 
Чайник жаждет, чтобы ему всё объяснили по простым шагам - как сделать DjVu-книгу. Типа "Делай раз - получаешь то-то", "делай два - это-то".
 
Я предлагаю каждое такое "делай..." сделать максимально простым - т.е. понятным чайнику. Правда, bolega утверждает, что чайнику не удастся объяснить, что должно получиться - дескать, чайник настолько дурак, что даже и не понимает, а чего он, собственно, делает. Да, это, конечно, проблема - но тут можно побороться - снабдить всё картинками, максимально разжевать. Что-то вроде такого: http://www.djvu-soft.narod.ru/scan/strange_lighted.htm .
 
Всё-таки разъяснить нечто заведомо простое (каждую из утилит) гораздо проще - чем объяснять нечто сложное (типа СК и СТ).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 18:07 24-07-2009 | Исправлено: monday2000, 18:36 24-07-2009
dma200899

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вот разве исправление ориентации я не раз хотел отключить. И собрать одну сборку СТ специально без этой функции.  

зачем отключать ?
туда неплохо было бы добавить кнопку "применить к ...", и тогда можно 0.00 ко всем так сделать.
 
А в выводе хорошо бы иметь возможность принудительное сглаживание иметь возможность отключить, чтобы вывести "как есть".

Всего записей: 126 | Зарегистр. 29-06-2008 | Отправлено: 08:01 25-07-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
dma200899

Цитата:
зачем отключать ?  
 туда неплохо было бы добавить кнопку "применить к ...", и тогда можно 0.00 ко всем так сделать

Это уменьшило бы логичность интерфейса.  Сразу возникал бы вопрос: зачем применять ко всем страницам параметр, который у них явно не одинаковый.  То, что это может иметь смысл для уже выровненых страниц, пользователь может понять, а может и не понять.  В любом случае это неочевидность, а неочевидностей в пользовательском интерфейсе я сильно не люблю.
В принципе можно свести на нет эту неочевидность примерно так:
[v] Компенсировать наклон
[   Применить к ...   ]
-------------------------------------
Угол наклона: [0.14o]
 
Тут сразу видно, что применяется не угол, а состояние включить / выключить.
Против такого варианта у меня возражений в принципе нет, но приоритет все равно низкий - мало кому такое надо, особенно учитывая то, что почти всегда можно просто позволить автомату отработать на уже выровненных страницах.
 

Цитата:
А в выводе хорошо бы иметь возможность принудительное сглаживание иметь возможность отключить, чтобы вывести "как есть".

Такую необходимость нужно доказывать реальными примерами.
Между прочим, сейчас сглаживание применяется только как стадия подготовки к бинаризации.  В режиме "Серый / Цветной" например - сглаживания нет совсем.  Некоторое замыливание все равно будет конечно - это результат геометрических проебразований (одного преобразования), и от него никуда не деться.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 09:29 25-07-2009 | Исправлено: Tulon, 09:31 25-07-2009
terminat0r



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
учитывая то, что почти всегда можно просто позволить автомату отработать на уже выровненных страницах.  

вам не жалко времени пользователей? Ведь это ощутимые затраты.

Всего записей: 2084 | Зарегистр. 31-03-2002 | Отправлено: 13:59 25-07-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
вам не жалко времени пользователей? Ведь это ощутимые затраты.

Компенсация наклона - самая быстрая стадия, не считая холостых.
Если ее делать отдельно - практически все время уйдет на загрузку картинок.  Если ее делать в вместе с другими - разницы по скорости практически нет - что с ней, что без нее.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 14:55 25-07-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Попробовал решить проблему с ускорением скроллинга при зажатом Ctrl или Shift.  К сожалению, тут ничего сделать нельзя - это поведение идет и от Qt и от самой операционной системы.
В общем придется вам отпускать Ctrl / Shift при скроллинге, и потом опять зажимать при клике.
 
Добавлено:
Собрал билд, который вероятно станет релизом 0.9.6
Быстренько тестируем, и если серьезных проблем не обнаружится, завтра зарелизю его оффициально.
Ссылка: http://www.onlinedisk.ru/file/185236/

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 18:36 25-07-2009
dabudada

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Похоже на баг.  Выкладывайте файл, миниатюра которого не отображается.
Не отображается она на всех этапах или только на некоторых?  

Не отображается только на двух стадиях: компенсация наклона и выделение полезной области.
Эта страница вне пакета (серый tiff-zip на 80 страниц) ведет себя подобающе, поэтому выкладывать ее в отдельности от остальных нет смысла. Я еще помучаю этот проект и о результатах изысканий напишу. Если понадобится, то попробую выложить весь проект, но для моего интернета это ну ооочень сложная задача

Всего записей: 21 | Зарегистр. 12-03-2009 | Отправлено: 09:27 26-07-2009
dma200899

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
вылезла черная полоса в смешанном режиме

Всего записей: 126 | Зарегистр. 29-06-2008 | Отправлено: 14:11 26-07-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Если эта черная полоса - часть исходного изображения, и при этом попала в область контента - тут уже ничего не поделаешь.  Ну а если она за пределами исходного изображения - тогда пример в студию.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 14:22 26-07-2009
dma200899

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
http://www.onlinedisk.ru/file/185563/
исходная картинка и файл проекта.
 
если надо, могу результирующий тоже выложить

Всего записей: 126 | Зарегистр. 29-06-2008 | Отправлено: 14:37 26-07-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Исправил черные полосы в Смешанном режиме.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:58 26-07-2009
dma200899

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
она там, кстати, и в ч/б режиме появляется, только в виде какого-то пунктира

Всего записей: 126 | Зарегистр. 29-06-2008 | Отправлено: 16:08 26-07-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
она там, кстати, и в ч/б режиме появляется, только в виде какого-то пунктира

Это ошибки округления.  Уже исправил.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 16:29 26-07-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Выпустил версию 0.9.6
Брать как обычно тут.
 
По сравнению с тем, что выкладывал вчера, было сделано еще несколько мелких и не очень фиксов.  Не очень мелкий фикс - это тенденция выставлять линию разреза на самом краю картинки в случае одностраничных сканов.  Теперь эта тенденция заметно поуменьшится.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 22:06 26-07-2009
drcode



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
I am sorry I am new to this scantailor. Can anyone list the names of softwares for book processing and give a comparison or a link where they are compared ?
 
For example, compare scantailor with scankromsator and book restorer and any other tools, and list their merits and demerits in a tabular fashion ?
 
Is there a software that can be used to convert djvu to pdf or to read djvu with the same convenience, annotation and other features as acrobat ?
 
Thanks a lot.

Всего записей: 42 | Зарегистр. 26-08-2007 | Отправлено: 02:21 28-07-2009 | Исправлено: drcode, 02:24 28-07-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
http://djvu-soft.narod.ru/soft (in Russian, but Google Translate could help)

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 04:10 28-07-2009 | Исправлено: iit512, 18:11 28-07-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru